CN114450031A - 靶向rna的敲低和替代组合物及使用方法 - Google Patents

靶向rna的敲低和替代组合物及使用方法 Download PDF

Info

Publication number
CN114450031A
CN114450031A CN202080061471.7A CN202080061471A CN114450031A CN 114450031 A CN114450031 A CN 114450031A CN 202080061471 A CN202080061471 A CN 202080061471A CN 114450031 A CN114450031 A CN 114450031A
Authority
CN
China
Prior art keywords
rna
sequence
protein
seq
present disclosure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080061471.7A
Other languages
English (en)
Inventor
D·A·内尔斯
R·巴特拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rocana Biological Co ltd
Original Assignee
Rocana Biological Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rocana Biological Co ltd filed Critical Rocana Biological Co ltd
Publication of CN114450031A publication Critical patent/CN114450031A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/16Otologicals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/861Adenoviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Psychiatry (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Epidemiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Cardiology (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Ophthalmology & Optometry (AREA)

Abstract

公开了用于特异性靶向和敲低引起毒性的功能获得或丧失型突变的致病性RNA分子、同时还用治疗性替代基因替代所靶向且敲低的基因的组合物和方法。

Description

靶向RNA的敲低和替代组合物及使用方法
技术领域
本公开涉及分子生物学、基因疗法以及用于修饰RNA分子的表达和活性的组合物和方法。
以引用方式并入序列表
于2020年7月10日创建的大小为6.07MB的名为“LOCN_005_001WO_SeqList_ST25”的文本文件的内容特此以引用方式整体并入。
相关申请的交叉引用
本申请根据35 USC§119(e)要求2019年7月10日提交的美国临时申请第62/872,604号和2020年1月31日提交的美国临时申请第62/968,819号的优先权和利益。这些申请各自的内容特此以引用方式整体并入。
背景技术
在本领域中存在对提供有效的功能获得或丧失型基因替代疗法的长期但未满足的需求。在本领域中还存在对提供有效的RNA靶向系统的方法的长期需求。因此,本公开提供了RNA靶向和基因替代策略的组合。特别地,本公开提供了用于以序列特异性方式特异性靶向和敲低引起毒性的功能获得或丧失型突变的致病性RNA分子、同时还用治疗性替代基因替代所靶向且敲低的基因的组合物和方法。
发明内容
本公开提供了一种组合物,所述组合物包含编码RNA指导的靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽在由gRNA序列指导时结合并切割靶RNA,其中致病性RNA包含所述靶RNA,并且其中所述治疗性蛋白是由所述致病性RNA编码的功能获得或丧失型突变的替代物。
本公开提供了一种组合物,所述组合物包含编码靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶RNA或由所述靶RNA编码的蛋白质,其中编码具有一个或多个功能获得或丧失型突变的致病性蛋白的致病性RNA包含所述靶RNA,并且其中所述治疗性蛋白是所述致病性蛋白的替代蛋白。
本公开还提供了一种组合物,所述组合物包含编码用于治疗色素性视网膜炎(RP)的靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶视紫红质RNA或由所述靶视紫红质RNA编码的蛋白质,其中编码具有一个或多个功能获得或丧失型视紫红质突变的致病性视紫红质蛋白的致病性视紫红质RNA包含所述靶视紫红质RNA,并且其中所述治疗性蛋白是野生型视紫红质蛋白。
在一些实施方案中,所述RNA结合多肽是RNA指导的RNA结合蛋白。在一些实施方案中,所述RNA指导的RNA结合蛋白是Cas13a、Cas13b、Cas13c或Cas13d。在一些实施方案中,所述RNA结合多肽是非指导的RNA结合多肽。在一些实施方案中,所述非指导的RNA结合多肽是PUF或PUMBY蛋白。在一些实施方案中,所述非指导的RNA结合多肽是PUF或PUMBY融合蛋白。在一个实施方案中,基于PUF或PUMBY的第一RNA结合蛋白与第二RNA结合蛋白融合,所述第二RNA结合蛋白是称为SEQ ID NO:358的ZC3H12A(本文中亦称为E17)的锌指核酸内切酶。
在一些实施方案中,所述治疗性替代基因(相应疾病)选自由以下组成的组:视紫红质(色素性视网膜炎)、PRPF3(色素性视网膜炎)、PRPF31(常染色体显性色素性视网膜炎)、GRN(FTD)、SOD1(ALS)、PMP22(夏科-马里-图思病)、PABPN1(眼咽型肌营养不良)、KCNQ4(听力损失)、CLRN1(乌谢尔综合征)、APOE2(阿尔茨海默氏病)、APOE4(阿尔茨海默氏病)、BEST1(眼病)、MYBPC3(家族性心肌病)、TNNT2(家族性心肌病)和TNNI3(家族性心肌病)。
在一些实施方案中,所述治疗性蛋白是视紫红质或野生型视紫红质。在一些实施方案中,所述治疗性蛋白是人视紫红质。在一些实施方案中,所述治疗性蛋白是“硬化的”视紫红质。
在本公开的组合物的一些实施方案中,所述致病性视紫红质RNA包含或编码至少一个功能获得或丧失型突变。
在一些实施方案中,所述视紫红质靶RNA包含GCCAGCGTGGCATTCTACATCTTC(SEQ IDNO:406)。在一些实施方案中,所述视紫红质靶RNA包含CAACGAGTCTTTTGTCATCTACATGT(SEQID NO:462)、CGCCAGCGTGGCATTCTACATCTTCA(SEQ ID NO:463)或CATCTATATCATGATGAACAAGCAGT(SEQ ID NO:464)。
在一些实施方案中,所述靶RNA编码在位置269至276处包含ASVAFYIF(SEQ ID NO:407)的氨基酸序列。在一些实施方案中,所述靶RNA编码在位置268至277处包含YASVAFYIFT(SEQ ID NO:486)的氨基酸。
在一些实施方案中,所述“硬化的”视紫红质由不包含视紫红质靶RNA的核酸序列编码,所述视紫红质靶RNA包含GCCAGCGTGGCATTCTACATCTTC(SEQ ID NO:406)。
在一些实施方案中,所述“硬化的”视紫红质由包含GCTTCCGTAGCTTTTTATATTTTT(SEQ ID NO:408)的核酸序列编码。
在一些实施方案中,所述核酸序列包含至少一个启动子。在一些实施方案中,所述至少一个启动子是组成型启动子或组织特异性启动子。在一些实施方案中,所述至少一个启动子选自由以下组成的组:视蛋白启动子、EFS启动子以及它们的组合。在一些实施方案中,所述核酸序列包含两个启动子。在一个实施方案中,所述两个启动子是驱动替代视紫红质蛋白的表达的视蛋白启动子和驱动与第二RNA结合蛋白融合的基于PUF或PUMBY的RNA结合蛋白的表达的EFS启动子,所述第二RNA结合蛋白是效应蛋白如ZC3H12A。
在本文所公开的一些实施方案中是包含本文所公开的敲低替代组合物的载体。在一些实施方案中,所述载体选自由以下组成的组:腺相关病毒、逆转录病毒、慢病毒、腺病毒、纳米颗粒、胶束、脂质体、阳离子脂质体-DNA复合物(lipoplex)、聚合物囊泡、聚合物-DNA复合物(polyplex)和树枝状聚合物。在本文所公开的一些实施方案中是包含本文所公开的载体的细胞。
在本文所公开的组合物的一些实施方案中,所述RNA结合多肽是第一RNA结合多肽,并且所述核酸序列编码第二RNA结合多肽,所述第二RNA结合多肽以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合多肽以切割RNA的方式与RNA缔合。在一些实施方案中,所述第二RNA结合多肽选自由以下组成的组:RNAse1、RNAse4、RNAse6、RNAse7、RNAse8、RNAse2、RNAse6PL、RNAseL、RNAseT2、RNAse11、RNAseT2样蛋白、NOB1、ENDOV、ENDOG、ENDOD1、hFEN1、hSLFN14、hLACTB2、APEX2、ANG、HRSP12、ZC3H12A、RIDA、PDL6、NTHL、KIAA0391、APEX1、AGO2、EXOG、ZC3H12D、ERN2、PELO、YBEY、CPSF4L、hCG_2002731、ERCC1、RAC1、RAA1、RAB1、DNA2、FLJ35220、FLJ13173、ERCC4、Rnase1(K41R)、Rnase1(K41R、D121E)、Rnase1(K41R、D121E、H119N)、Rnase1(H119N)、Rnase1(R39D、N67D、N88A、G89D、R91D、H119N)、Rnase1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E)、Rnase1(R39D、N67D、N88A、G89D、R91D)、TENM1、TENM2、RNAseK、TALEN、ZNF638和hSMG6。在一个实施方案中,所述第二RNA结合多肽是ZC3H12A。
在本公开的组合物的一些实施方案中,包含所述gRNA的序列还包含编码能够在真核细胞中表达所述gRNA的启动子的序列。
在本公开的组合物的一些实施方案中,所述gRNA包含间隔子序列,所述间隔子序列包含ACATGTAGATGACAAAAGACTCGTTG(SEQ ID NO:465)、TGAAGATGTAGAATGCCACGCTGGCG(SEQ ID NO:409)或ACTGCTTGTTCATCATGATATAGATG(SEQ ID NO:466)。
在本公开的组合物的一些实施方案中,所述真核细胞是动物细胞。在一些实施方案中,所述动物细胞是哺乳动物细胞。在一些实施方案中,所述动物细胞是人细胞。
在本公开的组合物的一些实施方案中,所述启动子是组成型活性启动子。在一些实施方案中,所述启动子序列是从能够驱动RNA聚合酶的表达的启动子分离或衍生的。在一些实施方案中,所述启动子序列是Pol II启动子。在一些实施方案中,所述启动子序列是从U6启动子分离或衍生的。在一些实施方案中,所述启动子是从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的序列。在一些实施方案中,所述启动子是从以下启动子分离或衍生的:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。在一些实施方案中,所述启动子是从缬氨酸tRNA启动子分离的或衍生的。
在本公开的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%的互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸、25个核苷酸、26个核苷酸、27个核苷酸、28个核苷酸或29个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含26个核苷酸或由其组成。在一些实施方案中,所述间隔子序列是未加工的并且包含30个核苷酸或由其组成。在一些实施方案中,所述未加工的间隔子序列包含30-36个核苷酸或由其组成。
在本公开的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
在本公开的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
在本公开的组合物的一些实施方案中,所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
在本公开的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包括取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包括核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在一些实施方案中,所述致病性RNA包含所述靶RNA,并且/或者所述靶RNA与所述致病性RNA相关。在一些实施方案中,所述致病性RNA编码功能获得或丧失型突变。
在本公开的组合物的一些实施方案中,所述RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。在一些实施方案中,所述RNA结合蛋白包含Cpf1多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包括取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包括核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开的组合物的一些实施方案中,所述RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。在一些实施方案中,所述RNA结合蛋白包含Cas13多肽或其RNA结合部分。在一些实施方案中,所述RNA结合蛋白包含Cas13d多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包括取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包括核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开的组合物的一些实施方案中,所述RNA结合蛋白是非指导的RNA结合蛋白。在一些实施方案中,所述非指导的RNA结合蛋白包含Pumilio和FBF(PUF)蛋白或其RNA结合部分。在一些实施方案中,所述RNA结合蛋白包含基于Pumilio的组装体(PUMBY)蛋白或其RNA结合部分。
在本公开的组合物的一些实施方案中,所述RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述RNA结合蛋白。
在本公开的组合物的一些实施方案中,所述RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。
在本公开的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
本公开的组合物的一些实施方案中,所述RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在本公开的组合物的一些实施方案中,编码所述RNA结合蛋白的序列还包含编码核定位信号(NLS)、核输出信号(NES)或标签的序列。在一些实施方案中,编码核定位信号(NLS)的序列定位于编码所述RNA结合蛋白的序列的N末端。在一些实施方案中,所述RNA结合蛋白在所述蛋白质的C末端包含NLS。
在本公开的组合物的一些实施方案中,编码所述RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述RNA结合蛋白的序列的N末端。在一些实施方案中,所述RNA结合蛋白在所述蛋白质的C末端包含第一NLS或第二NLS。
在本公开的组合物的一些实施方案中,所述组合物还包含第二RNA结合蛋白。在一些实施方案中,所述第二RNA结合蛋白包含核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合蛋白以切割RNA的方式与RNA缔合。在本公开的组合物的一些实施方案中,编码所述第二RNA结合蛋白的序列包含RNAse或由其组成。
在一些实施方案中,本公开的组合物用于治疗有需要的受试者的方法中,所述方法包括使靶RNA与编码敲低RNA和替代蛋白的核酸序列相接触。
在一些实施方案中,本文所公开的组合物用于降低致病性靶RNA分子或由所述致病性RNA分子编码的蛋白质的表达水平并用治疗性替代蛋白替代由所述致病性靶RNA引起的功能获得或丧失型突变的方法中,所述方法包括使本文所公开的组合物与包含靶RNA序列的所述致病性靶RNA分子在适合于所述RNA结合蛋白与所述靶RNA序列结合的条件下相接触,其中所述致病性靶RNA的表达水平降低,并且其中所述致病性靶RNA的表达被治疗性替代蛋白的表达所替代。
附图说明
本专利或申请文件含有至少一张彩图。本专利或专利申请公布的带有一张或多张彩图的副本,在提出请求并支付必要的费用之后,由专利办公室提供。
图1A至图1E是本公开的组合物的示例性实施方案的示意图,这些示意图描绘了促进同时敲低和替代致病性RNA的核酸序列设计。核酸序列A-E各自描述示例性载体序列。在这些实施方案中,聚合酶II(“Pol II”)启动子驱动RNA靶向蛋白的表达,并且聚合酶III启动子(“Pol III”)驱动任选的单一指导RNA(“sgRNA”)在还编码CRISPR相关(Cas)RNA靶向蛋白的载体中表达。替代蛋白由第二聚合酶II启动子或通过驱动RNA靶向蛋白的同一启动子提供。在单一聚合酶II启动系统的情况下,替代基因和RNA敲低系统由2A位点或内部核糖体进入位点(IRES)隔开。
图2是涉及敲低和替代载体的本公开的治疗性组合物和方法的实施方案的示意图。某些示意性载体设计封装在如腺相关病毒(AAV)的递送媒介物中,并以由AAV血清型和施用方法决定的方式递送至靶组织。一旦出现在靶组织中,治疗剂就会同时替代突变的RNA和编码的蛋白质,同时破坏突变的RNA。
图3是显示针对用于检测本文所公开的组合物的敲低效果的荧光素酶报告基因测定而设计的pmirGlo的示例性构型的质粒图谱。
图4是显示本文所公开的组合物的基于PUMBY的敲低和替代实施方案的质粒图谱。
图5是显示本文所公开的组合物的基于PUF的敲低和替代实施方案的质粒图谱。
图6A至图6C显示了本文所公开的组合物的实施方案。图6A显示了本公开的组合物的示例性实施方案的示意图,该示意图描绘了编码基于PUF或PUMBY的RNA结合效应子融合蛋白的核酸序列设计。图6B至图6C显示了视紫红质靶RNA的敲低和“硬化”视紫红质对靶RNA的替代。
图7A至图7B显示了视紫红质靶RNA的敲低和“硬化”视紫红质对靶RNA的替代。
图8显示了与无靶向相比的荧光素酶测定PUF靶向视紫红质敲低筛选。
具体实施方式
本公开提供了RNA靶向和基因替代的治疗性组合。特别地,本公开提供了用于以序列特异性方式特异性靶向和敲低引起毒性的功能获得或丧失型突变的致病性RNA分子、同时还用相应治疗性基因替代所靶向且敲低的基因的组合物和方法。在一个实施方案中,致病性RNA包含靶RNA序列。在一个实施方案中,致病性RNA包含靶RNA序列,但所述靶RNA序列不包含功能获得或丧失型突变。在另一个实施方案中,靶RNA在非编码RNA中。在进一步的实施方案中,致病性RNA包含一个或多个额外的靶RNA。特别地,本公开提供了一种组合物,所述组合物包含编码靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶RNA,其中致病性RNA包含所述靶RNA,并且其中所述治疗性蛋白是所述致病性RNA或由所述致病性RNA编码的蛋白质的野生型替代物。本公开提供了包含所述敲低和替代组合物的载体、组合物和细胞。本公开提供了使用本公开的敲低和替代系统、RNA指导的(如基于CRISPR/Cas的)或非RNA指导的(基于PUF或PUMBY的)RNA结合蛋白融合物、对应于RNA指导的CRISPR/Cas蛋白的指导RNA(gRNA)、治疗性替代基因或其部分、载体、组合物和细胞来治疗疾病或病症的方法。所述组合物还提供特定的靶RNA序列或特定的靶向RNA序列(例如,特定的gRNA间隔子序列)。
本公开的组合物和方法提供组合的敲低和治疗效果。因此,所述组合物包含编码以下项的核酸序列:1)能够切割包含靶RNA序列的致病性RNA的RNA结合多肽(RBP)或RNA结合结构域(RBD),和2)替代治疗性蛋白。在一些实施方案中,替代治疗性蛋白是致病性靶RNA或蛋白质的野生型蛋白。在一些实施方案中,治疗性(例如,野生型)替代蛋白替代由致病性靶RNA编码的功能获得或丧失型突变。
在一些实施方案中,RNA结合多肽是RNA指导的RNA结合多肽。在一些实施方案中,RNA指导的RNA结合多肽是CRISPR/Cas蛋白并且核酸序列还包含对应于靶RNA和CRISPR/Cas蛋白的gRNA序列。在一些实施方案中,RNA结合多肽不是RNA指导的RNA结合多肽。在特定实施方案中,非RNA指导的RNA结合多肽是PUF蛋白或PUMBY蛋白或其部分。在一些实施方案中,包含靶RNA的致病性RNA编码功能获得或丧失型突变。
在一些实施方案中,致病性RNA编码视紫红质基因中的功能获得或丧失型突变,而替代基因编码人视紫红质。在一些实施方案中,致病性视紫红质RNA包含视紫红质靶RNA。在一个实施方案中,视紫红质靶RNA序列包含GCCAGCGTGGCATTCTACATCTTC(SEQ ID NO:406)。在一些实施方案中,视紫红质靶RNA包含CAACGAGTCTTTTGTCATCTACATGT(SEQ ID NO:462)、CGCCAGCGTGGCATTCTACATCTTCA(SEQ ID NO:463)或CATCTATATCATGATGAACAAGCAGT(SEQ IDNO:464)。
在另一个实施方案中,视紫红质靶RNA编码包含ASVAFYIF(SEQ ID NO:407)的氨基酸。在一个实施方案中,视紫红质靶RNA编码在例如位置269至276处包含ASVAFYIF(SEQ IDNO:407)的氨基酸。在另一个实施方案中,靶RNA编码包含YASVAFYIFT(SEQ ID NO:486)的氨基酸。在另一个实施方案中,靶RNA编码在例如位置268至277处包含YASVAFYIFT(SEQ IDNO:486)的氨基酸。
在一些实施方案中,替代基因编码“硬化的”视紫红质。“硬化的”视紫红质是一种工程化的野生型视紫红质,其表达被工程化为不能使用本文所公开的组合物进行敲低。在一个实施方案中,“硬化的”视紫红质核酸序列包含至少一个错配。在另一个实施方案中,“硬化的”视紫红质核酸序列包含两个或更多个错配。在一个实施方案中,“硬化的”视紫红质由不包含视紫红质靶RNA的核酸序列编码,所述视紫红质靶RNA包含GCCAGCGTGGCATTCTACATCTTC SEQ ID NO:406。在另一个实施方案中,“硬化的”视紫红质由包含GCTTCCGTAGCTTTTTATATTTTT(SEQ ID NO:408)的核酸序列编码。在一些实施方案中,gRNA的间隔子序列是与视紫红质靶RNA互补的序列。在一个实施方案中,靶向视紫红质靶RNA的间隔子序列是ACATGTAGATGACAAAAGACTCGTTG(SEQ ID NO:465)、TGAAGATGTAGAATGCCACGCTGGCG(SEQ ID NO:409)或ACTGCTTGTTCATCATGATATAGATG(SEQ IDNO 466)。
指导RNA
术语指导RNA(gRNA)与单一指导RNA(sgRNA)在本公开通篇中可互换使用。
本公开的指导RNA(gRNA)可包含间隔子序列和支架和/或“同向重复”(DR)序列。在一些实施方案中,指导RNA是单一指导RNA(sgRNA),其包含连续间隔子序列和支架序列。在一些实施方案中,间隔子序列和支架序列是不连续的。在一些实施方案中,支架序列包含“同向重复”(DR)序列。在一些实施方案中,gRNA包含DR序列。DR序列是指CRISPR基因座(天然存在于细菌基因组或质粒中)中的重复性序列,其中散布有间隔子序列。众所周知,如果相关CRISPR基因座的序列是已知的,则将能够推断相应Cas蛋白的DR序列。在一些实施方案中,指导RNA包含同向重复(DR)序列和间隔子序列。在一些实施方案中,编码本公开的指导RNA或单一指导RNA的序列包含间隔子序列和支架序列和/或DR序列或由其组成,这些序列由接头序列隔开。在一些实施方案中,接头序列可包含1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或之间的任何数量的核苷酸或由其组成。在一些实施方案中,接头序列可包含至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或之间的任何数量的核苷酸。在一些实施方案中,支架序列是Cas9支架序列。在一些实施方案中,DR序列是Cas13d序列。
在一个实施方案中,以Cas l3d介导的方式与一个或多个靶RNA分子杂交的gRNA包括一个或多个同向重复(DR)序列、一个或多个间隔子序列,例如像一个或多个包含DR-间隔子-DR-间隔子阵列的序列。在一个实施方案中,从单一阵列产生多个gRNA,其中每个gRNA可不同,例如靶向不同的RNA或靶向单一RNA的多个区域,或它们的组合。在一些实施方案中,分离的gRNA包括一个或多个同向重复(DR)序列,如未加工的(例如,约36nt)或加工的DR(例如,约30nt)。在一些实施方案中,gRNA还可包括一个或多个特异于(例如,互补于)靶RNA的间隔子序列。在某些此类实施方案中,多个pol III启动子可用于驱动多个gRNA、间隔子和/或DR。在一个实施方案中,指导阵列包含DR(约36nt)-间隔子(约30nt)-DR(约36nt)-间隔子(约30nt)-DR(约36nt)。
本公开的指导RNA(gRNA)可包含非天然存在的核苷酸。在一些实施方案中,本公开的指导RNA或编码所述指导RNA的序列包含修饰的或合成的RNA核苷酸或由其组成。示例性的修饰的RNA核苷酸包括但不限于假尿苷(Ψ)、二氢尿苷(D)、肌苷(I)和7-甲基鸟苷(m7G)、次黄嘌呤、黄嘌呤、黄苷、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶、5-甲基胞苷、5-羟甲基胞嘧啶、异鸟嘌呤和异胞嘧啶。
本公开的指导RNA(gRNA)可结合靶序列内的修饰的RNA。在靶序列内,本公开的指导RNA(gRNA)可结合修饰的或突变的(例如,致病性)RNA。示例性的表观遗传或转录后修饰的RNA包括但不限于2'-O-甲基化(2'-OMe)(2'-O-甲基化发生在核糖部分的游离2'-OH的氧上)、N6-甲基腺苷(m6A)和5-甲基胞嘧啶(m5C)。
在本公开的组合物的一些实施方案中,本公开的指导RNA包含编码非编码C/D盒核仁小RNA(snoRNA)序列的至少一个序列。在一些实施方案中,snoRNA序列包含至少一个与靶RNA互补的序列,其中RNA分子的靶序列包含至少一个2'-OMe。在一些实施方案中,snoRNA序列包含至少一个与靶RNA互补的序列,其中所述至少一个与靶RNA互补的序列包含盒C基序(RUGAUGA)和盒D基序(CUGA)。
本公开的间隔子序列与RNA分子的靶序列结合。在一些实施方案中,本公开的间隔子序列与致病性靶RNA结合。
本公开的间隔子序列可包含CRISPR RNA(crRNA)。本公开的间隔子序列包含与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列或由其组成。在与RNA分子的靶序列结合后,间隔子序列可将支架序列和融合蛋白中的一者或多者指导至所述RNA分子。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或之间的任何百分比的同一性。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有100%同一性。
本公开的支架序列结合本公开的第一RNA结合多肽。本公开的支架序列可包含反式作用RNA(tracrRNA)。本公开的支架序列包含与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列或由其组成。在与RNA分子的靶序列结合后,支架序列可将融合蛋白指导至所述RNA分子。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或之间的任何百分比的同一性。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有100%同一性。或者,或另外地,在一些实施方案中,本公开的支架序列包含与本公开的融合蛋白的第一RNA结合蛋白或第二RNA结合蛋白结合的序列或由其组成。在一些实施方案中,本公开的支架序列包含二级结构或三级结构。示例性二级结构包括但不限于螺旋、茎环、凸起、四环和假结。示例性三级结构包括但不限于螺旋的A形式、螺旋的B形式和螺旋的Z形式。示例性三级结构包括但不限于扭曲的或螺旋化的茎环。示例性三级结构包括但不限于扭曲的或螺旋化的假结。在一些实施方案中,本公开的支架序列包含至少一个二级结构或至少一个三级结构。在一些实施方案中,本公开的支架序列包含一个或多个二级结构或一个或多个三级结构。
在本公开的组合物的一些实施方案中,指导RNA或其部分与本公开的RNA分子中的四环基序选择性结合。在一些实施方案中,RNA分子的靶序列包含四环基序。在一些实施方案中,四环基序是“GRNA”基序,所述基序包含GAAA、GUGA、GCAA或GAGA的序列中的一者或多者或由其组成。
在本公开的组合物的一些实施方案中,与RNA分子的靶序列结合的指导RNA或其部分与所述RNA分子的靶序列杂交。在一些实施方案中,与第一RNA结合蛋白或与第二RNA结合蛋白结合的指导RNA或其部分与第一RNA结合蛋白或与第二RNA结合蛋白共价结合。在一些实施方案中,与第一RNA结合蛋白或与第二RNA结合蛋白结合的指导RNA或其部分与第一RNA结合蛋白或与第二RNA结合蛋白非共价结合。
在本公开的组合物的一些实施方案中,指导RNA或其部分包含在10个与100个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开的间隔子序列包含在10个与30个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开的间隔子序列包含15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸或由其组成。在一些实施方案中,本公开的间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,本公开的间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,本公开的间隔子序列包含26个核苷酸或由其组成。
指导分子一般以各种加工状态存在。在一个实例中,未加工的指导RNA是36nt的DR,接着是30-32nt的间隔子。指导RNA由Cas l3d本身或其他RNase加工(截短/修饰)为较短的“成熟”形式。在一些实施方案中,未加工的指导序列的长度为约或至少约30、35、40、45、50、55、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75个或更多个核苷酸(nt)。在一些实施方案中,加工的指导序列为约44至60nt(如40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70nt)。在一些实施方案中,未加工的间隔子长约28-32nt(如25、26、27、28、29、30、31、32、33、34或35nt),而成熟(加工的)间隔子可为约10至30nt、10至25nt、14至25nt、20至22nt或14-30nt(如10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35nt)。在一些实施方案中,未加工的DR为约36nt(如30、31、32、33、34、35、36、37、38、39、40或41nt),而加工的DR为约30nt(如25、26、27、28、29、30、31、32、33、34或35nt)。在一些实施方案中,DR序列在例如5'端被截去1-10个核苷酸(如1、2、3、4、5、6、7、8、9或10个核苷酸)以便表达作为成熟的预加工的指导RNA。
在一些实施在一些实施方案中,本公开的支架序列例如像Cas9支架序列包含在10个与100个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开的支架序列包含30、35、40、45、50、55、60、65、70、76、80、87、90、95、100个或之间的任何数量的核苷酸或由其组成。在一些实施方案中,本公开的支架序列包含在85个与95个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开的支架序列包含85个核苷酸或由其组成。在一些实施方案中,本公开的支架序列包含90个核苷酸或由其组成。在一些实施方案中,本公开的支架序列包含93个核苷酸或由其组成。在本公开的组合物的一些实施方案中,包含gRNA的序列还包含与第一RNA结合蛋白特异性结合的支架序列。在一些实施方案中,支架序列包含茎环结构。在一些实施方案中,支架序列包含90个核苷酸或由其组成。在一些实施方案中,支架序列包含93个核苷酸或由其组成。在一些实施方案中,支架序列包含序列GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:403)或由其组成。在一些实施方案中,支架序列包含序列GGACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU(SEQ ID NO:404)或由其组成。在一些实施方案中,支架序列包含序列GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:405)或由其组成。
在本公开的组合物的一些实施方案中,指导RNA或其部分不包含核定位序列(NLS)。
在本公开的组合物的一些实施方案中,指导RNA或其部分不包含与原间隔子相邻基序(PAM)互补的序列。
本公开的治疗性组合物或药物组合物不包含PAMmer寡核苷酸。在其他实施方案中,任选地,非治疗性组合物或非药物组合物可包含PAMmer寡核苷酸。术语“PAMmer”是指这样的寡核苷酸:其包含能够与指导核苷酸序列可编程的RNA结合蛋白相互作用的PAM序列。PAMmer的非限制性实例描述于O’Connell等人Nature 516,第263-266页(2014)中,所述文献以引用方式并入本文。PAM序列是指包含约2至约10个核苷酸的原间隔子相邻基序。PAM序列对与其相互作用的指导核苷酸序列可编程的RNA结合蛋白具有特异性,并且是本领域中已知的。例如,酿脓链球菌(Streptococcus pyogenes)PAM具有序列5'-NGG-3',其中“N”是任何核苷碱基,之后有两个鸟嘌呤(“G”)核苷碱基。新凶手弗朗西斯菌(Francisellanovicida)的Cas9识别规范PAM序列5'-NGG-3',但是已经被工程化以识别PAM 5'-YG-3’(其中“Y”是嘧啶),从而添加至可能的Cas9靶标的范围内。新凶手弗朗西斯菌的Cpf1核酸酶识别PAM 5'-TTTN-3'或5'-YTN-3'。
在本公开的组合物的一些实施方案中,指导RNA或其部分包含与原间隔子侧翼序列(PFS)互补的序列。在一些实施方案(包括其中指导RNA或其部分包含与PFS互补的序列的那些实施方案)中,第一RNA结合蛋白可包含从Cas13蛋白分离或衍生的序列。在一些实施方案(包括其中指导RNA或其部分包含与PFS互补的序列的那些实施方案)中,第一RNA结合蛋白可包含编码Cas13蛋白或其RNA结合部分的序列。在一些实施方案中,所述指导RNA或其部分不包含与PFS互补的序列。
在本公开的组合物的一些实施方案中,本公开的指导RNA序列包含用于驱动指导RNA的表达的启动子序列。在一些实施方案中,包含本公开的指导RNA序列的载体包含用于驱动指导RNA的表达的启动子序列。在一些实施方案中,用于驱动指导RNA的表达的启动子是组成型启动子。在一些实施方案中,所述启动子序列是诱导型启动子。在一些实施方案中,所述启动子是序列是组织特异性和/或细胞类型特异性启动子。在一些实施方案中,所述启动子是杂合启动子或重组启动子。在一些实施方案中,所述启动子是能够在哺乳动物细胞中表达指导RNA的启动子。在一些实施方案中,所述启动子是能够在人细胞中表达指导RNA的启动子。在一些实施方案中,所述启动子是能够表达指导RNA并将指导RNA限制于细胞核的启动子。在一些实施方案中,所述启动子是人RNA聚合酶启动子或从编码人RNA聚合酶启动子的序列分离或衍生的序列。在一些实施方案中,所述启动子是U6启动子或从编码U6启动子的序列分离或衍生的序列。在一些实施方案中,所述启动子是人tRNA启动子或从编码人tRNA启动子的序列分离或衍生的序列。在一些实施方案中,所述启动子是人缬氨酸tRNA启动子或从编码人缬氨酸tRNA启动子的序列分离或衍生的序列。
在本公开的组合物的一些实施方案中,用于驱动指导RNA的表达的启动子还包含调控元件。在一些实施方案中,包含用于驱动指导RNA的表达的启动子序列的载体还包含调控元件。在一些实施方案中,调控元件增强指导RNA的表达。示例性调控元件包括但不限于增强子元件、内含子、外显子或它们的组合。
在本公开的组合物的一些实施方案中,本公开的载体包含编码指导RNA的序列、用于驱动指导RNA的表达的启动子序列和编码调控元件的序列中的一者或多者。在本公开的组合物的一些实施方案中,所述载体还包含编码本公开的融合蛋白的序列。
在本公开的组合物的一些实施方案中,gRNA对应于靶RNA分子和RNA指导的RNA结合蛋白。在一些实施方案中,gRNA对应于RNA指导的RNA结合融合蛋白,其中所述融合蛋白包含第一和第二RNA结合蛋白。在一些实施方案中,沿着编码RNA结合融合蛋白的序列,编码第一RNA结合蛋白的序列位于编码第二RNA结合蛋白的序列的5'。在一些实施方案中,沿着编码融合蛋白的序列,编码第一RNA结合蛋白的序列位于编码第二RNA结合蛋白的序列的3'。
在本公开的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够选择性结合RNA分子,并且不结合DNA分子、哺乳动物DNA分子或任何DNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,并且诱导所述RNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,诱导所述RNA分子中的断裂,并且不结合DNA分子、哺乳动物DNA分子或任何DNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,诱导所述RNA分子中的断裂,并且既不结合DNA分子、哺乳动物DNA分子或任何DNA分子,也不诱导所述DNA分子中的断裂。
在本公开的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从没有DNA核酸酶活性的蛋白质分离或衍生的序列。
在本公开的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从具有DNA核酸酶活性的蛋白质分离或衍生的序列,其中在使本公开的组合物与RNA分子接触或引入本公开的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。
在本公开的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从具有DNA核酸酶活性的蛋白质分离或衍生的序列,其中所述DNA核酸酶活性是失活的,并且其中在使本公开的组合物与RNA分子接触或引入本公开的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含使DNA核酸酶活性失活或降低至以下水平的突变,在所述水平下,在使本公开的组合物与RNA分子接触或引入本公开的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含使DNA核酸酶活性失活或降低的突变,并且所述突变包含对编码第一RNA结合蛋白或其核酸酶结构域的核酸序列或氨基酸序列的取代、倒位、转座、插入、缺失或它们的任何组合中的一者或多者。
在本公开的组合物的一些实施方案中,编码本文所公开的RNA指导的RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,CRISPR Cas蛋白包含II型CRISPR Cas蛋白。在一些实施方案中,II型CRISPR Cas蛋白包含Cas9蛋白。本公开的示例性Cas9蛋白可从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开的示例性Cas9蛋白可从任何物种分离或衍生,所述物种包括但不限于酿脓链球菌、地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉弗朗西斯菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀巴斯德菌(Pasteurella multocida)、脑膜炎奈瑟球菌(Neisseria meningitidis)、空肠弯曲杆菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)、红嘴鸥弯曲杆菌CF89-12(Campylobacter lari CF89-12)、鸡毒支原体F株(Mycoplasma gallisepticumstr.F)、卤水硝酸盐裂解菌DSM 16511株(Nitratifractor salsuginis str.DSM 16511)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburiaintestinalis)、灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌B510(Azospirillum B510)、球状螺旋菌巴迪株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare)、塔夫河栖河菌(Fluviicola taffensis)、嗜粪拟杆菌(Bacteroides coprophilus)、运动支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis)、巴氏链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、伪中间型葡萄球菌(Staphylococcus pseudintermedius)、龈沟产线菌(Filifactor alocis)、齿垢密螺旋体(Treponema denticola)、嗜肺军团菌巴黎株(Legionella pneumophila str.Paris)、华德萨特氏菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacterdiphtherias)、金黄色葡萄球菌(Streptococcus aureus)和新凶手弗朗西斯菌。
本公开的示例性的野生型酿脓链球菌Cas9蛋白可包含SEQ ID NO:416的氨基酸序列或由其组成。
核酸酶失活的酿脓链球菌Cas9蛋白可包含丙氨酸(A)取代位置10的天冬氨酸(D)以及丙氨酸(A)取代位置840的组氨酸(H)。本公开的示例性的核酸酶失活的酿脓链球菌Cas9蛋白可包含(EQ ID NO:417的氨基酸序列或由其组成(D10A和H840A加粗并加下划线)。
核酸酶失活的酿脓链球菌Cas9蛋白可包含RuvC核酸酶结构域或其部分、HNH结构域、DNAse活性位点、包含DNAse活性位点的ββα-金属折叠或其部分或它们的任何组合的缺失。
其他示例性Cas9蛋白或其部分可包含以下氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是酿脓链球菌Cas9,并且可包含SEQ ID NO:418的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是金黄色葡萄球菌Cas9,并且可包含SEQ IDNO:419的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是嗜热链球菌CRISPR1 Cas9,并且可包含SEQID NO:420的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是脑膜炎奈瑟球菌Cas9,并且可包含SEQ IDNO:421的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是食清洁剂细小棒菌Cas9,并且可包含SEQ IDNO:422的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是白喉棒状杆菌Cas9,并且可包含SEQ ID NO:423的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是巴氏链球菌Cas9,并且可包含SEQ ID NO:424的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是灰色奈瑟球菌Cas9,并且可包含SEQ ID NO:425的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是红嘴鸥弯曲杆菌Cas9,并且可包含SEQ IDNO:426的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是齿垢密螺旋体Cas9,并且可包含SEQ ID NO:427的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是变异链球菌Cas9,并且可包含SEQ ID NO:428的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是嗜热链球菌CRISPR 3 Cas9,并且可包含SEQID NO:429的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是空肠弯曲杆菌Cas9,并且可包含SEQ ID NO:430的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是多杀巴斯德菌Cas9,并且可包含SEQ ID NO:431的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是新凶手弗朗西斯菌Cas9,并且可包含SEQ IDNO:432的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是布氏乳杆菌(Lactobacillus buchneri)Cas9,并且可包含SEQ ID NO:433的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是无害李斯特菌(Listeria innocua)Cas9,并且可包含SEQ ID NO:434的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是嗜肺军团菌Cas9,并且可包含SEQ ID NO:435的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是嗜乳糖奈瑟球菌(N.lactamica)Cas9,并且可包含SEQ ID NO:436的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是脑膜炎奈瑟球菌Cas9,并且可包含SEQ IDNO:437的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是长双歧杆菌(B.longum)Cas9,并且可包含SEQID NO:438的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是嗜粘蛋白艾克曼菌(A.muciniphila)Cas9,并且可包含SEQ ID NO:439的氨基酸序列或由其组成。
在一些实施方案中,Cas9蛋白可以是兰氏臭杆菌(O.laneus)Cas9,并且可包含SEQID NO:440的氨基酸序列或由其组成。
在本公开的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从CRISPR Cas蛋白或其部分分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含V型CRISPR Cas蛋白。在一些实施方案中,所述V型CRISPR Cas蛋白包含Cpf1蛋白。本公开的示例性Cpf1蛋白可从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开的示例性Cpf1蛋白可从任何物种分离或衍生,所述物种包括但不限于土拉弗朗西斯菌新凶手亚种、氨基酸球菌属种(Acidaminococcus sp.)BV3L6和毛螺菌科细菌物种ND2006。本公开的示例性Cpf1蛋白可以是核酸酶失活的。
本公开的示例性野生型土拉弗朗西斯菌新凶手亚种Cpf1(FnCpf1)蛋白可包含SEQID NO:441的氨基酸序列或由其组成。
本公开的示例性野生型毛螺菌科细菌物种ND2006 Cpf1(LbCpf1)蛋白可包含SEQID NO:442的氨基酸序列或由其组成。
本公开的示例性野生型氨基酸球菌属物种BV3L6 Cpf1(AsCpf1)蛋白可包含SEQID NO:443的氨基酸序列或由其组成。
在本公开的组合物的一些实施方案中,编码RNA结合蛋白的序列包含从CRISPRCas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含VI型CRISPR Cas蛋白或其部分。在一些实施方案中,所述VI型CRISPR Cas蛋白包含Cas13蛋白或其部分。本公开的示例性Cas13蛋白可从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开的示例性Cas13蛋白可从任何物种分离或衍生,所述物种包括但不限于韦德纤毛菌(Leptotrichia wadei)、斯氏李斯特菌血清变型(Listeria seeligeri serovar)1/2b(菌株ATCC35967/DSM 20751/CIP 100100/SLCC 3954)、毛螺菌科细菌、嗜氨梭菌(Clostridiumaminophilum)DSM 10710、鸡肉杆菌(Carnobacterium gallinarum)DSM 4847、产丙酸沼杆菌(Paludibacter propionicigenes)WB4、韦氏李斯特菌(Listeria weihenstephanensis)FSL R9-0317、韦氏李斯特菌FSL R9-0317、细菌FSL M6-0635(纽约李斯特菌(Listerianewyorkensis))、韦德纤毛菌F0279、荚膜红细菌(Rhodobacter capsulatus)SB 1003、荚膜红细菌R121、荚膜红细菌DE442和溃疡棒状杆菌(Corynebacterium ulcerans)。本公开的示例性Cas13蛋白可以是DNA核酸酶失活的。本公开的示例性Cas13蛋白包括但不限于Cas13a、Cas13b、Cas13c、Cas13d及其直系同源物。本公开的示例性Cas13b蛋白包括但不限于亚型1和2,在本文中分别称为Csx27和Csx28。
示例性Cas13a蛋白包括但不限于:
Figure BDA0003526863300000271
Figure BDA0003526863300000281
Figure BDA0003526863300000291
本公开的示例性野生型Cas13a蛋白可包含SEQ ID NO:459的氨基酸序列或由其组成。
示例性Cas13b蛋白包括但不限于:
Figure BDA0003526863300000292
Figure BDA0003526863300000301
Figure BDA0003526863300000311
Figure BDA0003526863300000321
本公开的示例性野生型动物溃疡伯格菌ATCC 43767Cas13b(BzCas13b)蛋白可包含SEQ ID NO:460的氨基酸序列或由其组成。
在本公开的组合物的一些实施方案中,编码RNA结合蛋白的序列包含从Cas13d蛋白分离或衍生的序列。Cas13d是VI-D型CRISPR-Cas系统的效应子。在一些实施方案中,所述Cas13d蛋白是可切割或结合RNA的RNA指导的RNA核酸内切酶。在一些实施方案中,所述Cas13d蛋白可包括一个或多个高等真核生物和原核生物核苷酸结合(HEPN)结构域。在一些实施方案中,所述Cas13d蛋白可包括野生型或突变的HEPN结构域。在一些实施方案中,所述Cas13d蛋白包括不能切割RNA但可加工指导RNA的突变的HEPN结构域。在一些实施方案中,所述Cas13d蛋白不需要原间隔子侧翼序列。非限制地,关于Cas13d蛋白的其他实例和序列还参见WO公布号WO2019/040664和US2019/0062724,所述文献以引用方式整体并入本文。
在一些实施方案中,本公开的Cas13d序列包括但不限于WO2019/040664的SEQ IDNO:1-296,这些序列在本文中如此编号并包含在此。
SEQ ID NO:1是来自惰性真杆菌(Eubacterium siraeum)的示例性Cas13d序列,含有HEP位点。
SEQ ID NO:2是来自惰性真杆菌的示例性Cas13d序列,含有突变的HEPN位点。
SEQ ID NO:3是来自未培养的瘤胃球菌属种的示例性Cas13d序列,含有HEPN位点。
SEQ ID NO:4是来自未培养的瘤胃球菌属种的示例性Cas13d序列,含有突变的HEPN位点。
SEQ ID NO:5是来自肠道_宏基因组_重叠群2791000549的示例性Cas13d序列。
SEQ ID NO:6是来自肠道_宏基因组_重叠群855000317的示例性Cas13d序列。
SEQ ID NO:7是来自肠道_宏基因组_重叠群3389000027的示例性Cas13d序列。
SEQ ID NO:8是来自肠道_宏基因组_重叠群8061000170的示例性Cas13d序列。
SEQ ID NO:9是来自肠道_宏基因组_重叠群l509000299的示例性Cas13d序列。
SEQ ID NO:10是来自肠道_宏基因组_重叠群9549000591的示例性Cas13d序列。
SEQ ID NO:11是来自肠道_宏基因组_重叠群71000500的示例性Cas13d序列。
SEQ ID NO:12是来自人肠道宏基因组的示例性Cas13d序列。
SEQ ID NO:13是来自肠道_宏基因组_重叠群3915000357的示例性Cas13d序列。
SEQ ID NO:14是来自肠道_宏基因组_重叠群4719000173的示例性Cas13d序列。
SEQ ID NO:15是来自肠道_宏基因组_重叠群6929000468的示例性Cas13d序列。
SEQ ID NO:16是来自肠道_宏基因组_重叠群7367000486的示例性Cas13d序列。
SEQ ID NO:17是来自肠道_宏基因组_重叠群7930000403的示例性Cas13d序列。
SEQ ID NO:18是来自肠道_宏基因组_重叠群993000527的示例性Cas13d序列。
SEQ ID NO:19是来自肠道_宏基因组_重叠群6552000639的示例性Cas13d序列。
SEQ ID NO:20是来自肠道_宏基因组_重叠群ll932000246的示例性Cas13d序列。
SEQ ID NO:21是来自肠道_宏基因组_重叠群l2963000286的示例性Cas13d序列。
SEQ ID NO:22是来自肠道_宏基因组_重叠群2952000470的示例性Cas13d序列。
SEQ ID NO:23是来自肠道_宏基因组_重叠群451000394的示例性Cas13d序列。
SEQ ID NO:24是来自惰性真杆菌_DSM_l5702的示例性Cas13d序列。
SEQ ID NO:25是来自肠道_宏基因组_P19E0k2120140920,_c369000003的示例性Cas13d序列。
SEQ ID NO:26是来自肠道_宏基因组_重叠群7593000362的示例性Cas13d序列。
SEQ ID NO:27是来自肠道_宏基因组_重叠群l2619000055的示例性Cas13d序列。
SEQ ID NO:28是来自肠道_宏基因组_重叠群l405000151的示例性Cas13d序列。
SEQ ID NO:29是来自鸡_肠道_宏基因组_c298474的示例性Cas13d序列。
SEQ ID NO:30是来自肠道_宏基因组_重叠群l516000227的示例性Cas13d序列。
SEQ ID NO:31是来自肠道_宏基因组_重叠群l838000319的示例性Cas13d序列。
SEQ ID NO:32是来自肠道_宏基因组_重叠群13123000268的示例性Cas13d序列。
SEQ ID NO:33是来自肠道_宏基因组_重叠群5294000434的示例性Cas13d序列。
SEQ ID NO:34是来自肠道_宏基因组_重叠群6415000192的示例性Cas13d序列。
SEQ ID NO:35是来自肠道_宏基因组_重叠群6144000300的示例性Cas13d序列。
SEQ ID NO:36是来自肠道_宏基因组_重叠群9118000041的示例性Cas13d序列。
SEQ ID NO:37是来自激活的_污泥_宏基因组_转录物124486的示例性Cas13d序列。
SEQ ID NO:38是来自肠道_宏基因组_重叠群1322000437的示例性Cas13d序列。
SEQ ID NO:39是来自肠道_宏基因组_重叠群4582000531的示例性Cas13d序列。
SEQ ID NO:40是来自肠道_宏基因组_重叠群9190000283的示例性Cas13d序列。
SEQ ID NO:41是来自肠道_宏基因组_重叠群l709000510的示例性Cas13d序列。
SEQ ID NO:42是来自M24_(LSQX01212483_厌氧消化器_宏基因组)的示例性Cas13d序列,具有HEPN结构域。
SEQ ID NO:43是来自肠道_宏基因组_重叠群3833000494的示例性Cas13d序列。
SEQ ID NO:44是来自激活的_污泥_宏基因组_转录物_117355的示例性Cas13d序列。
SEQ ID NO:45是来自肠道_宏基因组_重叠群ll061000330的示例性Cas13d序列。
SEQ ID NO:46是来自来自绵羊肠道宏基因组的肠道_宏基因组_重叠群338000322的示例性Cas13d序列。
SEQ ID NO:47是来自人肠道宏基因组的示例性Cas13d序列。
SEQ ID NO:48是来自肠道_宏基因组_重叠群9530000097的示例性Cas13d序列。
SEQ ID NO:49是来自肠道_宏基因组_重叠群l750000258的示例性Cas13d序列。
SEQ ID NO:50是来自肠道_宏基因组_重叠群5377000274的示例性Cas13d序列。
SEQ ID NO:51是来自肠道_宏基因组_P19E0k2120140920_c248000089的示例性Cas13d序列。
SEQ ID NO:52是来自肠道_宏基因组_重叠群ll400000031的示例性Cas13d序列。
SEQ ID NO:53是来自肠道_宏基因组_重叠群7940000191的示例性Cas13d序列。
SEQ ID NO:54是来自肠道_宏基因组_重叠群6049000251的示例性Cas13d序列。
SEQ ID NO:55是来自肠道_宏基因组_重叠群l137000500的示例性Cas13d序列。
SEQ ID NO:56是来自肠道_宏基因组_重叠群9368000105的示例性Cas13d序列。
SEQ ID NO:57是来自肠道_宏基因组_重叠群546000275的示例性Cas13d序列。
SEQ ID NO:58是来自肠道_宏基因组_重叠群7216000573的示例性Cas13d序列。
SEQ ID NO:59是来自肠道_宏基因组_重叠群4806000409的示例性Cas13d序列。
SEQ ID NO:60是来自肠道_宏基因组_重叠群l0762000480的示例性Cas13d序列。
SEQ ID NO:61是来自肠道_宏基因组_重叠群4114000374的示例性Cas13d序列。
SEQ ID NO:62是来自生黄瘤胃球菌_FD1的示例性Cas13d序列。
SEQ ID NO:63是来自肠道_宏基因组_重叠群7093000170的示例性Cas13d序列。
SEQ ID NO:64是来自肠道_宏基因组_重叠群l1113000384的示例性Cas13d序列。
SEQ ID NO:65是来自肠道_宏基因组_重叠群6403000259的示例性Cas13d序列。
SEQ ID NO:66是来自肠道_宏基因组_重叠群6193000124的示例性Cas13d序列。
SEQ ID NO:67是来自肠道_宏基因组_重叠群721000619的示例性Cas13d序列。
SEQ ID NO:68是来自肠道_宏基因组_重叠群l666000270的示例性Cas13d序列。
SEQ ID NO:69是来自肠道_宏基因组_重叠群2002000411的示例性Cas13d序列。
SEQ ID NO:70是来自白色瘤胃球菌(Ruminococcus_albus)的示例性Cas13d序列。
SEQ ID NO:71是来自肠道_宏基因组_重叠群13552000311的示例性Cas13d序列。
SEQ ID NO:72是来自肠道_宏基因组_重叠群l0037000527的示例性Cas13d序列。
SEQ ID NO:73是来自肠道_宏基因组_重叠群238000329的示例性Cas13d序列。
SEQ ID NO:74是来自肠道_宏基因组_重叠群2643000492的示例性Cas13d序列。
SEQ ID NO:75是来自肠道_宏基因组_重叠群874000057的示例性Cas13d序列。
SEQ ID NO:76是来自肠道_宏基因组_重叠群4781000489的示例性Cas13d序列。
SEQ ID NO:77是来自肠道_宏基因组_重叠群l2144000352的示例性Cas13d序列。
SEQ ID NO:78是来自肠道_宏基因组_重叠群5590000448的示例性Cas13d序列。
SEQ ID NO:79是来自肠道_宏基因组_重叠群9269000031的示例性Cas13d序列。
SEQ ID NO:80是来自肠道_宏基因组_重叠群8537000520的示例性Cas13d序列。
SEQ ID NO:81是来自肠道_宏基因组_重叠群l845000130的示例性Cas13d序列。
SEQ ID NO:82是来自肠道_宏基因组_P13E0k2l20140920_c3000072的示例性Cas13d序列。
SEQ ID NO:83是来自肠道_宏基因组_P1 E0k2l20140920_cI000078的示例性Cas13d序列。
SEQ ID NO:84是来自肠道_宏基因组_重叠群l2990000099的示例性Cas13d序列。
SEQ ID NO:85是来自肠道_宏基因组_重叠群525000349的示例性Cas13d序列。
SEQ ID NO:86是来自肠道_宏基因组_重叠群7229000302的示例性Cas13d序列。
SEQ ID NO:87是来自肠道_宏基因组_重叠群3227000343的示例性Cas13d序列。
SEQ ID NO:88是来自肠道_宏基因组_重叠群7030000469的示例性Cas13d序列。
SEQ ID NO:89是来自肠道_宏基因组_重叠群5149000068的示例性Cas13d序列。
SEQ ID NO:90是来自肠道_宏基因组_重叠群400200045的示例性Cas13d序列。
SEQ ID NO:91是来自肠道_宏基因组_重叠群l0420000446的示例性Cas13d序列。
SEQ ID NO:92是来自新_生黄_菌株_XPD3002(CasRx)的示例性Cas13d序列。
SEQ ID NO:93是来自M26_肠道_宏基因组_重叠群698000307的示例性Cas13d序列。
SEQ ID NO:94是来自M36_未培养的_真杆菌属种_TS28_c40956的示例性Cas13d序列。
SEQ ID NO:95是来自M12_肠道_宏基因组_P25C0k2l20140920_c134000066的示例性Cas13d序列。
SEQ ID NO:96是来自人肠道宏基因组的示例性Cas13d序列。
SEQ ID NO:97是来自MlO_肠道_宏基因组_P25C90k2120 l40920_c2800004l的示例性Cas13d序列。
SEQ ID NO:98是来自30Ml I_肠道_宏基因组_P25C7k2120140920_c4078000105的示例性Cas13d序列。
SEQ ID NO:99是来自肠道_宏基因组_P25C0k2120l40920_c32000045的示例性Cas13d序列。
SEQ ID NO:100是来自M13_肠道_宏基因组_P23C7k2l20140920_c3000067的示例性Cas13d序列。
SEQ ID NO:101是来自M5_肠道_宏基因组_Pl8E90k2120140920的示例性Cas13d序列。
SEQ ID NO:102是来自M2l_肠道_宏基因组_Pl8E0k2120140920的示例性Cas13d序列。
SEQ ID NO:103是来自M7_肠道_宏基因组_P38C7k2120 l40920_c484 l 000003的示例性Cas13d序列。
SEQ ID NO:104是来自二环瘤胃球菌(Ruminococcus_bicirculans)的示例性Cas13d序列。
SEQ ID NO:105是示例性Cas13d序列。
SEQ ID NO:106是示例性Cas13d共有序列。
SEQ ID NO:107是来自M18_肠道_宏基因组_P22EOk2l20140920_c3395000078的示例性Cas13d序列。
SEQ ID NO:108是来自M17_肠道_宏基因组_P22E90k2120140920_c114的示例性Cas13d序列。
SEQ ID NO:109是来自瘤胃球菌属种_CAG57的示例性Cas13d序列。
SEQ ID NO:110是来自肠道_宏基因组_Pl 1E90k2120 l40920_c43000123的示例性Cas13d序列。
SEQ ID NO:111是来自M6_肠道_宏基因组_P13E90k2120 l40920_c7000009的示例性Cas13d序列。
SEQ ID NO:112是来自Ml9_肠道_宏基因组_Pl 7E90k2120140920的示例性Cas13d序列。
SEQ ID NO:113是来自肠道_宏基因组_Pl7E0k2120l40920,_c87000043的示例性Cas13d序列。
SEQ ID NO:114是示例性的人密码子优化的惰性真杆菌Cas13d核酸序列。
SEQ ID NO:115是具有突变型HEPN结构域的示例性的人密码子优化的惰性真杆菌Cas13d核酸序列。
SEQ ID NO:116是具有N末端NLS的示例性的人密码子优化的惰性真杆菌Cas13d核酸序列。
SEQ ID NO:117是具有N末端和C末端NLS标签的示例性的人密码子优化的惰性真杆菌Cas13d核酸序列。
SEQ ID NO:118是示例性的人密码子优化的未培养的瘤胃球菌属种Cas13d 30核酸序列。
SEQ ID NO:119是具有突变型HEPN结构域的示例性的人密码子优化的未培养的瘤胃球菌属种Cas13d核酸序列。
SEQ ID NO:120是具有N末端NLS的示例性的人密码子优化的未培养的瘤胃球菌属种Cas13d核酸序列。
SEQ ID NO:121是具有N末端和C末端NLS标签的示例性的人密码子优化的未培养的瘤胃球菌属种Cas13d核酸序列。
SEQ ID NO:122是示例性的人密码子优化的未培养的生黄瘤胃球菌(Ruminococcus flavefaciens)FDl Cas13d核酸序列。
SEQ ID NO:123是具有突变的HEPN结构域的示例性的人密码子优化的未培养的生黄瘤胃球菌FDl Casl3d核酸序列。
SEQ ID NO:124是来自二环瘤胃球菌(Ruminococcus bicirculans)的示例性Cas13d核酸序列。
SEQ ID NO:125是来自惰性真杆菌的示例性Cas13d核酸序列。
SEQ ID NO:126是来自生黄瘤胃球菌FD1的示例性Cas13d核酸序列。
SEQ ID NO:127是来自白色瘤胃球菌(Ruminococcus albus)的示例性Cas13d核酸序列。
SEQ ID NO:128是来自生黄瘤胃球菌XPD的示例性Cas13d核酸序列。
SEQ ID NO:129是惰性真杆菌Cas13d的示例性共有DR核酸序列。
SEQ ID NO:130是瘤胃球菌属种Cas13d的示例性共有DR核酸序列。
SEQ ID NO:131是生黄瘤胃球菌菌株XPD3002 Cas13d(CasRx)的示例性共有DR核酸序列。
SEQ ID NO:132-137是示例性共有DR核酸序列。
SEQ ID NO:138是七个全长Cas13d直系同源物的示例性50%共有序列。
SEQ ID NO:139是来自肠道宏基因组PlEO的示例性Cas13d核酸序列。
SEQ ID NO:140是来自厌氧消化器的示例性Cas13d核酸序列。
SEQ ID NO:141是来自瘤胃球菌属种CAG:57的示例性Cas13d核酸序列。
SEQ ID NO:142是示例性的人密码子优化的未培养的肠道宏基因组PlEO Cas13d核酸序列。
SEQ ID NO:143是示例性的人密码子优化的厌氧消化器Cas13d核酸序列。
SEQ ID NO:144是示例性的人密码子优化的生黄瘤胃球菌XPD Cas13d核酸序列。
SEQ ID NO:145是示例性的人密码子优化的白色瘤胃球菌Cas13d核酸序列。
SEQ ID NO:146是瘤胃球菌属种CAG:57CRISPR阵列的示例性加工。
SEQ ID NO:147是来自重叠群emb|OBVH01003037.l,人肠道宏基因组序列(也发现于WGS重叠群emb|OBXZ01000094.l|和emb|OBJFO1000033.1的示例性Cas13d蛋白序列。
SEQ ID NO:148是示例性共有DR核酸序列(伴随SEQ ID NO:147)。
SEQ ID NO:149是来自重叠群tpg|DBYI01000091.l|(从牛肠道宏基因组组装的未培养的生黄瘤胃球菌UBA1190)的示例性Cas13d蛋白序列。
SEQ ID NO:150-152是示例性共有DR核酸序列(伴随SEQ ID NO:149)。
SEQ ID NO:153是来自重叠群tpg|DJXD01000002.l|(未培养的瘤胃球菌组装体,UBA7013,来自绵羊肠道宏基因组)的示例性Cas13d蛋白序列。
SEQ ID NO:154是示例性共有DR核酸序列(伴随SEQ ID NO:153)。
SEQ ID NO:155是来自重叠群OGZC01000639.l(人肠道宏基因组组装体)的示例性Cas13d蛋白序列。
SEQ ID NO:156-177是示例性共有DR核酸序列(伴随SEQ ID NO:155)。
SEQ ID NO:158是来自重叠群emb|OHBM01000764.l(人肠道宏基因组组装体)的示例性Cas13d蛋白序列。
SEQ ID NO:159是示例性共有DR核酸序列(伴随SEQ ID NO:158)。
SEQ ID NO:160是来自重叠群emb|0HCP01000044.l(人肠道宏基因组组装体)的示例性Cas13d蛋白序列。
SEQ ID NO:161是示例性共有DR核酸序列(伴随SEQ ID NO:160)。
SEQ ID NO:162是来自重叠群embl0GDF01008514.l|(人肠道宏基因组组装体)的示例性Cas13d蛋白序列。
SEQ ID NO:163是示例性共有DR核酸序列(伴随SEQ ID NO:162)。
SEQ ID NO:164是来自重叠群emb|0GPN01002610.l(人肠道宏基因组组装体)的示例性Cas13d蛋白序列。
SEQ ID NO:165是示例性共有DR核酸序列(伴随SEQ ID NO:164)。
SEQ ID NO:166是来自重叠群NFIR01000008.l(真杆菌属种An3,来自鸡肠道宏基因组)的示例性Cas13d蛋白序列。
SEQ ID NO:167是示例性共有DR核酸序列(伴随SEQ ID NO:166)。
SEQ ID NO:168是来自重叠群NFLV01000009.l(真杆菌属种An11,来自鸡肠道宏基因组)的示例性Cas13d蛋白序列。
SEQ ID NO:169是示例性共有DR核酸序列(伴随SEQ ID NO:168)。
SEQ ID NO:171-174是示例性Cas13d基序序列。
SEQ ID NO:175是来自重叠群OJMM01002900人肠道宏基因组序列的示例性Cas13d蛋白序列。
SEQ ID NO:176是示例性共有DR核酸序列(伴随SEQ ID NO:175)。
SEQ ID NO:177是来自重叠群ODAI011611274.l肠道宏基因组序列的示例性Cas13d蛋白序列。
SEQ ID NO:178是示例性共有DR核酸序列(伴随SEQ ID NO:177)。
SEQ ID NO:179是来自重叠群OIZX01000427.l的示例性Cas13d蛋白序列。
SEQ ID NO:180是示例性共有DR核酸序列(伴随SEQ ID NO:179)。
SEQ ID NO:181是来自重叠群emb|OCVV012889144.l|的示例性Cas13d蛋白序列。
SEQ ID NO:182是示例性共有DR核酸序列(伴随SEQ ID NO:181)。
SEQ ID NO:183是来自重叠群OCTW011587266.l的示例性Cas13d蛋白序列。
SEQ ID NO:184是示例性共有DR核酸序列(伴随SEQ ID NO:183)。
SEQ ID NO:185是来自重叠群emb|OGNFO 1009141.1的示例性Cas13d蛋白序列。
SEQ ID NO:186是示例性共有DR核酸序列(伴随SEQ ID NO:185)。
SEQ ID NO:187是来自重叠群emb|OIEN01002l96.l的示例性Cas13d蛋白序列。
SEQ ID NO:188是示例性共有DR核酸序列(伴随SEQ ID NO:187)。
SEQ ID NO:189是来自重叠群e-k87_11092736的示例性Cas13d蛋白序列。
SEQ ID NO:190-193是示例性共有DR核酸序列(伴随SEQ ID NO:189)。
SEQ ID NO:194是来自肠道_宏基因组_重叠群6893000291的示例性Cas13d序列。
SEQ ID NO:195-197是示例性Cas13d基序序列。
SEQ ID NO:198是来自Ga0224415_10007274的示例性Cas13d蛋白序列。
SEQ ID NO:199是示例性共有DR核酸序列(伴随SEQ ID NO:198)。
SEQ ID NO:200是来自EMG_l0003641的示例性Cas13d蛋白序列。
SEQ ID NO:202是来自Ga0129306_1000735的示例性Cas13d蛋白序列。
SEQ ID NO:201是示例性共有DR核酸序列(伴随SEQ ID NO:200)。
SEQ ID NO:202是来自Ga0129306_1000735的示例性Cas13d蛋白序列。
SEQ ID NO:203是示例性共有DR核酸序列(伴随SEQ ID NO:203)。
SEQ ID NO:204是来自GaO129317_l 008067的示例性Cas13d蛋白序列。
SEQ ID NO:205是示例性共有DR核酸序列(伴随SEQ ID NO:204)。
SEQ ID NO:206是来自Ga0224415_10048792的示例性Cas13d蛋白序列。
SEQ ID NO:207是示例性共有DR核酸序列(伴随SEQ ID NO:206)。
SEQ ID NO:208是来自160582958_基因49834的示例性Cas13d蛋白序列。
SEQ ID NO:209是示例性共有DR核酸序列(伴随SEQ ID NO:208)。
SEQ ID NO:210是来自250twins_35838_GL0110300的示例性Cas13d蛋白序列。
SEQ ID NO:211是示例性共有DR核酸序列(伴随SEQ ID NO:210)。
SEQ ID NO:212是来自250twins_36050_GLOI58985的示例性Cas13d蛋白序列。
SEQ ID NO:213是示例性共有DR核酸序列(伴随SEQ ID NO:212)。
SEQ ID NO:214是来自31009_GL0034153的示例性Cas13d蛋白序列。
SEQ ID NO:215是示例性共有DR核酸序列(伴随SEQ ID NO:214)。
SEQ ID NO:216是来自530373_GL0023589的示例性Cas13d蛋白序列。
SEQ ID NO:217是示例性共有DR核酸序列(伴随SEQ ID NO:216)。
SEQ ID NO:218是来自BMZ-l 1B_GL0037771的示例性Cas13d蛋白序列。
SEQ ID NO:219是示例性共有DR核酸序列(伴随SEQ ID NO:218)。
SEQ ID NO:220是来自BMZ-l 1B_GL0037915的示例性Cas13d蛋白序列。
SEQ ID NO:221是示例性共有DR核酸序列(伴随SEQ ID NO:220)。
SEQ ID NO:222是来自BMZ-l 1B_GL00696 l 7的示例性Cas13d蛋白序列。
SEQ ID NO:223是示例性共有DR核酸序列(伴随SEQ ID NO:222)。
SEQ ID NO:224是来自DLF014_GL0011914的示例性Cas13d蛋白序列。
SEQ ID NO:225是示例性共有DR核酸序列(伴随SEQ ID NO:224)。
SEQ ID NO:226是来自EYZ-362B_GL0088915的示例性Cas13d蛋白序列。
SEQ ID NO:227-228是示例性共有DR核酸序列(伴随SEQ ID NO:226)。
SEQ ID NO:229是来自Ga0099364 10024192的示例性Cas13d蛋白序列。
SEQ ID NO:230是示例性共有DR核酸序列(伴随SEQ ID NO:229)。
SEQ ID NO:231是来自Ga0187910_10006931的示例性Cas13d蛋白序列。
SEQ ID NO:232是示例性共有DR核酸序列(伴随SEQ ID NO:231)。
SEQ ID NO:233是来自Ga0187910_10015336的示例性Cas13d蛋白序列。
SEQ ID NO:234是示例性共有DR核酸序列(伴随SEQ ID NO:233)。
SEQ ID NO:235是来自Ga0187910_10040531的示例性Cas13d蛋白序列。
SEQ ID NO:236是示例性共有DR核酸序列(伴随SEQ ID NO:23)。
SEQ ID NO:237是来自Ga0187911_10069260的示例性Cas13d蛋白序列。
SEQ ID NO:238是示例性共有DR核酸序列(伴随SEQ ID NO:237)。
SEQ ID NO:239是来自MH0288_GL0082219的示例性Cas13d蛋白序列。
SEQ ID NO:240是示例性共有DR核酸序列(伴随SEQ ID NO:239)。
SEQ ID NO:241是来自O2.UC29-0_GL0096317的示例性Cas13d蛋白序列。
SEQ ID NO:242是示例性共有DR核酸序列(伴随SEQ ID NO:241)。
SEQ ID NO:243是来自PIG-014_GL0226364的示例性Cas13d蛋白序列。
SEQ ID NO:244是示例性共有DR核酸序列(伴随SEQ ID NO:243)。
SEQ ID NO:245是来自PIG-018_GL0023397的示例性Cas13d蛋白序列。
SEQ ID NO:246是示例性共有DR核酸序列(伴随SEQ ID NO:245)。
SEQ ID NO:247是来自PIG-025_GL0099734的示例性Cas13d蛋白序列。
SEQ ID NO:248是示例性共有DR核酸序列(伴随SEQ ID NO:247)。
SEQ ID NO:249是来自PIG-028_GL0185479的示例性Cas13d蛋白序列。
SEQ ID NO:250是示例性共有DR核酸序列(伴随SEQ ID NO:249)。
SEQ ID NO:251是来自Ga0224422_10645759的示例性Cas13d蛋白序列。
SEQ ID NO:252是示例性共有DR核酸序列(伴随SEQ ID NO:251)。
SEQ ID NO:253是来自ODAI嵌合体的示例性Cas13d蛋白序列。
SEQ ID NO:254是示例性共有DR核酸序列(伴随SEQ ID NO:253)。
SEQ ID NO:255是HEPN基序。
SEQ ID NO:256和257分别是示例性的Cas13d核定位信号氨基酸和核酸序列。
SEQ ID NO:258和260分别是示例性的SV40大T抗原核定位信号氨基酸和核酸序列。
SEQ ID NO:259是dCas9靶序列。
SEQ ID NO:261是靶向ccdB的人工惰性真杆菌nCasl阵列。
SEQ ID NO:262是完整的36nt同向重复。
SEQ ID NO:263-266是间隔子序列。
SEQ ID NO:267是靶向ccdB的人工的未培养的瘤胃菌属种nCasl阵列。
SEQ ID NO:268是完整的36nt同向重复。
SEQ ID NO:269-272是间隔子序列。
SEQ ID NO:273是ccdB靶RNA序列。
SEQ ID NO:274-277是间隔子序列。
SEQ ID NO:278是突变的Cas13d序列NLS-Ga_053l(trunc)-NLS-HA。该突变体具有非保守性N末端的缺失。
SEQ ID NO:279是突变的Cas13d序列NES-Ga_053l(trunc)-NES-HA。该突变体具有非保守性N末端的缺失。
SEQ ID NO:280是全长Cas13d序列NLS-RfxCas13d-NLS-HA。
SEQ ID NO:281是突变的Cas13d序列NLS-RfxCas13d(del5)-NLS-HA。该突变体具有氨基酸558-587的缺失。
SEQ ID NO:282是突变的Cas13d序列NLS-RfxCas13d(del5.12)-NLS-HA。该突变体具有氨基酸558-587和953-966的缺失。
SEQ ID NO:283是突变的Cas13d序列NLS-RfxCas13d(del5.13)-NLS-HA。该突变体具有氨基酸376-392和558-587的缺失。
SEQ ID NO:284是突变的Cas13d序列NLS-RfxCas13d(del5.12+5.13)-NLS-HA。该突变体具有氨基酸376-392、558-587和953-966的缺失。
SEQ ID NO:285是突变的Cas13d序列NLS-RfxCas13d(dell3)-NLS-HA。该突变体具有氨基酸376-392的缺失。
SEQ ID NO:286是用于编辑ADAR2表达的效应子序列。氨基酸1至969是dRfxCas13,氨基酸970至991是NLS序列,并且氨基酸992至1378是ADAR2DD。
SEQ ID NO:287是示例性HIV NES蛋白序列。
SEQ ID NO:288-291是示例性Cas13d基序序列。
SEQ ID NO:292是Cas13d直系同源物序列MH_4866。
SEQ ID NO:293是来自037_-_emblOIZA01000315.ll的示例性Cas13d蛋白序列。
SEQ ID NO:294是来自PIG-022GL002635l的示例性Cas13d蛋白序列。
SEQ ID NO:295是来自PIG-046_GL0077813的示例性Cas13d蛋白序列。
SEQ ID NO:296是来自猪_嵌合体的示例性Cas13d蛋白序列。
SEQ ID NO:297是来自生黄瘤胃球菌XPD3002(CasRx)的示例性核酸酶失活或死亡Cas13d(dCas13d)蛋白序列。
SEQ ID NO:298是示例性Cas13d蛋白序列。
SEQ ID NO:299是来自(重叠群tpg|DJXD01000002.1|;未培养的瘤胃球菌组装体,UBA7013,来自绵羊肠道宏基因组)的示例性Cas13d蛋白序列。
SEQ ID NO:300是来自Cas13d(重叠群tpg|DJXD01000002.1|;未培养的瘤胃球菌组装体,UBA7013,来自绵羊肠道宏基因组)(伴随SEQ ID NO:299)的示例性Cas13d同向重复核苷酸序列。
SEQ ID NO:301是示例性Cas13d蛋白重叠群emb|OBLI01020244。
Yan等人(2018)Mol Cell.70(2):327-339(doi:10.1016/j.molcel.2018.02.2018)和Konermann等人(2018)Cell 173(3):665-676(doi:10.1016/j.cell/2018.02.033)已经描述了Cas13d蛋白,并且所述两篇参考文献均以引用方式整体并入本文。还参见WO公布号WO2018/183403(CasM,其为Cas13d)和WO2019/006471(Cas13d),所述公布以引用方式整体并入本文。
SEQ ID NO:467是来自惰性真杆菌的示例性CasM蛋白。
SEQ ID NO:468是来自瘤胃球菌属种分离株2789STDY5834971的示例性CasM蛋白。
SEQ ID NO:469是来自二环瘤胃球菌的示例性CasM蛋白。
SEQ ID NO:470是来自瘤胃球菌属种分离株2789STDY5608892的示例性CasM蛋白。
SEQ ID NO:471是来自瘤胃球菌属种CAG:57的示例性CasM蛋白。
SEQ ID NO:472是生黄瘤胃球菌FD-1的示例性CasM蛋白。
SEQ ID NO:473是来自白色瘤胃球菌菌株KH2T6的示例性CasM蛋白。
SEQ ID NO:474是来自生黄瘤胃球菌菌株XPD3002的示例性CasM蛋白。
SEQ ID NO:475是来自瘤胃球菌属种分离株2789STDY5834894的示例性CasM蛋白。
SEQ ID NO:476是示例性RtcB同系物。
SEQ ID NO:477是来自惰性真杆菌的示例性WYL+C末端NLS。
SEQ ID NO:478是来自瘤胃球菌属种分离株2789STDY5834971的示例性WYL+C末端NLS。
SEQ ID NO:479是来自二环瘤胃球菌的示例性WYL+C末端NLS。
SEQ ID NO:480是来自瘤胃球菌属种分离株2789STDY5608892的示例性WYL+C末端NLS。
SEQ ID NO:481是来自瘤胃球菌属种CAG:57的示例性WYL+C末端NLS。
SEQ ID NO:482是来自生黄瘤胃球菌FD-1的示例性WYL+C末端NLS。
SEQ ID NO:483是来自白色瘤胃球菌菌株KH2T6的示例性WYL+C末端NLS。
SEQ ID NO:484是来自生黄瘤胃球菌菌株XPD3002的示例性WYL+C末端NLS。
SEQ ID NO:485是来自惰性真杆菌的示例性RtcB+C末端NLS。
本公开的示例性野生型Cas13d蛋白可包含氨基酸序列SEQ ID NO:92或SEQ IDNO:298(Cas13d蛋白也称为CasRx)或由其组成。
生黄瘤胃球菌XPD3002 Cas13d(CasRx)的示例性同向重复序列包含核酸序列:AACCCCTACCAACTGGTCGGGGTTTGAAAC(SEQ ID NO:461)。
治疗性替代基因(待治疗的相应疾病/病症)
包含本文所公开的治疗性替代基因的组合物包括任何有效的功能获得或丧失型基因替代疗法。示例性的治疗性置换基因(相应疾病)包括但不限于基因(疾病/病症)如视紫红质(色素性视网膜炎)、PRPF3-前体mRNA剪接因子3(常染色体显性色素性视网膜炎)、PRPF31(常染色体显性色素性视网膜炎)、GRN(额颞叶痴呆(FTD))、SOD1(ALS)、PMP22(夏科-马里-图思病(Charcot Marie Tooth Disease))、PABPN1(眼咽型肌营养不良)、KCNQ4(听力损失)、CLRN1(乌谢尔综合征(Usher Syndrome))、APOE2(阿尔茨海默氏病(Alzheimer’sDisease))、APOE4(阿尔茨海默氏病)、BEST1(眼病)、MYBPC3(家族性心肌病)、TNNT2(家族性心肌病)和TNNI3(家族性心肌病)。
在一些实施方案中,治疗性替代基因是密码子优化的。在一些实施方案中,与靶位点相关的密码子不是密码子优化的。在一些实施方案中,本公开的靶向RNA的蛋白质确保突变型等位基因的切割但不确保转基因或治疗性替代基因的切割。
示例性的治疗性替代基因和相应序列包括但不限于以下:
视紫红质(人RHO)
示例性的治疗性替代基因可包含视紫红质的氨基酸序列或由其组成:
MNGTEGPNFYVPFSNATGVVRSPFEYPQYYLAEPWQFSMLAAYMFLLIVLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVLGGFTSTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLAGWSRYIPEGLQCSCGIDYYTLKPEVNNESFVIYMFVVHFTIPMIIIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWVPYASVAFYIFTHQGSNFGPIFMTIPAFFAKSAAIYNPVIYIMMNKQFRNCMLTTICCGKNPLGDDEASATVSKTETSQVAPA(SEQ ID NO:302)。
超氧化物歧化酶1(SOD1)
示例性的治疗性替代基因可包含超氧化物歧化酶1的氨基酸序列或由其组成:
MATKAVCVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHEFGDNTAGCTSAGPHFNPLSRKHGGPKDEERHVGDLGNVTADKDGVADVSIEDSVISLSGDHCIIGRTLVVHEKADDLGKGGNEESTKTGNAGSRLACGVIGIAQ(SEQ ID NO:303)。
外周髓鞘蛋白22(PMP22)
示例性的治疗性替代基因可包含外周髓鞘蛋白22的氨基酸序列或由其组成:
MLLLLLSIIVLHVAVLVLLFVSTIVSQWIVGNGHATDLWQNCSTSSSGNVHHCFSSSPNEWLQSVQATMILSIIFSILSLFLFFCQLFTLTKGGRFYITGIFQILAGLCVMSAAAIYTVRHPEWHLNSDYSYGFAYILAWVAFPLALLSGVIYVILRKRE(SEQ ID NO:304)。
Poly(A)结合蛋白核1(PABPN1)
示例性的治疗性替代基因可包含Poly(A)结合蛋白核1的氨基酸序列或由其组成:
MAAAAAAAAAAGAAGGRGSGPGRRRHLVPGAGGEAGEGAPGGAGDYGNGLESEELEPEELLLEPEPEPEPEEEPPRPRAPPGAPGPGPGSGAPGSQEEEEEPGLVEGDPGDGAIEDPELEAIKARVREMEEEAEKLKELQNEVEKQMNMSPPPGNAGPVIMSIEEKMEADARSIYVGNVDYGATAEELEAHFHGCGSVNRVTILCDKFSGHPKGFAYIEFSDKESVRTSLALDESLFRGRQIKVIPKRTNRPGISTTDRGFPRARYRARTTNYNSSRSRFYSGFNSRPRGRVYRGRARATSWYSPY(SEQ ID NO:305)。
钾电压门控通道亚家族Q成员4(KCNQ4)
示例性的治疗性替代基因可包含钾电压门控通道亚家族Q成员4的氨基酸序列或由其组成:
MAEAPPRRLGLGPPPGDAPRAELVALTAVQSEQGEAGGGGSPRRLGLLGSPLPPGAPLPGPGSGSGSACGQRSSAAHKRYRRLQNWVYNVLERPRGWAFVYHVFIFLLVFSCLVLSVLSTIQEHQELANECLLILEFVMIVVFGLEYIVRVWSAGCCCRYRGWQGRFRFARKPFCVIDFIVFVASVAVIAAGTQGNIFATSALRSMRFLQILRMVRMDRRGGTWKLLGSVVYAHSKELITAWYIGFLVLIFASFLVYLAEKDANSDFSSYADSLWWGTITLTTIGYGDKTPHTWLGRVLAAGFALLGISFFALPAGILGSGFALKVQEQHRQKHFEKRRMPAANLIQAAWRLYSTDMSRAYLTATWYYYDSILPSFRELALLFEHVQRARNGGLRPLEVRRAPVPDGAPSRYPPVATCHRPGSTSFCPGESSRMGIKDRIRMGSSQRRTGPSKQHLAPPTMPTSPSSEQVGEATSPTKVQKSWSFNDRTRFRASLRLKPRTSAEDAPSEEVAEEKSYQCELTVDDIMPAVKTVIRSIRILKFLVAKRKFKETLRPYDVKDVIEQYSAGHLDMLGRIKSLQTRVDQIVGRGPGDRKAREKGDKGPSDAEVVDEISMMGRVVKVEKQVQSIEHKLDLLLGFYSRCLRSGTSASLGAVQVPLFDPDITSDYHSPVDHEDISVSAQTLSISRSVSTNMD(SEQ ID NO:306)。
肝素钾(Clarin)1(CLRN1)
示例性的治疗性替代基因可包含肝素钾1的氨基酸序列或由其组成:
MPSQQKKIIFCMAGVFSFACALGVVTALGTPLWIKATVLCKTGALLVNASGQELDKFMGEMQYGLFHGEGVRQCGLGARPFRFSFFPDLLKAIPVSIHVNVILFSAILIVLTMVGTAFFMYNAFGKPFETLHGPLGLYLLSFISGSCGCLVMILFASEVKIHHLSEKIANYKEGTYVYKTQSEKYTTSFWVIFFCFFVHFLNGLLIRLAGFQFPFAKSKDAETTNVAADLM(SEQ ID NO:307)。
载脂蛋白2(APOE2)
示例性的治疗性替代基因可包含载脂蛋白2的氨基酸序列或由其组成:
MKVLWAALLVTFLAGCQAKVEQAVETEPEPELRQQTEWQSGQRWELALGRFWDYLRWVQTLSEQVQEELLSSQVTQELRALMDETMKELKAYKSELEEQLTPVAEETRARLSKELQAAQARLGADMEDVCGRLVQYRGEVQAMLGQSTEELRVRLASHLRKLRKRLLRDADDLQKCLAVYQAGAREGAERGLSAIRERLGPLVEQGRVRAATVGSLAGQPLQERAQAWGERLRARMEEMGSRTRDRLDEVKEQVAEVRAKLEEQAQQIRLQAEAFQARLKSWFEPLVEDMQRQWAGLVEKVQAAVGTSAAPVPSDNH(SEQ ID NO:308)。
载脂蛋白4(APOE4)
示例性的治疗性替代基因可包含载脂蛋白4的氨基酸序列或由其组成:
MKVLWAALLVTFLAGCQAKVEQAVETEPEPELRQQTEWQSGQRWELALGRFWDYLRWVQTLSEQVQEELLSSQVTQELRALMDETMKELKAYKSELEEQLTPVAEETRARLSKELQAAQARLGADMEDVRGRLVQYRGEVQAMLGQSTEELRVRLASHLRKLRKRLLRDADDLQKRLAVYQAGAREGAERGLSAIRERLGPLVEQGRVRAATVGSLAGQPLQERAQAWGERLRARMEEMGSRTRDRLDEVKEQVAEVRAKLEEQAQQIRLQAEAFQARLKSWFEPLVEDMQRQWAGLVEKVQAAVGTSAAPVPSDNH(SEQ ID NO:309)。
卵黄状黄斑病蛋白(Bestrophin)-1(BEST1)
示例性的治疗性替代基因可包含卵黄状黄斑病蛋白-1的氨基酸序列或由其组成:
MTITYTSQVANARLGSFSRLLLCWRGSIYKLLYGEFLIFLLCYYIIRFIYRLALTEEQQLMFEKLTLYCDSYIQLIPISFVLGFYVTLVVTRWWNQYENLPWPDRLMSLVSGFVEGKDEQGRLLRRTLIRYANLGNVLILRSVSTAVYKRFPSAQHLVQAGFMTPAEHKQLEKLSLPHNMFWVPWVWFANLSMKAWLGGRIRDPILLQSLLNEMNTLRTQCGHLYAYDWISIPLVYTQVVTVAVYSFFLTCLVGRQFLNPAKAYPGHELDLVVPVFTFLQFFFYVGWLKVAEQLINPFGEDDDDFETNWIVDRNLQVSLLAVDEMHQDLPRMEPDMYWNKPEPQPPYTAASAQFRRASFMGSTFNISLNKEEMEFQPNQEDEEDAHAGIIGRFLGLQSHDHHPPRANSRTKLLWPKRESLLHEGLPKNHKAAKQNVRGQEDNKAWKLKAVDAFKSAPLYQRPGYYSAPQTPLSPTPMFFPLEPSAPSKLHSVTGIDTKDKSLKTVSSGAKKSFELLSESDGALMEHPEVSQVRRKTVEFNLTDMPEIPENHLKEPLEQSPTNIHTTLKDHMDPYWALENRDEAHS(SEQ ID NO:310)。
心肌肌球蛋白结合蛋白-C(MYBPC3)
示例性的治疗性替代基因可包含心肌肌球蛋白结合蛋白-C的氨基酸序列或由其组成:
MPEPGKKPVSAFSKKPRSVEVAAGSPAVFEAETERAGVKVRWQRGGSDISASNKYGLATEGTRHTLTVREVGPADQGSYAVIAGSSKVKFDLKVIEAEKAEPMLAPAPAPAEATGAPGEAPAPAAELGESAPSPKGSSSAALNGPTPGAPDDPIGLFVMRPQDGEVTVGGSITFSARVAGASLLKPPVVKWFKGKWVDLSSKVGQHLQLHDSYDRASKVYLFELHITDAQPAFTGSYRCEVSTKDKFDCSNFNLTVHEAMGTGDLDLLSAFRRTSLAGGGRRISDSHEDTGILDFSSLLKKRDSFRTPRDSKLEAPAEEDVWEILRQAPPSEYERIAFQYGVTDLRGMLKRLKGMRRDEKKSTAFQKKLEPAYQVSKGHKIRLTVELADHDAEVKWLKNGQEIQMSGSKYIFESIGAKRTLTISQCSLADDAAYQCVVGGEKCSTELFVKEPPVLITRPLEDQLVMVGQRVEFECEVSEEGAQVKWLKDGVELTREETFKYRFKKDGQRHHLIINEAMLEDAGHYALCTSGGQALAELIVQEKKLEVYQSIADLMVGAKDQAVFKCEVSDENVRGVWLKNGKELVPDSRIKVSHIGRVHKLTIDDVTPADEADYSFVPEGFACNLSAKLHFMEVKIDFVPRQEPPKIHLDCPGRIPDTIVVVAGNKLRLDVPISGDPAPTVIWQKAITQGNKAPARPAPDAPEDTGDSDEWVFDKKLLCETEGRVRVETTKDRSIFTVEGAEKEDEGVYTVTVKNPVGEDQVNLTVKVIDVPDAPAAPKISNVGEDSCTVQWEPPAYDGGQPILGYILERKKKKSYRWMRLNFDLIQELSHEARRMIEGVVYEMRVYAVNAIGMSRPSPASQPFMPIGPPSEPTHLAVEDVSDTTVSLKWRPPERVGAGGLDGYSVEYCPEGCSEWVAALQGLTEHTSILVKDLPTGARLLFRVRAHNMAGPGAPVTTTEPVTVQEILQRPRLQLPRHLRQTIQKKVGEPVNLLIPFQGKPRPQVTWTKEGQPLAGEEVSIRNSPTDTILFIRAARRVHSGTYQVTVRIENMEDKATLVLQVVDKPSPPQDLRVTDAWGLNVALEWKPPQDVGNTELWGYTVQKADKKTMEWFTVLEHYRRTHCVVPELIIGNGYYFRVFSQNMVGFSDRAATTKEPVFIPRPGITYEPPNYKALDFSEAPSFTQPLVNRSVIAGYTAMLCCAVRGSPKPKISWFKNGLDLGEDARFRMFSKQGVLTLEIRKPCPFDGGIYVCRATNLQGEARCECRLEVRVPQ(SEQ ID NO:311)。
心肌肌钙蛋白T2(TNNT2)
示例性的治疗性替代基因可包含心肌肌钙蛋白T2的氨基酸序列或由其组成:
MSDEEVEQVEEQYEEEEEAQEEAAEVHEEVHEPEEVQEDTAEEDAEEEKPRPKLTAPKIPEGEKVDFDDIQKKRQNKDLMELQALIDSHFEARKKEEEELVALKERIEKRRAERAEQQRIRAEKERERQNRLAEEKARREEEDAKRRAEDDLKKKKALSSMGANYSSYLAKADQKRGKKQTAREMKKKILAERRKPLNIDHLGEDKLRDKAKELWETLHQLEIDKFEFGEKLKRQKYDITTLRSRIDQAQKHSKKAGTPAKGKVGGRWK(SEQ ID NO:312)。
心肌肌钙蛋白TI3(TNNI3)
示例性的治疗性替代基因可包含心肌肌钙蛋白TI3的氨基酸序列或由其组成:
MADGSSDAAREPRPAPAPIRRRSSNYRAYATEPHAKKKSKISASRKLQLKTLLLQIAKQELEREAEERRGEKGRALSTRCQPLELAGLGFAELQDLCRQLHARVDKVDEERYDIEAKVTKNITEIADLTQKIFDLRGKFKRPTLRRVRISADAMMQALLGARAKESLDLRAHLKQVKKEDTEKENREVGDWRKNIDALSGMEGRKKKFES(SEQ ID NO:313)。
前体mRNA加工因子31(PRPF31)
示例性的治疗性替代基因可包含前体mRNA加工因子31(PRPF31)(常染色体显性色素性视网膜炎)的氨基酸序列或由其组成:MSLADELLADLEEAAEEEEGGSYGEEEEEPAIEDVQEETQLDLSGDSVKTIAKLWDSKMFAEIMMKIEEYISKQAKASEVMGPVEAAPEYRVIVDANNLTVEIENELNIIHKFIRDKYSKRFPELESLVPNALDYIRTVKELGNSLDKCKNNENLQQILTNATIMVVSVTASTTQGQQLSEEELERLEEACDMALELNASKHRIYEYVESRMSFIAPNLSIIIGASTAAKIMGVAGGLTNLSKMPACNIMLLGAQRKTLSGFSSTSVLPHTGYIYHSDIVQSLPPDLRRKAARLVAAKCTLAARVDSFHESTEGKVGYELKDEIERKFDKWQEPPPVKQVKPLPAPLDGQRKKRGGRRYRKMKERLGLTEIRKQANRMSFGEIEEDAYQEDLGFSLGHLGKSGSGRVRQTQVNEATKARISKTLQRTLQKQSVVYGGKSTIRDRSSGTASSVAFTPLQGLEIVNPQAAEKKVAEANQKYFSSMAEFLKVKGEKSGLMST(SEQ ID NO:487)。
颗粒蛋白前体(GRN)(FTD)
示例性的治疗性替代基因可包含颗粒蛋白前体(GRN)(额颞叶痴呆(FTD))的氨基酸序列或由其组成:
MWTLVSWVALTAGLVAGTRCPDGQFCPVACCLDPGGASYSCCRPLLDKWPTTLSRHLGGPCQVDAHCSAGHSCIFTVSGTSSCCPFPEAVACGDGHHCCPRGFHCSADGRSCFQRSGNNSVGAIQCPDSQFECPDFSTCCVMVDGSWGCCPMPQASCCEDRVHCCPHGAFCDLVHTRCITPTGTHPLAKKLPAQRTNRAVALSSSVMCPDARSRCPDGSTCCELPSGKYGCCPMPNATCCSDHLHCCPQDTVCDLIQSKCLSKENATTDLLTKLPAHTVGDVKCDMEVSCPDGYTCCRLQSGAWGCCPFTQAVCCEDHIHCCPAGFTCDTQKGTCEQGPHQVPWMEKAPAHLSLPDPQALKRDVPCDNVSSCPSSDTCCQLTSGEWGCCPIPEAVCCSDHQHCCPQGYTCVAEGQCQRGSEIVAGLEKMPARRASLSHPRDIGCDQHTSCPVGQTCCPSLGGSWACCQLPHAVCCEDRQHCCPAGYTCNVKARSCEKEVVSAQPATFLARSPHVGVKDVECGEGHFCHDNQTCCRDNRQGWACCPYRQGVCCADRRHCCPAGFRCAARGTKCLRREAPRWDAPLRDPALRQLL(SEQ IDNO:488)。
gRNA靶序列
在本公开的组合物的一些实施方案中,RNA分子的靶序列包含致病性序列。在一些实施方案中,靶RNA包含对应于RNA指导的RNA结合蛋白的指导RNA的间隔子序列的序列基序。在一些实施方案中,一个或多个间隔子序列用于靶向一个或多个靶序列。在一些实施方案中,多个间隔子用于靶向多个靶RNA。此类靶RNA可以是相同RNA分子内的不同靶位点或者可以是不同RNA分子内的不同靶位点。间隔子序列还可靶向非编码RNA。在一些实施方案中,多个启动子(例如pol III启动子)可用于驱动gRNA中的多个间隔子以靶向多个靶RNA。在一些实施方案中,当一个或多个靶RNA或靶序列基序被本文所公开的靶向RNA的组合物靶向并敲低时,则致病性的或引起疾病的功能获得或丧失型突变会被破坏。
在本公开的组合物和方法的一些实施方案中,靶RNA的序列基序是疾病或病症的标志。
本公开的序列基序可从基因组序列中发现的外来或外源序列的序列分离或衍生,并且因此翻译为本公开的mRNA分子或在本公开的RNA序列中发现的外来或外源序列的序列。
本公开的靶序列基序可包含内源序列中引起疾病或病症的突变,由所述突变组成,是所述突变所在或与所述突变相关。所述突变可包含序列取代、倒位、缺失、插入、转座或它们的任何组合,或者由它们组成。
本公开的靶序列基序可包含重复序列或由其组成。在一些实施方案中,所述重复序列可能与微卫星不稳定性(MSI)相关。一个或多个基因座处的MSI是由于本公开的细胞的DNA错配修复机制受损所致。可将DNA的高变序列转录为本公开的包含靶序列的mRNA,所述靶序列包含所述高变序列或由其组成。
本公开的靶序列基序可包含生物标志物或由其组成。所述生物标志物可指示患上疾病或病症的风险。所述生物标志物可指示健康基因(低或无可确定的患上疾病或病症的风险)。所述生物标志物可指示编辑的基因。示例性生物标志物包括但不限于单核苷酸多态性(SNP)、序列变异或突变、表观遗传标志物、剪接受体位点、外源序列、异源序列以及它们的任何组合。
本公开的靶序列基序可包含二级、三级或四级结构或由其组成。所述二级、三级或四级结构可以是内源的或天然存在的。所述二级、三级或四级结构可以是诱导的或非天然存在的。所述二级、三级或四级结构可由内源、外源或异源序列编码。
在本公开的组合物和方法的一些实施方案中,RNA分子的靶序列包含在2个与100个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的靶序列包含在2个与50个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的靶序列包含在2个与20个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的靶序列包含在20-30个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的靶序列包含约26个核苷酸或核酸碱基(包括端点)或由其组成。
在本公开的组合物和方法的一些实施方案中,RNA分子的靶序列是连续的。在一些实施方案中,RNA分子的靶序列是不连续的。例如,RNA分子的靶序列可包含不连续的一个或多个核苷酸或核酸碱基或由其组成,因为一个或多个间断的核苷酸定位于所述靶序列的核苷酸之间。
在本公开的组合物和方法的一些实施方案中,RNA分子的靶序列是天然存在的。在一些实施方案中,RNA分子的靶序列是非天然存在的。示例性的非天然存在的靶序列可包含序列变异或突变、嵌合序列、外源序列、异源序列、嵌合序列、重组序列、包含修饰的或合成的核苷酸的序列或它们的任何组合,或者由其组成。
在本公开的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开的指导RNA结合。在本公开的组合物和方法的一些实施方案中,RNA分子的一个或多个靶序列与本公开的一个或多个指导RNA间隔子序列结合。
在本公开的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开的第一RNA结合蛋白结合。
在本公开的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开的第二RNA结合蛋白结合。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列与编码视红紫质(Rhodospin)蛋白的RNA分子的靶序列特异性结合,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000681
与本公开的编码视紫红质蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:619至SEQ ID NO:3361中的任一者的序列的核酸或由所述核酸组成。
在一些实施方案中,示例性gRNA间隔子序列和相应Rho靶序列包含如表1中详述的序列或由其组成。
表1:用于视紫红质靶向的间隔子序列和靶序列
Figure BDA0003526863300000691
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码SOD1蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000692
与编码本公开的SOD1蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:3362至SEQ ID NO:4317中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码PMP22蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000701
与编码本公开的PMP22蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:4318至SEQ ID NO:6120中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码PABPN1蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000702
Figure BDA0003526863300000711
与编码本公开的PABPN1蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:6121至SEQ ID NO:9213中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码KCNQ4蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000721
Figure BDA0003526863300000731
与编码本公开的KCNQ4蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:9214至SEQ ID NO:13512中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码CLRN1蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000741
与编码本公开的CLRN1蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:13513至SEQ ID NO:15574中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码APOE2蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000751
与编码本公开的APOE2蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:15575至SEQ ID NO:16797中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码TNNI3蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000761
与编码本公开的TNNI3蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:16798至SEQ ID NO:17615中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码BEST1蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000771
与编码本公开的BEST1蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:17616至SEQ ID NO:19800中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码MYBPC3蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000781
Figure BDA0003526863300000791
与编码本公开的MYBPC3蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:19801至SEQ ID NO:23992中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码TNNT2蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000792
Figure BDA0003526863300000801
与编码本公开的TNNT2蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:23993至SEQ ID NO:25329中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码前体mRNA加工因子31(PRPF31)蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000802
与编码本公开的PRPF31蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:25330至SEQ ID NO:27137中的任一者的序列的核酸或由所述核酸组成。
本公开的组合物可包含含有间隔子序列的gRNA,所述间隔子序列特异性结合编码颗粒蛋白前体(GRN)蛋白的RNA分子的靶序列,所述靶序列包含以下序列的约20-30个核苷酸或由其组成:
Figure BDA0003526863300000811
与编码本公开的颗粒蛋白前体(GRN)蛋白的RNA分子的靶序列特异性结合的本公开的示例性gRNA间隔子序列可包含具有选自SEQ ID NO:27138至SEQ ID NO:29242中的任一者的序列的核酸或由所述核酸组成。
RNA分子
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含靶RNA序列。在一些实施方案中,致病性RNA包含靶RNA序列或者所述靶序列与所述致病性RNA相关。在一些实施方案中,本公开的RNA分子包含至少一个靶序列。在一些实施方案中,本公开的RNA分子包含一个或多个靶序列。在一些实施方案中,本公开的RNA分子包含两个或更多个靶序列。在一些实施方案中,靶RNA是非编码RNA。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子是天然存在的RNA分子。在一些实施方案中,本公开的RNA分子是非天然存在的分子。示例性的非天然存在的RNA分子可包含序列变异或突变、嵌合序列、外源序列、异源序列、嵌合序列、重组序列、包含修饰的或合成的核苷酸的序列或它们的任何组合,或者由其组成。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含从病毒分离或衍生的序列或由其组成。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含从原核生物分离或衍生的序列或由其组成。在一些实施方案中,本公开的RNA分子包含从古菌的物种或菌株或者细菌的物种或菌株分离或衍生的序列或由其组成。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含从真核生物分离或衍生的序列或由其组成。在一些实施方案中,本公开的RNA分子包含从以下的物种分离或衍生的序列或由其组成:原生动物(protozoa)、寄生虫、原生生物(protist)、藻类、真菌、酵母、变形虫、蠕虫、微生物、无脊椎动物、脊椎动物、昆虫、啮齿动物、小鼠、大鼠、哺乳动物或灵长类动物。在一些实施方案中,本公开的RNA分子包含从人分离或衍生的序列或由其组成。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含从生物或病毒的基因组的编码序列衍生的序列或由其组成。在一些实施方案中,本公开的RNA分子包含初级RNA转录物、前体信使RNA(前体mRNA)或信使RNA(mRNA)或由其组成。在一些实施方案中,本公开的RNA分子包含尚未加工的基因产物(例如转录物)或由其组成。在一些实施方案中,本公开的RNA分子包含已经进行转录后加工的基因产物(例如包含5'帽和3'聚腺苷酸化信号的转录物)或由其组成。在一些实施方案中,本公开的RNA分子包含已经进行选择性剪接的基因产物(例如剪接变体)或由其组成。在一些实施方案中,本公开的RNA分子包含已经进行非编码序列和/或内含子序列的去除的基因产物(例如信使RNA(mRNA))或由其组成。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含从非编码序列衍生的序列(例如非编码RNA(ncRNA))或由其组成。在一些实施方案中,本公开的RNA分子包含核糖体RNA或由其组成。在一些实施方案中,本公开的RNA分子包含小ncRNA分子或由其组成。本公开的示例性小RNA分子包括但不限于微小RNA(miRNA)、小干扰(siRNA)、piwi相互作用RNA(piRNA)、核仁小RNA(snoRNA)、小核RNA(snRNA)、细胞外或外泌体RNA(exRNA)和小卡哈尔(Cajal)体特异性RNA(scaRNA)。在一些实施方案中,本公开的RNA分子包含长ncRNA分子或由其组成。本公开的示例性长RNA分子包括但不限于X染色体失活特异性转录物(Xist)和HOX转录物反义RNA(HOTAIR)。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子与本公开的组合物在细胞内间隙中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在胞质溶胶面中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在核中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在囊泡、细胞的膜结合区室或细胞器中接触。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子与本公开的组合物在细胞外间隙中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在外泌体中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在脂质体、聚合物囊泡(polymersome)、胶束或纳米颗粒中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在细胞外基质中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在液滴中接触。在一些实施方案中,本公开的RNA分子与本公开的组合物在微流体液滴中接触。
在本公开的组合物和方法的一些实施方案中,本公开的RNA分子包含单链序列或由其组成。在一些实施方案中,本公开的RNA分子包含双链序列或由其组成。在一些实施方案中,所述双链序列包含两个RNA分子。在一些实施方案中,所述双链序列包含一个RNA分子和一个DNA分子。在一些实施方案(包括其中所述双链序列包含一个RNA分子和一个DNA分子的那些实施方案)中,本公开的组合物选择性结合并任选地选择性切割所述RNA分子。
RNA结合核酸内切酶
在本公开的组合物的一些实施方案中,可存在任选的第二RNA结合蛋白,所述第二RNA结合蛋白包含核酸酶或核酸内切酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白是效应蛋白。在一些实施方案中,所述第二RNA结合蛋白以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合蛋白以切割RNA的方式与RNA缔合。在一些实施方案中,所述第二RNA结合蛋白与第一RNA结合蛋白融合,所述第一RNA结合蛋白是基于PUF、PUMBY或PPR的蛋白。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含RNAse或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse1或由其组成。在一些实施方案中,RNAse1蛋白包含SEQ ID NO:325或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse4或由其组成。在一些实施方案中,RNAse4蛋白包含SEQ ID NO:326或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse6或由其组成。在一些实施方案中,RNAse6蛋白包含SEQ ID NO:327或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse7或由其组成。在一些实施方案中,RNAse7蛋白包含SEQ ID NO:328或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse8或由其组成。在一些实施方案中,RNAse8蛋白包含SEQ ID NO:329或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse2或由其组成。在一些实施方案中,RNAse2蛋白包含SEQ ID NO:330或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse6PL或由其组成。在一些实施方案中,RNAse6PL蛋白包含SEQ ID NO:331或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAseL或由其组成。在一些实施方案中,RNAseL蛋白包含SEQ ID NO:332或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAseT2或由其组成。在一些实施方案中,RNAseT2蛋白包含SEQ ID NO:333或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAse11或由其组成。在一些实施方案中,RNAse11蛋白包含SEQ ID NO:334或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含RNAseT2样蛋白或由其组成。在一些实施方案中,RNAseT2样蛋白包含SEQ ID NO:335或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含突变的RNAse或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(K41R))多肽或由其组成。在一些实施方案中,Rnase1(K41R)多肽包含SEQ ID NO:336或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(K41R、D121E))多肽或由其组成。在一些实施方案中,Rnase1(Rnase1(K41R,D121E))多肽包含SEQID NO:337或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(K41R、D121E、H119N))多肽或由其组成。在一些实施方案中,Rnase1(Rnase1(K41R,D121E,H119N))多肽包含SEQ ID NO:338或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(H119N))多肽或由其组成。在一些实施方案中,Rnase1(Rnase1(H119N))多肽包含SEQ ID NO:339或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
在一些实施方案中,Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含SEQ ID NO:340或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含SEQ ID NO:341或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D))多肽包含SEQ ID NO:342或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含突变的Rnase1(Rnase1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽或由其组成,所述多肽包含SEQ ID NO:343或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含NOB1多肽或由其组成。在一些实施方案中,所述NOB1多肽包含SEQ ID NO:344或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含核酸内切酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含核酸内切酶V(ENDOV)或由其组成。在一些实施方案中,所述ENDOV蛋白包含SEQ ID NO:345或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含核酸内切酶G(ENDOG)或由其组成。在一些实施方案中,所述ENDOG蛋白包含SEQ ID NO:346或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含核酸内切酶D1(ENDOD1)或由其组成。在一些实施方案中,所述ENDOD1蛋白包含SEQ ID NO:347或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含人瓣状核酸内切酶-1(hFEN1)或由其组成。在一些实施方案中,hFEN1多肽包含SEQ ID NO:348或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含DNA修复核酸内切酶XPF(ERCC4)多肽或由其组成。在一些实施方案中,ERCC4多肽包含SEQ ID NO:349或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含核酸内切酶III样蛋白1(NTHL)多肽或由其组成。在一些实施方案中,NTHL多肽包含SEQ ID NO:340或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含人斯库拉芬(Schlafen)14(hSLFN14)多肽或由其组成。在一些实施方案中,hSLFN14多肽包含SEQ IDNO:351或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。在一些实施方案中,hLACTB2多肽包含SEQ ID NO:352或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)脱氧核糖核酸内切酶(APEX)多肽或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)脱氧核糖核酸内切酶(APEX2)多肽或由其组成。在一些实施方案中,APEX2多肽包含SEQ ID NO:353或由其组成。
在一些实施方案中,APEX2多肽包含SEQ ID NO:354或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。在一些实施方案中,APEX1多肽包含SEQ ID NO:355或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。在一些实施方案中,ANG多肽包含SEQ ID NO:356或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。在一些实施方案中,HRSP12多肽包含SEQ ID NO:357或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含含锌指CCCH型12A(ZC3H12A)多肽或由其组成。在一些实施方案中,ZC3H12A多肽包含SEQ ID NO:358或由其组成。
在一些实施方案中,ZC3H12A多肽包含SEQ ID NO:359或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(RIDA)多肽或由其组成。在一些实施方案中,RIDA多肽包含SEQ ID NO:360或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。在一些实施方案中,PDL6多肽包含SEQ ID NO:361或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚单位(KIAA0391)多肽或由其组成。在一些实施方案中,KIAA0391多肽包含SEQID NO:362或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含阿尔古蛋白(argonaute)2(AGO2)多肽或由其组成。
在本公开的组合物的一些实施方案中,AGO2多肽包含SEQ ID NO:363或由其组成。
在本公开的组合物的一些实施方案中,所述二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。在一些实施方案中,EXOG多肽包含SEQ ID NO:364或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。在一些实施方案中,ZC3H12D多肽包含SEQ ID NO:365或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含内质网至核信号传导蛋白2(ERN2)多肽或由其组成。在一些实施方案中,ERN2多肽包含SEQ ID NO:366或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含pelota mRNA监测和核糖体拯救因子(PELO)多肽或由其组成。在一些实施方案中,PELO多肽包含SEQ IDNO:367或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。在一些实施方案中,YBEY多肽包含SEQ ID NO:368或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含切割和聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。在一些实施方案中,CPSF4L多肽包含SEQ ID NO:369或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。在一些实施方案中,hCG_2002731多肽包含SEQ ID NO:370或由其组成。
在一些实施方案中,hCG_2002731多肽包含SEQ ID NO:371或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。在一些实施方案中,ERCC1多肽包含SEQ ID NO:372或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1同种型(RAC1)多肽或由其组成。在一些实施方案中,RAC1多肽包含SEQ IDNO:373或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含核糖核酸酶AA1(RAA1)多肽或由其组成。在一些实施方案中,RAA1多肽包含SEQ ID NO:374或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。在一些实施方案中,RAB1多肽包含SEQ ID NO:375或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。在一些实施方案中,DNA2多肽包含SEQ ID NO:376或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。在一些实施方案中,FLJ35220多肽包含SEQ ID NO:377或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。在一些实施方案中,FLJ13173多肽包含SEQ ID NO:378或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含Teneurin跨膜蛋白(TENM)多肽或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含Teneurin跨膜蛋白1(TENM1)多肽或由其组成。在一些实施方案中,TENM1多肽包含SEQ ID NO:379或由其组成。
在一些实施方案中,所述第二RNA结合蛋白包含Teneurin跨膜蛋白2(TENM2)多肽或由其组成。在一些实施方案中,TENM2多肽包含SEQ ID NO:380或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含核糖核酸酶κ(RNAseK)多肽或由其组成。在一些实施方案中,RNAseK多肽包含SEQ ID NO:381或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含转录激活因子样效应子核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,TALEN多肽包含SEQ ID NO:382或由其组成。在一些实施方案中,TALEN多肽包含SEQ ID NO:383或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含ZNF638多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,ZNF638多肽多肽包含SEQ ID NO:384或由其组成。
在本公开的组合物的一些实施方案中,所述第二RNA结合蛋白包含从人SMG6蛋白衍生的PIN结构域或由其组成,所述人SMG6蛋白通常也称为端粒酶结合蛋白EST1A同种型3,NCBI参考序列:NP_001243756.1。在一些实施方案中,来自hSMG6的PIN在本文中以Cas融合蛋白的形式且作为内部对照使用,例如但不限于参见图9,其显示了PIN-dSauCas9、PIN-dSauCas9dHNH、PIN-dSPCas9和dcjeCas9-PIN。
在本公开的组合物的一些实施方案中,所述组合物还包含(a)包含特异性结合于RNA分子内的gRNA的序列;和(b)编码核酸酶的序列。在一些实施方案中,核酸酶包含从CRISPR/Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR/Cas蛋白是从以下任一者分离或衍生的:I型、IA型、IB型、IC型、ID型、IE型、IF型、IU型、III型、IIIA型、IIIB型、IIIC型、IIID型、IV型、IVA型、IVB型、II型、IIA型、IIB型、IIC型、V型或VI型CRISPR/Cas蛋白。在一些实施方案中,核酸酶包含从TALEN或其核酸酶结构域分离或衍生的序列。在一些实施方案中,核酸酶包含从锌指核酸酶或其核酸酶结构域分离或衍生的序列。
融合蛋白
在本公开的组合物和方法的一些实施方案中,所述组合物包含编码靶RNA结合融合蛋白的序列,所述序列包含(a)编码第一RNA结合多肽或其部分的序列;和任选地(b)编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽结合靶RNA,并且其中所述第二RNA结合多肽包含RNA核酸酶活性。
在一些实施方案中,靶RNA结合融合蛋白是RNA指导的靶RNA结合融合蛋白。RNA指导的靶RNA结合融合蛋白包含至少一种RNA结合多肽,所述多肽对应于将所述RNA结合多肽指导至靶RNA的gRNA。RNA指导的靶RNA结合融合蛋白包括但不限于RNA结合多肽,它们是基于CRISPR/Cas的RNA结合多肽或其部分。
在一些实施方案中,靶RNA结合融合蛋白不是RNA指导的靶RNA结合融合蛋白,并且因此包含至少一种RNA结合多肽,所述多肽能够在没有相应gRNA序列的情况下结合靶RNA。此类非指导的RNA结合多肽包括但不限于作为PUF(Pumilio和FBF同源家族)的至少一种RNA结合蛋白或其RNA结合部分。这种类型的RNA结合多肽可用于代替gRNA指导的RNA结合蛋白如CRISPR/Cas。参与介导mRNA稳定性和翻译的PUF蛋白(以果蝇Pumilio和秀丽隐杆线虫(C.elegans)fem-3结合因子命名)的独特RNA识别模式是本领域中众所周知的。同样是本领域中已知的人Pumilio1的PUF结构域与同源RNA序列紧密结合,并且可以修饰其特异性。其含有八个PUF重复,这些重复识别八个保守RNA碱基,每个重复识别单个碱基。由于每个重复中的两条氨基酸侧链识别相应碱基的沃森-克里克(Watson-Crick)边缘并决定该重复的特异性,PUF结构域可被设计为特异性结合大多数8-nt RNA。Wang等人,Nat Methods.2009;6(11):825-830。还参见WO2012/068627,其以引用方式整体并入本文。
PUF-RNA相互作用的模块化性质已被用于合理设计PUF结构域的结合特异性(Cheong,C.G.和Hall,T.M.(2006)PNAS 103:13635-13639;Wang,X.等人(2002)Cell 110:501-512)。然而,在上文WO2012/06827之前,仅曾报道过识别腺嘌呤、鸟嘌呤或尿嘧啶的具有重复的PUF结构域的成功设计。虽然野生型PumHD不结合C,但分子工程显示,一些Pum单位可经突变以结合C,且具有良好的收率和特异性。参见例如,Dong,S.等人Specific andmodular binding code for cytosine recognition in Pumilio/FBF(PUF)RNA-bindingdomains,The Journal of biological chemistry 286,26732-26742(2011)。因此,PumHD是WT Pumilio蛋白的修饰型式,它表现出与RNA的任意8碱基序列的可编程结合。PumHD的八个单位中的每一单位都可与所有四个RNA碱基结合,并且靶序列侧翼的RNA碱基不影响结合。关于本领域认可的PUF设计的RNA结合规则,还可参见:Filipovska A、Razif MF、
Figure BDA0003526863300000941
KK和Rackham O.A universal code for RNA recognition by PUFproteins.Nature chemical biology,7(7),425-427(2011);Filipovska A和RackhamO.Modular recognition of nucleic acids by PUF,TALE and PPR proteins.MolecularBioSystems,8(3),699-708(2012);Abil Z、Denard CA和Zhao H.Modular assembly ofdesigner PUF proteins for specific post-transcriptional regulation ofendogenous RNA.Journal of biological engineering,8(1),7(2014);Zhao Y、Mao M、Zhang W、Wang J、Li H、Yang Y、Wang Z和Wu J.Expanding RNA binding specificity andaffinity of engineered PUF domains.Nucleic Acids Research,46(9),4771-4782(2018);Shinoda K、Tsuji S、Futaki S和Imanishi M.Nested PUF Proteins:ExtendingTarget RNA Elements for Gene Regulation.ChemBioChem,19(2),171-176(2018);KohYY、Wang Y、Qiu C、Opperman L、Gross L、Tanaka Hall TM和Wickens M.StackingInteractions in PUF-RNA Complexes.RNA,17(4),718-727(2011)。
因此,在本领域中众所周知的是,人PUM1(1186个氨基酸)在蛋白质的C末端含有RNA结合结构域(RBD)(也称为Pumilio同源结构域PUM-HD氨基酸828-氨基酸1175)并且PUF是基于人PUM1的RBD。有8个具有36个氨基酸的结构重复模块(除模块7有43个氨基酸外)用于RNA结合,且侧翼的N末端和C末端区域对蛋白质结构和稳定性很重要。在每个重复模块内,氨基酸12、13和16对结合很重要,12和16控制RNA碱基识别。氨基酸13与RNA碱基叠加,并可进行修饰以调整特异性和亲和力。或者,PUF设计可将氨基酸13保留为人PUM1的天然残基。当N末端和C末端PUF识别3’至5'RNA时,识别发生在相反方向上。因此,如本领域中已知的8个模块的PUF工程(8PUF)模拟人蛋白质。示例性的8聚体RNA识别(8PUF)将如下设计:R1’-R1-R2-R3-R4-R5-R6-R7-R8-R8’。在一个实施方案中,将8PUF用作RBD。在另一个实施方案中,8PUF设计的变型用于产生12聚体RNA识别(12PUF)RBD或16聚体RNA识别(16PUF)RBD。野生型人PUM1的重复1-8在此分别在SEQ ID NO:609-616处提供。编码来自人PUM1的PUF结构域的核酸序列是SEQ ID NO:617,并且来自人PUM1氨基酸828-176的PUF结构域的氨基酸序列是SEQ ID NO:618。还参见美国专利9,580,714,将其整体并入本文。
在本公开的非指导的RNA结合融合蛋白的一些实施方案中,所述融合蛋白包含作为PUMBY(基于Pumilio的组装体)蛋白的至少一种RNA结合蛋白或其RNA结合部分。已经以天然和修饰形式广泛用于靶向RNA的RNA结合蛋白PumHD已被工程化为一种蛋白质架构,该蛋白质架构被设计成产生一组四个规范蛋白质模块,其中的每个模块靶向一个RNA碱基。这些模块(即Pumby,用于基于Pumilio的组装体)以不同组成和长度的链进行链状结合,以结合所需靶RNA。本质上,PUMBY是PumHD的一种更简单和模块化的形式,其中PumHD的单个蛋白质单位链状结合成具有任意大小和结合序列特异性的阵列。此类Pumby-RNA相互作用的特异性高,且Pumby链与携带相对于靶序列的三个或更多个错配的RNA序列的结合不可检测。Katarzyna等人,PNAS,2016;113(19):E2579-E2588。还参见US2016/0238593,其以引用方式整体并入本文。
在本公开的组合物的一些实施方案中,所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。在一些实施方案中,所述第一RNA结合蛋白包含基于Pumilio的组装体(PUMBY)蛋白。在一些实施方案中,PUF或PUMBY RNA结合蛋白与核酸酶结构域如E17融合。
用于本文所公开的组合物和方法中的示例性PUF RNA结合蛋白如下:
在一些实施方案中,本公开的PUF26蛋白(原始序列)包含SEQ ID NO:393的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF26蛋白由包含SEQ ID NO:394或由其组成的优化核酸序列编码。
在一些实施方案中,本公开的PUF54蛋白(原始序列)包含SEQ ID NO:395的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF54蛋白由包含SEQ ID NO:396或由其组成的优化核酸序列编码。
在一些实施方案中,本公开的PUF60蛋白(原始序列)包含SEQ ID NO:397的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF60蛋白由包含SEQ ID NO:398或由其组成的优化核酸序列编码。
在一些实施方案中,本公开的PUF110蛋白(原始序列)包含SEQ ID NO:399的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF110蛋白由包含SEQ ID NO:400或由其组成的优化核酸序列编码。
用于本文所公开的组合物和方法中的示例性PUF RNA结合蛋白(靶向8个Rho核苷酸)如下:
在一些实施方案中,本公开的PUF08(靶向8个核苷酸)包含SEQ ID NO:491的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF08(靶向8个核苷酸)由包含SEQ ID NO:492或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF16(靶向8个核苷酸)包含SEQ ID NO:493的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF16(靶向8个核苷酸)由包含SEQ ID NO:494或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF22(靶向8个核苷酸)包含SEQ ID NO:495的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF22(靶向8个核苷酸)由包含SEQ ID NO:496或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF34(靶向8个核苷酸)包含SEQ ID NO:497的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF34(靶向8个核苷酸)由包含SEQ ID NO:498或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF56(靶向8个核苷酸)包含SEQ ID NO:499的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF56(靶向8个核苷酸)由包含SEQ ID NO:500或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF64(靶向8个核苷酸)包含SEQ ID NO:501的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF64(靶向8个核苷酸)由包含SEQ ID NO:502或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF66(靶向8个核苷酸)包含SEQ ID NO:503的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF66(靶向8个核苷酸)由包含SEQ ID NO:504或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF90(靶向8个核苷酸)包含SEQ ID NO:505的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF90(靶向8个核苷酸)由包含SEQ ID NO:506或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF102(靶向8个核苷酸)包含SEQ ID NO:507的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF102(靶向8个核苷酸)由包含SEQ ID NO:508或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF112(靶向8个核苷酸)包含SEQ ID NO:509的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF112(靶向8个核苷酸)由包含SEQ ID NO:510或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF122(靶向8个核苷酸)包含SEQ ID NO:511的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF122(靶向8个核苷酸)由包含SEQ ID NO:512或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF128(靶向8个核苷酸)包含SEQ ID NO:513的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF128(靶向8个核苷酸)由包含SEQ ID NO:514或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF130(靶向8个核苷酸)包含SEQ ID NO:515的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF130(靶向8个核苷酸)由包含SEQ ID NO:516或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF154(靶向8个核苷酸)包含SEQ ID NO:517的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF154(靶向8个核苷酸)由包含SEQ ID NO:518或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF166(靶向8个核苷酸)包含SEQ ID NO:519的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF166(靶向8个核苷酸)由包含SEQ ID NO:520或由其组成的核酸序列编码。
示例性PUF RNA结合蛋白(靶向16个Rho核苷酸)如下:
在一些实施方案中,本公开的PUF26(设计1-P001IS)包含SEQ ID NO:521的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF26(设计1-P001IS)由包含SEQ ID NO:522或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF26(设计2-P001KZ)包含SEQ ID NO:523的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF26(设计2-P001KZ)由包含SEQ ID NO:524或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF26(设计3-P001LE)包含SEQ ID NO:525的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF26(设计3-P001LE)由包含SEQ ID NO:526或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF54(设计1-P001IT)包含SEQ ID NO:527的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF54(设计1-P001IT)由包含SEQ ID NO:528或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF54(设计2-P001LA)包含SEQ ID NO:529的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF54(设计2-P001LA)由包含SEQ ID NO:530或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF54(设计3-P001LF)包含SEQ ID NO:531的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF54(设计3-P001LF)由包含SEQ ID NO:532或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF60(设计1-P001IU)包含SEQ ID NO:533的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF60(设计1-P001IU)由包含SEQ ID NO:534或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF60(设计2-P001LB)包含SEQ ID NO:535的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF60(设计2-P001LB)由包含SEQ ID NO:536或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF60(设计3-P001LG)包含SEQ ID NO:537的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF60(设计3-P001LG)由包含SEQ ID NO:538或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF110(设计1-P001IV)包含SEQ ID NO:539的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF110(设计1-P001IV)由包含SEQ ID NO:540或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF110(设计2-P001LC)包含SEQ ID NO:541的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF110(设计2-P001LC)由包含SEQ ID NO:542或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUF110(设计3-P001LH)包含SEQ ID NO:543的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUF110(设计3-P001LH)由包含SEQ ID NO:545或由其组成的核酸序列编码。
示例性PUMBY RNA结合蛋白(靶向8个Rho核苷酸)如下:
在一些实施方案中,本公开的PUM14蛋白包含SEQ ID NO:401的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUM14蛋白由包含SEQ ID NO:402或由其组成的核酸序列编码。
示例性PUMBY RNA结合蛋白(靶向16个Rho核苷酸)如下:
在一些实施方案中,本公开的PUM14蛋白(设计1-P001JG)包含SEQ ID NO:545的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUM14蛋白(设计1-P001JG)由包含SEQ ID NO:546或由其组成的核酸序列编码。
在一些实施方案中,本公开的PUM14蛋白(设计2-P001JB)包含SEQ ID NO:547的氨基酸序列或由其组成。
在一些实施方案中,本公开的PUM14蛋白(设计2-P001JB)由包含SEQ ID NO:548或由其组成的核酸序列编码。
在本公开的组合物的一些实施方案中,至少一种RNA结合蛋白或其RNA结合部分是PPR蛋白。PPR蛋白(从植物衍生的具有三角状五肽重复(PPR)基序的蛋白质)是核编码的并且仅在RNA水平上受控制细胞器(叶绿体和线粒体),切割,翻译,剪接,RNA编辑,特异性作用于RNA稳定性的基因。PPR蛋白通常是35个氨基酸的基序,并且具有以下结构,其中PPR基序是约10个连续氨基酸。PPR基序的组合可用于与RNA的序列选择性结合。PPR蛋白通常由约10个重复结构域的PPR基序构成。PPR结构域或RNA结合结构域可被配置为无催化活性的。WO2013/058404以引用方式整体并入本文。
在一些实施方案中,本文所公开的融合蛋白在所述至少两种RNA结合多肽之间包含接头。在一些实施方案中,所述接头是肽接头。在一些实施方案中,所述肽接头包含三肽GGS的一个或多个重复。在其他实施方案中,所述接头是非肽接头。在一些实施方案中,所述非肽接头包含聚乙二醇(PEG)、聚丙二醇(PPG)、共-聚(乙二醇/丙二醇)、聚氧乙烯(POE)、聚氨酯、聚膦腈、多糖、葡聚糖、聚乙烯醇、聚乙烯吡咯烷酮、聚乙烯基乙醚、聚丙烯酰胺、聚丙烯酸酯、聚氰基丙烯酸酯、脂质聚合物、甲壳素、透明质酸、肝素或烷基接头。
在一些实施方案中,所述至少一种RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述至少一种RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含RNA结合蛋白。在一些实施方案中,所述至少一种RNA结合蛋白与RNA分子内的靶序列选择性结合。在一些实施方案中,所述至少一种RNA结合蛋白不包含对RNA分子内的第二序列的亲和力。在一些实施方案中,所述至少一种RNA结合蛋白不包含对RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。在一些实施方案中,所述至少一种RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在一些实施方案中,本文所公开的融合蛋白的至少一种RNA结合蛋白还包含编码核定位信号(NLS)的序列。在一些实施方案中,核定位信号(NLS)定位于RNA结合蛋白的N末端。在一些实施方案中,所述至少一种RNA结合蛋白在所述蛋白质的C末端包含NLS。在一些实施方案中,所述至少一种RNA结合蛋白还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,第一NLS或第二NLS定位于RNA结合蛋白的N末端。在一些实施方案中,所述至少一种RNA结合蛋白在所述蛋白质的C末端包含第一NLS或第二NLS。在一些实施方案中,所述至少一种RNA结合蛋白还包含NES(核输出信号)或其他肽标签或分泌信号。
在一些实施方案中,本文所公开的融合蛋白包含所述至少一种RNA结合蛋白作为第一RNA结合蛋白以及包含核酸酶结构域或由其组成的第二RNA结合蛋白。
在一些实施方案中,所述第二RNA结合多肽被可操作地配置到在所述第一RNA结合多肽的C末端的第一RNA结合多肽。在一些实施方案中,所述第二RNA结合多肽被可操作地配置到在所述第一RNA结合多肽的N末端的第一RNA结合多肽。例如,一种这样的示例性融合蛋白是E99,其被配置为使得RNAse1(R39D、N67D、N88A、G89D、R19D、H119N、K41R)位于SpyCas9的N末端;而另一种示例性融合蛋白E100被配置为使得RNAse1(R39D、N67D、N88A、G89D、R19D、H119N、K41R)位于SpyCas9的C末端。在另一个实施方案中,示例性融合蛋白是与第二RNA结合蛋白融合的基于PUF或PUMBY的第一RNA结合蛋白,所述第二RNA结合蛋白是称为SEQID NO:358的ZC3H12A(亦称E17)的锌指核酸内切酶。
载体
在本公开的组合物和方法的一些实施方案中,载体包含本公开的指导RNA。在一些实施方案中,所述载体包含至少一种本公开的指导RNA。在一些实施方案中,所述载体包含一种或多种本公开的指导RNA。在一些实施方案中,所述载体包含两种或更多种本公开的指导RNA。在一个实施方案中,所述载体包含三种指导RNA。在一个实施方案中,所述载体包含四种指导RNA。在一些实施方案中,所述载体还包含本公开的指导的或非指导的RNA结合蛋白。在一些实施方案中,所述载体还包含本公开的RNA结合融合蛋白。在一些实施方案中,所述融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。在一些实施方案中,包含RNA结合蛋白和gRNA的RNA指导的RNA结合系统在单一载体中。在特定实施方案中,单一载体包含RNA指导的RNA结合系统,其是Cas13d RNA指导的RNA结合系统。在一个实施方案中,单一载体包含Cas13dRNA指导的RNA结合系统,其是CasRx RNA指导的RNA结合系统。在另一个实施方案中,单一载体包含非指导的RNA结合系统,所述系统包含与核酸酶结构域如ZC3H12A融合的基于PUF或PUMBY的蛋白质。
在本公开的组合物和方法的一些实施方案中,第一载体包含本公开的指导RNA并且第二载体包含本公开的RNA结合蛋白或RNA结合融合蛋白。在一些实施方案中,所述第一载体包含至少一种本公开的指导RNA。在一些实施方案中,所述第一载体包含一种或多种本公开的指导RNA。在一些实施方案中,所述第一载体包含两种或更多种本公开的指导RNA。在一些实施方案中,所述融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。在一些实施方案中,所述第一载体和所述第二载体是相同的载体或载体血清型。在一些实施方案中,所述第一载体和所述第二载体不是相同的载体或载体血清型。
在本公开的组合物和方法的一些实施方案中,所述载体是或包含“基于2组分Cas9的RNA靶向系统”的组分,所述系统包含(a)编码本公开的RNA结合蛋白或RNA结合融合蛋白和治疗性替代蛋白的核酸序列;以及(b)单一指导RNA(sgRNA)序列,所述序列包含:在其5'端,与靶RNA序列(例如,包含靶RNA序列的致病性RNA)杂交或结合的RNA序列(或间隔子序列);和在其3'端,能够与融合蛋白的CRISPR/Cas9蛋白结合或缔合的RNA序列(或支架序列);并且其中所述2组分RNA靶向系统在不存在PAMmer的情况下识别并改变细胞中的靶RNA(例如,包含在致病性靶RNA中)。在一些实施方案中,2组分系统的序列在单一载体中。在一些实施方案中,2组分系统的间隔子序列靶向包含一个或多个功能获得或丧失型突变的RNA。
一种类型的载体是“质粒”,其是指环状双链DNA环,可以如通过标准分子克隆技术向该环中插入另外的DNA区段。另一种类型的载体是病毒载体,其中病毒衍生的的DNA或RNA序列存在于包装到病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)中的载体中。病毒载体还包括由转染到宿主细胞中的病毒携带的多核苷酸。在一些实施方案中,载体是慢病毒(如整合缺陷型慢病毒载体)或腺相关病毒(AAV)载体。载体能够在它们被引入的宿主细胞中自主复制(例如像具有细菌复制起点的细菌载体和附加型哺乳动物载体),而其他载体(例如像非附加型哺乳动物载体)在引入到宿主细胞中之后被整合到宿主细胞的基因组中,并且因此随着宿主基因组一起复制。
在一些实施方案中,载体例如像表达载体能够引导与它们可操作地连接的基因的表达。常见的表达载体通常为质粒的形式。在一些实施方案中,重组表达载体包含本文所提供的核酸,例如像可从RNA序列表达的指导RNA或RNA序列,以及编码Cas 13d蛋白的核酸,呈适于在宿主细胞中表达核酸的形式。重组表达载体包括一个或多个调控元件,这些调控元件可基于用于表达的宿主细胞进行选择,与待表达的核酸序列可操作地连接。在重组表达载体内,“可操作地连接”旨在意指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调控元件。载体的某些实施方案取决于如待转化的宿主细胞的选择和所需表达水平等因素。可将载体引入宿主细胞中,从而产生由本文所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽,例如像CRISPR转录物、蛋白质、酶、其突变形式、其融合蛋白等。
在本公开的组合物和方法的一些实施方案中,本公开的载体是病毒载体。在一些实施方案中,所述病毒载体包含从逆转录病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从慢病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从腺病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。在一些实施方案中,所述病毒载体无复制能力。在一些实施方案中,所述病毒载体是分离的或重组的。在一些实施方案中,所述病毒载体是自身互补的。
在本公开的组合物和方法的一些实施方案中,所述病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。在一些实施方案中,所述病毒载体包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10(AAVrh10)、AAV11或AAV12的AAV分离或衍生的反向末端重复序列或衣壳序列。在一个实施方案中,所述AAV载体包含修饰的衣壳。在一个实施方案中,所述AAV载体是AAV2-Tyr突变型载体。在一个实施方案中,所述AAV载体包含在对应于位于野生型AAV2的位置Tyr252、Tyr272、Tyr275、Tyr281、Tyr508、Tyr612、Tyr704、Tyr720、Tyr730或Tyr673的表面暴露的酪氨酸残基的位置处具有非酪氨酸氨基酸的衣壳。还参见WO 2008/124724,将其整体并入本文。在一些实施方案中,所述AAV载体包含工程化的衣壳。包含工程化衣壳的AAV载体包括但不限于AAV2.7m8、AAV9.7m8、AAV2 2tYF和AAV8Y733F)。在一些实施方案中,所述病毒载体无复制能力。在一些实施方案中,所述病毒载体是分离的或重组的(rAAV)。在一些实施方案中,所述病毒载体是自身互补的(scAAV)。
在本公开的组合物和方法的一些实施方案中,本公开的载体是非病毒载体。在一些实施方案中,所述载体包含以下项或由其组成:纳米颗粒、胶束、脂质体或阳离子脂质体-DNA复合物、聚合物囊泡、聚合物-DNA复合物或树枝状聚合物。在一些实施方案中,所述载体是表达载体或重组表达系统。如本文所用,术语“重组表达系统”是指用于表达通过重组形成的某些遗传物质的遗传构建体。
在本公开的组合物和方法的一些实施方案中,本文所提供的表达载体、病毒载体或非病毒载体包括但不限于表达控制元件。如本文所用,“表达控制元件”是指调节编码序列如基因的表达的任何序列。示例性表达控制元件包括但不限于启动子、增强子、微小RNA、转录后调控元件、聚腺苷酸化信号序列和内含子。例如,表达控制元件可以是组成型的、诱导型的、阻抑型的或组织特异性的。“启动子”是控制序列,它是多核苷酸序列中控制转录起始和速率的区域。它可含有调控蛋白和分子可以结合的遗传元件,如RNA聚合酶和其他转录因子。在一些实施方案中,启动子对表达的控制是组织特异性的。在一些实施方案中,启动子对表达的控制是组成型的或普遍存在的。非限制性的示例性启动子包括pol III启动子,例如像U6和H1启动子;和/或pol II启动子,例如SV40、CMV(任选地包括CMV增强子)、RSV(劳斯氏肉瘤病毒LTR启动子(任选地包括RSV增强子)、CBA(杂交CMV增强子/鸡β-肌动蛋白)、CAG(与鸡β-肌动蛋白融合的杂合CMV增强子)、截短的CAG、Cbh(杂合CBA)、EF-1a(人延长因子α-1)或EFS(无短内含子的EF-1α)、PGK(磷酸甘油激酶)、CEF(鸡胚胎成纤维细胞)、UBC(泛素C)、GUSB(溶酶体酶β-葡萄糖醛酸酶)、UCOE(泛染色质开放元件)、hAAT(α-1抗胰蛋白酶)、TBG(甲状腺素结合球蛋白)、结蛋白(Desmin)、MCK(肌肉肌酸激酶)、C5-12(合成肌肉启动子)、NSE(神经元特异性烯醇化酶)、突触蛋白、突触蛋白-1(SYN-1)、视蛋白、PDGF(血小板衍生生长因子)、PDGF-A、MecP2(甲基CpG结合蛋白2)、CaMKII(钙/钙调蛋白依赖性蛋白激酶II)、mGluR2(代谢型谷氨酸受体2)、NFL(轻神经丝)、NFH(重神经丝)、nβ2、PPE(大鼠前脑啡肽原)、ENK(前脑啡肽原)、前脑啡肽原-神经丝嵌合启动子、EAAT2(谷氨酸转运蛋白)、GFAP(胶质纤维酸性蛋白)、MBP(髓鞘碱性蛋白)、人视紫红质激酶启动子(hGRK1)、β-肌动蛋白启动子、二氢叶酸还原酶启动子以及它们的组合。“增强子”是DNA中可由激活蛋白结合以增加转录的可能性或频率的区域。非限制性的示例性增强子和转录后调控元件包括CMV增强子、MCK增强子、HTLV-1的LTR中的R-U5’区段、SV40增强子、兔β-珠蛋白外显子2与3之间的内含子序列和WPRE。
在本公开的组合物和方法的一些实施方案中,本文所提供的表达载体、病毒载体或非病毒载体包括但不限于用于建构“多顺反子(multicistronic)”或“多顺反子(polycistronic)”或“双顺反子”或“三顺反子”构建体(即,具有双重或三重或多重编码区或外显子)的载体元件,如IRES或2A肽位点,并且因此将具有从mRNA表达来自单一构建体的两种或更多种蛋白质的能力。多顺反子载体从同一mRNA同时表达两种或更多种单独蛋白质。最广泛用于构建多顺反子构型的两种策略是通过使用IRES或2A自切割位点。“IRES”是指用于多顺反子载体构建体内的病毒、原核或真核来源的内部核糖体进入位点或其部分。在一些实施方案中,IRES是允许以非帽依赖性方式进行翻译起始的RNA元件。术语“自切割肽”或“编码自切割肽的序列”或“2A自切割位点”是指在载体构建体内用于并入位点以促进核糖体跳跃且因此从单一启动子产生两种多肽的连接序列,此类自切割肽包括但不限于T2A和P2A肽或编码自切割肽的序列。
在一个实施方案中,所述载体构型显示在例如图1、图2或图6中。在另一个实施方案中,所述载体构型包含与驱动替代基因的表达的启动子或调控序列可操作地连接的驱动编码RNA结合蛋白的核酸的表达的启动子或调控序列。在另一个实施方案中,所述载体构型包含驱动编码PUF或PUMBY融合蛋白的核酸的表达的启动子如视紫红质激酶启动子,所述启动子与驱动编码替代或“硬化”视紫红质蛋白的核酸序列的表达的启动子如视蛋白启动子可操作地连接。在另一个实施方案中,所述载体构型包含驱动编码PUF或PUMBY融合蛋白的核酸的表达的启动子如视蛋白启动子,所述启动子与驱动编码替代或“硬化”视紫红质蛋白的核酸序列的表达的启动子如视紫红质激酶启动子可操作地连接。在另一个实施方案中,编码RNA结合蛋白的核酸通过IRES或2A肽与编码替代蛋白的核酸可操作地连接。
在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是腺病毒载体、腺相关病毒(AAV)载体或慢病毒载体。在一些实施方案中,所述载体是逆转录病毒载体、腺病毒/逆转录病毒嵌合体载体、单纯疱疹病毒I或II载体、细小病毒载体、网状内皮组织增殖病病毒载体、脊髓灰质炎病毒载体、乳头状瘤病毒载体、痘苗病毒载体或者并入两种或更多种病毒载体的有利方面的任何杂合或嵌合载体。在一些实施方案中,所述载体还包含与多核苷酸可操作地连接的一种或多种表达控制元件。在一些实施方案中,所述载体还包含一种或多种选择性标志物。在一些实施方案中,所述AAV载体具有低毒性。在一些实施方案中,所述AAV载体不并入宿主基因组中,从而具有低的引起插入诱变的概率。在一些实施方案中,所述AAV载体可编码4.5kb至4.75kb的一系列总多核苷酸。在一些实施方案中,可用于任何本文所述的组合物、系统、方法和试剂盒中的示例性AAV载体可包括AAV1载体、修饰的AAV1载体、AAV2载体、修饰的AAV2载体、AAV2-Tyr突变型载体、AAV3载体、修饰的AAV3载体、AAV4载体、修饰的AAV4载体、AAV5载体、修饰的AAV5载体、AAV6载体、修饰的AAV6载体、AAV7载体、修饰的AAV7载体、AAV8载体、AAV9载体、AAV.rh10载体、修饰的AAV.rh10载体、AAV.rh32/33载体、修饰的AAV.rh32/33载体、AAV.rh43载体、修饰的AAV.rh43载体、AAV.rh64R1载体和修饰的AAV.rh64R1载体、AAV-Tyr突变型载体以及它们的任何组合物或等效物。在一些实施方案中,所述慢病毒载体是有整合酶能力的慢病毒载体(ICLV)。在一些实施方案中,所述慢病毒载体可以指转基因质粒载体,以及与相关质粒(例如,包装质粒、rev表达质粒、包膜质粒)结合的转基因质粒载体,以及能够通过病毒或病毒样进入机制将外源核酸引入细胞中的基于慢病毒的颗粒。慢病毒载体是本领域众所周知的(参见,例如,Trono D.(2002)Lentiviral vectors,New York:Spring-Verlag Berlin Heidelberg以及Durand等人(2011)Viruses 3(2):132-159doi:10.3390/v3020132)。在一些实施方案中,可用于任何本文所述的组合物、系统、方法和试剂盒中的示例性慢病毒载体可包括人免疫缺陷病毒(HIV)1载体、修饰的人免疫缺陷病毒(HIV)1载体、人免疫缺陷病毒(HIV)2载体、修饰的人免疫缺陷病毒(HIV)2载体、白领白眉猴(sooty mangabey)猿猴免疫缺陷病毒(SIVSM)载体、修饰的白领白眉猴猿猴免疫缺陷病毒(SIVSM)载体、非洲绿猴猿猴免疫缺陷病毒(SIVAGM)载体、修饰的非洲绿猴猿猴免疫缺陷病毒(SIVAGM)载体、马传染性贫血病毒(EIAV)载体、修饰的马传染性贫血病毒(EIAV)载体、猫免疫缺陷病毒(FIV)载体、修饰的猫免疫缺陷病毒(FIV)载体、维斯纳/梅迪病毒(Visna/maedi virus)(VNV/VMV)载体、修饰的维斯纳/梅迪病毒(VNV/VMV)载体、羊关节炎-脑炎病毒(CAEV)载体、修饰的羊关节炎-脑炎病毒(CAEV)载体、牛免疫缺陷病毒(BIV)或修饰的牛免疫缺陷病毒(BIV)。
核酸
本文提供了编码用于本文所述的基因转移和表达技术中的本文所公开的敲低和替代治疗剂的核酸序列。虽然没有总是明确陈述,但是应当理解,本文所提供的序列可用于提供表达产物以及产生具有相同生物特性的蛋白质的基本上相同的序列。这些“生物等效的”或“生物活性的”或“等效的”多肽是由如本文所述的等效多核苷酸编码的。当使用在默认条件下运行的序列同一性方法比较时,它们可具有与参考多肽至少60%、或可替代地至少65%、或可替代地至少70%、或可替代地至少75%、或可替代地至少80%、或可替代地至少85%、或可替代地至少90%、或可替代地至少95%、或可替代地至少98%相同的初级氨基酸序列。提供了特定多肽序列作为具体实施方案的实例。用具有类似电荷的可替代氨基酸对序列中的氨基酸进行修饰。另外,等效多核苷酸是在严格条件下与参考多核苷酸或其互补体杂交的多核苷酸,或者就多肽而言,是由在严格条件下与参考编码多核苷酸或其互补链杂交的多核苷酸编码的多肽。或者,等效多肽或蛋白质是从等效多核苷酸表达的多肽或蛋白质。
本文所公开的核酸序列(例如,多核苷酸序列)可以是密码子优化的,密码子优化是本领域中众所周知的技术。在本文所公开的一些实施方案中,示例性Cas序列,例如像编码SEQ ID NO:92(Cas13d,称为CasRx)的核酸序列或编码SEQ ID NO:298(Cas13d,称为CasRx)的核酸序列经密码子优化以用于在人细胞中表达。密码子优化涉及以下事实,即不同细胞在对特定密码子的使用方面有所不同。该密码子偏倚对应于特定tRNA在细胞类型中的相对丰度的偏倚。通过改变序列中的密码子以与相应tRNA的相对丰度匹配,可能增加表达。还可能通过故意选择已知相应tRNA在特定细胞类型中罕见的密码子来减少表达。哺乳动物细胞以及多种其他生物的密码子使用表是本领域中已知的。基于遗传密码,可产生编码例如Cas蛋白的核酸序列。在一些实施方案中,这样的序列被优化以用于在宿主细胞或靶细胞中表达,所述宿主细胞或靶细胞是如用于表达Cas蛋白的宿主细胞或在其中实践所公开方法的细胞(如在哺乳动物细胞例如人细胞中)。特定物种的密码子偏好和密码子使用表可用于工程化编码Cas蛋白的分离的核酸分子(如编码与其相应野生型蛋白具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的蛋白质的核酸分子),其利用该特定物种的密码子使用偏好。例如,本文所公开的Cas蛋白可被设计为具有特定目标生物优先使用的密码子。在一个实例中,Cas核酸序列被优化以用于在人细胞中表达,如与其相应野生型或起源核酸序列具有至少70%、至少80%、至少85%、至少90%、至少92%、至少95%、至少98%或至少99%序列同一性的Cas核酸序列。在一些实施方案中,编码至少一种Cas蛋白的分离的核酸分子(其可能是载体的一部分)包括经密码子优化以用于在真核细胞中表达的至少一个Cas蛋白编码序列或经密码子优化以用于在人细胞中表达的至少一个Cas蛋白编码序列。在一个实施方案中,这样的密码子优化的Cas编码序列与其相应野生型或起源序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在另一个实施方案中,真核细胞密码子优化的核酸序列编码与其相应野生型或起源蛋白具有至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的Cas蛋白。在另一个实施方案中,可常规地产生含有功能等效核酸的多个克隆,所述功能等效核酸如有序列不同但编码相同Cas蛋白序列的核酸。编码序列中的沉默突变是由于遗传密码的简并性(即,冗余)所致,借此超过一种密码子可以编码相同的氨基酸残基。因此,例如,亮氨酸可由CTT、CTC、CTA、CTG、TTA或TTG编码;丝氨酸可由TCT、TCC、TCA、TCG、AGT或AGC编码;天冬酰胺可由AAT或AAC编码;天冬氨酸可由GAT或GAC编码;半胱氨酸可由TGT或TGC编码;丙氨酸可由GCT、GCC、GCA或GCG编码;谷氨酰胺可由CAA或CAG编码;酪氨酸可由TAT或TAC编码;并且异亮氨酸可由ATT、ATC或ATA编码。显示标准遗传密码的表格可见于多个来源(参见,例如,Stryer,1988,Biochemistry,第3版,W.H.5Freeman and Co.,NY)。
“杂交”是指一种或多种多核苷酸反应形成通过核苷酸残基的碱基之间的氢键合稳定化的复合物的反应。氢键合可通过沃森克里克碱基配对、霍格斯坦结合(Hoogsteinbinding)或以任何其他序列特异性方式来进行。复合物可包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、单条自杂交链或这些的任何组合。杂交反应可构成更广泛过程中的一个步骤(如PC反应的起始或核酶对多核苷酸的酶促切割)中的步骤。
严格杂交条件的实例包括:约25℃至约37℃的孵育温度;约6xSSC至约10x SSC的杂交缓冲液浓度;约0%至约25%的甲酰胺浓度;和约4x SSC至约8x SSC的洗涤溶液。中等杂交条件的实例包括:约40℃至约50℃的孵育温度;约9x SSC至约2x SSC的缓冲液浓度;约30%至约50%的甲酰胺浓度;和约5x SSC至约2x SSC的洗涤溶液。高严格性条件的实例包括:约55℃至约68℃的孵育温度;约lx SSC至约0.1x SSC的缓冲液浓度;约55%至约75%的甲酰胺浓度;和约lx SSC、0.1x SSC或去离子水的洗涤溶液。一般来讲,杂交孵育时间为5分钟至24小时,有1个、2个或更多个洗涤步骤,并且洗涤孵育时间为约1、2或15分钟。SSC是0.15M NaCl和15mM柠檬酸盐缓冲液。应当理解,可采用使用其他缓冲液系统的SSC的等效物。
“同源性”或“同一性”或“相似性”是指两个肽之间或两个核酸分子之间的序列相似性。同源性可通过比较各序列中可为比较目的来比对的位置而确定。当所比较序列中的位置被相同的碱基或氨基酸占据时,那么这些分子在那个位置上是同源的。序列之间的同源性程度随着序列共有的匹配或同源位置的数目而变化。“无关”或“非同源的”序列与本发明的序列中的一个序列共有小于40%的同一性,或可替代地小于25%的同一性。
细胞
在本公开的组合物和方法的一些实施方案中,本公开的细胞是原核细胞。
在本公开的组合物和方法的一些实施方案中,本公开的细胞是真核细胞。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是牛、鼠、猫、马、猪、犬、猿或人细胞。在一些实施方案中,所述细胞是非人哺乳动物细胞,如非人灵长类动物细胞。
在一些实施方案中,本公开的细胞是体细胞。在一些实施方案中,本公开的细胞是种系细胞。在一些实施方案中,本公开的种系细胞不是人细胞。
在本公开的组合物和方法的一些实施方案中,本公开的细胞是干细胞。在一些实施方案中,本公开的细胞是胚胎干细胞。在一些实施方案中,本公开的胚胎干细胞不是人细胞。在一些实施方案中,本公开的细胞是多潜能干细胞或多能干细胞。在一些实施方案中,本公开的细胞是成体干细胞。在一些实施方案中,本公开的细胞是诱导多能干细胞(iPSC)。在一些实施方案中,本公开的细胞是造血干细胞(HSC)。
在本公开的一些实施方案中,体细胞是眼细胞。眼细胞包括但不限于角膜上皮细胞、角质细胞、视网膜色素上皮(RPE)细胞、晶状体上皮细胞、虹膜色素上皮细胞、结膜成纤维细胞、无色素睫状上皮细胞、小梁网细胞、眼脉络膜成纤维细胞、结膜上皮细胞,在一些实施方案中,眼细胞是视网膜细胞或角膜细胞。在一个实施方案中,视网膜细胞是光感受器细胞或视网膜色素上皮细胞。在另一个实施方案中,视网膜细胞是神经节细胞、无长突细胞、双极细胞、水平细胞、Müller胶质细胞、杆细胞或视锥细胞。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是免疫细胞。在一些实施方案中,本公开的免疫细胞是淋巴细胞。在一些实施方案中,本公开的免疫细胞是T淋巴细胞(本文也称为T细胞)。本公开的示例性T细胞包括但不限于幼稚T细胞、效应T细胞、辅助T细胞、记忆T细胞、调节性T细胞(Treg)和γδT细胞。在一些实施方案中,本公开的免疫细胞是B淋巴细胞。在一些实施方案中,本公开的免疫细胞是自然杀伤细胞。在一些实施方案中,本公开的免疫细胞是抗原呈递细胞。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是肌肉细胞。在一些实施方案中,本公开的肌细胞是成肌细胞或肌细胞。在一些实施方案中,本公开的肌细胞是心肌细胞、骨骼肌细胞或平滑肌细胞。在一些实施方案中,本公开的肌肉细胞是横纹肌细胞。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是上皮细胞。在一些实施方案中,本公开的上皮细胞形成鳞状细胞上皮、立方细胞上皮、柱状细胞上皮、层状细胞上皮、假复层柱状细胞上皮或移行细胞上皮。在一些实施方案中,本公开的上皮细胞形成腺体,包括但不限于松果腺、胸腺、垂体、甲状腺、肾上腺、顶质分泌腺、全质分泌腺、局质分泌腺、浆液腺、粘液腺和皮脂腺。在一些实施方案中,本公开的上皮细胞接触器官的外表面,所述器官包括但不限于肺、脾、胃、胰腺、膀胱、肠、肾、胆囊、肝、喉或咽。在一些实施方案中,本公开的上皮细胞接触血管或静脉的外表面。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是神经元细胞。在一些实施方案中,本公开的神经元细胞是中枢神经系统的神经元。在一些实施方案中,本公开的神经元细胞是脑或脊髓的神经元。在一些实施方案中,本公开的神经元细胞是视网膜的神经元。在一些实施方案中,本公开的神经元细胞是脑神经或视神经的神经元。在一些实施方案中,本公开的神经元细胞是周围神经系统的神经元。在一些实施方案中,本公开的神经元细胞是神经胶质细胞或胶质细胞。在一些实施方案中,本公开的胶质细胞是中枢神经系统的胶质细胞,包括但不限于少突胶质细胞、星形胶质细胞、室管膜细胞和小胶质细胞。在一些实施方案中,本公开的胶质细胞是周围神经系统的胶质细胞,包括但不限于施万细胞(Schwann cell)和卫星细胞。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是原代细胞。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是培养的细胞。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是体内的、体外的、离体的或原位的。
在本公开的组合物和方法的一些实施方案中,本公开的体细胞是自体的或同种异体的。
使用方法
本公开提供了一种修饰本公开的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括使本公开的组合物与所述RNA分子在适合于指导RNA或RNA结合蛋白或RNA结合融合蛋白(或其部分)中的一者或多者与所述RNA分子结合的条件下相接触。
本公开提供了一种修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括使本公开的组合物与所述RNA分子在适合于指导RNA或RNA结合蛋白或融合蛋白(或其部分)中的一者或多者与所述RNA分子结合的条件下相接触。
本公开提供了一种修饰本公开的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括使本公开的组合物与包含所述RNA分子的细胞在适合于指导RNA或RNA结合蛋白或融合蛋白(或其部分)中的一者或多者与所述RNA分子结合的条件下相接触。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,本公开的组合物包含载体,所述载体包含本公开的指导RNA和本公开的RNA结合蛋白或融合蛋白以及本公开的治疗性替代蛋白。在一些实施方案中,所述载体是AAV。
本公开提供了一种修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括使本公开的组合物与包含所述RNA分子的细胞在适合于指导RNA或RNA结合蛋白或融合蛋白(或其部分)中的一者或多者与所述RNA分子结合的条件下相接触。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,本公开的组合物包含载体,所述载体包含本公开的指导RNA或单一指导RNA序列和编码本公开的RNA结合蛋白或融合蛋白和本公开的治疗性替代蛋白的核酸序列。在一些实施方案中,所述载体是AAV。
本公开提供了一种修饰本公开的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括使本公开的组合物与所述RNA分子在适合于RNA核酸酶活性的条件下相接触,其中所述RNA结合蛋白或融合蛋白诱导所述RNA分子中的断裂。
本公开提供了一种修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括使本公开的组合物与所述RNA分子在适合于RNA核酸酶活性的条件下相接触,其中所述RNA结合蛋白或融合蛋白诱导所述RNA分子中的断裂。
本公开提供了一种修饰本公开的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括使本公开的组合物与包含所述RNA分子的细胞在适合于RNA核酸酶活性的条件下相接触,其中所述RNA结合蛋白或融合蛋白诱导所述RNA分子中的断裂。在一些实施方案中,本公开的组合物另外提供了替代治疗性蛋白,所述替代治疗性蛋白与包含靶RNA的致病性RNA相对应。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,所述载体包含含有本公开的指导RNA、本公开的RNA结合融合蛋白和本公开的治疗性替代蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开提供了一种修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括使本公开的组合物与包含所述RNA分子的细胞在适合于RNA核酸酶活性的条件下相接触,其中所述RNA结合蛋白或融合蛋白诱导所述RNA分子中的断裂。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,所述载体包含含有本公开的指导RNA或单一指导RNA或编码本公开的RNA结合蛋白或融合蛋白和治疗性替代蛋白的核酸序列的组合物。在一些实施方案中,所述载体是AAV。
本公开提供了一种治疗疾病或病症的方法,所述方法包括向受试者施用治疗有效量的本公开的组合物。
本公开提供了一种治疗疾病或病症的方法,所述方法包括向受试者施用治疗有效量的本公开的组合物,其中所述组合物包含载体,所述载体包含含有本公开的指导RNA和编码本公开的RNA结合蛋白或融合蛋白和本公开的治疗性替代蛋白的核酸序列的组合物,其中所述组合物修饰、降低或消除本公开的RNA分子的致病性靶RNA或由所述RNA分子编码的蛋白质的表达水平(与相应野生型蛋白的表达水平相比),并且其中所述治疗性蛋白替代由所述致病性RNA编码的功能获得或丧失型突变。
本公开提供了一种治疗疾病或病症的方法,所述方法包括向受试者施用治疗有效量的本公开的组合物,其中所述组合物包含载体,所述载体包含含有本公开的指导RNA和编码本公开的RNA结合蛋白或融合蛋白和本公开的治疗性替代蛋白的核酸序列的组合物,其中所述组合物修饰、降低或消除本公开的RNA分子的致病性靶RNA或由所述RNA分子编码的蛋白质的表达水平(与相应野生型蛋白的表达水平相比),并且其中所述治疗性蛋白替代由所述致病性RNA编码的功能获得或丧失型突变。
在本公开的组合物和方法的一些实施方案中,疾病或病症包括但不限于与视紫红质表达或其缺乏相关的疾病或病症。在一些实施方案中,所述疾病或病症是视网膜退行性病症或视网膜病变。在一些实施方案中,所述视网膜退行性病症是色素性视网膜炎。
色素性视网膜炎是一种由视紫红质基因中的功能获得或丧失型突变引起的常染色体显性病症。表达视紫红质的视杆细胞的损失会导致视锥细胞的损失,从而导致退行性视力损失。人视紫红质基因中的突变会影响蛋白质的折叠、运输和活性,而这些蛋白质最常引发患者的视网膜变性。人视蛋白基因(P23H)中密码子位置23处的单个碱基取代也是色素性视网膜炎的常见原因。色素性视网膜炎是遗传性视网膜变性的最常见形式之一,患病率为1/4000分。该疾病取决于突变基因,是不同遗传模式(常染色体显性、常染色体隐性和X连锁)的结果。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于遗传疾病或病症。在一些实施方案中,遗传疾病或病症是单基因疾病或病症。在一些实施方案中,单基因疾病或病症是常染色体显性疾病或病症、常染色体隐性疾病或病症、X染色体连锁(X连锁)疾病或病症、X连锁显性疾病或病症、X连锁隐性疾病或病症、Y连锁疾病或病症或线粒体疾病或病症。在一些实施方案中,遗传疾病或病症是多基因疾病或病症。在一些实施方案中,遗传疾病或病症是多基因疾病或病症。在一些实施方案中,单基因疾病或病症是常染色体显性疾病或病症,包括但不限于亨廷顿氏病(Huntington'sdisease)、神经纤维瘤病1型、神经纤维瘤病2型、马凡综合征(Marfan syndrome)、遗传性非息肉病性结直肠癌、遗传性多发性外生骨疣、血管性血友病(Von Willebrand disease)和急性间歇性卟啉病。在一些实施方案中,单基因疾病或病症是常染色体隐性疾病或病症,包括但不限于白化病、中链酰基辅酶A脱氢酶缺乏症、囊性纤维化、镰状细胞病、泰-萨二氏病(Tay-Sachs disease)、尼曼-皮克病(Niemann-Pickdisease)、脊髓性肌萎缩和罗伯茨综合征(Robertssyndrome)。在一些实施方案中,单基因疾病或病症是X连锁疾病或病症,包括但不限于肌营养不良、杜氏肌营养不良(Duchenne muscular dystrophy)、血友病、肾上腺脑白质营养不良(ALD)、雷特综合征(Rett syndrome)和血友病A。在一些实施方案中,单基因疾病或病症是线粒体病症,包括但不限于利伯氏遗传性视神经病变(Leber's hereditary opticneuropathy)。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于免疫疾病或病症。在一些实施方案中,免疫疾病或病症是免疫缺陷疾病或病症,包括但不限于B细胞缺乏症、T细胞缺乏症、嗜中性粒细胞减少症、无脾、补体缺乏症、获得性免疫缺陷综合征(AIDS)和由医学干预引起的免疫缺陷(免疫抑制是医学疗法的预期或不利影响)。在一些实施方案中,免疫疾病或病症是自身免疫性疾病或病症,包括但不限于失弛缓症、艾迪生氏病(Addison’s disease)、成人斯提耳氏(Adult Still'sdisease)、无丙种球蛋白血症、斑秃、淀粉样变性、抗GBM/抗TBM肾炎、抗磷脂综合征、自身免疫性血管性水肿、自身免疫性自主神经机能异常、自身免疫性脑脊髓炎、自身免疫性肝炎、自身免疫性内耳病(AIED)、自身免疫性心肌炎、自身免疫性卵巢炎、自身免疫性睾丸炎、自身免疫性胰腺炎、自身免疫性视网膜病变、自身免疫性荨麻疹、轴突和神经元神经病变(AMAN)、巴洛病(Balódisease)、白塞氏病(Behcet's disease)、良性粘膜类天疱疮、大疱性类天疱疮、卡斯尔曼病(Castlemandisease,CD)、乳糜泻、美洲锥虫病(Chagas disease)、慢性炎症性脱髓鞘性多发性神经病变(CIDP)、慢性复发性多病灶性骨髓炎(CRMO)、变应性肉芽肿性血管炎(Churg-StraussSyndrome,CSS)或嗜伊红细胞性肉芽肿病(EGPA)、瘢痕性类天疱疮、寇甘综合征(Cogan'ssyndrome)、冷凝集素病、先天性心脏传导阻滞、柯萨奇病毒性心肌炎、CREST综合征、克罗恩病(Crohn’s disease)、疱疹样皮炎、皮肌炎、德维克氏病(Devic's disease)(视神经脊髓炎)、盘状狼疮、德雷斯勒综合征(Dressler’s syndrome)、子宫内膜异位症、嗜酸性食道炎(EoE)、嗜酸性筋膜炎、结节性红斑、特发性混合性冷球蛋白血症(Essential mixedcryoglobulinemia)、伊文思综合征(Evans syndrome)、纤维肌痛、纤维化肺泡炎、巨细胞动脉炎(颞动脉炎)、巨细胞性心肌炎、肾小球肾炎、肺出血-肾炎综合征(Goodpasture’ssyndrome)、肉芽肿性多血管炎、格雷夫斯病(Graves’disease)、格林-巴利综合征(Guillain-Barre syndrome)、桥本甲状腺炎(Hashimoto’s thyroiditis)、溶血性贫血、过敏性紫癜(Henoch-Schonlein purpura,HSP)、妊娠疱疹或妊娠性类天疱疮(PG)、化脓性汗腺炎(HS)(反常性痤疮)、低丙球蛋白血症、IgA肾病、IgG4相关性硬化性疾病、免疫性血小板减少性紫癜(ITP)、包涵体肌炎(IBM)、间质性膀胱炎(IC)、幼年型关节炎、幼年型糖尿病(1型糖尿病)、幼年型肌炎(JM)、川崎病(Kawasaki disease)、兰伯特-伊顿综合征(Lambert-Eaton syndrome)、白细胞破碎性血管炎、扁平苔癣、硬化性苔癣、木样结膜炎、线性IgA疾病(LAD)、狼疮、慢性莱姆病(Lyme disease chronic)、梅尼埃病(Meniere’s disease)、显微镜下多血管炎(MPA)、混合性结缔组织病(MCTD)、蚕蚀性角膜溃疡(Mooren’sulcer)、穆-哈二氏病(Mucha-Habermann disease)、多灶性运动神经病变(MMN)或MMNCB、多发性硬化症、重症肌无力、肌炎、发作性睡病、新生儿狼疮、视神经脊髓炎、嗜中性粒细胞减少症、眼部瘢痕性类天庖疮、视神经炎、复发性风湿病(PR)、PANDAS、副肿瘤性小脑变性(PCD)、阵发性睡眠性血红蛋白尿(PNH)、帕里-龙贝格综合征(Parry Romberg syndrome)、睫状体扁平部炎(周边葡萄膜炎)、帕-特二氏综合征(Parsonnage-Turner syndrome)、天疱疮、周围神经病变、静脉周围性脑脊髓炎(Perivenous encephalomyelitis)、恶性贫血(PA)、POEMS综合征、结节性多动脉炎、多腺体综合征I型、II型、III型、风湿性多肌痛、多发性肌炎、心肌梗死后综合征、心包切开术后综合征、原发性胆汁性肝硬化、原发性硬化性胆管炎、孕酮性皮炎、银屑病、银屑病关节炎、纯红细胞再生障碍(PRCA)、坏疽性脓皮病、雷诺现象(Raynaud’sphenomenon)、反应性关节炎、反射性交感神经营养不良、复发性多软骨炎、不宁腿综合征(RLS)、腹膜后纤维化、风湿热、类风湿性关节炎、结节病、施密特综合征(Schmidtsyndrome)、巩膜炎、硬皮病、干燥综合征(
Figure BDA0003526863300001221
syndrome)、精子和睾丸自身免疫、僵人综合征(SPS)、亚急性细菌性心内膜炎(SBE)、苏萨克综合征(Susac's syndrome)、交感性眼炎(SO)、大动脉炎(Takayasu's arteritis)、颞动脉炎/巨细胞动脉炎、血小板减少性紫癜(TTP)、托洛萨-亨特综合征(Tolosa-Hunt syndrome,THS)、横贯性脊髓炎、1型糖尿病、溃疡性结肠炎(UC)、未分化结缔组织病(UCTD)、葡萄膜炎、血管炎、白癜风、小柳原田病(Vogt-Koyanagi-Harada Disease)、AAT(α1抗胰蛋白酶缺乏症)、或韦氏肉芽肿病(Wegener’sgranulomatosis)、威尔逊病(Wilson disease)、遗传性血色素沉着病1-5型、I型酪氨酸血症、精氨琥珀酸裂解酶缺乏症、糖原贮积病I-VIII型、希特林缺乏症(Citrin deficiency)、胆固醇酯贮积病、进行性家族性肝内胆汁淤积症3型、多囊肾病、阿尔斯特雷姆综合征(
Figure BDA0003526863300001222
syndrome)和先天性肝纤维化。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于炎症性疾病或病症。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于代谢性疾病或病症。在一些实施方案中,代谢性疾病或病症与先天性代谢缺陷相关。在一些实施方案中,与先天性代谢缺陷相关的代谢性疾病或病症包括但不限于氨基酸代谢病症、碳水化合物代谢病症、尿素循环障碍或缺陷、有机酸代谢病症(例如有机酸尿症)、脂肪酸氧化和线粒体代谢病症、卟啉代谢病症、嘌呤或嘧啶代谢病症、类固醇代谢病症、过氧化物酶体功能病症、溶酶体贮积症和胆汁淤积性疾病。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于线粒体疾病。在一些实施方案中,线粒体疾病包括但不限于莱伯氏遗传性视神经病变(LHON)、雷氏病或综合征(Leigh’sdisease or syndrome)、神经病变、共济失调和色素性视网膜炎(NARP)、卡恩斯-塞尔综合征(Kearns Sayre syndrome,KSS)、皮尔森综合征(Pearson syndrome)、慢性进行性外眼肌麻痹(CPEO)、线粒体神经胃肠脑病综合征(MNGIE)、线粒体脑肌病乳酸酸中毒和中风样发作(MELAS)和线粒体烯酰辅酶A还原酶蛋白相关性神经变性(MEPAN)。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于退行性或进行性疾病或病症。在一些实施方案中,退行性或进行性疾病或病症包括但不限于肌萎缩侧索硬化症(ALS)、亨廷顿氏病、阿尔茨海默氏病和衰老。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于感染性疾病或病症。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于儿科或发育性疾病或病症。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于心血管疾病或病症。
在本公开的组合物和方法的一些实施方案中,本公开的疾病或病症包括但不限于增殖性疾病或病症。在一些实施方案中,增殖性疾病或病症是癌症。在一些实施方案中,所述癌症包括但不限于急性淋巴细胞性白血病(ALL)、急性髓性白血病(AML)、肾上腺皮质癌、AIDS相关性癌症、卡波西肉瘤(Kaposi Sarcoma)(软组织肉瘤)、AIDS相关性淋巴瘤(淋巴瘤)、原发性CNS淋巴瘤(淋巴瘤)、肛门癌、阑尾癌、胃肠道类癌瘤、星形细胞瘤、非典型畸胎瘤/横纹肌样瘤、中枢神经系统(脑癌)、基底细胞癌、胆管癌、膀胱癌、骨癌、尤因肉瘤(EwingSarcoma)、骨肉瘤、恶化纤维组织细胞瘤、脑瘤、乳腺癌、伯基特淋巴瘤(BurkittLymphoma)、类癌瘤、癌、心脏(Cardiac/Heart)肿瘤、胚胎瘤、胚细胞瘤、原发性CNS淋巴瘤、宫颈癌、胆管细胞癌(Cholangiocarcinoma)、脊索瘤、慢性淋巴细胞性白血病(CLL)、慢性髓细胞性白血病(CML)、慢性骨髓增殖性肿瘤、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、原位导管癌、胚胎瘤、子宫内膜癌(子宫癌)、室管膜瘤、食管癌、鼻腔神经胶质瘤(头颈癌)、尤因肉瘤(骨癌)、颅外胚细胞瘤、性腺外胚细胞瘤、眼癌、儿童眼内黑色素瘤、眼内黑色素瘤、视网膜母细胞瘤、输卵管癌、骨恶性纤维组织细胞瘤和骨肉瘤、胆囊癌、胃(Gastric/Stomach)癌、胃肠道类癌瘤、胃肠道间质瘤(GIST)(软组织肉瘤)、儿童胃肠道间质瘤、胚细胞瘤、儿童颅外胚细胞瘤、性腺外胚细胞瘤、卵巢胚细胞瘤、睾丸癌、妊娠滋养细胞疾病、毛细胞白血病、头颈癌、心脏肿瘤、肝细胞(肝)癌、组织细胞增多症、霍奇金淋巴瘤(HodgkinLymphoma)、下咽癌(头颈癌)、眼内黑色素瘤、胰岛细胞瘤、胰腺神经内分泌肿瘤、卡波西肉瘤(软组织肉瘤)、肾(肾细胞)癌、朗格汉斯细胞组织细胞增生症(Langerhans CellHistiocytosis)、喉癌(Laryngeal Cancer)(头颈癌)、白血病、唇和口腔癌(Lip and OralCavity Cancer)(头颈癌)、肝癌、肺癌(非小细胞和小细胞)、儿童肺癌、淋巴瘤、男性乳腺癌、骨恶性纤维组织细胞瘤和骨肉瘤、黑色素瘤、梅克尔细胞癌(Merkel Cell Carcinoma)(皮肤癌)、间皮瘤、隐匿性原发性转移性鳞状颈癌(头颈癌)、具有NUT基因变化的中线道癌、口腔癌(Mouth Cancer)(头颈癌)、多发性内分泌肿瘤综合征、多发性骨髓瘤/浆细胞瘤、蕈样真菌病(淋巴瘤)、骨髓增生异常综合征、骨髓增生异常性/骨髓增殖性肿瘤、鼻腔和鼻旁窦癌(头颈癌)、鼻咽癌(头颈癌)、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌(Oral Cancer)、唇和口腔癌和口咽癌、骨肉瘤和骨恶性纤维组织细胞瘤、卵巢癌、胰腺癌、胰腺神经内分泌肿瘤(胰岛细胞瘤)、乳头状瘤病、副神经节瘤、甲状旁腺癌、阴茎癌、咽癌(头颈癌)、嗜铬细胞瘤、浆细胞瘤/多发性骨髓瘤、胸膜肺母细胞瘤、妊娠期乳腺癌、原发性中枢神经系统(CNS)淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发性癌症、肾细胞(肾)癌、视网膜母细胞瘤、横纹肌肉瘤、儿童(软组织肉瘤)、唾液腺癌(头颈癌)、肉瘤、儿童横纹肌肉瘤(软组织肉瘤)、儿童血管瘤(软组织肉瘤)、尤因肉瘤(骨癌)、卡波西肉瘤(软组织肉瘤)、骨肉瘤(骨癌)、子宫肉瘤、塞扎里综合征(Sézary Syndrome)、淋巴瘤、皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、皮肤鳞状细胞癌、鳞状颈癌、胃(Stomach/Gastric)癌、T细胞淋巴瘤、睾丸癌、喉癌(Throat Cancer)(头颈癌)、鼻咽癌、口咽癌、下咽癌、胸腺瘤和胸腺癌、甲状腺癌、肾盂和输尿管移行细胞癌、肾细胞癌、尿道癌、子宫肉瘤、阴道癌、血管瘤(软组织肉瘤)、外阴癌、威尔姆氏瘤(Wilms Tumor)和其他儿童肾脏肿瘤。
在本公开的方法的一些实施方案中,本公开的受试者已经被诊断患有所述疾病或病症。在一些实施方案中,本公开的受试者呈现所述疾病或病症的至少一种体征或症状。在一些实施方案中,所述受试者具有预示患上所述疾病或病症的风险的生物标志物。在一些实施方案中,所述生物标志物是基因突变。
在本公开的方法的一些实施方案中,本公开的受试者为雌性。在本公开的方法的一些实施方案中,本公开的受试者为雄性。在一些实施方案中,本公开的受试者具有两个XX或XY染色体。在一些实施方案中,本公开的受试者具有两个XX或XY染色体和第三染色体(X或Y)。
在本公开的方法的一些实施方案中,本公开的受试者是新生儿、婴儿、儿童、成人、年长成人或老年人。在本公开的方法的一些实施方案中,本公开的受试者为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31日龄。在本公开的方法的一些实施方案中,本公开的受试者为至少1、2、3、4、5、6、7、8、9、10、11或12月龄。在本公开的方法的一些实施方案中,本公开的受试者为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100岁或之间的任何岁数或非整岁数。
在本公开的方法的一些实施方案中,本公开的受试者是哺乳动物。在一些实施方案中,本公开的受试者是非人哺乳动物。
在本公开的方法的一些实施方案中,本公开的受试者是人。
在本公开的方法的一些实施方案中,治疗有效量包含本公开的组合物的单个剂量。在一些实施方案中,治疗有效量包含治疗有效量包含本公开的组合物的至少一个剂量。在一些实施方案中,治疗有效量包含治疗有效量包含本公开的组合物的一个或多个剂量。
在本公开的方法的一些实施方案中,治疗有效量消除所述疾病或病症的体征或症状。在一些实施方案中,治疗有效量降低所述疾病或病症的体征或症状的严重程度。
在本公开的方法的一些实施方案中,治疗有效量消除所述疾病或病症。
在本公开的方法的一些实施方案中,治疗有效量预防疾病或病症的发作。在一些实施方案中,治疗有效量延迟疾病或病症的发作。在一些实施方案中,治疗有效量降低疾病或病症的体征或症状的严重程度。在一些实施方案中,治疗有效量改善受试者的预后。
在本公开的方法的一些实施方案中,将本公开的组合物全身施用至所述受试者。在一些实施方案中,将本公开的组合物通过静脉内途径施用至所述受试者。在一些实施方案中,将本公开的组合物通过注射或输注施用至所述受试者。
在本公开的方法的一些实施方案中,将本公开的组合物局部施用至所述受试者。在一些实施方案中,将本公开的组合物通过骨内、眼内、脑脊髓内或脊柱内途径施用至所述受试者。在一些实施方案中,将本公开的组合物直接施用至中枢神经系统的脑脊液。在一些实施方案中,将本公开的组合物直接施用至眼组织或流体,并且本公开的组合物在眼结构外不具有生物利用性。在一些实施方案中,将本公开的组合物通过注射或输注施用至所述受试者。
在一些实施方案中,将本文所公开的组合物配制为药物组合物。简言之,如本文所公开使用的药物组合物可包含与一种或多种药学上或生理上可接受的载体、稀释剂或赋形剂组合的一种或多种蛋白或编码所述一种或多种蛋白的多核苷酸,所述蛋白或多核苷酸任选地包含于AAV中,所述AAV任选地也是免疫正交的。此类组合物可包含缓冲液,如中性缓冲盐水、磷酸盐缓冲盐水等;碳水化合物,如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇;蛋白质;多肽或氨基酸,如甘氨酸;抗氧化剂;螯合剂,如EDTA或谷胱甘肽;佐剂(例如,氢氧化铝);和防腐剂。可将本公开的组合物配制用于施用途径,例如像口服、肠内、局部、透皮、鼻内和/或吸入;并且用于通过注射或输注的施用途径,例如像静脉内、肌肉内、软膜下、鞘内、纹状体内、皮下、皮内、腹膜内、瘤内、静脉内、眼内和/或肠胃外施用。在一些实施方案中,眼内施用包括但不限于视网膜下、玻璃体内、深部玻璃体内或局部(通过滴眼剂)施用。在一个实施方案中,视网膜下注射靶向光感受器和RPE(视网膜色素上皮)细胞。在某些实施方案中,将本公开的组合物配制用于静脉内施用。
示例性实施方案:
实施方案1.一种组合物,所述组合物包含编码RNA指导的靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽在由gRNA序列指导时结合并切割靶RNA,其中致病性RNA包含所述靶RNA,并且其中所述治疗性蛋白是由所述致病性RNA编码的功能获得或丧失型突变的替代物。
或者
一种组合物,所述组合物包含编码靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶RNA,其中致病性RNA包含所述靶RNA,并且其中所述治疗性蛋白是由所述致病性RNA编码的功能获得或丧失型突变的替代物。
或者
一种组合物,所述组合物包含编码靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶RNA,其中致病性RNA包含所述靶RNA,并且其中所述致病性RNA编码一个或多个功能获得型视紫红质突变,并且其中所述治疗性蛋白是替代功能获得或丧失型视紫红质突变的野生型视紫红质或“硬化的”视紫红质。
实施方案2.如实施方案1所述的组合物,其中所述治疗性蛋白选自由以下组成的组:视紫红质(色素性视网膜炎)、PRPF3(色素性视网膜炎)、PRPF31(常染色体显性色素性视网膜炎)、GRN(FTD)、SOD1(ALS)、PMP22(夏科-马里-图思病)、PABPN1(眼咽型肌营养不良)、KCNQ4(听力损失)、CLRN1(乌谢尔综合征)、APOE2(阿尔茨海默氏病)、APOE4(阿尔茨海默氏病)、BEST1(眼病)、MYBPC3(家族性心肌病)、TNNT2(家族性心肌病)和TNNI3(家族性心肌病)。
实施方案3.如实施方案1或2所述的组合物,其中所述致病性靶序列包含或编码至少一个功能获得或丧失型突变。
实施方案4.如实施方案1所述的组合物,其中包含所述gRNA的序列包含能够在真核细胞中表达所述gRNA的启动子。
实施方案5.如实施方案4所述的组合物,其中所述真核细胞是动物细胞。
实施方案6.如实施方案4所述的组合物,其中所述动物细胞是哺乳动物细胞。
实施方案7.如实施方案5所述的组合物,其中所述动物细胞是人细胞。
实施方案8.如实施方案1-7中任一项所述的组合物,其中所述启动子是组成型活性启动子。
实施方案9.如实施方案1-7中任一项所述的组合物,其中所述启动子是从能够驱动RNA聚合酶的表达的启动子分离或衍生的。
实施方案9.如实施方案9所述的组合物,其中所述启动子是从U6启动子分离或衍生的。
实施方案10.如实施方案1-9中任一项所述的组合物,其中所述启动子是从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的。
实施方案11.如实施方案10所述的组合物,其中所述启动子是从以下启动子分离或衍生的:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。
实施方案12.如实施方案11所述的组合物,其中所述启动子是从缬氨酸tRNA启动子分离或衍生的。
实施方案13.如实施方案1-12中任一项所述的组合物,其中包含所述gRNA的序列包含与所述靶RNA序列特异性结合的间隔子序列。
实施方案14.如实施方案13所述的组合物,其中所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
实施方案15.如实施方案14所述的组合物,其中所述间隔子序列与所述靶RNA序列具有100%的互补性。
实施方案16.如实施方案13-15中任一项所述的组合物,其中所述间隔子序列包含20个核苷酸或由其组成。
实施方案17.如实施方案13-15中任一项所述的组合物,其中所述间隔子序列包含26个核苷酸或由其组成。
实施方案18.如实施方案1-17中任一项所述的组合物,其中包含所述gRNA的序列包含与第一RNA结合蛋白特异性结合的同向重复(DR)序列或支架序列。
实施方案20.如实施方案18所述的组合物,其中所述支架序列包含茎环结构。
实施方案21.如实施方案19或20所述的组合物,其中所述支架序列包含90个核苷酸或由其组成。
实施方案22.如实施方案19或20所述的组合物,其中所述支架序列包含93个核苷酸或由其组成。
实施方案23.如实施方案22所述的组合物,其中所述支架序列包含序列
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:403)。
实施方案24.如实施方案19所述的组合物,其中所述支架序列包含茎环结构。
实施方案25.如实施方案19所述的组合物,其中所述支架序列包含85个核苷酸或由其组成。
实施方案26.如实施方案25所述的组合物,其中所述支架序列包含序列
GGACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU(SEQ ID NO:404)。
实施方案27.如实施方案19所述的组合物,其中包含所述gRNA的序列包含与第一RNA结合蛋白特异性结合的DR序列。
实施方案28.如实施方案27所述的组合物,其中所述DR序列包含茎环结构。
实施方案29.如实施方案27所述的组合物,其中所述DR序列包含约20-36个核苷酸或由其组成。
实施方案30.如实施方案27所述的组合物,其中所述支架序列包含30-32个核苷酸或由其组成。
实施方案31.如实施方案27所述的组合物,其中所述DR序列包含含有AACCCCTACCAACTGGTCGGGGTTTGAAAC(SEQ ID NO:461)的核苷酸序列。
实施方案32.如实施方案1-31中任一项所述的组合物,其中所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
实施方案33.如实施方案32所述的组合物,其中RNA基因组或RNA转录组包含所述RNA分子。
实施方案34.如实施方案1-33中任一项所述的组合物,其中所述RNA结合蛋白包含CRISPR-Cas蛋白。
实施方案35.如实施方案34所述的组合物,其中所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。
实施方案36.如实施方案35所述的组合物,其中所述RNA结合蛋白包含Cas9多肽或其RNA结合部分。
实施方案37.如实施方案34所述的组合物,其中所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。
实施方案38.如实施方案34所述的组合物,其中所述RNA结合蛋白包含Cpf1多肽或其RNA结合部分。
实施方案39.如实施方案34所述的组合物,其中所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。
实施方案40.如实施方案39所述的组合物,其中所述RNA结合蛋白包含Cas13多肽或其RNA结合部分。
实施方案41.如实施方案34-40中任一项所述的组合物,其中所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。
实施方案42.如实施方案41所述的组合物,其中所述天然RNA核酸酶活性被降低或抑制。
实施方案43.如实施方案41所述的组合物,其中所述天然RNA核酸酶活性被增加或诱导。
实施方案44.如实施方案34-43中任一项所述的组合物,其中所述CRISPR-Cas蛋白包含天然DNA核酸酶活性,并且其中所述天然DNA核酸酶活性是受抑制的、失活的和/或死亡的(例如,dCas)。
实施方案45.如实施方案34所述的组合物,其中所述CRISPR-Cas蛋白包含突变。
实施方案46.如实施方案45所述的组合物,其中所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。
实施方案47.如实施方案45所述的组合物,其中所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。
实施方案48.如实施方案45所述的组合物,其中所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。
实施方案49.如实施方案45-48中任一项所述的组合物,其中所述突变包括取代、插入、缺失、移码、倒位或转座。
实施方案50.如实施方案45-49中任一项所述的组合物,其中所述突变包括核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
实施方案51.如实施方案2-3中任一项所述的组合物,其中所述RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。
实施方案52.如实施方案51所述的组合物,其中所述RNA结合蛋白包含基于Pumilio的组装体(PUMBY)蛋白。
实施方案53.如实施方案51-52中任一项所述的组合物,其中所述RNA结合蛋白不需要多聚化以用于RNA结合活性。
实施方案54.如实施方案53所述的组合物,其中所述RNA结合蛋白不是多聚体复合物的单体。
实施方案55.如实施方案54所述的组合物,其中多聚体蛋白复合物不包含所述第一RNA结合蛋白。
实施方案56.如实施方案1-55中任一项所述的组合物,其中所述RNA结合蛋白与所述RNA分子内的致病性靶序列选择性结合。
实施方案57.如实施方案56所述的组合物,其中所述RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。
实施方案58.如实施方案56或57所述的组合物,其中所述RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。
实施方案59.如实施方案58所述的组合物,其中RNA基因组或RNA转录组包含所述RNA分子。
实施方案60.如实施方案1-59中任一项所述的组合物,其中所述RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
实施方案61.如实施方案1-60中任一项所述的组合物,其中编码所述RNA结合蛋白的序列还包含编码核定位信号(NLS)的序列。
实施方案62.如实施方案61所述的组合物,其中编码核定位信号(NLS)的所述序列位于编码所述第一RNA结合蛋白的序列的3'。
实施方案63.如实施方案62所述的组合物,其中所述RNA结合蛋白包含在所述蛋白质的C末端的NLS。
实施方案64.如实施方案1-63中任一项所述的组合物,其中编码所述RNA结合蛋白的所述序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。
实施方案65.如实施方案64所述的组合物,其中编码所述第一NLS或所述第二NLS的序列定位于编码所述RNA结合蛋白的序列的3'。
实施方案66.如实施方案65所述的组合物,其中所述RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
实施方案67.如实施方案1-66中任一项所述的组合物,其中所述第二RNA结合蛋白包含核酸酶结构域或由其组成。
实施方案68.一种组合物,所述组合物包含编码以下项的序列:1)靶RNA结合融合蛋白,所述融合蛋白包含(a)编码第一RNA结合多肽或其部分的序列;和(b)编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽结合不受gRNA序列指导的致病性靶RNA,并且其中所述第二RNA结合多肽包含RNA核酸酶活性;以及2)治疗性替代蛋白,其中所述治疗性替代蛋白替代包含至少一个由所述致病性靶RNA编码的功能获得或丧失型突变的相应基因。
实施方案69.如实施方案68所述的组合物,其中所述第一RNA结合多肽或其部分是PUF、PUMBY或PPR多肽或其部分。
实施方案70.一种修饰致病性RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括使实施方案1、2、3或68所述的组合物与所述RNA分子在适合于所述RNA结合蛋白或其部分与所述RNA分子结合的条件下相接触。
实施方案71.一种制造本文所公开的靶向RNA的敲低和替代组合物或包含本文所公开的靶向RNA的敲低和替代组合物的载体的方法。
实施例
实施例1:RNA指导的靶mRNA切割
构建了具有和不具有效应核酸酶的各种RNA靶向蛋白。RNA靶向蛋白是CRISPR相关(Cas)蛋白或称为PUF或Pumby蛋白的工程化RNA结合蛋白(图1A至图1E)。将编码RNA指导的靶向的RNA结合蛋白的质粒与编码靶向靶RNA序列的相应指导RNA的质粒共转染,例如在编码SOD1、人视紫红质、PRPF3、PMP22、PABPN1、KCNQ4、CLRN1、APOE2、APOE4、BEST1、MYBPC3、TNNT2、TNN13的基因,或其他一些导致疾病或导致病症的基因或突变基因中进行。使用对靶RNA具有特异性的示例性指导RNA间隔子序列设计质粒和载体。对于靶向RHO、SOD1、PMP22、PABPN1、KCNQ4、CLRN1、APOE2、TNNI3、BEST1、MYBPC3和TNNT2的示例性gRNA序列,参见SEQ IDNO:250至SEQ ID NO:24960。将编码Cas13d RNA指导的靶向的RNA结合蛋白的质粒与编码靶向靶RNA序列的相应指导RNA的质粒共转染。使用基于CasRx序列的Cas13d系统。构建了三个靶向视紫红质靶RNA的包含以下间隔子序列的gRNA,并将其用于敲低以下视紫红质靶序列。gRNA包含具有核酸序列AACCCCTACCAACTGGTCGGGGTTTGAAAC(SEQ ID NO:461)的CasRx DR序列。将转染的细胞系与编码靶RNA的质粒共转染。此外,使用天然地表达靶RNA的细胞系。通过RT-PCR评估靶RNA的水平。我们观察到含有mRNA的WT RHO的敲低。
用于Rho靶向的间隔子序列和靶序列如表2中所详述。
表2:用于Rho靶向的间隔子序列和靶序列
Figure BDA0003526863300001361
实施例2:靶基因的同时敲低和替代
构建了携带实施例1中描述的RNA靶向系统的载体,所述系统具有靶向基因的密码子优化型式,缺乏相应的致病性突变(图2)。所得载体能够敲低内源性突变基因并用野生型拷贝重构同一基因的表达。用载体转染细胞。此外,将细胞用包含RNA靶向系统的AAV载体感染(图2)。我们评估了细胞中突变基因的水平和重构的治疗性替代基因的水平(图2)。
实施例3:疾病模型中靶基因的同时敲低和替代
构建了携带实施例1中描述的RNA靶向系统的载体,所述系统具有靶向基因的密码子优化型式,缺乏相应的致病性突变。所得载体能够敲低内源性突变基因并用野生型拷贝重构同一基因的表达。将携带以下基因之一的突变拷贝的小鼠用携带上述系统的AAV载体进行处理(括号中是相关人疾病):视紫红质(色素性视网膜炎)、PRPF3(色素性视网膜炎)、PRPF31(常染色体显性色素性视网膜炎)、GRN(FTD)、SOD1(ALS)、PMP22(夏科-马里-图思病)、PABPN1(眼咽型肌营养不良)、KCNQ4(听力损失)、CLRN1(乌谢尔综合征)、APOE2(阿尔茨海默氏病)、APOE4(阿尔茨海默氏病)、BEST1(眼病)、MYBPC3(家族性心肌病)、TNNT2(家族性心肌病)和TNNI3(家族性心肌病)。我们评估了细胞中突变基因的水平和靶组织中重构的未突变的治疗性替代基因的水平。我们还评估了这些现象受疾病模型调节的情况下的功能/行为/生理变化。
实施例4:视紫红质敲低和替代
对于视紫红质(RHO)敲低检测,使用pmirGlo质粒(图3)通过在由人磷酸甘油酸激酶(hPGK)驱动的萤火虫荧光素酶的3'UTR中引入野生型(WT)RHO mRNA序列设计了荧光素酶报告基因测定。出于归一化目的,报告基因质粒还表达由SV40启动子驱动的海肾荧光素酶。对于表达由视蛋白启动子驱动的“硬化”视紫红质(RHO)开放阅读框和与ZC3H12A(也称为E17)连接的由EFS启动子驱动的PUMBY或PUF蛋白的RHO 500ng的“敲低和替代”PUM和PUF构建体(1个PUMBY构建体PUM14,4个具有不同优化PUF序列的PUF构建体26、54、60、110-下面列出的PUF序列)的敲低和替代,(图4、图5、图6A)靶向用于切割,使用Lipofectamine 3000(Thermo)将WT RHO mRNA上的特定位点与100ng的pmirGlo报告基因一起转染到CosM6细胞中(根据制造商的方案)。洗涤细胞并使用Qiagen RNeasy试剂盒收集RNA。使用Quantabio一步式RT-qPCR试剂盒、Biorad qPCR机器和以下引物组对正常和硬化视紫红质进行RT-qPCR:萤火虫荧光素酶-正向:GTGGTGTGCAGCGAGAATAG(SEQ ID NO:410)反向:CGCTCGTTGTAGATGTCGTTAG(SEQ ID NO:411);海肾荧光素酶-正向:TTCTGGATTCATCGACTGTG(SEQ ID NO:412)反向:TTCAGCAATATCACGGGTAG(SEQ ID NO:413);硬化RHO-正向:ACTGCATGCTCACCACCAT(SEQ ID NO:414)反向:CGAAGAACTCCAGCATGAGA(SEQ ID NO:415)。使用萤火虫荧光素酶表达作为WT RHO mRNA敲低归一化的海肾荧光素酶mRNA表达的量度,用于控制转染。硬化视紫红质的表达针对GAPDH进行归一化并且其是替代的量度。我们观察到我们的敲低和替代载体能够敲低含有mRNA的WT RHO并降低萤火虫荧光素酶的表达,同时表达持续的硬化RHO水平。(图6B至图6C和图7A至图7B)。
表3:敲低和替代研究中使用的PUF和PUMBY序列
Figure BDA0003526863300001381
Figure BDA0003526863300001391
以下序列存在于以上提及的质粒的敲低模块中。
原始PUF26氨基酸序列:
MGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIRLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGSYVVRKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASYVVRKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG(SEQ ID NO:393
PUF26的优化的(针对智人(人))序列
A 285T 205C 286G 292|GC%:54.12%|长度:1068
ATGGGAAGGAGCAGACTCCTCGAGGACTTTAGGAACAATAGATACCCCAACCTCCAGCTGAGAGAAATCGCCGGCCACATCATGGAGTTCAGCCAAGACCAGCACGGATCTAGATTCATTAGGCTGAAGCTCGAGAGAGCTACACCCGCCGAGAGGCAACTGGTGTTCAATGAGATTCTGCAAGCCGCCTACCAGCTCATGGTCGACGTCTTCGGAAACTACGTGATCCAGAAGTTCTTCGAGTTCGGATCTCTGGAGCAGAAACTCGCTCTGGCTGAGAGGATCAGAGGCCATGTGCTGTCTCTGGCTCTCCAGATGTACGGCTCTAGAGTGATCGAGAAAGCCCTCGAGTTCATCCCCTCCGACCAACAGAATGAGATGGTGAGGGAGCTGGACGGCCACGTGCTGAAATGTGTGAAGGACCAGAACGGCTCCTACGTCGTGAGAAAGTGCATTGAGTGCGTGCAGCCCCAGAGCCTCCAGTTTATCATCGACGCCTTCAAGGGCCAAGTGTTCGCTCTCAGCACCCATCCTTACGGCTGTAGAGTCATCCAGAGAATTCTGGAGCATTGCCTCCCCGACCAGACACTGCCTATTCTCGAGGAGCTCCATCAGCATACCGAGCAACTCGTCCAAGACCAGTACGGCAACTACGTGATTCAGCATGTGCTGGAGCATGGCAGACCCGAGGACAAGAGCAAGATCGTGGCTGAGATCAGAGGCAATGTGCTGGTGCTGAGCCAGCACAAATTCGCCAGCTATGTGGTGAGGAAGTGTGTGACACACGCCTCTAGAACAGAGAGGGCTGTGCTCATCGATGAGGTGTGCACCATGAACGATGGCCCTCACAGCGCTCTGTACACCATGATGAAGGACCAGTACGCCAACTACGTGGTGCAGAAAATGATCGACGTGGCTGAGCCCGGCCAGAGGAAAATCGTGATGCACAAGATCAGACCTCATATCGCCACCCTCAGAAAGTACACCTATGGCAAACACATTCTGGCCAAGCTCGAGAAGTACTACATGAAAAATGGCGTCGATCTGGGC(SEQ IDNO:394)
PUF54的原始序列
MGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGNRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGSYVIEKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNYVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGSRVIERILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASYVVRKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYASYVVRKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG(SEQ ID NO:395)
PUF54的优化的(针对智人(人))序列
A 290 T 194 C 285 G 299|GC%:54.68%|长度:1068
ATGGGAAGATCCAGACTGCTGGAGGACTTTAGAAACAATAGGTACCCCAATCTGCAGCTGAGAGAGATCGCCGGCCACATCATGGAATTCAGCCAAGACCAGCACGGCAATAGATTCATCCAGCTGAAGCTCGAGAGGGCTACACCCGCTGAGAGGCAGCTGGTCTTCAACGAGATTCTGCAAGCCGCCTATCAACTGATGGTGGACGTGTTCGGCAGCTATGTGATCGAGAAGTTCTTCGAATTCGGCTCTCTGGAACAGAAGCTGGCTCTGGCCGAGAGGATCAGAGGCCATGTGCTGTCTCTGGCTCTGCAGATGTACGGCTCTAGAGTCATCGAGAAGGCCCTCGAGTTCATCCCCTCCGACCAACAGAACGAGATGGTGAGGGAGCTGGACGGACACGTGCTGAAGTGCGTGAAGGACCAGAACGGAAACTACGTCGTCCAGAAGTGCATCGAATGCGTGCAGCCCCAGAGCCTCCAGTTCATTATCGACGCCTTCAAGGGCCAAGTGTTCGCCCTCAGCACACACCCTTACGGAAGCAGAGTGATCGAGAGGATTCTGGAGCACTGTCTGCCCGACCAGACACTGCCTATTCTGGAGGAGCTGCACCAACACACAGAGCAGCTGGTGCAAGACCAGTACGGCAACTATGTCATTCAGCACGTCCTCGAGCATGGCAGACCCGAGGACAAAAGCAAGATCGTCGCCGAAATCAGAGGCAATGTGCTGGTGCTCAGCCAACACAAGTTCGCTTCCTACGTCGTGAGGAAGTGCGTGACACACGCTTCCAGAACAGAGAGAGCCGTGCTCATCGATGAGGTGTGCACCATGAACGATGGCCCTCACAGCGCTCTGTATACCATGATGAAGGACCAATACGCCAGCTATGTGGTGAGAAAGATGATCGACGTGGCTGAACCCGGCCAGAGAAAGATCGTGATGCACAAGATCAGACCCCACATTGCCACACTGAGGAAGTATACCTACGGCAAGCACATTCTGGCCAAGCTCGAGAAGTACTACATGAAGAACGGAGTGGATCTGGGC(SEQ IDNO:396)
PUF60的原始序列
MGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNYVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGSRVIERILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYASYVVEKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG(SEQ ID NO:397)
PUF60的优化的(针对智人(人))序列
A 288 T 201 C 281 G 298|GC%:54.21%|长度:1068
ATGGGAAGATCCAGACTGCTGGAGGACTTTAGAAATAATAGATACCCCAATCTGCAGCTGAGGGAAATCGCTGGCCACATCATGGAGTTCTCCCAAGACCAGCATGGATCTAGATTCATCCAGCTGAAGCTCGAGAGAGCCACCCCCGCCGAAAGGCAGCTCGTCTTCAACGAAATTCTGCAAGCCGCCTACCAACTGATGGTGGATGTGTTTGGCAACTACGTGATCCAGAAGTTCTTCGAATTTGGCAGCCTCGAGCAGAAGCTGGCTCTGGCCGAAAGAATTAGAGGCCATGTGCTGTCTCTGGCCCTCCAGATGTATGGCTCTAGAGTCATCGAAAAGGCTCTGGAGTTCATCCCCTCCGACCAGCAGAACGAGATGGTGAGAGAGCTCGACGGACATGTGCTGAAGTGTGTGAAGGACCAGAACGGCAATTACGTCGTCCAGAAGTGCATCGAGTGCGTGCAGCCCCAGTCTCTGCAGTTTATCATCGACGCCTTCAAGGGCCAAGTGTTCGCTCTGAGCACACACCCTTACGGCAGCAGAGTGATCGAGAGGATTCTGGAACACTGTCTGCCCGACCAGACACTGCCTATTCTGGAGGAGCTGCACCAGCACACAGAGCAGCTGGTGCAAGACCAGTACGGCAACTATGTGATCCAGCATGTGCTGGAGCATGGCAGACCCGAGGACAAGAGCAAGATCGTGGCCGAAATCAGAGGCAACGTGCTGGTGCTGAGCCAGCACAAGTTCGCCTCCAACGTGGTGGAAAAGTGCGTGACCCACGCTTCTAGAACAGAAAGGGCTGTGCTCATCGATGAGGTGTGTACCATGAACGATGGCCCTCACAGCGCTCTGTACACCATGATGAAAGACCAGTACGCCAGCTACGTGGTGGAGAAAATGATCGACGTCGCTGAGCCCGGCCAGAGGAAGATCGTGATGCACAAGATCAGACCCCACATTGCCACACTGAGGAAGTACACCTATGGCAAACACATTCTGGCCAAGCTCGAGAAGTACTACATGAAGAACGGAGTGGATCTGGGC(SEQ IDNO:398)
PUF110的原始序列
MGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIELKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGSYVVRKCIECVQPQSLQFIIDAFKGQVFALSTHPYGNRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGCYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASYVVRKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG(SEQ ID NO:399)
PUF110的优化的(针对智人(人))序列
A 292 T 196 C 293 G 287|GC%:54.31%|长度:1068
ATGGGAAGATCCAGACTGCTGGAGGACTTTAGAAACAATAGGTACCCCAACCTCCAGCTGAGAGAAATCGCCGGCCACATCATGGAGTTCAGCCAAGACCAGCACGGCTCTAGATTTATTGAGCTGAAGCTCGAGAGAGCCACCCCCGCCGAGAGGCAACTGGTGTTCAATGAGATTCTGCAAGCCGCCTACCAGCTCATGGTCGACGTCTTCGGCAACTACGTCATCCAGAAGTTCTTCGAGTTCGGCTCTCTGGAACAGAAGCTGGCTCTGGCCGAGAGGATCAGAGGCCACGTGCTGTCCCTCGCTCTGCAGATGTACGGCTGTAGGGTGATCCAGAAGGCTCTGGAGTTCATCCCTTCCGACCAGCAGAACGAGATGGTGAGAGAGCTGGATGGACACGTGCTGAAATGCGTCAAGGACCAGAACGGCTCCTATGTGGTGAGAAAGTGCATCGAGTGCGTGCAGCCCCAGTCTCTGCAGTTCATCATCGACGCCTTCAAGGGCCAAGTCTTCGCCCTCAGCACACACCCTTACGGAAATAGAGTCATCCAGAGGATTCTGGAACACTGTCTGCCCGACCAGACACTGCCTATTCTGGAGGAGCTGCACCAACACACAGAGCAGCTGGTCCAAGACCAGTATGGCTGCTACGTGATCCAGCACGTGCTGGAGCATGGAAGACCCGAGGATAAGAGCAAGATCGTCGCCGAAATCAGAGGCAATGTGCTGGTGCTCAGCCAACACAAGTTCGCTTCCTACGTCGTGAGGAAATGCGTGACACACGCTTCTAGAACAGAAAGGGCCGTGCTCATCGATGAGGTGTGCACCATGAACGATGGCCCCCACAGCGCTCTGTATACCATGATGAAGGACCAGTACGCCAACTACGTGGTGCAGAAGATGATCGACGTGGCTGAGCCCGGCCAGAGGAAGATTGTGATGCACAAGATTAGGCCCCATATCGCCACACTGAGAAAGTACACCTACGGAAAGCATATCCTCGCCAAGCTCGAGAAGTACTACATGAAGAACGGCGTCGACCTCGGC(SEQ IDNO:400)
靶向视紫红质的PUMBY(PUM14)包含以下氨基酸序列:
MGRSRLLEDFRNNRYPNLQLREIAHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGCYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGSYVIRHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGCYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGSYVIRHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGCYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGSYVIRHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGR(SEQ ID NO:401)。
靶向视紫红质的PUMBY(PUM14)包含以下核酸序列:ATGGGCAGAAGCCGGCTGCTGGAAGATTTCCGGAACAACAGATACCCCAACCTGCAGCTGAGAGAGATCGCCCACACAGAGCAGCTGGTGCAGGACCAGTACGGCAACTACGTGATCCAGCATGTGCTGGAACACGGCAGACCCGAGGACAAGTCTAAGATCGTGGCCGAGATCAGAGGCCACACCGAACAGCTCGTCCAGGATCAATACGGCTGTTATGTGATTCAGCACGTCCTCGAGCACGGACGGCCTGAGGATAAGAGCAAAATTGTGGCCGAAATCCGGGGCCATACTGAACAACTGGTTCAGGATCAGTATGGGTCCTATGTGATCCGCCACGTCCTGGAACATGGACGCCCAGAGGACAAAAGCAAGATCGTCGCTGAGATTCGGGGACATACCGAGCAACTCGTCCAAGACCAGTACGGCTGTTACGTGATCCAGCATGTGCTGGAACACGGCAGACCCGAGGACAAGTCTAAGATCGTGGCCGAGATCAGAGGCCACACCGAACAGCTGGTGCAGGACCAGTACGGCAACTATGTGATTCAGCACGTCCTCGAGCACGGACGGCCTGAGGATAAGAGCAAAATTGTGGCCGAAATCCGGGGACACACAGAGCAGCTCGTCCAGGATCAGTATGGCTCCTACGTGATCAGACACGTTTTGGAGCACGGCAGGCCAGAAGATAAGTCCAAGATTGTCGCTGAGATTCGCGGGCATACTGAGCAACTGGTGCAAGATCAATACGGGAATTACGTCATCCAACACGTTCTCGAACATGGAAGGCCAGAGGACAAAAGCAAGATCGTCGCAGAAATTAGGGGCCATACAGAACAACTGGTCCAGGACCAGTACGGCAACTACGTGATCCAGCATGTGCTGGAACACGGCAGACCCGAGGACAAGTCTAAGATCGTGGCCGAGATCAGAGGCCACACCGAACAGCTGGTGCAGGATCAGTACGGCTGTTATGTGATTCAGCACGTCCTCGAGCACGGACGGCCTGAGGATAAGAGCAAAATTGTGGCCGAAATCCGGGGACACACAGAGCAGCTGGTCCAAGACCAGTATGGAAGCTATGTCATCAGGCACGTCCTGGAACATGGACGCCCAGAGGACAAAAGCAAGATCGTCGCTGAGATTCGGGGCCATACTGAGCAGCTCGTTCAGGACCAATACGGGTCTTACGTGATCGAACACGTGTTGGAGCATGGCAGGCCCGAAGATAAGTCCAAAATTGTCGCAGAGATACGCGGCCACACCGAACAGCTGGTGCAGGATCAGTACGGCAGCTACGTGATCGAGCATGTGCTGGAACACGGCAGACCCGAGGACAAGTCTAAGATCGTGGCCGAGATCAGAGGCCACACCGAGCAGCTCGTTCAGGACCAGTATGGCAATTATGTGATCCAGCACGTCCTCGAGCACGGACGGCCTGAGGATAAGAGCAAAATTGTGGCCGAAATCCGGGGACACACAGAGCAACTGGTCCAAGACCAGTACGGCTCCTATGTGATTGAACACGTTCTGGAACATGGACGCCCAGAGGACAAAAGCAAGATCGTCGCTGAGATTCGGGGCCCTCACATTGCCACACTGCGGAAGTACACCTACGGCAAGCACATCCTGGCCAAGCTGGAAAAGTACTACATGAAGAACGGCGTGGACCTCGGCGGCAGA(SEQ ID NO:402)。
实施例5:额外候选物的敲低替代筛选
视紫红质(RHO)敲低检测荧光素酶报告基因测定如先前实施例4中所述进行。
其他PUF候选物的详细信息如表4中所示。
表4:用于敲低替代的其他PUF候选物
Figure BDA0003526863300001461
Figure BDA0003526863300001471
以引用方式并入
除非明确排除或另有限制,否则本文中引用的每个文件,包括任何交叉引用的或相关的专利或申请,均以引用方式整体并入本文。对任何文件的引用并不承认它是关于本文公开或实施的任何发明的现有技术,或者它单独或与任何其他一个或多个参考文献的任何组合教导、提出或公开任何所述发明。此外,如果本文件中某一术语的任何含义或定义与以引用方式并入的文件中同一术语的任何含义或定义相冲突,则应以本文件中赋予该术语的含义或定义为准。
其他实施方案
虽然已经说明和描述了本公开的特定实施方案,但可在不脱离本公开的精神和范围的情况下进行各种其他变化和修改。所附权利要求的范围包括处于本公开范围内的所有此类变化和修改。

Claims (25)

1.一种组合物,所述组合物包含编码靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶RNA或由所述靶RNA编码的蛋白质,其中编码具有一个或多个功能获得或丧失型突变的致病性蛋白的致病性RNA包含所述靶RNA,并且其中所述治疗性蛋白是所述致病性蛋白的替代蛋白。
2.一种组合物,所述组合物包含编码靶RNA敲低和替代治疗剂的核酸序列,所述治疗剂包含(a)RNA结合多肽或其部分;和(b)治疗性蛋白,其中所述RNA结合多肽结合并切割靶视紫红质RNA或由所述靶视紫红质RNA编码的蛋白质,其中编码具有一个或多个功能获得或丧失型视紫红质突变的致病性视紫红质蛋白的致病性视紫红质RNA包含所述靶视紫红质RNA,并且其中所述治疗性蛋白是野生型视紫红质蛋白。
3.如权利要求1所述的组合物,其中所述治疗性蛋白选自由以下组成的组:视紫红质(色素性视网膜炎)、PRPF3(色素性视网膜炎)、PRPF31(常染色体显性色素性视网膜炎)、GRN(FTD)、SOD1(ALS)、PMP22(夏科-马里-图思病)、PABPN1(眼咽型肌营养不良)、KCNQ4(听力损失)、CLRN1(乌谢尔综合征)、APOE2(阿尔茨海默氏病)、APOE4(阿尔茨海默氏病)、BEST1(眼病)、MYBPC3(家族性心肌病)、TNNT2(家族性心肌病)和TNNI3(家族性心肌病)。
4.如权利要求2或3所述的组合物,其中所述治疗性蛋白是视紫红质。
5.如权利要求3或4所述的组合物,其中视紫红质是人视紫红质。
6.如权利要求4所述的组合物,其中所述治疗性视紫红质是“硬化的”视紫红质。
7.如权利要求1或2所述的组合物,其中所述RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。
8.如权利要求1或2所述的组合物,其中所述RNA结合蛋白包含基于Pumilio的组装体(PUMBY)蛋白。
9.如权利要求2所述的组合物,其中所述视紫红质靶RNA序列包含CAACGAGTCTTTTGTCATCTACATGT(SEQ ID NO:462)、CGCCAGCGTGGCATTCTACATCTTCA(SEQ IDNO:463)或CATCTATATCATGATGAACAAGCAGT(SEQ ID NO:464)。
10.如权利要求9所述的组合物,其中所述视紫红质靶RNA编码在位置268至277处包含YASVAFYIFT(SEQ ID NO:486)的氨基酸。
11.如权利要求5所述的组合物,其中所述“硬化的”视紫红质由不包含所述视紫红质靶RNA的核酸序列编码,所述视紫红质靶RNA包含GCCAGCGTGGCATTCTACATCTTC(SEQ ID NO:406)。
12.如权利要求11所述的组合物,其中所述“硬化的”视紫红质由包含GCTTCCGTAGCTTTTTATATTTTT(SEQ ID NO:408)的核酸序列编码。
13.如权利要求1或2所述的组合物,其中所述核酸序列包含至少一个启动子。
14.如权利要求8所述的组合物,其中所述至少一个启动子是组成型启动子或组织特异性启动子。
15.如权利要求9所述的组合物,其中所述至少一个启动子选自由以下组成的组:视蛋白启动子、EFS启动子和两者。
16.如权利要求1或2所述的组合物,其中所述核酸序列包含两个启动子。
17.一种载体,所述载体包含权利要求1或2中任一项所述的组合物。
18.如权利要求17所述的载体,其中所述载体选自由以下组成的组:腺相关病毒、逆转录病毒、慢病毒、腺病毒、纳米颗粒、胶束、脂质体、阳离子脂质体-DNA复合物、聚合物囊泡、聚合物-DNA复合物和树枝状聚合物。
19.一种细胞,所述细胞包含权利要求17所述的载体。
20.如权利要求1或2中任一项所述的组合物,其中所述RNA结合多肽是第一RNA结合多肽,并且其中所述核酸序列编码第二RNA结合多肽,所述第二RNA结合多肽以与RNA缔合的方式结合RNA。
21.如权利要求20所述的组合物,其中所述第二RNA结合多肽以切割RNA的方式与RNA缔合。
22.如权利要求20所述的组合物,其中所述第二RNA结合多肽选自由以下组成的组:RNAse1、RNAse4、RNAse6、RNAse7、RNAse8、RNAse2、RNAse6PL、RNAseL、RNAseT2、RNAse11、RNAseT2样蛋白、NOB1、ENDOV、ENDOG、ENDOD1、hFEN1、hSLFN14、hLACTB2、APEX2、ANG、HRSP12、ZC3H12A、RIDA、PDL6、NTHL、KIAA0391、APEX1、AGO2、EXOG、ZC3H12D、ERN2、PELO、YBEY、CPSF4L、hCG_2002731、ERCC1、RAC1、RAA1、RAB1、DNA2、FLJ35220、FLJ13173、ERCC4、Rnase1(K41R)、Rnase1(K41R、D121E)、Rnase1(K41R、D121E、H119N)、Rnase1(H119N)、Rnase1(R39D、N67D、N88A、G89D、R91D、H119N)、Rnase1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E)、Rnase1(R39D、N67D、N88A、G89D、R91D)、TENM1、TENM2、RNAseK、TALEN、ZNF638和hSMG6。
23.如权利要求22所述的组合物,其中所述第二RNA结合多肽是ZC3H12A。
24.一种用于降低致病性靶RNA分子或由所述致病性RNA分子编码的蛋白质的表达水平并用治疗性替代蛋白替代由所述致病性靶RNA引起的功能获得或丧失型突变的方法,所述方法包括使权利要求1或2所述的组合物与包含靶RNA序列的所述致病性靶RNA分子在适合于所述RNA结合蛋白与所述靶RNA序列结合的条件下相接触,其中所述致病性靶RNA的表达水平降低,并且其中所述致病性靶RNA的表达被治疗性替代蛋白的表达所替代。
25.一种腺相关病毒(AAV)载体,所述腺相关病毒(AAV)载体包含权利要求1所述的组合物。
CN202080061471.7A 2019-07-10 2020-07-10 靶向rna的敲低和替代组合物及使用方法 Pending CN114450031A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962872604P 2019-07-10 2019-07-10
US62/872,604 2019-07-10
US202062968819P 2020-01-31 2020-01-31
US62/968,819 2020-01-31
PCT/US2020/041634 WO2021007529A1 (en) 2019-07-10 2020-07-10 Rna-targeting knockdown and replacement compositions and methods for use

Publications (1)

Publication Number Publication Date
CN114450031A true CN114450031A (zh) 2022-05-06

Family

ID=71995058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080061471.7A Pending CN114450031A (zh) 2019-07-10 2020-07-10 靶向rna的敲低和替代组合物及使用方法

Country Status (7)

Country Link
US (1) US20210009987A1 (zh)
EP (1) EP3997227A1 (zh)
JP (1) JP2022540446A (zh)
CN (1) CN114450031A (zh)
AU (1) AU2020310201A1 (zh)
CA (1) CA3145309A1 (zh)
WO (1) WO2021007529A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3901262A1 (en) * 2020-04-20 2021-10-27 Universität Regensburg Compositions for use in treating autosomal dominant best1-related retinopathies
EP4291654A2 (en) 2021-02-12 2023-12-20 Alnylam Pharmaceuticals, Inc. Superoxide dismutase 1 (sod1) irna compositions and methods of use thereof for treating or preventing superoxide dismutase 1- (sod1-) associated neurodegenerative diseases
WO2022221278A1 (en) * 2021-04-12 2022-10-20 Locanabio, Inc. Compositions and methods comprising hybrid promoters
WO2022241059A2 (en) * 2021-05-11 2022-11-17 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023015153A2 (en) * 2021-08-02 2023-02-09 President And Fellows Of Harvard College ANTISENSE OLIGONUCLEOTIDE TARGETING APOE ε4 AND USES THEREOF
WO2023070062A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of usher syndrome type 3
WO2023215761A1 (en) * 2022-05-03 2023-11-09 Tacit Therapeutics, Inc. Localization of trans-splicing nucleic acid molecules to and within the cellular nucleus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140249212A1 (en) * 2011-09-27 2014-09-04 Yale University Compositions and Methods for Transient Expression of Recombinant RNA
WO2015164773A1 (en) * 2014-04-25 2015-10-29 Shire Human Genetic Therapies, Inc. Methods for purification of messenger rna
CN105087650A (zh) * 2007-10-05 2015-11-25 吉尼松公司 使用外周注射aav载体向运动神经元进行广泛基因投送
CN108690861A (zh) * 2017-04-10 2018-10-23 肖晓莺 用于早期乳腺癌症诊断的微小核糖核酸

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2623605B1 (en) 2007-04-09 2018-11-28 University of Florida Research Foundation, Inc. RAAV vector compositions having tyrosine-modified capsid proteins and methods for use
CN101895633A (zh) 2010-07-14 2010-11-24 中兴通讯股份有限公司 一种移动终端及其解锁方法
US9580714B2 (en) 2010-11-24 2017-02-28 The University Of Western Australia Peptides for the specific binding of RNA targets
DK2784157T3 (da) 2011-10-21 2019-10-21 Univ Kyushu Nat Univ Corp Designfremgangsmåde til et rna-bindende protein under anvendelse af ppr-motiv og anvendelse deraf
US10330674B2 (en) 2015-01-13 2019-06-25 Massachusetts Institute Of Technology Pumilio domain-based modular protein architecture for RNA binding
EP3289080B1 (en) * 2015-04-30 2021-08-25 The Trustees of Columbia University in the City of New York Gene therapy for autosomal dominant diseases
US10876101B2 (en) 2017-03-28 2020-12-29 Locanabio, Inc. CRISPR-associated (Cas) protein
US11168322B2 (en) 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US10476825B2 (en) 2017-08-22 2019-11-12 Salk Institue for Biological Studies RNA targeting methods and compositions

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105087650A (zh) * 2007-10-05 2015-11-25 吉尼松公司 使用外周注射aav载体向运动神经元进行广泛基因投送
US20140249212A1 (en) * 2011-09-27 2014-09-04 Yale University Compositions and Methods for Transient Expression of Recombinant RNA
WO2015164773A1 (en) * 2014-04-25 2015-10-29 Shire Human Genetic Therapies, Inc. Methods for purification of messenger rna
CN106164248A (zh) * 2014-04-25 2016-11-23 夏尔人类遗传性治疗公司 信使rna的纯化方法
CN108690861A (zh) * 2017-04-10 2018-10-23 肖晓莺 用于早期乳腺癌症诊断的微小核糖核酸

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YI-TING TSAI等: "Clustered Regularly lnterspaced Short Palindromic Repeats-based genome surgery for the treatment of autosomal dominantretinitis pigmentosa", OPHTHALMOLOGY, vol. 125, no. 9, 11 May 2018 (2018-05-11) *
凌宏艳;廖端芳;: "微小RNA研究进展", 中国动脉硬化杂志, no. 05, 26 May 2008 (2008-05-26) *
陈如意;陈素峰;周丹;许健;: "2型腺相关病毒作为基因治疗载体的研究进展", 生命科学, no. 06, 15 June 2013 (2013-06-15) *

Also Published As

Publication number Publication date
US20210009987A1 (en) 2021-01-14
WO2021007529A1 (en) 2021-01-14
CA3145309A1 (en) 2021-01-14
AU2020310201A1 (en) 2022-01-27
JP2022540446A (ja) 2022-09-15
EP3997227A1 (en) 2022-05-18

Similar Documents

Publication Publication Date Title
US10822617B2 (en) RNA-targeting fusion protein compositions and methods for use
CN114450031A (zh) 靶向rna的敲低和替代组合物及使用方法
US20220127621A1 (en) Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna
US20230233651A1 (en) Materials and methods for treatment of titin-based myopathies and other titinopathies
CN113286619A (zh) 用于调节适应性免疫的组合物和方法
CA3092459A1 (en) Closed-ended dna (cedna) vectors for insertion of transgenes at genomic safe harbors (gsh) in humans and murine genomes
EP3841116A1 (en) Fasl immunomodulatory gene therapy compositions and methods for use
JP2023551873A (ja) Cagリピート病を処置するためのrna標的化組成物および方法
WO2022119979A1 (en) Rna-targeting compositions and methods for treating myotonic dystrophy type 1
WO2023154807A2 (en) Compositions and methods for modulating pre-mrna splicing
CN117320741A (zh) 用于治疗cag重复疾病的靶向rna的组合物和方法
CN116801901A (zh) 用于治疗1型强直性肌营养不良的靶向rna的组合物和方法
WO2022221278A1 (en) Compositions and methods comprising hybrid promoters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination