CN116490615A - 工程化CRISPR-Cas13f系统及其用途 - Google Patents

工程化CRISPR-Cas13f系统及其用途 Download PDF

Info

Publication number
CN116490615A
CN116490615A CN202280007043.5A CN202280007043A CN116490615A CN 116490615 A CN116490615 A CN 116490615A CN 202280007043 A CN202280007043 A CN 202280007043A CN 116490615 A CN116490615 A CN 116490615A
Authority
CN
China
Prior art keywords
cas13f
engineered
polypeptide
rna
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280007043.5A
Other languages
English (en)
Inventor
童华威
王兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huida Gene Therapy Singapore Private Ltd
Huida Shanghai Biotechnology Co ltd
Original Assignee
Huida Shanghai Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CN2021/121926 external-priority patent/WO2022068912A1/en
Application filed by Huida Shanghai Biotechnology Co ltd filed Critical Huida Shanghai Biotechnology Co ltd
Publication of CN116490615A publication Critical patent/CN116490615A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Plant Pathology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开提供新型工程化Cas13f效应蛋白及其用途,如在基于RNA的靶基因转录物敲低中,所述效应蛋白基本上保持指导序列特异性切割活性,并且基本上缺乏非指导序列依赖性旁切活性。

Description

工程化CRISPR-Cas13f系统及其用途
相关申请的交叉引用
本申请要求于2021年9月29日提交的标题为“Engineered CRISPR-Cas13Systemand Uses Thereof”的国际专利申请号PCT/CN2021/121926和于2022年3月28日提交的标题为“Engineered CRISPR-Cas13 System and Uses Thereof”的国际专利申请号PCT/CN2022/083461的权益和优先权,将其包括任何序列表和附图在内的全部内容通过引用以其全文并入本文。
电子序列表的引用
将电子序列表(“HGP020PCT.xml”;大小为17,778字节,并且创建于2022年9月29日)的内容通过引用以其全文并入本文。
技术领域
本文所公开的主题通常涉及用于利用包含工程化Cas13f多肽的系统进行靶RNA修饰和编辑的系统、方法和组合物。特别地,本公开提供包含新型工程化Cas13f多肽和至少一种靶向核酸组分的RNA靶向组合物。
背景技术
CRISPR-Cas13正迅速成为一种广泛采用的RNA编辑技术。该系统可以使用其序列特异性指导RNA选择性地修饰(例如,经由内切核酸酶活性切割(cut或cleave))靶RNA,如mRNA。与通过基于DNA的编辑引入的永久性基因组变化相比,RNA在转录水平控制基因表达,从而提供更安全且更可控的基因疗法方法。由于CRISPR-Cas13系统的RNA编辑效率高,它们已广泛用于多种生物中,包括酵母、植物、哺乳动物和斑马鱼(参见Abudayyeh等人,2017;Aman等人,2018;Cox等人,2017;Jing等人,2018;Konermann等人,2018)。CRISPR-Cas13d的直系同源物CasRx可以在体内介导RNA敲低,并有效缓解各种小鼠模型中的疾病表型(He等人,Protein Cell[蛋白与细胞]11:518-524,2020;Zhou等人,Cell[细胞]181:590-603e516,2020;以及Zhou等人,National Science Review[国家科学评论]7:835-837,2020)。
然而,目前鉴定的这些Cas13蛋白的一个缺点是,它们在通过基于crRNA的靶序列识别激活后全部都具有非特异性/旁切(collateral)RNA酶活性。这种活性在Cas13a和Cas13b中特别强烈,并且仍然例如以可检测的方式存在于Cas13d中以及在较小程度上存在于Cas13e中。虽然这种特性可以有利地用于核酸检测方法中,但这些Cas13蛋白的非特异性/旁切RNA酶活性也会导致不希望的邻近RNA的旁切降解,并对它们的体内应用(例如在基因疗法中)施加了巨大的障碍。
另一方面,对于依赖旁切活性进行灵敏检测的实际效用(如SHERLOCK),具有表现出甚至比野生型Cas13f更高的旁切活性的突变体Cas13f效应蛋白可以是有益的。
因此,本领域需要进一步优化野生型Cas13以用于不同目的,例如,降低旁切活性,使其具有针对某些用途(如治疗应用)的可接受的中靶切割活性;或增强/增加旁切活性,使其具有针对某些其他用途(如诊断应用)的可接受的中靶切割活性。
在本申请中对任何文献的引用或标识均不是承认该文献可作为本公开的现有技术获得。
发明内容
本公开的一个方面提供工程化Cas13f多肽,其中所述工程化Cas13f多肽:
(1)包含在空间上接近以下的区域中的突变:a)(例如,SEQ ID NO:1的)参考Cas13f多肽的N-末端内切核酸酶催化RXXXXH基序(例如,N-末端内切核酸酶催化RNFYSH基序),和/或b)所述(例如,SEQ ID NO:1的)参考Cas13f多肽的C-末端内切核酸酶催化RXXXXH基序(例如,C-末端内切核酸酶催化RNKALH基序);
(2)基本上保留(例如,具有至少约50%、60%、70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%或更多的)所述(例如,SEQID NO:1的)参考Cas13f多肽对与间隔序列互补的靶RNA的间隔序列特异性切割活性;以及
(3)基本上缺乏(例如,具有不超过约50%、45%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%或更少的)所述(例如,SEQ ID NO:1的)参考Cas13f多肽对不与所述间隔序列结合的非靶RNA的间隔序列非依赖性旁切活性。
在一些实施方式中,所述区域包括距离所述N-末端内切核酸酶催化RXXXXH基序或所述C-末端内切核酸酶催化RXXXXH基序的任何残基在140、130、120、110、100、90、80、70、60、50、40、30、20或10个氨基酸以内的残基。
在一些实施方式中,所述区域包括距离所述N-末端内切核酸酶催化RXXXXH基序或所述C-末端内切核酸酶催化RXXXXH基序的任何残基在100、110、120或130个残基以外,但在空间上在所述N-末端内切核酸酶催化RXXXXH基序或所述C-末端内切核酸酶催化RXXXXH基序的任何残基的约1埃至约10埃以内或约5埃的残基。
在一些实施方式中,所述区域包含对应于SEQ ID NO:1的所述参考Cas13f多肽的以下结构域的残基、基本上由其组成、或由其组成:HEPN1结构域(例如,残基1-168)、IDL结构域(例如,残基168-185)、Helical1结构域(例如,Helical1-1(Hel1-1)结构域(例如,残基185-234)、Helical1-2(Hel1-2)结构域(例如,残基281-346)、Helical1-3(Hel1-3)结构域(例如,残基477-644))、Helical2结构域(例如,残基346-477)、或HEPN2结构域(例如,残基644-790)。
在一些实施方式中,所述突变包含在所述区域内的一段约8个至约20个(例如,约9个或约17个)连续氨基酸内的以下、基本上由其组成、或由其组成:
(a)一个或多个(例如,1、2、3、4、5或更多个)非Ala(A)残基至Ala(A)残基的取代;
(b)一个或多个(例如,1、2、3、4、5或更多个)带电荷的残基、含氮侧链基团的残基、大的(如F或Y)残基、脂肪族残基、和/或极性残基至电荷中性的短链脂肪族残基(如A、V或I)的取代;
(c)一个或多个(例如,1、2、3、4、5或更多个)Ile(I)和/或Leu(L)残基至Ala(A)残基的取代;和/或
(d)一个或多个(例如,1、2、3、4、5或更多个)Ala(A)残基至Val(V)残基的取代。
在一些实施方式中,所述一个或多个非Ala残基和/或所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S、T、L残基或其组合。
在一些实施方式中,所述一个或多个非Ala残基和/或所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、Y、L残基或其组合。
在一些实施方式中,所述一段内的一个或多个Y残基被取代。
在一些实施方式中,所述一个或多个Y残基对应于SEQ ID NO:1的所述参考Cas13f多肽的Y666和/或Y677。
在一些实施方式中,所述一段内的一个或多个D残基被取代。
在一些实施方式中,所述一个或多个D残基对应于SEQ ID NO:1的所述参考Cas13f多肽的D160和/或D642。
在一些实施方式中,所述电荷中性的短链脂肪族残基是Ala(A)。
在一些实施方式中,所述突变包含以下、基本上由以下组成、或由以下组成:
(a)在所述区域内的一段约8个至约20个(例如,约9个或约17个)连续氨基酸中的1、2、3、4或5个所述段内的取代;
(b)对应于以下突变(例如,表1-5中的任何一个)或其组合的突变,所述突变导致工程化Cas13f多肽具有至少约75%的间隔序列特异性切割活性和不超过约25%的间隔序列非依赖性旁切活性;和/或
(c)对应于表5中的F7V2、F10V1、F10V4、F40V4、F40S22、F40S26、F40S36、F10S21、F10S24、F10S26、F10S27、F10S33、F10S34、F10S35、F10S36、F10S45、F10S46、F10S48、F10S49、F40S23、或F40S27突变或其组合的突变。
在一些实施方式中,所述工程化Cas13f多肽保留SEQ ID NO:1的所述参考Cas13f多肽对所述靶RNA的间隔序列特异性切割活性的至少约50%、60%、70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%或更多。
在一些实施方式中,所述工程化Cas13f多肽具有SEQ ID NO:1的所述参考Cas13f多肽对所述非靶RNA的间隔序列非依赖性旁切活性的不超过50%、45%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%或更少。
在一些实施方式中,所述工程化Cas13f多肽具有SEQ ID NO:1的所述参考Cas13f多肽对所述靶RNA的间隔序列特异性切割活性的至少约80%,以及SEQ ID NO:1的所述参考Cas13f多肽对所述非靶RNA的间隔序列非依赖性旁切活性的不超过约40%。
在一些实施方式中,所述突变是F40S23(即,Y666A/Y677A双重突变)。
在一些实施方式中,所述工程化Cas13f多肽包含SEQ ID NO:3的氨基酸序列、基本上由其组成、或由其组成。
在一些实施方式中,所述工程化Cas13f多肽进一步包含对应于表6中任何一个、两个或更多个(例如,3、4或5个以上)突变(如,D160A、D642A和/或L641A)的组合的突变。
在一些实施方式中,所述突变是表6中任何一个、两个或更多个(例如,3、4或5个以上)单一突变(如,D160A、D642A和/或L641A)与F40S23(即,Y666A/Y677A双重突变)的组合。
在一些实施方式中,所述突变是Y666A/Y677A双重突变与选自D160A、L641A和D642A的1、2或3个突变的组合。
在一些实施方式中,所述突变是表7-12中的任何组合突变。
在一些实施方式中,所述突变是D160A/D642A/Y666A/Y677A四重突变。
在一些实施方式中,所述工程化Cas13f多肽与SEQ ID NO:3的工程化Cas13f多肽相比具有增加的间隔序列特异性切割活性。
在一些实施方式中,所述突变是对应于表13-16中的突变与D160A/D642A/Y666A/Y677A突变的组合的突变。
在一些实施方式中,所述工程化Cas13f多肽包含SEQ ID NO:4的氨基酸序列、基本上由其组成、或由其组成。
在一些实施方式中,所述工程化Cas13f多肽进一步包含非碱性氨基酸残基至Arg(R)残基的氨基酸取代。
在一些实施方式中,所述工程化Cas13f多肽进一步包含对应于表13-16中任何一个、两个或更多个(例如,3、4或5个以上)单一突变的组合的突变。
在一些实施方式中,所述工程化Cas13f多肽与SEQ ID NO:4的工程化Cas13f多肽相比具有增加的间隔序列特异性切割活性。
在一些实施方式中,所述工程化Cas13f多肽与所述SEQ ID NO:1的参考Cas13f多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%且小于100%的序列同一性。
在一些实施方式中,所述工程化Cas13f多肽进一步包含核定位信号(NLS)序列或核输出信号(NES)。
在一些实施方式中,所述工程化Cas13f多肽进一步包含N-末端和/或C-末端NLS。
本公开的另一方面提供多核苷酸,所述多核苷酸编码本公开的工程化Cas13f多肽。
在一些实施方式中,所述多核苷酸经密码子优化以在真核生物、哺乳动物如人或非人哺乳动物、植物、昆虫、鸟、爬行动物、啮齿动物(例如,小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
本公开的另一方面提供CRISPR-Cas13f系统,所述CRISPR-Cas13f系统包含:
a)本公开的工程化Cas13f多肽或其多核苷酸编码序列(例如,DNA编码序列或RNA编码序列);以及
b)指导RNA(gRNA)或其多核苷酸编码序列(例如,DNA编码序列或RNA编码序列),所述gRNA包含:
i.能够与所述工程化Cas13f多肽形成复合物的同向重复(DR)序列;和
ii.能够与靶RNA杂交并将所述复合物引导或募集至所述靶RNA的间隔序列。
在一些实施方式中,所述DR序列具有与SEQ ID NO:2中的二级结构基本上相同的二级结构。
在一些实施方式中,所述间隔序列的长度为至少15个核苷酸。在一些实施方式中,所述间隔序列的长度为30个核苷酸。
本公开的另一方面提供载体,所述载体包含本公开的多核苷酸。
在一些实施方式中,所述多核苷酸与启动子可操作地连接。在一些实施方式中,所述多核苷酸与增强子可操作地连接。
在一些实施方式中,所述启动子是组成型启动子,诱导型启动子,广谱启动子(ubiquitous promoter),或者细胞、组织或器官特异性启动子。
在一些实施方式中,所述载体是质粒。
在一些实施方式中,所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒(HSV)载体、AAV载体或慢病毒载体。
在一些实施方式中,所述AAV载体是血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV 11、AAV 12、AAV 13、AAV.PHP.eB或AAV-DJ的重组AAV载体。
在一些实施方式中,所述AAV载体是包封RNA的AAV载体。
本公开的另一方面提供递送系统,所述递送系统包含(1)递送媒介物(vehicle),和(2)本公开的工程化Cas13f多肽、本公开的多核苷酸、本公开的CRISPR-Cas13f系统、或本公开的载体。
在一些实施方式中,所述递送媒介物是纳米颗粒(例如,LNP)、脂质体、外泌体、微泡或基因枪。
本公开的另一个方面提供细胞或其后代,所述细胞或其后代包含本公开的工程化Cas13f多肽、本公开的多核苷酸、本公开的CRISPR-Cas13f系统、本公开的载体、或本公开的递送系统。
在一些实施方式中,所述细胞是真核细胞(例如,非人哺乳动物细胞、人细胞或植物细胞)或原核细胞(例如,细菌细胞)。
本公开的另一方面提供非人类多细胞真核生物,所述非人类多细胞真核生物包含本公开的细胞或后代。
在一些实施方式中,所述非人类多细胞真核生物是针对人遗传障碍的动物(例如,啮齿动物或灵长类动物)模型。
本公开的另一方面提供修饰靶RNA的方法,所述方法包括使靶RNA与本公开的CRISPR-Cas13f系统、本公开的载体、本公开的递送系统、或本公开的细胞或后代接触。
在一些实施方式中,通过由所述工程化Cas13f多肽进行切割来修饰所述靶RNA。
在一些实施方式中,所述靶RNA是mRNA、tRNA、rRNA、非编码RNA、lncRNA或核RNA。
在一些实施方式中,在所述工程化Cas13f多肽和所述指导RNA的复合物与所述靶RNA结合后,所述工程化Cas13f多肽不会表现出实质性的(或可检测的)间隔序列非依赖性旁切活性。
在一些实施方式中,所述靶RNA在细胞内。
在一些实施方式中,所述细胞是癌细胞。
在一些实施方式中,所述细胞受感染原感染。
在一些实施方式中,所述感染原是病毒、朊病毒、原生动物、真菌或寄生物。
在一些实施方式中,所述细胞是神经元细胞(例如,星形胶质细胞、神经胶质细胞(例如,穆勒神经胶质细胞(Muller glia cell)、少突胶质细胞、室管膜细胞、施万细胞(Schwan cell)、NG2细胞或卫星细胞))。
在一些实施方式中,所述CRISPR-Cas13f系统由以下编码:编码所述工程化Cas13f多肽的第一多核苷酸,以及包含或编码所述指导RNA的第二多核苷酸,其中所述第一多核苷酸和所述第二多核苷酸被引入所述细胞中。
在一些实施方式中,通过同一个的载体将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中。
在一些实施方式中,所述接触导致以下中的一项或多项:(i)体外或体内诱导细胞衰老;(ii)体外或体内细胞周期停滞;(iii)体外或体内细胞生长抑制;(iv)体外或体内诱导无能(anergy);(v)体外或体内诱导细胞凋亡;以及(vi)体外或体内诱导坏死。
本公开的另一方面提供在有需要的受试者中治疗病症或疾病的方法,所述方法包括向所述受试者施用包含以下的组合物:本公开的CRISPR-Cas13f系统、本公开的载体、本公开的递送系统、或本公开的细胞或后代;其中,在施用后,所述工程化Cas13f多肽切割所述靶RNA,从而治疗所述受试者的病症或疾病。
在一些实施方式中,所述病症或疾病是神经病症、癌症、感染性疾病或遗传障碍。
在一些实施方式中,所述癌症是威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病、慢性骨髓性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。
在一些实施方式中,所述神经病症是青光眼,与年龄相关的RGC丧失,视神经损伤,视网膜缺血,莱伯遗传性视神经病变,与RGC神经元退化相关的神经病症,与有需要的受试者的纹状体中功能性神经元退化相关的神经病症,帕金森病,阿尔茨海默病,亨廷顿病,精神分裂症,抑郁症,药物成瘾,运动障碍如舞蹈病、舞蹈徐动症和动作障碍,双相障碍,自闭症谱系障碍(ASD)或功能失调。
在一些实施方式中,所述方法是体外方法、体内方法或离体方法。
本公开的另一方面提供CRISPR-Cas13f复合物,所述CRISPR-Cas13f复合物包含本公开的工程化Cas13f多肽以及包含DR序列和间隔序列的指导RNA,所述DR序列与所述工程化Cas13f多肽结合,所述间隔序列能够与靶RNA杂交并且将所述复合物引导或募集至所述靶RNA。
在一些实施方式中,所述靶RNA由真核DNA编码。
在一些实施方式中,所述真核DNA是非人哺乳动物DNA、非人灵长类动物DNA、人DNA、植物DNA、昆虫DNA、鸟DNA、爬行动物DNA、啮齿动物DNA、鱼DNA、蠕虫/线虫DNA、或酵母DNA。
在一些实施方式中,所述靶RNA是mRNA。
在一些实施方式中,所述CRISPR-Cas13f复合物进一步包含靶RNA,所述靶RNA包含能够与所述间隔序列杂交的序列。
应理解,本文描述的本公开的任何一个实施方式,包括仅在实施例或权利要求中、或仅在下文的一个方面/部分中描述的那些实施方式,可以与本公开的任何其他一个或多个实施方式组合,除非明确否认或认为不当。
通过考虑所展示的示例性实施方式的以下详细描述,对于本领域普通技术人员而言,示例性实施方式的这些和其它方面、目的、特征和优点将变得清楚。
附图说明
通过参考下面的详细描述和附图,将获得对本公开的某些特征和优点的理解,下面的详细描述阐述了说明性实施方式,其中可以利用本公开的原理,并且在这些附图中:
图1显示了以条带表示的SEQ ID NO:1的参考Cas13f多肽的预测3D结构(通过I-TASSER)的视图。两个HEPN结构域的RXXXXH基序是催化位点。
图2是用于检测Cas13f突变体的切割和旁切活性的示例性单质粒哺乳动物双荧光报告系统的示意图。
图3显示了经选择用于诱变的SEQ ID NO:1的参考Cas13f多肽的HEPN1、HEPN2、IDL和Hel1-3结构域的20个区段,其中每个区段跨越9或17个氨基酸。
图4显示了相对于死Cas13f(dCas13f)归一化的Cas13f突变体的EGFP+或mCherry+细胞的百分比。
图5显示了具有在F10V1、F10V4、F38V2、F40V2、F40V4、F46V1和F46V3中或附近的组合突变的Cas13f突变体的EGFP+或mCherry+细胞的百分比,所述Cas13f突变体相对于死Cas13f(dCas13f)归一化。
图6是用于检测Cas13f突变体的切割和旁切活性的示例性两质粒哺乳动物双荧光报告系统的示意图。
图7显示了相对于NT归一化的Cas13f突变体的EGFP和mCherry的MFI(平均荧光强度)的定量。
图8显示了相对于NT归一化的Cos7细胞中Cas13f突变体的SOD1 mRNA敲低效率。
图9显示了相对于NT归一化的Cas13f突变体的EGFP和mCherry的MFI的定量。
图10显示了相对于NT归一化的Cas13f突变体的EGFP和mCherry的MFI的定量。
图11显示了相对于NT归一化的Cos7细胞中Cas13f v2、v3、v2+H638A和D642A突变体的SOD1 mRNA敲低效率。
图12显示了Cas13f v3的功能性结构域结构。与参考Cas13f多肽相比,以红色标记的四个氨基酸突变是Cas13f v3的突变。
图13是用于检测Cas13f突变体的切割活性的示例性哺乳动物荧光报告系统的示意图。
图14是相对于非靶向阴性对照(“NT”)归一化的Cas13f突变体的BFP阳性细胞的RFP的平均荧光强度。所有值均呈现为平均值±s.d.(n=2),*P<0.05,**P<0.01。
图15是相对于非靶向阴性对照(“NT”)归一化的Cas13f突变体的BFP阳性细胞的RFP的平均荧光强度。所有值均呈现为平均值±s.d.(n=2或1),*P<0.05,**P<0.01。
图16是相对于非靶向阴性对照(“NT”)归一化的Cas13f突变体的BFP阳性细胞的RFP的平均荧光强度。所有值均呈现为平均值±s.d.(n=2),*P<0.05,**P<0.01。
图17是相对于非靶向阴性对照(“NT”)归一化的Cas13f突变体的BFP阳性细胞的RFP的平均荧光强度。所有值均呈现为平均值±s.d.(n=2或1),*P<0.05,**P<0.01。
本文的附图仅是出于说明目的,并且不一定按比例绘制。
具体实施方式
1.概述
存在2类VI型的几种亚型,包括至少VI-A(Cas13a/C2c2)、VI-B(Cas13b1和Cas13b2)、VI-C(Cas13c)、VI-D(Cas13d、CasRx)、VI-E(Cas13e)和VI-F(Cas13f)亚型。Cas13亚型通常共享非常低的序列同一性/相似性,但基于两个保守的HEPN样RNA酶结构域的存在,可以全部分类为VI型Cas蛋白(例如,本文通常称为“Cas13”)。尽管这两个结构域似乎是Cas13酶的保守特征,并且典型地位于靠近两个末端的位置,但它们在蛋白内的间距对于每种亚型似乎是唯一的。已公布了至少三种VI-A型Cas13a蛋白的晶体结构,包括来自沙氏纤毛菌(Leptotrichia shahii)(LshCas13a)、毛螺旋菌科(Lachnospiraceae)细菌(LbaCas13a)和口腔纤毛菌(Leptotrichia buccalis)(LbuCas13a)的Cas13a。与其他2类复合物相似,crRNA-Cas13a复合物是双叶的,带有核酸酶(NUC)叶和crRNA识别(REC)叶。Cas13a的crRNA结合形式采用“握紧拳头(clenched fist)”样结构,其中REC叶不完美地堆叠在NUC叶的顶部。REC叶具有可变的N-末端结构域(NTD),然后是螺旋结构域(Helical-1)。同时,NUC叶由两个HEPN结构域(HEPN-1和HEPN-2)组成,这两个HEPN结构域由接头结构域(Helical-3)隔开。此外,HEPN-1结构域经另一螺旋结构域(Helical-2)拆分成两个亚结构域。NTD、Helical-1和HEPN2结构域形成狭窄的带正电荷的裂隙,其锚定结合的crRNA的5'重复序列衍生端(5'-手柄(handle)),而Helical-2结构域结合crRNA的3'端。
Cas13 CRISPR基因座最初经转录成长的pre-crRNA转录物。然后,Cas13蛋白在由回文性质的同向重复(DR)序列形成的茎环结构上游的固定位置处切割pre-crRNA。VI型中的pre-crRNA加工涉及茎环上游的非金属依赖性切割,并且不需要反式激活crRNA(tracrRNA)或其他宿主因子。成熟的crRNA(其包含DR序列和与靶RNA互补的指导序列)与Cas13蛋白组装形成功能性RNP复合物,然后针对互补的RNA靶标扫描转录物。一旦发现这样的RNA靶标并且指导序列与其结合,所述RNA靶标就会经Cas13内切核酸酶降解。
Cas13效应蛋白表现出前所未有的灵敏度以识别异质非靶RNA群内的特异性靶RNA。据报道,Cas13能够以飞摩尔级灵敏度检测靶RNA。因此,一方面,2类VI型酶或Cas13为基因疗法提供巨大的机会以敲低靶基因产物(例如,mRNA),但另一方面,这种使用本质上受到所谓的旁切活性的限制,所述旁切活性会带来显著的细胞毒性风险。
特别地,在2类VI型系统中,在靶RNA结合后,Cas13中的高等真核生物和原核生物核苷酸结合(HEPN)结构域赋予指导序列非特异性RNA切割,称为“旁切活性”。与结合的crRNA互补的同源靶ssRNA的结合导致Cas13f效应蛋白发生实质性的构象变化,从而导致形成单一的复合催化位点,用于非指导序列依赖性“旁切”RNA切割,从而将Cas13转化为序列非特异性核糖核酸酶。这个新形成的高度可及的活性位点不仅会以顺式降解靶RNA(如果所述靶RNA足够长,能够到达这个新的活性位点),而且还会基于这种混杂的RNA酶活性以反式降解非靶RNA。
大多数RNA似乎容易受到Cas13f这种混杂的RNA酶活性的影响,并且大多数(如果不是全部)Cas13f效应蛋白具有这种旁切活性。最近已证明,Cas13介导的敲低带来的旁切效应存在于哺乳动物细胞和动物中(已提交稿件),这表明Cas13介导的靶RNA敲低的临床应用在旁切效应存在的情况下将面临重大挑战。
已经使用如本文描述的本公开的双荧光报告系统证明了存在Cas13介导的RNA敲低的实质性的旁切效应。针对哺乳动物细胞中的外源性和内源性基因,均已经观察到这样的旁切效应。
因此,为了在基因疗法中使用Cas13酶特异性敲低靶RNA,显然必须严格控制这种指导序列非特异性旁切活性,以防止不必要的自发性细胞毒性。通过不清楚的机制,VI-B亚型系统包括经由VI型相关基因csx27和csx28调节Cas13b的旁切活性的天然手段,但这种天然调节机制似乎是VI-B亚型独有的,因为类似的机制似乎不存在于其他亚型(如VI-A型和VI-C型)中。
据发现,使用本公开的报告系统,在高等真核生物和原核生物核苷酸结合(HEPN)结构域上具有2-4个突变的几种突变体保留了不减弱的中靶活性,但大大减少了旁切效应。
有趣的是,据发现,大多数突变体表现出低的双切割活性,或者高的中靶切割活性但低的旁切活性。然而,几乎没有突变体显示出低的中靶切割活性但高的旁切活性。这些结果表明在中靶切割活性和旁切活性之间存在不同的结合机制。
尽管不希望受任何特定理论的束缚,但申请人相信以下靶标(例如,gRNA特异性)和旁切活性的模型有助于Cas13f效应蛋白的无旁切效应的突变体的基本原理设计。特别地,如图1中所示,认为Cas13f含有两个靠近HEPN结构域的分开的结合结构域——一个负责中靶切割,并且两者都是旁切所必需的。与该模型一致,在切割位点周围的F10、F38和F40区域上设计的突变会引起空间位阻效应或电荷变化,从而导致激活的Cas13f与混杂的RNA之间的相互作用弱化,但对激活的Cas13f与中靶RNA之间的影响不大(如果有的话)。因此,对这些结合位点的诱变消除Cas13f的旁切活性,同时保留对应的野生型Cas13f的中靶切割活性。
因此,本文描述的本公开提供工程化高保真2类VI型或Cas13f效应蛋白突变体,所述突变体具有最小的残余旁切效应。例如,这些突变体可用于在基础研究和治疗性应用中靶向降解RNA。
另一方面,鉴定了多种表现出双切割活性增加的低保真Cas13f突变体。这样的突变体可用于更好的核酸检测应用(例如在SHERLOCK测定中使用的那些)。
特别地,在一个方面,本公开提供工程化2类VI型或Cas13f效应蛋白,所述效应蛋白大部分保持其针对靶RNA的序列特异性切割活性,但减弱(如果未消除)针对非靶RNA的非指导序列特异性切割活性。这样的工程化Cas13f效应蛋白(其基本上缺乏旁切效应)为在基于靶RNA敲低的效用(如基因疗法)中使用Cas13f铺平道路。这样的工程化Cas13f效应蛋白(其基本上缺乏旁切效应)也可用于RNA碱基编辑,因为这样的工程化Cas13f的核酸酶死亡版本(或“dCas13”)也减少了脱靶效应,这种效应仍然存在于没有本发明工程化Cas13f的突变的dCas13f中。
野生型Cas13f不仅具有通过crRNA的指导序列与靶RNA结合的能力,而且还在HEPN催化结构域附近具有针对任何RNA的非特异性RNA结合位点(参见催化位点周围的椭圆形基序)。一旦指导序列识别到靶RNA,Cas13f的构象变化就会激活其催化活性,并且互补指导序列和非特异性RNA结合位点两者所结合的靶RNA会受到切割。一旦经激活,Cas13f也会非特异性地切割不与指导序列结合的非靶RNA,部分原因是这样的非靶RNA与cas13上的非特异性RNA结合位点结合。非特异性RNA结合基序的突变(如由椭圆基序的不同阴影表示)降低/消除(或在一些情况下,增强)Cas13f结合RNA的能力,从而降低/消除(或增强)针对非靶RNA的旁切活性而不显著影响靶RNA切割,因为指导序列仍然结合靶RNA。
根据该模型,也可以减少或消除使用工程化Cas13f的核酸酶缺陷型(dCas13)版本的RNA碱基编辑中的脱靶效应,因为工程化dCas13f中非特异性RNA结合的丧失减少/消除由于RNA碱基编辑结构域(例如,ADAR或CDAR)和脱靶RNA底物的接近而导致的基于RNA的非预期编辑。
在相关方面,本公开还提供工程化2类VI型或Cas13f效应蛋白,与对应的野生型Cas13f相比,所述效应蛋白大部分保持其针对靶RNA的序列特异性切割活性,但增强针对非靶RNA的非指导序列特异性切割活性。与野生型相比,这种旁切效应增强的工程化Cas13f在核酸检测测定(如SHERLOCK)中提供更好的(例如,更灵敏的)突变体,所述SHERLOCK利用旁切活性来提供极灵敏的测定,用于在预扩增或不预扩增样品中的初始核酸的情况下检测样品中非常少量的指导序列特异性靶RNA。
更特别地,本公开的一个方面提供工程化2类VI型成簇的规律间隔的短回文重复序列(CRISPR)-Cas13f效应子,其中所述工程化2类VI型Cas效应蛋白:(1)在与对应的野生型效应蛋白的内切核酸酶催化结构域空间上接近的区域中包含突变;(2)基本上保留野生型效应蛋白对与指导序列互补的靶RNA的指导序列特异性内切核酸酶切割活性(或其理论最大值);以及(3)基本上缺乏或具有增强的所述野生型效应蛋白对基本上不与所述指导序列互补/不与所述指导序列结合的非靶RNA的非指导序列依赖性旁切内切核酸酶切割活性(或其理论最大值)。
在某些实施方式中,所述指导序列特异性内切核酸酶切割活性和所述非指导序列依赖性旁切内切核酸酶切割活性两者都可以与对应的野生型Cas13f效应蛋白相比来测量,如针对对应的核酸酶缺陷型(无催化活性的)Cas13f(如dCas13f)进行归一化。
所述核酸酶缺陷型Cas13f可缺乏催化结构域、基序或关键催化残基,使它不表现出可察觉的或可检测的指导序列依赖性靶RNA内切核酸酶切割活性水平、以及非指导序列依赖性旁切内切核酸酶切割活性水平。因此,在本文描述的适当报告系统中,dCas13f典型地具有100%剩余/基线EGFP信号(作为没有可察觉的或可检测的指导序列依赖性靶RNA内切核酸酶切割活性水平的指示),并且具有100%剩余/基线mCherry信号(作为没有可察觉的或可检测的非指导序列依赖性旁切内切核酸酶切割活性水平的指示)。同时,野生型Cas13f典型地表现出强烈的指导序列依赖性靶RNA内切核酸酶切割活性(如通过dCas13fEGFP参考信号减少近80%、90%、95%或接近100%所反映的)。这种指导序列依赖性靶RNA内切核酸酶切割活性的理论最大值为100%,相当于完全消除所有dCas13f EGFP参考信号。
野生型Cas13f还典型地表现出不同水平的非指导序列依赖性旁切内切核酸酶切割活性,从而导致dCas13f mCherry参考信号减少约50%-70%。这种非指导序列依赖性旁切内切核酸酶切割活性的理论最大值为100%,相当于完全消除所有dCas13f mCherry参考信号。
在某些实施方式中,本公开的工程化Cas13f效应蛋白与对应的衍生所述工程化Cas13f的野生型Cas13f相比表现出降低的或减弱的非指导序列依赖性旁切内切核酸酶切割活性(或其理论最大值)。例如,所述工程化Cas13f效应蛋白可以基本上缺乏(例如,保留少于50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%或更少的)野生型Cas13f对不与指导序列结合的非靶RNA的非指导序列依赖性旁切内切核酸酶切割活性。例如,如果野生型Cas13f由于旁切活性而消除dCas13f mCherry基线信号的约70%(理论最大值为100%消除),并且旁切活性减弱的突变体Cas13f由于剩余旁切活性而仅消除dCas13f mCherry基线信号的约10%,则所述突变体仅表现或保留约1/7(或约15%)的野生型旁切活性(或理论最大值的10%)。
在某些实施方式中,本公开的工程化Cas13f效应蛋白与对应的衍生所述工程化Cas13f的野生型Cas13f相比表现出增加的或增强的非指导序列依赖性旁切内切核酸酶切割活性。例如,所述工程化Cas13f效应蛋白可以具有基本上增强的或增加的(例如,具有多于100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多的)野生型Cas13f对不与指导序列结合的非靶RNA的非指导序列依赖性旁切内切核酸酶切割活性。例如,如果野生型Cas13f由于旁切活性而消除dCas13f mCherry基线信号的约50%,并且旁切活性增强的突变体Cas13f由于其增强的旁切活性而消除dCas13f mCherry基线信号的约90%,则所述突变体表现出约90/50(或约180%)的野生型旁切活性。
在某些实施方式中,所述突变发生在以下区域内,例如,在野生型Cas13f的其中一个HEPN型催化结构域处、旁边或附近的两个RNA结合结构域中的一个内。在某些实施方式中,所述突变弱化(例如,显著弱化或消除)野生型Cas13f与非特异性RNA靶标(例如,基本上不与指导RNA互补的靶标)的结合,但基本上保留与靶RNA(其与所述指导RNA基本上互补)的结合。在某些实施方式中,所述突变引起空间位阻效应和/或所涉及残基的侧链的电荷、极性和/或大小的变化,从而导致激活的Cas13f与混杂的RNA之间的相互作用弱化,但对激活的Cas13f与中靶RNA之间的影响不大(如果有的话)。
如本文所用,“Cas13”是2类VI型CRISPR-Cas效应蛋白,其作为野生型酶在结合与其crRNA的指导序列互补的同源靶RNA后显示出旁切活性。野生型2类VI型效应蛋白的旁切活性使其能够针对非靶RNA切割RNA酶或内切核酸酶活性,所述非靶RNA不与crRNA的指导序列互补或基本上不与其互补。所述野生型2类VI型效应蛋白还可以表现出一个或多个以下特征:具有一个或两个保守的HEPN样RNA酶结构域,如具有保守的RXXXXH基序(其中X是任何氨基酸)(例如,下文所述的RXXXXH基序)的HEPN结构域;当所述2类VI型效应蛋白(例如,Cas13)与同源crRNA结合时,具有“握紧拳头”样结构;具有带有核酸酶(NUC)叶和crRNA识别(REC)叶的双叶结构,任选地,所述REC叶具有可变的N-末端结构域(NTD),然后是螺旋结构域(Helical-1),并且/或者任选地,所述NUC叶由两个HEPN结构域(HEPN-1和HEPN-2)组成,这两个HEPN结构域由接头结构域(Helical-3)隔开,其中所述HEPN-1结构域任选地经另一螺旋结构域(Helical-2)拆分成两个亚结构域;将pre-crRNA转录物加工成crRNA;不需要反式激活crRNA(tracrRNA)或其他宿主因子来进行pre-crRNA加工;并且表现出飞摩尔级灵敏度以识别异质非靶RNA群内的指导序列特异性靶RNA。
在某些实施方式中,所述2类VI型效应蛋白(例如,Cas13)在HEPN样结构域中的其中一个RXXXXN基序位于或接近(例如,在50-160个残基以内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基以内)N-末端。在某些实施方式中,所述2类VI型效应蛋白(例如,Cas13)在HEPN样结构域中的其中一个RXXXXN基序位于或接近(例如,在50-160个残基以内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基以内)C-末端。在某些实施方式中,所述2类VI型效应蛋白(例如,Cas13)的HEPN样结构域的其中一个RXXXXN基序位于或接近(例如,在50-160个残基以内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基以内)N-末端,同时HEPN样结构域的另一个RXXXXN基序位于或接近(例如,在50-160个残基以内,或在10、20、30、40、50、60、70、80、90、100、110、120、130、140、150或160个残基以内)C-末端。如果RXXXXN基序的R或N残基位于或接近N-末端或C-末端,则所述RXXXXN基序“位于或接近”N-末端或C-末端。
基于生物学和细胞实验数据,所述工程化Cas13f效应蛋白显著降低了针对非靶RNA的非序列特异性切割活性,但同时表现出基本上相同(如果不是更高)的针对靶RNA的序列特异性切割活性,所述靶RNA与crRNA的指导序列基本上互补。所述工程化效应蛋白可实现高保真RNA靶向/编辑。
在某些实施方式中,所述Cas13f效应蛋白是Cas13f效应蛋白,或基本上保持指导序列特异性切割活性的其直系同源物、旁系同源物、同源物、天然的或工程化的突变体或其功能性片段。
在某些实施方式中,其突变体或功能性片段保持对应的野生型效应蛋白的至少一种功能。这样的功能包括但不限于结合本公开的指导RNA/crRNA(下文描述)以形成复合物的能力、指导序列特异性RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在一些实施方式中,所述Cas13f蛋白是野生型或参考Cas13f多肽。在某些实施方式中,所述野生型或参考Cas13f多肽具有本公开的SEQ ID NO:1(Cas13f.1)的氨基酸序列、PCT/CN2020/077211的SEQ ID NO:2-7(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)中的任何一个(将所述文献通过引用以其全文并入本文)、PCT/CN2022/101884的SEQ IDNO:9-10(分别为Cas13f.6和Cas13f.7)中的任何一个(将所述文献通过引用以其全文并入本文)。那些野生型或参考Cas13f多肽的同向重复(DR)序列分别是本公开的SEQ ID NO:2(Cas13f.1)、PCT/CN2020/077211的SEQ ID NO:11-14(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)中的任何一个(将所述文献通过引用以其全文并入本文)、PCT/CN2022/101884的SEQ ID NO:26-27(分别为Cas13f.6和Cas13f.7)中的任何一个(将所述文献通过引用以其全文并入本文)。
如本文所用,“同向重复序列”可指CRISPR基因座中的DNA编码序列,或指在crRNA中由其编码的RNA。因此,当在RNA分子(如crRNA)的上下文中提到这样的序列时,每个T应理解为代表U。
在某些实施方式中,本公开的野生型Cas13f效应蛋白可以是:(i)本公开的SEQ IDNO:1(Cas13f.1)、PCT/CN2020/077211的SEQ ID NO:2-7(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)中的任何一个、或PCT/CN2022/101884的SEQ ID NO:9-10(分别为Cas13f.6和Cas13f.7)中的任何一个,如本公开的SEQ ID NO:1;(ii)本公开的SEQ ID NO:1(Cas13f.1)的直系同源物、旁系同源物、同源物,PCT/CN2020/077211的SEQ ID NO:2-7(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)中的任何一个,或PCT/CN2022/101884的SEQ ID NO:9-10(分别为Cas13f.6和Cas13f.7)中的任何一个;或(iii)与本公开的SEQ IDNO:1(Cas13f.1)中的任何一个、PCT/CN2020/077211的SEQ ID NO:2-7(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)中的任何一个、或PCT/CN2022/101884的SEQ ID NO:9-10(分别为Cas13f.6和Cas13f.7)中的任何一个相比,具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列同一性的Cas13f效应蛋白。
在某些实施方式中,所述Cas13f效应蛋白、其直系同源物、同源物、衍生物和功能性片段是天然存在的。在某些其他实施方式中,所述Cas13f效应蛋白、其直系同源物、同源物、衍生物和功能性片段不是天然存在的,例如与天然存在的序列相比具有至少一个氨基酸差异。
在某些实施方式中,在空间上接近对应的野生型Cas13f效应蛋白的内切核酸酶催化结构域的区域包括距离所述Cas13f的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基在120、110、100、90、80、70、60、50、40、30、20或10个氨基酸以内的残基。
在某些实施方式中,所述区域包括距离所述Cas13f的一级序列中的内切核酸酶催化结构域(例如,RXXXXH结构域)的任何残基在140、130、120、110、100、90、80、70、60、50、40、30、20或10个氨基酸以内的残基。
在某些实施方式中,在空间上接近对应的野生型Cas13f效应蛋白的内切核酸酶催化结构域的区域包括距离所述Cas13f的一级序列中的内切核酸酶催化结构域的任何残基在100、110、120或130个残基以外,但在空间上在所述内切核酸酶催化结构域的残基的1-10埃以内或5埃的残基。
在某些实施方式中,所述内切核酸酶催化结构域是HEPN结构域,任选地是包含RXXXXH基序的HEPN结构域。
在某些实施方式中,所述N-末端RXXXXH基序具有RNFYSH序列。
在某些实施方式中,所述C-末端RXXXXH基序具有RNKALH序列。
在某些实施方式中,区域包含以下、基本上由以下组成、或由以下组成:对应于SEQID NO:1的HEPN1结构域(例如,残基1-168)、Helical1结构域、Helical2结构域(例如,残基346-477)和HEPN2结构域(例如,残基644-790)的残基。
在某些实施方式中,所述突变包含在所述区域内的一段8-20个连续氨基酸内的以下取代、基本上由其组成、或由其组成:一个或多个带电荷的或极性残基至电荷中性的短链脂肪族残基(如A)。例如,在一些实施方式中,所述一段为约9或17个残基。
在某些实施方式中,所述突变包含在所述区域内的一段15-20个连续氨基酸内的以下取代、基本上由其组成、或由其组成:(a)一个或多个带电荷的、含氮侧链基团的、大的(如F或Y)、脂肪族和/或极性残基至电荷中性的短链脂肪族残基(如A、V或I);(b)一个或多个I/L至A的取代;和/或(c)一个或多个A至V的取代。
在某些实施方式中,所述一段内除了至多1、2或3个之外的基本上所有带电荷的和极性残基都被取代。
在某些实施方式中,所述一段内总共约7、8、9或10个带电荷的和极性残基被取代。
在某些实施方式中,所述一段的N-末端和C-末端的2个残基被取代为编码序列含有限制酶识别序列的氨基酸。例如,在一些实施方式中,所述N-末端的两个残基可以是VF,并且所述C-末端的2个残基可以是ED,并且所述限制酶是BpiI。其他合适的RE位点很容易想到。N-末端和C-末端的RE位点可以相同,但不必相同。
在某些实施方式中,所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S和T残基。在某些实施方式中,所述一个或多个带电荷的或极性残基包含R、K、H、N、Y和/或Q残基。
在某些实施方式中,所述电荷中性的短链脂肪族残基是A、I、L、V或G。
在某些实施方式中,所述电荷中性的短链脂肪族残基是Ala(A)。
在某些实施方式中,所述突变包含以下、基本上由以下组成或由以下组成:在所述区域内的一段15-20个连续氨基酸中的2、3、4或5个所述段内的取代。
在某些实施方式中,旁切活性降低的所述突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的一段15-20个连续氨基酸中的1、2、3、4或5个所述段内的取代;(b)对应于Cas13f突变(例如,实施例1的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:1)的至少约75%的指导RNA特异性切割(或其理论最大值),并且表现出野生型Cas13f(如SEQ ID NO:1)的小于约25%或27.5%的旁切效应(或其理论最大值);(c)对应于Cas13f突变的F7V2、F10V1、F10V4、F40V2、F40V4、F44V2、F10S19、F10S21、F10S24、F10S26、F10S27、F10S33、F10S34、F10S35、F10S36、F10S45、F10S46、F10S48、F10S49、F40S22、F40S23、F40S26、F40S27、或F40S36突变的突变;(d)对应于Cas13f突变(例如,实施例12的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:1)的约50%-75%之间的指导RNA特异性切割(或其理论最大值),(e)表现出野生型Cas13f(如SEQID NO:1)的小于约25%、27.5%或40%的旁切效应(或其理论最大值);和/或(f)对应于Cas13f突变的F2V4、F3V1、F3V3、F3V4、F5V2、F5V3、F6V4、F7V1、F38V4、F40V1、F41V1、F41V3、F42V4、F43V1、F10S2、F10S11、F10S12、F10S18、F10S20、F10S23、F10S25、F10S28、F10S43、F10S44、F10S47、F10S50、F10S51、F10S52、F40S7、F40S9、F40S11、F40S21、F40S22、F40S24、F40S28、F40S29、F40S30、F40S35、或F40S37突变的突变。
在某些实施方式中,旁切活性增强的所述突变包含以下、基本上由以下组成、或由以下组成:(a)在所述区域内的一段15-20个连续氨基酸中的1、2、3、4或5个所述段内的取代;(b)对应于Cas13f突变(例如,实施例1的Cas13f突变)的突变,所述Cas13f突变保留野生型Cas13f(如SEQ ID NO:1)的至少约75%的指导RNA特异性切割(或其理论最大值),并且表现出野生型Cas13f(如SEQ ID NO:1)的多于约110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%、165%、170%、175%、180%或更多的旁切效应;和/或(c)对应于Cas13f突变(例如,实施例1的Cas13f突变)的F38V2、F42V1、F46V3、F38S2、F38S4、F38S5、F38S6、F38S7、F38S8、F38S9、F38S10、F38S11、F38S12、F38S13、F38S15、F38S16、F38S17、F40S1、F40S2、F40S3、F40S4、F40S5、F40S6、F40S8、F40S16、F40S18、F46S1、F46S4、F46S6、F46S7、F46S10、F46S14、F46S15、F10S4、F10S5、F10S6、F10S9、F10S10、F10S7、F38S1、F38S13或F46S2突变的突变。
在实施例和相关序列表中详细描述了本文提及的Cas13f的突变和/或突变体的序列。
在某些实施方式中,多于一个(例如,两个或更多个的任何组合)这样的突变/突变体可以存在于相同的工程化Cas13f效应蛋白中。
在某些实施方式中,所述工程化Cas13f保留所述野生型Cas13f对所述靶RNA的指导序列特异性内切核酸酶切割活性的至少约50%、60%、70%、72.5%、75%、80%、85%、87.5%、90%、95%、96%、97%、97.5%、98%或99%(或其理论最大值)。
在某些实施方式中,所述工程化Cas13f具有所述野生型Cas13f对所述靶RNA的指导序列特异性内切核酸酶切割活性的至少约95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、155%、160%或更多。也就是说,与衍生突变体的野生型Cas13f相比,本发明工程化Cas13f突变体可对所述靶RNA具有更高的指导序列特异性内切核酸酶切割活性。
在某些实施方式中,所述工程化Cas13f缺乏所述野生型Cas13f对所述非靶RNA的非指导序列依赖性旁切内切核酸酶切割活性的至少约70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%、或100%(或其理论最大值)。
在某些实施方式中,所述工程化Cas13f保留所述野生型Cas13f对所述靶RNA的指导序列特异性内切核酸酶切割活性的至少约80%-90%(或其理论最大值),并且缺乏所述野生型Cas13f对所述非靶RNA的非指导序列依赖性旁切内切核酸酶切割活性的至少约95%-100%(或其理论最大值)。
在某些实施方式中,使用基本上如任一实施例(如实施例1、2、4、5和12)中所述的方法测量所述工程化Cas13f效应蛋白的指导RNA特异性和旁切(非gRNA依赖性)切割活性。
在某些实施方式中,与SEQ ID NO:1的对应区段相比,所述氨基酸序列在由表1或2中定义的一个或多个区段中含有至多1、2、3、4或5个差异。例如,表1或2中定义的一个或多个区段中的额外变化可能不会对指导序列特异性切割活性产生实质性的负面影响,并且/或者不会增加非指导序列依赖性旁切效应。
在某些实施方式中,本公开的工程化Cas13f具有SEQ ID NO:3或4的氨基酸序列。
在某些实施方式中,本公开的工程化Cas13f进一步包含核定位信号(NLS)序列或核输出信号(NES)。例如,在某些实施方式中,所述工程化Cas13f可包含N-末端和/或C-末端NLS。
在相关方面,本公开提供本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,如基于SEQ ID NO:3-4中的任一者的Cas13f效应蛋白)或其上述直系同源物、同源物、衍生物和功能性片段的额外的衍生物,所述额外的衍生物包含另一共价或非共价连接的蛋白或多肽或其他分子(如检测试剂或药物/化学部分)。这样的其他蛋白/多肽/其他分子可以通过例如化学偶联、基因融合或其他非共价连接(如生物素-链霉亲和素结合)来连接。这样的衍生的蛋白不影响原始蛋白的功能,如结合本公开的指导RNA/crRNA(下文描述)以形成复合物的能力、RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。此外,这样的衍生的蛋白确实保留了本发明工程化Cas13f缺乏旁切活性或具有增强的旁切活性的特征。
也就是说,在某些实施方式中,在本发明工程化Cas13f(或其衍生物)的RNP复合物与所述靶RNA结合后,所述工程化Cas13f不会表现出实质性的(或可检测的)旁切RNA酶活性或具有增强的旁切RNA酶活性。
例如,这样的衍生可用于添加核定位信号(NLS,如SV40大T抗原NLS(SEQ ID NO:5))以增强本发明Cas13f效应蛋白进入细胞核的能力。这样的衍生也可用于添加靶向分子或部分,以将本发明Cas13f效应蛋白引导至特定的细胞或亚细胞位置。这样的衍生还可用于添加可检测标记,以促进本发明Cas13f效应蛋白的检测、监测或纯化。这样的衍生可进一步用于添加脱氨基酶部分(如具有腺嘌呤或胞嘧啶脱氨基活性的酶部分)以促进RNA碱基编辑。
衍生可以通过在本发明Cas13f效应蛋白的N-末端或C-末端处或在内部(例如,通过内部氨基酸的侧链进行内部融合或连接)添加任一额外的部分来进行。
在相关方面,本公开提供本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的基本上缺乏旁切活性的那些,如基于SEQ ID NO:3-4中的任一者的Cas13f效应蛋白)或其上述直系同源物、同源物、衍生物和功能性片段的缀合物,所述缀合物缀合有如其他蛋白或多肽、可检测标记、或其组合等部分。这样的缀合部分可包括但不限于定位信号、报告基因(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、标记(例如,荧光染料,如FITC或DAPI)、NLS、靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨酶结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶结构域、去甲基化酶结构域、转录释放因子、HDAC、具有ssRNA切割活性的部分、具有dsRNA切割活性的部分、具有ssDNA切割活性的部分、具有dsDNA切割活性的部分、DNA或RNA连接酶结构域、其任何组合。
例如,所述缀合物可包括一个或多个NLS,其可以位于或接近N-末端、C-末端、内部、或其组合。连接可以通过氨基酸(如D或E、或S或T)、氨基酸衍生物(如Ahx、β-Ala、GABA或Ava)或PEG连接来进行。
在某些实施方式中,缀合不影响原始工程化蛋白(例如基本上缺乏旁切效应或具有增强的旁切效应的那些)的功能,如结合本公开的指导RNA/crRNA(下文描述)以形成复合物的能力、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在相关方面,本公开提供本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,如基于SEQ ID NO:3-4中的任一者的Cas13f效应蛋白)或其上述直系同源物、同源物、衍生物和功能性片段的融合物,所述融合物具有如下部分,如定位信号、报告基因(例如,GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、NLS、蛋白靶向部分、DNA结合结构域(例如,MBP、Lex A DBD、Gal4 DBD)、表位标签(例如,His、myc、V5、FLAG、HA、VSV-G、Trx等)、转录激活结构域(例如,VP64或VPR)、转录抑制结构域(例如,KRAB部分或SID部分)、核酸酶(例如,FokI)、脱氨酶结构域(例如,ADAR1、ADAR2、APOBEC、AID或TAD)、甲基化酶结构域、去甲基化酶结构域、转录释放因子、HDAC、具有ssRNA切割活性的部分、具有dsRNA切割活性的部分、具有ssDNA切割活性的部分、具有dsDNA切割活性的部分、DNA或RNA连接酶、其任何组合。
例如,所述融合物可包括一个或多个NLS,其可以位于或接近N-末端、C-末端、内部、或其组合。在某些实施方式中,缀合不影响原始工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)的功能,如结合本公开的指导RNA/crRNA(下文描述)以形成复合物的能力、RNA酶活性、以及在与靶RNA至少部分互补的crRNA的指导下在特定位点处结合并切割所述靶RNA的能力。
在另一方面,本公开提供多核苷酸,所述多核苷酸编码本公开的工程化Cas13f。所述多核苷酸可以包含:(i)编码以下中的任一者的多核苷酸:本公开的工程化Cas13f效应蛋白(例如基本上缺乏旁切效应或具有增强的旁切效应的那些,例如基于SEQ ID NO:3-4的Cas13f效应蛋白的那些)或其直系同源物、同源物、衍生物、功能性片段、融合物;(ii)包含或编码SEQ ID NO:2的多核苷酸;或(iii)包含(i)和(ii)的多核苷酸。
在某些实施方式中,本公开的多核苷酸经密码子优化以在真核生物、哺乳动物(如人或非人哺乳动物)、植物、昆虫、鸟、爬行动物、啮齿动物(例如,小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
在相关方面,本公开提供多核苷酸,所述多核苷酸(i)与上文描述的本发明多核苷酸相比具有一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)核苷酸添加、缺失或取代;(ii)与上文描述的本发明多核苷酸具有至少50%、60%、70%、80%、90%、95%或97%的序列同一性;(iii)在严格条件下与上文描述的本发明多核苷酸、或(i)和(ii)中的任一者杂交;或(iv)是(i)-(iii)中的任一者的互补序列。
在另一相关方面,本公开提供载体,所述载体包含或涵盖本文所述的本公开的任一多核苷酸。所述载体可以是克隆载体或表达载体。仅举几例,所述载体可以是质粒、噬菌粒或粘粒。在某些实施方式中,所述载体可用于表达哺乳动物细胞(如人细胞)中的多核苷酸、工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如基于SEQID NO:3-4的本发明工程化Cas13f效应蛋白)或其直系同源物、同源物、衍生物、功能性片段、融合物中的任一者;或本公开的任一多核苷酸;或本公开的任一复合物。
在某些实施方式中,所述多核苷酸与启动子和任选的增强子可操作地连接。例如,在一些实施方式中,所述启动子是组成型启动子、诱导型启动子、广谱启动子或组织特异性启动子。在某些实施方式中,所述载体是质粒。在某些实施方式中,所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒(HSV)载体、AAV载体或慢病毒载体。在某些实施方式中,所述AAV载体是血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV 11、AAV 12或AAV 13的重组AAV载体。在某些实施方式中。
本公开的另一方面提供递送系统,所述递送系统包含(1)递送媒介物,和(2)本公开的工程化Cas13f、本公开的多核苷酸、或本公开的载体。
在某些实施方式中,所述递送媒介物是纳米颗粒、脂质体、外泌体、微泡或基因枪。
本公开的另外的方面提供细胞或其后代,所述细胞或其后代包含本公开的工程化Cas13f、本公开的多核苷酸、或本公开的载体。所述细胞可以是原核生物(如大肠杆菌)或来自真核生物(如酵母、昆虫、植物、动物(例如,哺乳动物,包括人和小鼠))的细胞。所述细胞可以是分离的原代细胞(如用于离体疗法的骨髓细胞)或已建立的细胞系,如肿瘤细胞系、293T细胞或干细胞、iPC等。
在某些实施方式中,所述细胞或其后代是真核细胞(例如,非人哺乳动物细胞、人细胞或植物细胞)或原核细胞(例如,细菌细胞)。
本公开的另外的方面提供非人类多细胞真核生物,所述非人类多细胞真核生物包含本公开的细胞。
在某些实施方式中,所述非人类多细胞真核生物是针对人遗传障碍的动物(例如,啮齿动物或灵长类动物)模型。
在另一方面,本公开提供复合物,所述复合物包含:(i)以下中的任一者的蛋白组合物:本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如,工程化Cas13f效应蛋白)、或其直系同源物、同源物、衍生物、缀合物、功能性片段、其缀合物、或其融合物;以及(ii)包含分离的多核苷酸以及与靶RNA的至少一部分互补的间隔序列/指导序列的多核苷酸组合物,所述分离的多核苷酸包含针对工程化Cas13f效应蛋白的同源DR序列。
在某些实施方式中,所述DR序列在所述间隔序列的3'端。
在某些实施方式中,所述DR序列在所述间隔序列的5'端。
在一些实施方式中,所述多核苷酸组合物是本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如,不包括tracrRNA的工程化Cas13f系统)的指导RNA/crRNA。
在某些实施方式中,为了与本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如,本发明工程化Cas13f效应蛋白)、其同源物、直系同源物、衍生物、融合物、缀合物或具有指导序列特异性RNA酶活性的功能性片段一起使用,所述间隔序列为至少约10个核苷酸,或在10-60、15-50、20-50、25-40、25-50或19-50个核苷酸之间。
在相关方面,本公开提供真核细胞,所述真核细胞包含含有本发明工程化Cas13f的本发明复合物,所述复合物包含:(1)RNA指导序列,其包含能够与靶RNA杂交的间隔序列以及在所述间隔序列的5’或3'的同向重复(DR)序列;和(2)本发明工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如基于具有SEQ ID NO:3-4中的任一者的氨基酸序列的野生型的本发明工程化Cas13f效应蛋白),或Cas的衍生物或功能性片段;其中所述Cas、所述Cas的衍生物和功能性片段能够(i)与所述RNA指导序列结合,并且(ii)靶向所述靶RNA。
在另一方面,本公开提供组合物,所述组合物包含:(i)选自以下中的任一者的第一(蛋白)组合物:工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如,基于SEQ ID NO:3-4的工程化Cas13f效应蛋白)或其直系同源物、同源物、衍生物、缀合物、功能性片段、融合物;和(ii)包含RNA的第二(核苷酸)组合物,所述RNA涵盖指导RNA/crRNA、特别是间隔序列或其编码序列。所述指导RNA可包含DR序列和可与靶RNA互补或杂交的间隔序列。所述指导RNA可以与(i)的第一(蛋白)组合物形成复合物。在一些实施方式中,所述DR序列可以是本公开的多核苷酸。在一些实施方式中,所述DR序列可以在所述指导RNA的5或3'端。在一些实施方式中,所述组合物(如(i)和/或(ii))是非天然存在的或从天然存在的组合物修饰而来。在一些实施方式中,所述靶序列是来自原核生物或真核生物的RNA,如非天然存在的RNA。所述靶RNA可以存在于细胞内,如在胞质溶胶中或在细胞器内。在一些实施方式中,所述蛋白组合物可以具有可位于其N-末端或C-末端或内部的NLS。
在另一方面,本公开提供了组合物,所述组合物包含本公开的一种或多种载体,所述一种或多种载体包含:(i)编码以下中的任一者的第一多核苷酸:工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,如基于SEQ ID NO:3-4的本发明工程化Cas13f效应蛋白)或其直系同源物、同源物、衍生物、功能性片段、融合物;任选地与第一调节元件可操作地连接;和(ii)编码本公开的指导RNA的第二多核苷酸;任选地与第二调节元件可操作地连接。所述第一多核苷酸和所述第二多核苷酸可以在不同的载体上或在同一个载体上。所述指导RNA可与由所述第一多核苷酸编码的蛋白产物形成复合物,并包含DR序列(如第4方面的任一DR序列)和可与靶RNA结合/互补的间隔序列。在一些实施方式中,所述第一调节元件是启动子,如诱导型启动子。在一些实施方式中,所述第二调节元件是启动子,如诱导型启动子。在一些实施方式中,所述靶序列是来自原核生物或真核生物的RNA,如非天然存在的RNA。所述靶RNA可以存在于细胞内,如在胞质溶胶中或在细胞器内。在一些实施方式中,所述蛋白组合物可以具有可位于其N-末端或C-末端或内部的NLS。
在一些实施方式中,所述载体是质粒。在一些实施方式中,所述载体是病毒载体,所述病毒载体基于逆转录病毒、不能复制的逆转录病毒、腺病毒、不能复制的腺病毒或AAV。在一些实施方式中,所述载体可以在宿主细胞中自我复制(例如,具有细菌复制起点序列)。在一些实施方式中,所述载体可以整合到宿主基因组中并与其一起复制。在一些实施方式中,所述载体是克隆载体。在一些实施方式中,所述载体是表达载体。
本公开进一步提供用于递送以下中的任一者的递送组合物:工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如,基于SEQ ID NO:3-4的本发明工程化Cas13f效应蛋白)或本公开的工程化Cas13f的直系同源物、同源物、衍生物、缀合物、功能性片段、融合物;本公开的多核苷酸;本公开的复合物;本公开的载体;本公开的细胞和本公开的组合物。递送可以使用媒介物(如一种或多种脂质体、一种或多种纳米颗粒、一种或多种外泌体、一种或多种微泡、基因枪或一种或多种病毒载体)通过本领域已知的任何一种方式,如转染、脂质转染、电穿孔、基因枪、显微注射、超声、磷酸钙转染、阳离子转染、病毒载体递送等来进行。
本公开进一步提供试剂盒,所述试剂盒包含以下中的任一者或多者:以下中的任一者:工程化Cas13f(例如基本上缺乏旁切活性或具有增强的旁切活性的那些,例如,基于SEQ ID NO:3-4的本发明工程化Cas13f效应蛋白)或本公开的工程化Cas13f的直系同源物、同源物、衍生物、缀合物、功能性片段、融合物;本公开的多核苷酸;本公开的复合物;本公开的载体;本公开的细胞和本公开的组合物。在一些实施方式中,所述试剂盒可进一步包含关于如何使用试剂盒组分和/或如何从第3方获得用于与所述试剂盒组分一起使用的其他组分的说明。所述试剂盒的任何组分都可以储存在任何合适的容器中。
本公开的另一方面提供工程化Cas13f效应蛋白,所述工程化Cas13f效应蛋白包含如任一实施例(如实施例1、2、4、5或12)中所述的任何一个或多个突变。
在某些实施方式中,与衍生工程化Cas13f效应蛋白的野生型Cas13f效应蛋白的情况相比,所述工程化Cas13f效应蛋白表现出大致相同的或增强的与指导RNA互补的靶RNA的指导RNA介导的切割(或其理论最大值)。
在某些实施方式中,与衍生工程化Cas13f效应蛋白的野生型Cas13f效应蛋白的情况相比,所述工程化Cas13f效应蛋白表现出减少的或减弱的非特异性RNA(例如,基本上不与指导RNA互补的RNA)的非指导RNA依赖性或旁切(或其理论最大值)。例如,与衍生工程化Cas13f效应蛋白的野生型Cas13f效应蛋白的情况相比,所述工程化Cas13f效应蛋白表现出约50%、40%、30%、20%、15%、10%或更少的旁切(或其理论最大值)。
在某些实施方式中,与衍生工程化Cas13f效应蛋白的野生型Cas13f效应蛋白的情况相比,所述工程化Cas13f效应蛋白表现出增加的非特异性RNA(例如,基本上不与指导RNA互补的RNA)的非指导RNA依赖性或旁切。例如,与衍生工程化Cas13f效应蛋白的野生型Cas13f效应蛋白的情况相比,所述工程化Cas13f效应蛋白表现出约105%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多的旁切。
上文大体描述了本公开,本公开各个方面的更详细描述在下文的单独部分中提供。然而,应理解,为了简洁和减少冗余,本公开的某些实施方式仅在一个部分下描述或仅在权利要求或实施例中描述。因此,还应理解,本公开的任何一个实施方式,包括仅在一个方面、部分下或仅在权利要求或实施例中描述的那些实施方式,可以与本公开的任何其他实施方式组合,除非特别否认或组合不当。
2.代表性工程化Cas13f多肽及其衍生物
本公开的一个方面提供工程化Cas13f效应蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些。
如本文所用,“(工程化)Cas13f”、“(工程化)Cas13f效应蛋白”、“(工程化)Cas13f效应酶”、“(工程化)Cas13f蛋白”和“(工程化)Cas13f多肽”是可互换的。
在某些实施方式中,Cas13f效应蛋白是具有两个严格保守的RX4-6H(RXXXXH)样基序的Cas13f效应蛋白,这是高等真核生物和原核生物核苷酸结合(HEPN)结构域的特征。在某些实施方式中,含有两个HEPN结构域的Cas13f效应蛋白先前已被表征。
HEPN结构域经证明是RNA酶结构域并赋予结合和切割靶RNA分子的能力。所述靶RNA可以是任何合适形式的RNA,包括但不限于mRNA、tRNA、核糖体RNA、非编码RNA、lncRNA(长链非编码RNA)和核RNA。例如,在一些实施方式中,所述工程化Cas13f蛋白识别并切割位于开放阅读框(ORF)的编码链上的RNA靶标。
野生型Cas13f效应蛋白与其他CRISPR-Cas13系统的效应蛋白的直接比较显示出Cas13f效应蛋白甚至比先前识别的最小的VI-D型/Cas13d效应蛋白显著更小(例如,氨基酸少约20%),并且在与其他先前描述的效应蛋白(包括系统发育上最接近的亲属Cas13b)的一对一序列比对中具有小于30%的序列相似性。
Cas13f蛋白可用于多种应用中,并且特别适用于治疗性应用,因为它们比其他效应蛋白(例如,CRISPR Cas13a、Cas13b、Cas13c和Cas13d/CasRx效应蛋白)显著更小,这允许将编码效应蛋白的核酸及它们的指导RNA编码序列包装到具有大小限制的递送系统(如AAV载体)中。此外,在指导序列特异性RNA酶活性激活后,本发明工程化Cas13f的可检测的旁切/非特异性RNA酶活性的缺乏使这些工程化Cas13f效应蛋白在希望不受破坏的靶细胞中较不易于(如果不能免于)产生潜在危险的普遍脱靶RNA消化。
示例性Cas13f效应蛋白包括本公开的SEQ ID NO:1(Cas13f.1)、PCT/CN2020/077211的SEQ ID NO:2-7(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)、和PCT/CN2022/101884的SEQ ID NO:9-10(分别为Cas13f.6和Cas13f.7),如本公开的SEQ ID NO:1,其中任一者都可作为参考Cas13f多肽。
在上面的序列中,每个效应子中的两个RX4-6H(RXXXXH)基序加双下划线。在一个或两个这样的结构域处的突变可能产生Cas13f效应蛋白、其同源物、直系同源物、融合物、缀合物、衍生物或功能性片段的RNA酶死亡版本(或“dCas”),同时基本上保持它们结合指导RNA和与所述指导RNA互补的靶RNA的能力。
Cas效应蛋白的对应DR编码序列分别是本公开的SEQ ID NO:2(Cas13f.1)、PCT/CN2020/077211的SEQ ID NO:11-14(分别为Cas13f.2、Cas13f.3、Cas13f.4和Cas13f.5)中的任何一个(将所述文献通过引用以其全文并入本文)、PCT/CN2022/101884的SEQ ID NO:26-27(分别为Cas13f.6和Cas13f.7)中的任何一个(将所述文献通过引用以其全文并入本文)。
在一些实施方式中,本发明工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)基于野生型Cas13f效应蛋白的“衍生物”,所述衍生物具有如下氨基酸序列,所述氨基酸序列与本文野生型或参考Cas13f多肽中的任一者的氨基酸序列具有至少约80%的序列同一性(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)。与本文的野生型或参考Cas13f多肽中的任一者共享显著的蛋白序列同一性的这样的衍生性Cas13f效应蛋白保留了本文对应的野生型或参考Cas13f多肽的Cas的至少一种功能(参见下文),例如与包含本文Cas13f的DR序列中的至少一个的crRNA结合并形成复合物的能力。例如,Cas13f衍生物可分别与SEQ ID NO:1共享85%的氨基酸序列同一性,并保留与具有SEQ ID NO:2的DR序列的crRNA结合并形成复合物的能力。
在某些实施方式中,衍生物和野生型Cas13f之间的序列同一性基于实施例1中任何一个区段所限定的区域之外的区域。
在一些实施方式中,所述衍生物包含保守的氨基酸残基取代。在一些实施方式中,所述衍生物仅包含保守的氨基酸残基取代(即,所述衍生物中的所有氨基酸取代都是保守取代,并且没有不保守的取代)。
在一些实施方式中,所述衍生物将不超过1、2、3、4、5、6、7、8、9或10个氨基酸插入或缺失包含到本文野生型或参考Cas13f多肽的任一种序列中。只要保留野生型序列的至少一种功能,插入和/或缺失就可以聚集在一起,或在序列的整个长度上分开。这样的功能可以包括结合指导/crRNA的能力、RNA酶活性、结合和/或切割与指导/crRNA互补的靶RNA的能力。在一些实施方式中,插入和/或缺失不存在于RXXXXH基序中,或距RXXXXH基序在5、10、15或20个残基以内。
在一些实施方式中,所述衍生物保留结合指导RNA/crRNA的能力。
在一些实施方式中,所述衍生物保留指导/crRNA激活的RNA酶活性。
在一些实施方式中,在所结合的在序列方面与至少一部分靶RNA互补的指导/crRNA存在下,所述衍生物保留结合靶RNA和/或切割所述靶RNA的能力。
在其他实施方式中,由于例如RNA指导的RNA酶的一个或多个催化残基的突变,所述衍生物完全或部分丧失指导/crRNA激活的RNA酶活性。这样的衍生物有时称为dCas13f。
因此,在某些实施方式中,所述衍生物可以经修饰以具有减弱的核酸酶/RNA酶活性,例如,与相应的野生型蛋白相比,核酸酶灭活至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或100%。可以通过本领域已知的几种方法减弱核酸酶活性,例如,将突变引入蛋白的核酸酶(催化)结构域中。在一些实施方式中,鉴定出核酸酶活性的催化残基,并且这些氨基酸残基可以被不同的氨基酸残基(例如,甘氨酸或丙氨酸)取代以减弱核酸酶活性。在一些实施方式中,所述氨基酸取代是保守性氨基酸取代。在一些实施方式中,所述氨基酸取代是非保守性氨基酸取代。
在一些实施方式中,修饰包含在至少一个HEPN结构域中的一个或多个突变(例如,氨基酸缺失、插入或取代)。在一些实施方式中,在至少一个HEPN结构域中存在一个、两个、三个、四个、五个、六个、七个、八个、九个或更多个氨基酸取代。
在某些实施方式中,所述一个或多个突变或所述两个或更多个突变可以在包含HEPN结构域的效应蛋白的催化活性结构域或与HEPN结构域同源的催化活性结构域中。
本领域技术人员将理解,不同的Cas13f蛋白(如不同的Cas13f蛋白)中的对应氨基酸位置可以突变成相同效果。本领域技术人员可以进行几种代表性Cas13f家族酶的多序列比对。本领域技术人员可以容易地对共享实质性的序列同源性/同一性的任何Cas13f家族蛋白中的突变进行作图,以确定“对应于”本文描述的示例性Cas13f突变的突变。
在某些实施方式中,一个或多个突变完全或部分消除蛋白的催化活性(例如,改变的切割速率、改变的特异性等)。
与缺乏突变的对应野生型蛋白相比,这些突变中的至少一个的存在导致具有减少的或减弱的指导序列依赖性RNA酶活性的衍生物。基本上缺乏旁切效应的本发明工程化Cas13f中的任何一个突变的额外存在可以减少/消除由非特异性RNA结合导致的脱靶效应。
在某些实施方式中,如本文描述的效应蛋白是“死”效应蛋白,如死Cas13f效应蛋白(即dCas13f)。在某些实施方式中,所述效应蛋白在HEPN结构域1(N-末端)中具有一个或多个突变。在某些实施方式中,所述效应蛋白在HEPN结构域2(C-末端)中具有一个或多个突变。在某些实施方式中,所述效应蛋白在HEPN结构域1和HEPN结构域2中具有一个或多个突变。
在一些实施方式中,dCas13f是具有基于SEQ ID NO:1的参考Cas13f多肽的R77A、H82A、R764A和H769A突变的Cas13f突变体。
灭活的Cas或其衍生物或功能性片段可以与一个或多个异源/功能性结构域融合或缔合(例如,经由融合蛋白、接头肽、“GS”接头等)。这些功能性结构域可以具有多种活性,例如,甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、碱基编辑活性和开关活动(例如,光诱导型)。在一些实施方式中,所述功能性结构域是Krüppel相关盒(KRAB)、SID(例如SID4X)、VP64、VPR、VP16、Fok1、P65、HSF1、MyoD1、作用于RNA的腺苷脱氨酶(如ADAR1、ADAR2)、APOBEC、胞苷脱氨酶(AID)、TAD、小型-SOG、APEX和生物素-APEX。
在一些实施方式中,所述功能性结构域是碱基编辑结构域,例如,ADAR1(包括野生型或其ADAR2DD版本,具有或不具有E1008Q和/或E488Q突变)、ADAR2(包括野生型或其ADAR2DD版本,具有或不具有E1008Q和/或E488Q突变)、APOBEC或AID。
在一些实施方式中,所述功能性结构域可以包含一个或多个核定位信号(NLS)结构域。所述一个或多个异源功能性结构域可以包含至少两个或更多个NLS结构域。所述一个或多个NLS结构域可位于或接近或邻近所述效应蛋白(例如,Cas13f效应蛋白)的末端处,并且如果有两个或更多个NLS,则两者中的每一个可位于或接近或邻近所述效应蛋白(例如,Cas13f效应蛋白)的末端处。
在一些实施方式中,至少一个或多个异源功能性结构域可以位于或接近所述效应蛋白的氨基末端处,并且/或者其中至少一个或多个异源功能性结构域位于或接近所述效应蛋白的羧基末端处。所述一个或多个异源功能性结构域可以与所述效应蛋白融合。所述一个或多个异源功能性结构域可以与所述效应蛋白相连。所述一个或多个异源功能性结构域可以通过接头部分与所述效应蛋白连接。
在一些实施方式中,存在多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)相同或不同的功能性结构域。
在一些实施方式中,所述功能性结构域(例如,碱基编辑结构域)进一步与RNA结合结构域(例如,MS2)融合。
在一些实施方式中,所述功能性结构域与接头序列(例如,柔性接头序列或刚性接头序列)缔合或经由接头序列(例如,柔性接头序列或刚性接头序列)融合。示例性接头序列和功能性结构域序列在PCT/CN2021/121926中提供。
所述一个或多个功能性结构域在灭活的Cas蛋白上的定位允许所述功能性结构域的正确的空间取向,从而以所归属的功能性效应影响靶标。例如,如果所述功能性结构域是转录激活子(例如,VP16、VP64或p65),则将所述转录激活子放置成允许其影响所述靶标的转录的空间取向。同样地,将转录阻遏子定位成影响所述靶标的转录,并且将核酸酶(例如,Fok1)定位成切割或部分切割所述靶标。在一些实施方式中,所述功能性结构域位于Cas/dCas的N-末端处。在一些实施方式中,所述功能性结构域位于Cas/dCas的C-末端处。在一些实施方式中,将灭活的CRISPR相关蛋白(dCas)修饰为包含在N-末端处的第一功能性结构域和在C-末端处的第二功能性结构域。
与一个或多个功能性结构域融合的灭活的CRISPR相关蛋白的多种实例及其使用方法描述于例如国际公布号WO 2017/219027中,将所述文献通过引用以其全文并且特别是关于本文描述的特征并入本文。
在一些实施方式中,可以不使用全长野生型或衍生性Cas13f效应蛋白,而使用其“功能性片段”。
如本文所用,“功能性片段”是指具有小于全长序列的、野生型Cas13f蛋白或其衍生物的片段。所述功能性片段中缺失的残基可以在N-末端、C-末端和/或内部。所述功能性片段保留野生型Cas13f的至少一种功能、或其衍生物的至少一种功能。因此,功能性片段相对于所讨论的功能而特别定义。例如,其中所述功能是结合crRNA和靶RNA的能力的功能性片段,相对于RNA酶功能而言可能不是功能性片段,因为丢失Cas两端的RXXXXH基序可能不会影响其结合crRNA和靶RNA的能力,但可能消除破坏RNA酶活性。在某些实施方式中,本公开的工程化Cas13f(包括工程化Cas13f的功能性片段)基本上保留对应的野生型Cas13f的指导序列依赖性RNA酶活性,但基本上缺乏旁切活性。
在一些实施方式中,与全长野生型序列相比,所述工程化Cas13f效应蛋白或其衍生物或其功能性片段缺乏来自N-末端的约30、60、90、120、150或约180个残基。
在一些实施方式中,与全长野生型序列相比,所述工程化Cas13f效应蛋白或其衍生物或其功能性片段缺乏来自C-末端的约30、60、90、120或约150个残基。
在一些实施方式中,与全长野生型序列相比,所述工程化Cas13f效应蛋白或其衍生物或其功能性片段缺乏来自N-末端的约30、60、90、120、150或约180个残基,并且缺乏来自C-末端的约30、60、90、120或约150个残基。
在一些实施方式中,所述工程化Cas13f效应蛋白或其衍生物或其功能性片段具有RNA酶活性,例如,指导/crRNA激活的特异性RNA酶活性。
在一些实施方式中,所述工程化Cas13f效应蛋白或其衍生物或其功能性片段不具有实质性的/可检测的旁切RNA酶活性。
本公开还提供本文所述的工程化Cas13f效应蛋白的拆分版本。所述工程化Cas13f的拆分版本可有利于递送。在一些实施方式中,将所述工程化Cas13f拆分成酶的两个部分,所述酶的两个部分合在一起基本上构成有功能的工程化Cas13f。
所述拆分能以一个或多个催化结构域不受影响的方式进行。所述CRISPR相关蛋白可以作为核酸酶发挥作用,或者可以是灭活的酶,所述灭活的酶本质上是具有非常小的催化活性或没有催化活性(例如,由于其催化结构域中的一个或多个突变)的RNA结合蛋白。拆分型酶描述于例如Wright等人,“Rational design of a split-Cas9enzyme complex[拆分型Cas9酶复合物的合理设计],”Proc.Nat'l.Acad.Sci.[美国国家科学院院刊]112(10):2984-2989,2015中,将所述文献通过引用以其全文并入本文。
例如,在一些实施方式中,核酸酶叶(nuclease lobe)和α-螺旋叶(α-helicallobe)经表达为单独的多肽。尽管所述叶自身并不相互作用,但crRNA将它们募集到三元复合物中,所述复合物重现全长CRISPR相关蛋白的活性并催化位点特异性切割。使用经修饰的crRNA通过防止二聚化来消除拆分型酶的活性,从而允许开发诱导型二聚化系统。
在一些实施方式中,可以例如通过采用雷帕霉素敏感性二聚化结构域将拆分型CRISPR相关蛋白与二聚化配偶体融合。这允许生成用于对蛋白活性进行时间控制的化学诱导型CRISPR相关蛋白。因此,所述CRISPR相关蛋白可以通过拆分成两个片段而成为化学诱导性,并且雷帕霉素敏感性二聚化结构域可以用于蛋白的受控重组。
拆分点典型地经由计算机模拟设计并克隆到构建体中。在此过程期间,可以将突变引入拆分型CRISPR相关蛋白中,并且可以去除非功能性结构域。
在一些实施方式中,所述拆分型CRISPR相关蛋白的两个部分或片段(即,N-末端和C-末端片段)可以形成完整的CRISPR相关蛋白,其包含野生型CRISPR相关蛋白的例如至少70%、至少80%、至少90%、至少95%或至少99%的序列。
本文所述的Cas13f效应蛋白可以设计为自我激活或自我灭活。例如,可以将靶序列引入所述CRISPR相关蛋白的编码构建体中。因此,所述CRISPR相关蛋白可以切割所述靶序列以及编码所述蛋白的构建体,从而自我灭活它们的表达。构建自我灭活的CRISPR系统的方法描述于例如Epstein和Schaffer,Mol.Ther.[分子疗法]24:S50,2016中,将所述文献通过引用以其全文并入本文。
在一些其他实施方式中,在弱启动子(例如,7SK启动子)的控制下表达的额外的crRNA可以靶向编码所述CRISPR相关蛋白的核酸序列以防止和/或阻断其表达(例如,通过防止所述核酸的转录和/或翻译)。用表达所述CRISPR相关蛋白、所述crRNA、和靶向编码所述CRISPR相关蛋白的核酸的crRNA的载体转染细胞,可导致编码所述CRISPR相关蛋白的核酸的高效破坏并降低所述CRISPR相关蛋白的水平,从而限制其活性。
在一些实施方式中,所述CRISPR相关蛋白的活性可以通过哺乳动物细胞中的内源性RNA特征(例如,miRNA)来调节。可以通过在编码所述CRISPR相关蛋白的mRNA的5'-UTR中使用miRNA互补序列来制造CRISPR相关蛋白开关。所述开关选择性地并且高效地响应靶细胞中的miRNA。因此,所述开关可以通过感应异质细胞群内的内源性miRNA活性来对Cas活性进行差异控制。因此,开关系统可以为基于细胞内miRNA信息的细胞类型选择性活性和细胞工程化提供框架(参见例如,Hirosawa等人,Nucl.Acids Res.[核酸研究]45(13):e118,2017)。
所述工程化Cas13f效应蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些,可以经诱导表达,例如,它们的表达可以是光诱导的或化学诱导的。这种机制允许激活所述CRISPR相关蛋白中的功能性结构域。光诱导性可以通过本领域已知的各种方法来实现,例如,通过设计如下融合复合物来实现,其中将CRY2PHR/CIBN配对用于拆分型CRISPR相关蛋白中(参见例如,Konermann等人,
“Optical control of mammalian endogenous transcription and epigeneticstates[哺乳动物内源性转录和表观遗传状态的光学控制],”Nature[自然]500:7463,2013)。
化学诱导性可以例如通过设计如下融合复合物来实现,其中将FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合结构域)配对用于拆分型CRISPR相关蛋白中。需要雷帕霉素来形成融合复合物,从而激活所述CRISPR相关蛋白(参见例如,Zetsche等人,“A split-Cas9architecture for inducible genome editing and transcription modulation[用于诱导型基因组编辑和转录调节的拆分型Cas9架构],”Nature Biotech.[自然生物技术]33:2:139-42,2015)。
此外,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)的表达可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达系统)、激素诱导型基因表达系统(例如,蜕皮素诱导型基因表达系统)和阿拉伯糖诱导型基因表达系统来调节。当作为RNA递送时,RNA靶向效应蛋白的表达可以经由核糖开关进行调节,所述核糖开关可以感应小分子(像四环素)(参见例如,Goldfless等人,“Direct and specific chemical control of eukaryotic translation with asynthetic RNA-protein interaction[通过合成的RNA-蛋白相互作用对真核生物的翻译进行直接和特异性的化学控制],”Nucl.Acids Res.[核酸研究]40:9:e64-e64,2012)。
诱导型CRISPR相关蛋白和诱导型CRISPR系统的各种实施方式描述于例如美国专利号8,871,445、美国公布号2016/0208243和国际公布号WO 2016/205764中,将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)包括至少一个(例如,1、2、3、4、5、6、7、8、9或10个)附接至所述蛋白的N-末端或C-末端的核定位信号(NLS)。NLS的非限制性实例包括源自以下的NLS序列:SV40病毒大T抗原的NLS,其具有SEQ ID NO:5的氨基酸序列;来自核质蛋白的NLS(例如,核质蛋白二分NLS);c-myc NLS;hRNPA1 M9 NLS;来自输入蛋白-α的IBB结构域;肌瘤T蛋白;人p53;小鼠c-abl IV;流感病毒NS1;肝炎病毒δ抗原;小鼠Mx1蛋白;人聚(ADP-核糖)聚合酶;和人糖皮质激素受体。在一些实施方式中,所述CRISPR相关蛋白包含至少一个(例如,1、2、3、4、5、6、7、8、9或10个)附接所述蛋白的N-末端或C-末端的核输出信号(NES)。在优选的实施方式中,附接C-末端和/或N-末端NLS或NES,用于在真核细胞(例如,人细胞)中进行最佳表达和核靶向。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)在一个或多个氨基酸残基处突变以改变一种或多种功能性活性。
例如,在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)在一个或多个氨基酸残基处突变以改变其解旋酶活性。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)在一个或多个氨基酸残基处突变以改变其核酸酶活性(例如,内切核酸酶活性或外切核酸酶活性),如不依赖于指导序列的旁切核酸酶活性。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)在一个或多个氨基酸残基处突变以改变其与指导RNA功能性缔合的能力。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)在一个或多个氨基酸残基处突变以改变其与靶核酸功能性缔合的能力。
在一些实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)能够切割靶RNA分子。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)在一个或多个氨基酸残基处突变以改变其切割活性。例如,在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以包含一个或多个突变,所述突变使酶不能切割靶核酸。
在一些实施方式中,所述工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)能够切割与指导RNA杂交的链互补的靶核酸链。
在一些实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以经工程化以具有一个或多个氨基酸残基的缺失,以减小酶的大小,同时保留一种或多种所希望的功能性活性(例如,核酸酶活性和与指导RNA功能上相互作用的能力)。截短的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以有利地与具有负载限制的递送系统组合使用。
在一些实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以与一种或多种肽标签,包括His标签、GST标签、V5标签、FLAG标签、HA标签、VSV-G标签、Trx标签或myc标签融合。
在一些实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以与可检测部分,例如GST、荧光蛋白(例如,GFP、HcRed、DsRed、CFP、YFP或BFP)或酶(如HRP或CAT)融合。
在一些实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以与MBP、LexA DNA结合结构域或Gal4DNA结合结构域融合。
在一些实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以与可检测标记(如荧光染料,包括FITC和DAPI)连接或缀合。
在本文的任一实施方式中,本文描述的工程化Cas13f效应蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)与其他部分之间的连接可以经由共价化学键在所述CRISPR相关蛋白的N-末端或C-末端处,并且有时甚至在内部。所述连接可以被本领域已知的任何化学连接影响,所述化学连接例如肽连接、通过氨基酸(如D、E、S、T)的侧链或氨基酸衍生物(Ahx、β-Ala、GABA或Ava)连接、或PEG连接。
3.多核苷酸
本公开还提供编码本文描述的蛋白(例如,工程化Cas13f蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些)的核酸。
在一些实施方式中,所述核酸是合成的核酸。在一些实施方式中,所述核酸是DNA分子。在一些实施方式中,所述核酸是RNA分子(例如,编码所述工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)、其衍生物或功能性片段的mRNA分子)。在一些实施方式中,将所述mRNA加帽、聚腺苷酸化、用5-甲基胞苷取代、用假尿苷取代、或其组合。
在一些实施方式中,所述核酸(例如,DNA)与调节元件(例如,启动子)可操作地连接以控制所述核酸的表达。在一些实施方式中,所述启动子是组成型启动子。在一些实施方式中,所述启动子是诱导型启动子。在一些实施方式中,所述启动子是细胞特异性启动子。在一些实施方式中,所述启动子是生物特异性启动子。
合适的启动子是本领域已知的并且包括例如pol I启动子、pol II启动子、polIII启动子、T7启动子、U6启动子、H1启动子、逆转录病毒劳斯肉瘤病毒LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子和β-肌动蛋白启动子。例如,U6启动子可用于调节本文描述的指导RNA分子的表达。
在一些实施方式中,一个或多个核酸存在于载体(例如,病毒载体或噬菌体)中。所述载体可以是克隆载体或表达载体。所述载体可以是质粒、噬菌粒、粘粒等。所述载体可以包括一个或多个允许所述载体在感兴趣的细胞(例如,细菌细胞或哺乳动物细胞)中繁殖的调节元件。在一些实施方式中,所述载体包括编码本文描述的CRISPR相关(Cas)系统的单个组分的核酸。在一些实施方式中,所述载体包括多个核酸,每个核酸编码本文描述的CRISPR相关(Cas)系统的组分。
在一个方面,本公开提供与本文描述的核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核酸序列,即,编码如下的核酸序列:基本上缺乏旁切活性的工程化Cas13f蛋白、衍生物、功能性片段、或包括DR序列的指导/crRNA。
在另一方面,本公开还提供编码如下氨基酸序列的核酸序列,所述氨基酸序列与基本上缺乏旁切活性的本发明工程化Cas13f蛋白的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。
在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文描述的序列相同。在一些实施方式中,所述核酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个核苷酸,例如,连续或非连续核苷酸)与本文描述的序列不同。
在相关的实施方式中,本公开提供如下氨基酸序列,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文所述的序列相同。在一些实施方式中,所述氨基酸序列具有至少一部分(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90或100个氨基酸残基,例如,连续或非连续氨基酸残基)与本文描述的序列不同。
为了确定两个氨基酸序列或两个核酸序列的同一性百分比,出于最佳比较目的对序列进行比对(例如,可以在第一和第二氨基酸或核酸序列的一者或两者中引入空位以用于最佳比对,并且出于比较目的可以忽略非同源序列)。一般来说,出于比较目的而比对的参考序列的长度应是参考序列长度的至少80%,并且在一些实施方式中是参考序列长度的至少90%、95%或100%。然后比较对应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置处是相同的。将空位的数量和每个空位的长度考虑在内,两个序列之间的同一性百分比是所述序列共享的相同位置的数量的函数,需要引入所述空位以进行所述两个序列的最佳比对。出于本公开的目的,序列的比较和两个序列之间同一性百分比的确定可以使用具有空位罚分12、空位延伸罚分4、以及移码空位罚分5的Blosum 62评分矩阵来完成。
本文描述的蛋白(例如,基本上缺乏旁切活性的工程化Cas13f蛋白)可以作为核酸分子或多肽递送或使用。
在某些实施方式中,编码所述工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)、其衍生物或功能性片段的核酸分子经密码子优化以在宿主细胞或生物中表达。所述宿主细胞可以包括已建立的细胞系(如293T细胞)或分离的原代细胞。所述核酸可以经密码子优化以用于在任何感兴趣的生物(特别是人细胞或细菌)中使用。例如,所述核酸可以针对以下进行密码子优化:任何原核生物(如大肠杆菌)或任何真核生物,如人和其他非人真核生物,包括酵母、蠕虫、昆虫、植物和藻类(包括粮食作物、稻、玉米、蔬菜、水果、树木、草)、脊椎动物、鱼、非人哺乳动物(例如,小鼠、大鼠、兔子、狗、鸟(如鸡)、牲畜(母牛或牛、猪、马、绵羊、山羊等)、或非人灵长类动物)。密码子使用表易于获得,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon UsageDatabase)”中,并且这些表能以多种方式进行调整。参见Nakamura等人,Nucl.Acids Res.[核酸研究]28:292,2000(将所述文献通过引用以其全文并入本文)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Gene Forge)(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,Pa))。
在这种情况下,经密码子优化的序列的实例是经优化以在以下中表达的序列:真核生物,例如人(即,经优化以在人中表达),或如本文所讨论的另一真核生物、动物或哺乳动物;参见例如,WO 2014/093622(PCT/US2013/074667)中的经SaCas9人密码子优化的序列。尽管这是优选的,但应理解其他实例是可能的,并且针对人以外的宿主物种的密码子优化或针对特定器官的密码子优化是已知的。一般来说,密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列以增强在感兴趣的宿主细胞中的表达的方法:用该宿主细胞的基因中更频繁使用或最频繁使用的密码子替代天然序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)。多种物种对特定氨基酸的某些密码子表现出特定偏倚。密码子偏倚(生物之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而所述信使RNA(mRNA)的翻译效率又被认为尤其依赖于经翻译的密码子的特性和特定的转移RNA(tRNA)分子的可获得性。选定的tRNA在细胞中的优势通常反映出肽合成中最频繁使用的密码子。相应地,可以对基因进行定制以基于密码子优化在给定生物中实现最佳基因表达。密码子使用表易于获得,例如在http://www.kazusa.orjp/codon/上可获得的“密码子使用数据库”中,并且这些表能以多种方式进行调整。参见Nakamura,Y.等人“Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000[从国际DNA序列数据库中制表的密码子使用:2000年的状态]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如基因制造(Aptagen公司;宾夕法尼亚州雅各布斯)也是可获得的。在一些实施方式中,编码Cas的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸最频繁使用的密码子。
4.RNA指导物或crRNA
如本文所用,术语“指导序列”和“间隔序列”是可互换的。
如本文所用,术语“RNA指导物”、“crRNA”、“指导RNA”和“gRNA”是可互换的。
在一些实施方式中,本文描述的CRISPR系统包括至少RNA指导物(例如,gRNA或crRNA)。
多种RNA指导物的架构是本领域已知的(参见例如,国际公布号WO 2014/093622和WO 2015/070083,将各个文献的全部内容通过引用并入本文)。
在一些实施方式中,本文描述的CRISPR系统包括多种RNA指导物(例如,一种、两种、三种、四种、五种、六种、七种、八种或更多种RNA指导物)。
在一些实施方式中,所述RNA指导物包括crRNA。在一些实施方式中,所述RNA指导物包括crRNA,但不包括tracrRNA。
来自多个CRISPR系统的指导RNA的序列在本领域中通常是已知的,参见例如Grissa等人(Nucleic Acids Res.[核酸研究]35(网页服务器议题):W52-7,2007;Grissa等人,BMC Bioinformatics[BMC生物信息学]8:172,2007;Grissa等人,Nucleic Acids Res.[核酸研究]36(网页服务器议题):W145-8,2008;以及Moller和Liang,PeerJ[同行评审科学期刊]5:e3788,2017;在crispr.i2bc.paris-saclayfr/crispr/BLAST/CRISPRsBlast.php处的CRISPR数据库;以及可在以下处获得的MetaCRAST:github.com/molleraj/MetaCRAST)。将所有文献通过引用并入本文。
在一些实施方式中,所述crRNA包括同向重复(DR)序列和间隔序列。在某些实施方式中,所述crRNA包含如下同向重复序列、基本上由其组成或由其组成,所述同向重复序列与指导序列或间隔序列(优选地在所述间隔序列的3'端处)连接。
一般来说,工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)与成熟的crRNA形成复合物,所述成熟的crRNA的间隔序列引导所述复合物与靶RNA序列特异性结合,所述靶RNA与所述间隔序列互补和/或与所述间隔序列杂交。所得的复合物包含所述工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)和与所述靶RNA结合的成熟的crRNA。
所述Cas13f系统的同向重复序列通常非常保守,尤其是在末端处,例如,在5'端处的Cas13f的GCTGT与在3'端处的Cas13f的ACAGC反向互补。这种保守表明潜在地与基因座中的一种或多种蛋白相互作用的RNA茎环结构的强碱基配对。
在一些实施方式中,当在RNA中时,同向重复序列包含5'-S1a-Ba-S2a-L-S2b-Bb-S1b-3'的一般二级结构,其中区段S1a和S1b是反向互补序列并形成第一茎(S1),所述第一茎(S1)具有在Cas13f中的5个核苷酸;区段Ba和Bb不相互碱基配对,并形成对称的或接近对称的凸起(B),并且具有分别在Cas13f中的5个(Ba)和4个(Bb)或6个(Ba)和5个(Bb)核苷酸;区段S2a和S2b是反向互补序列并形成第二茎(S2),所述第二茎(S2)具有在Cas13f中的6或5个碱基对;并且L是Cas13f中的5个核苷酸的环。
在某些实施方式中,S1a具有在Cas13f中的GCUGU序列。
在某些实施方式中,S2a具有在Cas13f中的A/G CCUC G/A序列(其中第一个A或G可以不存在)。
在一些实施方式中,所述同向重复序列包含SEQ ID NO:2的核酸序列、基本上由其组成或由其组成。
如本文所用,“同向重复序列”可指CRISPR基因座中的DNA编码序列,或指在crRNA中由其编码的RNA。因此,当在RNA分子(如crRNA)的上下文中提到SEQ ID NO:2时,每个T应理解为代表U。
在一些实施方式中,所述同向重复序列包含如下核酸序列、基本上由其组成或由其组成,所述核酸序列具有SEQ ID NO:2的至多1、2、3、4、5、6、7或8个核苷酸的缺失、插入或取代。在一些实施方式中,所述同向重复序列包含如下核酸序列、基本上由其组成或由其组成,所述核酸序列与SEQ ID NO:2具有至少80%、85%、90%、95%或97%的序列同一性(例如,由于SEQ ID NO:2中核苷酸的缺失、插入或取代)。在一些实施方式中,所述同向重复序列包含如下核酸序列、基本上由其组成或由其组成,所述核酸序列与SEQ ID NO:2中的任一者不同,但可以在严格杂交条件下与SEQ ID NO:2中的任一者的互补序列杂交,或者可以在生理条件下与SEQ ID NO:2中的任一者的互补序列结合。
在某些实施方式中,所述缺失、插入或取代不改变SEQ ID NO:2的总体二级结构(例如,茎和凸起及环的相对位置和/或大小不显著偏离原始茎、凸起和环的相对位置和/或大小)。例如,所述缺失、插入或取代可以在所述凸起或环区中,使得所述凸起的总体对称性大致保持相同。所述缺失、插入或取代可以在所述茎中,使得所述茎的长度不显著偏离原始茎的长度(例如,在两个茎的每一个中添加或缺失一个碱基对对应于总共4个碱基变化)。
在某些实施方式中,所述缺失、插入或取代导致衍生性DR序列,所述衍生性DR序列可在一个或两个茎中具有±1或2个碱基对,在所述凸起的一条或两条单链中具有±1、2或3个碱基,和/或在所述环区中具有±1、2、3或4个碱基。
在某些实施方式中,与SEQ ID NO:2中的任一者不同的任一上述同向重复序列保留在所述Cas13f蛋白中作为同向重复序列(作为SEQ ID NO:2的DR序列)发挥作用的能力。
在一些实施方式中,所述同向重复序列包含如下核酸、基本上由其组成或由其组成,所述核酸具有SEQ ID NO:2中的任一者的核酸序列,且具有初始三个、四个、五个、六个、七个或八个3'核苷酸的截短。
在经典的CRISPR系统中,指导序列(例如,crRNA)与其对应的靶序列之间的互补程度可以是约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%。在一些实施方式中,所述互补程度是90%-100%。
指导RNA的长度可以是约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、100、125、150、175、200或更多个核苷酸。例如,为了在功能性工程化Cas13f效应蛋白、或其同源物、直系同源物、衍生物、融合物、缀合物或功能性片段中使用,间隔子可以在10-60个核苷酸、20-50个核苷酸、25-45个核苷酸、25-35个核苷酸之间,或为约27、28、29、30、31、32或33个核苷酸。然而,为了在上述任一者的dCas版本中使用,间隔子可以在10-200个核苷酸、20-150个核苷酸、25-100个核苷酸、25-85个核苷酸、35-75个核苷酸、45-60个核苷酸之间,或为约46、47、48、49、50、51、52、53、54或55个核苷酸。
为了减少脱靶相互作用,例如,为了减少指导物与具有低互补性的靶序列相互作用,可以将突变引入所述CRISPR系统中,使得所述CRISPR系统可以区分具有大于80%、85%、90%或95%互补性的靶序列与脱靶序列。在一些实施方式中,所述互补程度为从80%至95%,例如,约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%(例如,区分具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶)。相应地,在一些实施方式中,指导序列与其对应的靶序列之间的互补程度大于94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或99.9%。在一些实施方式中,所述互补程度是100%。
本领域已知不需要完全的互补性,前提是有足够的互补性发挥作用。可以通过引入错配(例如,间隔序列与靶序列之间的一个或多个错配,如1或2个错配(包括沿着间隔子/靶标的错配的位置))来利用对切割效率的调节。错配(例如,双错配)位于越中心的位置(即,不在3'端或5'端处),切割效率受到的影响越大。相应地,通过选择沿着所述间隔序列的错配位置,可以调节切割效率。例如,如果希望靶标切割小于100%(例如,在细胞群中),可以在所述间隔序列中引入在间隔子和靶序列之间的1或2个错配。
已证明VI型CRISPR-Cas效应蛋白采用多于一种RNA指导物,从而使这些效应蛋白以及包括它们的系统和复合物能够实现靶向多个核酸的能力。在一些实施方式中,如本文描述的包含所述工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)的CRISPR系统包括多种RNA指导物(例如,两种、三种、四种、五种、六种、七种、八种、九种、十种、十五种、二十种、三十种、四十种或更多种RNA指导物)。在一些实施方式中,本文描述的CRISPR系统包括单条RNA链或编码单条RNA链的核酸,其中所述RNA指导物串联排列。所述单条RNA链可以包括相同RNA指导物的多个拷贝、不同RNA指导物的多个拷贝、或其组合。本文描述的Cas13f效应蛋白的加工能力使这些效应蛋白能够靶向多个靶核酸(例如,靶RNA)而不丧失活性。在一些实施方式中,所述Cas13f效应蛋白可以与针对不同靶RNA的多种RNA指导物复合进行递送。在一些实施方式中,所述工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)可以与多种RNA指导物共同递送,每种RNA指导物对不同的靶核酸具有特异性。使用CRISPR相关蛋白进行多重复合(multiplexing)的方法描述于例如美国专利号9,790,490B2和EP 3009511 B1中,将各个文献的全部内容通过引用明确并入本文。
crRNA的间隔子长度可以在约10-50个核苷酸的范围内,如15-50个核苷酸、20-50个核苷酸、25-50个核苷酸或19-50个核苷酸。在一些实施方式中,指导RNA的间隔子长度为至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、或至少22个核苷酸。在一些实施方式中,所述间隔子长度为从15至17个核苷酸(例如,15、16或17个核苷酸)、从17至20个核苷酸(例如,17、18、19或20个核苷酸)、从20至24个核苷酸(例如,20、21、22、23或24个核苷酸)、从23至25个核苷酸(例如,23、24或25个核苷酸)、从24至27个核苷酸、从27至30个核苷酸、从30至45个核苷酸(例如,30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)、从30或35至40个核苷酸、从41至45个核苷酸、从45至50个核苷酸(例如,45、46、47、48、49或50个核苷酸)或更长。在一些实施方式中,所述间隔子长度为从约15至约42个核苷酸。在一些实施方式中,所述间隔子长度为约30个核苷酸。
在一些实施方式中,所述指导RNA的同向重复序列长度为15-36个核苷酸、为至少16个核苷酸、为从16至20个核苷酸(例如,16、17、18、19或20个核苷酸)、为20-30个核苷酸(例如,20、21、22、23、24、25、26、27、28、29或30个核苷酸)、为30-40个核苷酸(例如,30、31、32、33、34、35、36、37、38、39或40个核苷酸)、或为约36个核苷酸(例如,33、34、35、36、37、38或39个核苷酸)。在一些实施方式中,所述指导RNA的同向重复序列长度为36个核苷酸。
在一些实施方式中,所述crRNA/指导RNA的总体长度比上文任一间隔序列长度长约36个核苷酸。例如,所述crRNA/指导RNA的总体长度可以在45-86个核苷酸、或60-86个核苷酸、62-86个核苷酸、或63-86个核苷酸之间。
所述crRNA序列可以按以下方式修饰:允许在所述crRNA与所述工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)之间形成复合物并与靶标成功结合,同时不允许成功的核酸酶活性(即,没有核酸酶活性/没有导致插入缺失)。这些经修饰的指导序列称为“死crRNA”、“死指导物”或“死指导序列”。关于核酸酶活性,这些死指导物或死指导序列可以是无催化活性的或无构象活性的。死指导序列典型地比导致活性RNA切割的相应指导序列短。在一些实施方式中,死指导物比具有核酸酶活性的相应指导RNA短5%、10%、20%、30%、40%或50%。指导RNA的死指导序列的长度可以为从13至15个核苷酸(例如,长度为13、14或15个核苷酸)、长度为从15至19个核苷酸、或长度为从17至18个核苷酸(例如,长度为17个核苷酸)。
因此,在一个方面,本公开提供非天然存在的或工程化CRISPR系统,所述CRISPR系统包括如本文描述的功能性工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)和crRNA,其中所述crRNA包含死crRNA序列,由此所述crRNA能够与靶序列杂交,使得将所述CRISPR系统引导至细胞中的感兴趣的靶RNA而没有可检测的核酸酶活性(例如,RNA酶活性)。
对死指导物的详细描述例如在国际公布号WO 2016/094872中进行描述,将所述文献通过引用以其全文并入本文。
可以生成作为诱导型系统的组分的指导RNA(例如,crRNA)。所述系统的诱导型性质允许对基因编辑或基因表达进行时空控制。在一些实施方式中,用于所述诱导型系统的刺激包括例如电磁辐射、声能、化学能和/或热能。
在一些实施方式中,指导RNA(例如,crRNA)的转录可以通过诱导型启动子,例如四环素或强力霉素控制的转录激活(Tet-开和Tet-关表达系统)、激素诱导型基因表达系统(例如,蜕皮素诱导型基因表达系统)和阿拉伯糖诱导型基因表达系统来调节。诱导型系统的其他实例包括例如小分子双杂交转录激活系统(FKBP、ABA等)、光诱导型系统(光敏色素、LOV结构域或隐花色素)或光诱导型转录效应子(LITE)。这些诱导型系统描述于例如WO2016205764和美国专利号8,795,965中,将所述两个文献通过引用以其全文并入本文。
化学修饰可以应用于crRNA的磷酸骨架、糖和/或碱基。骨架修饰(如硫代磷酸酯)修饰磷酸骨架上的电荷并有助于寡核苷酸的递送和核酸酶抗性(参见例如,Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides[硫代磷酸酯:治疗性寡核苷酸的必要组分],”Nucl.Acid Ther.[核酸疗法],24,第374-387页,2014);糖的修饰(如2'-O-甲基(2'-OMe)、2'-F和锁核酸(LNA))增强碱基配对和核酸酶抗性两者(参见例如,Allerson等人“Fully 2’-modified oligonucleotide duplexes withimproved in vitro potency and stability compared to unmodified smallinterfering RNA[与未经修饰的小干扰RNA相比,完全2'修饰的寡核苷酸双链体具有改善的体外效力和稳定性]”,J.Med.Chem.[药物化学杂志]48.4:901-904,2005)。化学修饰的碱基(如2-硫代尿苷或N6-甲基腺苷等)可允许更强或更弱的碱基配对(参见例如,Bramsen等人,“Development of therapeutic-grade small interfering RNAs by chemicalengineering[通过化学工程开发治疗级小干扰RNA],”Front.Genet.[遗传学前沿],2012年8月20日;3:154)。另外,RNA适于5’端和3’端两者与多种功能性部分(包括荧光染料、聚乙二醇或蛋白)缀合。
可以对化学合成的crRNA分子应用多种修饰。例如,用2'-OMe修饰寡核苷酸以改善核酸酶抗性可以改变沃森-克里克(Watson-Crick)碱基配对的结合能。此外,2'-OMe修饰可以影响寡核苷酸与转染试剂、蛋白或细胞中任何其他分子相互作用的方式。这些修饰的效果可以通过经验测试来确定。
在一些实施方式中,所述crRNA包括一个或多个硫代磷酸酯修饰。在一些实施方式中,所述crRNA包括用于增强碱基配对和/或增加核酸酶抗性目的的一个或多个锁核酸。
这些化学修饰的汇总可见于例如Kelley等人,“Versatility of chemicallysynthesized guide RNAs for CRISPR-Cas9 genome editing[用于CRISPR-Cas9基因组编辑的化学合成的指导RNA的多功能性],”J.Biotechnol.[生物技术杂志]233:74-83,2016;WO 2016205764;和美国专利号8,795,965 B2中;将各个文献通过引用以其全文并入。
可以优化本文描述的RNA指导物(例如,crRNA)的序列和长度。在一些实施方式中,RNA指导物的优化长度可以通过鉴定crRNA的加工形式(即,成熟的crRNA)或通过对crRNA四环的经验长度研究来确定。
所述crRNA还可以包括一个或多个适配序列。适配子是具有特定的三维结构并可以与特定的靶分子结合的寡核苷酸或肽分子。所述适配子可以对基因效应蛋白、基因激活子或基因阻遏子具有特异性。在一些实施方式中,所述适配子可以对蛋白具有特异性,而所述蛋白又对特定的基因效应蛋白、基因激活子或基因阻遏子具有特异性并对其进行募集和/或与其结合。所述效应蛋白、激活子或阻遏子能够以融合蛋白的形式存在。在一些实施方式中,所述指导RNA具有对相同的衔接蛋白具有特异性的两个或更多个适配序列。在一些实施方式中,所述两个或更多个适配序列对不同的衔接蛋白具有特异性。所述衔接蛋白可以包括例如MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φkCb5、φkCb8r、φkCb12r、φkCb23r、7s和PRR1。相应地,在一些实施方式中,所述适配子选自特异性结合如本文描述的任一种衔接蛋白的结合蛋白。在一些实施方式中,所述适配序列是MS2结合环。在一些实施方式中,所述适配序列是Qβ结合环。在一些实施方式中,所述适配序列是PP7结合环。对适配子的详细描述可见于例如Nowak等人,“Guide RNA engineering for versatile Cas9 functionality[针对多种Cas9功能的指导RNA工程化],”Nucl.Acid.Res.[核酸研究],44(20):9555-9564,2016;和WO2016205764中,将所述文献通过引用以其全文并入本文。
在某些实施方式中,所述方法利用化学修饰的指导RNA。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处掺入2'-O-甲基(M)、2'-O-甲基3'-硫代磷酸酯(MS)、或2'-O-甲基3'-硫基PACE(MSP)。与未经修饰的指导RNA相比,这样的化学修饰的指导RNA可以具有增加的稳定性和增加的活性,尽管中靶相对于脱靶特异性是不可预测的。参见Hendel,Nat Biotechnol.[自然生物技术]33(9):985-9,2015,将所述文献通过引用并入。化学修饰的指导RNA可进一步包括但不限于具有硫代磷酸酯键和锁核酸(LNA)核苷酸的RNA,所述锁核酸(LNA)核苷酸包含在核糖环的2'与4'碳之间的亚甲基桥。
本公开还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰多种感兴趣的靶基因座。复合物的核酸组分可以包含一个或多个蛋白结合RNA适配子。所述一个或多个适配子能够结合噬菌体外壳蛋白。所述噬菌体外壳蛋白可以选自Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。在某些实施方式中,所述噬菌体外壳蛋白是MS2。
在一些实施方式中,本文Cas13f效应蛋白的DR序列是SEQ ID NO:2。
在一些实施方式中,所述间隔序列选自SEQ ID NO:8、11和12。在一些实施方式中,包含选自SEQ ID NO:8、11和12的间隔序列的gRNA用于治疗对应于间隔RNA序列相关疾病的靶序列。例如,包含SEQ ID NO:11的间隔序列的gRNA用于治疗Rho相关疾病,例如PD;包含SEQ ID NO:12的间隔序列的gRNA用于治疗SOD1相关疾病,例如ALS;包含SEQ ID NO:8的间隔序列的gRNA用于治疗ATXN2相关疾病,例如ALS。
5.靶RNA
所述靶RNA可以是任何感兴趣的RNA分子,包括天然存在的和工程化的RNA分子。所述靶RNA可以是mRNA、tRNA、核糖体RNA(rRNA)、微小RNA(miRNA)、干扰RNA(siRNA)、核酶、核糖开关、卫星RNA、微开关、微酶(microzyme)或病毒RNA。
在一些实施方式中,所述靶核酸与病症或疾病(例如,感染性疾病或癌症)相关。
因此,在一些实施方式中,本文描述的系统可用于通过靶向这些核酸来治疗病症或疾病。例如,与病症或疾病相关的靶核酸可以是在患病细胞(例如,癌细胞或肿瘤细胞)中过表达的RNA分子。所述靶核酸也可以是毒性RNA和/或突变的RNA(例如,具有剪接缺陷或突变的mRNA分子)。所述靶核酸还可以是对特定微生物(例如,致病性细菌)具有特异性的RNA。
6.复合物和细胞
本公开的一个方面提供工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)的复合物(如CRISPR-Cas13f复合物),所述复合物包含(1)工程化Cas13f蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些(例如,如本文描述的工程化Cas13f效应蛋白、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段)中的任一者,和(2)本文描述的任一指导RNA,每个指导RNA包括设计为与靶RNA至少部分互补的间隔序列和与以下相容的DR序列:所述工程化Cas13f蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些、其同源物、直系同源物、融合物、衍生物、缀合物、或功能性片段。
在某些实施方式中,所述复合物进一步包含所述指导RNA结合的靶RNA。
在相关方面,本公开还提供细胞,所述细胞包含本公开的任一复合物。在某些实施方式中,所述细胞是原核生物。在某些实施方式中,所述细胞是真核生物。
7.使用CRISPR系统的方法
如本文描述的具有工程化Cas13f蛋白(例如基本上缺乏旁切活性或具有增强的旁切活性的那些)的CRISPR-Cas系统具有多种类似基于对应的野生型Cas13的系统的效用,包括在多种细胞类型中修饰(例如,缺失、插入、易位、灭活或激活)靶多核苷酸或核酸。所述CRISPR系统在以下方面具有广泛的应用:例如核酸的跟踪和标记、富集测定(从背景提取所希望的序列)、控制干扰RNA或miRNA、检测循环肿瘤DNA、制备下一代文库、药物筛选、疾病诊断和预后、以及治疗各种遗传障碍。
与野生型相比,如本文描述的某些工程化Cas13f效应蛋白具有增强的旁切效应,并因此对于利用增强的旁切活性的效用(如DNA/RNA检测(例如,特异性高灵敏度酶促报告子解锁(SHERLOCK)))来说可以是比野生型Cas13f效应蛋白更好的替代物。这样的旁切活性增强的工程化Cas13f效应蛋白在本公开的一个方面的范围内。
RNA检测
在一个方面,本文描述的CRISPR系统可用于RNA检测中。如实施例中所示,当间隔序列为约30个核苷酸时,本公开的野生型Cas13f在其指导RNA依赖性特异性RNA酶活性激活后表现出非特异性/旁切RNA酶活性。因此,旁切活性增强的(与野生型相比)本公开的工程化CRISPR相关蛋白可以用CRISPR RNA(crRNA)重新编程以提供用于特定RNA感应的平台。此外,通过选择特定的间隔序列长度,并在识别其RNA靶标后,激活的CRISPR相关蛋白参与附近非靶向的RNA的增强的旁切。这种crRNA编程的旁切活性允许所述CRISPR系统通过触发程序性细胞死亡或通过经标记的RNA的非特异性降解来检测特定RNA的存在。
SHERLOCK方法(特异性高灵敏度酶促报告子解锁)提供基于报告RNA的核酸扩增和旁切的具有渺摩尔(attomolar)灵敏度的体外核酸检测平台,从而允许实时检测靶标。为了实现信号检测,可以将检测与不同的等温扩增步骤组合。例如,重组酶聚合酶扩增(RPA)可以与T7转录偶联,以将扩增的DNA转化为RNA,用于后续检测。通过RPA进行扩增、T7 RNA聚合酶将扩增的DNA转录为RNA、以及通过旁切RNA切割介导的报告信号释放检测靶RNA的组合称为SHERLOCK。在SHERLOCK中使用CRISPR的方法详细描述于例如Gootenberg等人“Nucleicacid detection with CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测],”Science[科学],2017年4月28日;356(6336):438-442中,将所述文献通过引用以其全文并入本文。
本文描述的本公开提供突变体/突变体2类VI型CRISPR-Cas效应蛋白,尤其是VI-D型、VI-E型和VI-F型Cas突变体/突变体,其具有增强的旁切效应,使得它们可以在基于旁切效应的核酸检测测定(如SHERLOCK测定)中更有效。这样的突变体包括在实施例1中描述的任何一个突变体,与对应的野生型Cas13f相比,所述突变体具有至少80%、85%、或87.5%或更高的旁切效率,以及任选地更好的gRNA指导的切割。
在某些实施方式中,这样的具有增强的旁切效应的Cas13f突变体包含对应于以下的突变、基本上由其组成或由其组成:实施例1中的F46S15、F10S6、F10S5、F38S12、F10S4、F38S10或F46V3突变。
所述CRISPR相关蛋白可用于RNA印迹测定中,所述测定使用电泳按大小分离RNA样品。所述CRISPR相关蛋白可用于特异性结合和检测靶RNA序列。所述CRISPR相关蛋白也可以与荧光蛋白(例如,GFP)融合,并用于跟踪活细胞中的RNA定位。更特别地,可以灭活所述CRISPR相关蛋白,因为它们不再如上所述切割RNA。因此,CRISPR相关蛋白可用于确定RNA或特定剪接突变体的定位、mRNA转录物的水平、转录物的上调或下调以及疾病特异性诊断。所述CRISPR相关蛋白可用于(活)细胞中的RNA的可视化,例如使用荧光显微镜检查术或流式细胞术,如荧光激活细胞分选术(FACS),其允许对细胞进行高通量筛选和回收细胞分选后的活细胞。关于如何检测DNA和RNA的详细描述可见于例如国际公布号WO 2017/070605中,将所述文献通过引用以其全文并入本文。
在一些实施方式中,本文描述的CRISPR系统可用于多重抗错荧光原位杂交(multiplexed error-robust fluorescence in situ hybridization,MERFISH)。这些方法描述于例如Chen等人,“Spatially resolved,highly multiplexed RNA profiling insingle cells[在单细胞中进行空间分辨的高度多重化RNA分析],”Science[科学],2015年4月24日;348(6233):aaa6090,将所述文献通过在本文中引用以其全文并入本文。
在一些实施方式中,本文描述的CRISPR系统可用于检测样品(例如,临床样品、细胞或细胞裂解物)中的靶RNA。当间隔序列具有选定的特定长度(如约30个核苷酸)时,当本文描述的工程化Cas13f(例如,Cas13f效应蛋白)与靶核酸结合时,所述效应蛋白的旁切RNA酶活性受到激活。在与感兴趣的靶RNA结合后,所述效应蛋白切割经标记的检测RNA以生成信号(例如,增加的信号或减少的信号),从而允许对样品中的靶RNA进行定性和定量检测。样品中的RNA的特异性检测和定量允许包括诊断在内的多种应用。在一些实施方式中,所述方法包括使样品与以下接触:i)RNA指导物(例如,crRNA)和/或编码所述RNA指导物的核酸,其中所述RNA指导物由同向重复序列和能够与所述靶RNA杂交的间隔序列组成;(ii)与野生型Cas13f相比旁切活性增强的工程化Cas13f蛋白(如本发明工程化Cas13f效应蛋白)和/或编码所述效应蛋白的核酸;和(iii)经标记的检测RNA;其中所述效应蛋白与所述RNA指导物缔合以形成复合物;其中所述RNA指导物与所述靶RNA杂交;并且其中在所述复合物与所述靶RNA结合后,所述效应蛋白表现出旁切RNA酶活性并切割所述经标记的检测RNA;以及b)测量通过所述经标记的检测RNA的切割产生的可检测信号,其中所述测量提供对所述样品中单链靶RNA的检测。在一些实施方式中,所述方法进一步包括将所述可检测信号与参考信号进行比较并确定所述样品中靶RNA的量。
在一些实施方式中,所述测量使用以下进行:金纳米颗粒检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感应。在一些实施方式中,所述经标记的检测RNA包括荧光发射染料对、荧光共振能量转移(FRET)对或猝灭剂/荧光团对。在一些实施方式中,在所述经标记的检测RNA经所述效应蛋白切割后,由所述经标记的检测RNA产生的可检测信号的量减少或增加。在一些实施方式中,所述经标记的检测RNA在经所述效应蛋白切割之前产生第一可检测信号,并且在经所述效应蛋白切割之后产生第二可检测信号。在一些实施方式中,当所述经标记的检测RNA经所述效应蛋白切割时产生可检测信号。在一些实施方式中,所述经标记的检测RNA包含经修饰的核碱基、经修饰的糖部分、经修饰的核酸连接、或其组合。在一些实施方式中,所述方法包括通过使用多个本公开的工程化Cas13f(如工程化CRISPR-Cas13f系统),对样品中的多个独立靶RNA(例如,两个、三个、四个、五个、六个、七个、八个、九个、十个、十五个、二十个、三十个、四十个或更多个靶RNA)进行多通道检测,每个所述系统包括不同的直系同源效应蛋白和对应的RNA指导物,从而允许区分所述样品中的多个靶RNA。在一些实施方式中,所述方法包括使用本公开的工程化Cas13f(如工程化CRISPR-Cas13f系统)的多个实例,对样品中的多个独立靶RNA进行多通道检测,每个所述实例含有具有可区分的旁切RNA酶底物的直系同源效应蛋白。使用CRISPR相关蛋白检测样品中的RNA的方法描述于例如美国专利公布号2017/0362644中,将所述文献的全部内容通过引用并入本文。
核酸的跟踪和标记
细胞过程依赖于蛋白、RNA和DNA间的分子相互作用网络。准确检测蛋白-DNA和蛋白-RNA相互作用是理解这样的过程的关键。体外邻近标记技术采用与报告基团(例如,可光激活基团)组合的亲和标签,以在体外标记感兴趣的蛋白或RNA附近的多肽和RNA。在UV辐照后,所述可光激活基团与紧邻加标签分子的蛋白和其他分子发生反应,从而标记它们。随后可回收和鉴定经标记的相互作用分子。例如,所述CRISPR相关蛋白可用于将探针靶向选定的RNA序列。这些应用也可以应用于动物模型中,用于疾病或难以培养的细胞类型的体内成像。跟踪和标记核酸的方法描述于例如美国专利号8,795,965、WO 2016205764和WO2017070605中;将各个文献通过本文引用以其全文并入本文。
RNA分离、纯化、富集和/或耗竭
本文描述的CRISPR系统(例如,CRISPR相关蛋白)可用于分离和/或纯化RNA。可以将所述CRISPR相关蛋白与亲和标签融合,所述亲和标签可用于分离和/或纯化RNA-CRISPR相关蛋白复合物。这些应用例如可用于分析细胞中的基因表达谱。
在一些实施方式中,所述CRISPR相关蛋白可用于靶向特定的非编码RNA(ncRNA),从而阻断其活性。在一些实施方式中,所述CRISPR相关蛋白可用于特异性富集特定RNA(包括但不限于增加稳定性等),或替代性地,特异性耗竭特定RNA(例如,特定的剪接突变体、同种型等)。
这些方法描述于例如美国专利号8,795,965、WO 2016205764和WO 2017070605中;将各个文献通过本文引用以其全文并入本文。
高通量筛选
本文描述的CRISPR系统可用于制备下一代测序(NGS)文库。例如,为了创建有成本效益的NGS文库,可以使用所述CRISPR系统破坏靶基因产物的编码序列,并且可以通过下一代测序(例如,在离子激流(Ion Torrent)PGM系统上)同时筛选经所述CRISPR相关蛋白转染的克隆。关于如何制备NGS文库的详细描述可见于例如Bell等人,“A high-throughputscreening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing[用于使用下一代测序检测CRISPR-Cas9诱导的突变的高通量筛选策略],”BMC Genomics[BMC基因组学],15.1(2014):1002,将所述文献通过引用以其全文并入本文。
工程化的微生物
微生物(例如,大肠杆菌、酵母和微藻)广泛用于合成生物学。合成生物学的发展具有广泛的效用,包括各种临床应用。例如,可编程CRISPR系统可以用于拆分具有用于靶向细胞死亡的毒性结构域的蛋白,例如使用癌症关联的RNA作为靶转录物。此外,涉及蛋白-蛋白相互作用的途径可以在使用例如与适当效应蛋白(如激酶或酶)的融合复合物的合成生物系统中受到影响。
在一些实施方式中,可以将靶向噬菌体序列的crRNA引入微生物中。因此,本公开还提供针对噬菌体感染接种微生物(例如,生产菌株)的方法。
在一些实施方式中,本文提供的CRISPR系统可用于对微生物进行工程化,例如以改善产率或改善发酵效率。例如,本文描述的CRISPR系统可用于对微生物(如酵母)进行工程化,以从可发酵糖生成生物燃料或生物聚合物,或降解源自作为可发酵糖的来源的农业废弃物的植物衍生的木质纤维素。更特别地,本文描述的方法可用于修饰生物燃料生产所需的内源性基因的表达和/或修饰可能干扰生物燃料合成的内源性基因。对微生物进行工程化的这些方法描述于例如Verwaal等人,“CRISPR/Cpf1 enables fast and simplegenome editing of Saccharomyces cerevisiae[CRISPR/Cpf1能实现对酿酒酵母的快速简单的基因组编辑],”Yeast[酵母]doi:10.1002/yea.3278,2017;和Hlavova等人,“Improving microalgae for biotechnology-from genetics to synthetic biology[改善用于生物技术的微藻——从遗传学到合成生物学],”Biotechnol.Adv.[生物技术进展],33:1194-203,2015,将所述两个文献通过引用以全文并入本文。
在一些实施方式中,本文提供的CRISPR系统可用于诱导细胞(例如,微生物,如工程化的微生物)的死亡或休眠。这些方法可用于诱导多种细胞类型的休眠或死亡,所述细胞类型包括原核细胞和真核细胞,包括但不限于哺乳动物细胞(例如,癌细胞或组织培养细胞)、原生动物、真菌细胞、受病毒感染的细胞、受细胞内细菌感染的细胞、受细胞内原生动物感染的细胞、受朊病毒感染的细胞、细菌(例如,致病性细菌和非致病性细菌)、原生动物、以及单细胞和多细胞寄生物。例如,在合成生物学领域,非常希望有控制工程化的微生物(例如,细菌)以防止它们繁殖或传播的机制。本文描述的系统可用作“杀灭开关(kill-switches)”以调节和/或防止工程化的微生物的繁殖或传播。此外,本领域需要现有抗生素治疗的替代物。本文描述的系统还可用于希望杀灭或控制特定微生物群(例如,细菌群)的应用中。例如,本文描述的系统可以包括RNA指导物(例如,crRNA),所述RNA指导物靶向属、种或株特异性核酸(例如,RNA),并且可以递送至细胞。在与靶核酸复合并结合后,Cas13f效应蛋白的旁切RNA酶活性受到激活,从而导致微生物内非靶RNA的切割,最终导致休眠或死亡。在一些实施方式中,所述方法包括使细胞与本文描述的系统接触,所述系统包括Cas13f效应蛋白或编码所述效应蛋白的核酸、以及RNA指导物(例如,crRNA)或编码所述RNA指导物的核酸,其中间隔序列与靶核酸(例如,属、株或种特异性RNA指导物)的至少15个核苷酸(例如,16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或更多个核苷酸)互补。不希望受任何特定理论的束缚,所述Cas13f效应蛋白对非靶RNA的切割可诱导程序性细胞死亡、细胞毒性、细胞凋亡、坏死、坏死性凋亡、细胞死亡、细胞周期停滞、细胞无能、细胞生长减少或细胞增殖减少。例如,在细菌中,所述Cas13f效应蛋白对非靶RNA的切割可以是抑细菌的或杀细菌的。
在植物中的应用
本文描述的CRISPR系统在植物中具有多种效用。在一些实施方式中,所述CRISPR系统可用于对植物转录组进行工程化(例如,改善产量、制造具有希望的翻译后修饰的产物、或引入用于生产工业产物的基因)。在一些实施方式中,所述CRISPR系统可用于将希望的性状引入植物中(例如,对基因组不进行可遗传修饰),或调节植物细胞或整株植物中内源性基因的表达。
在一些实施方式中,所述CRISPR系统可用于鉴定、编辑和/或沉默编码特定蛋白(例如,过敏原蛋白(例如,花生、大豆、扁豆、豌豆、四季豆和绿豆中的过敏原蛋白))的基因。关于如何鉴定、编辑和/或沉默编码蛋白的基因的详细描述在例如以下中描述:Nicolaou等人,“Molecular diagnosis of peanut and legume allergy[花生和豆类过敏的分子诊断],”Curr.Opin.Allergy Clin.Immunol.[过敏和临床免疫学的当前观点]11(3):222-8,2011,和WO 2016205764 A1;将所述两个文献通过引用以全文并入本文。
混合筛选(Pooled-Screening)
如本文所述,混合CRISPR筛选是用于鉴定参与生物机制(如细胞增殖、药物抗性和病毒感染)的基因的强大工具。用本文描述的编码指导RNA(gRNA)的载体的文库批量转导细胞,并且在应用选择性激发之前和之后测量gRNA的分布。混合CRISPR筛选非常适用于影响细胞存活和增殖的机制,并且它们可以扩展至测量单个基因的活性(例如,通过使用工程化的报告细胞系)。一次只靶向一个基因的阵列CRISPR筛选使得使用RNA-seq作为读数成为可能。在一些实施方式中,如本文描述的CRISPR系统可用于单细胞CRISPR筛选中。关于混合CRISPR筛选的详细描述可见于例如Datlinger等人,“Pooled CRISPR screening withsingle-cell transcriptome read-out[具有单细胞转录组读数的混合CRISPR筛选],”Nat.Methods.[自然方法]14(3):297-301,2017,将所述文献通过引用以其全文并入本文。
饱和诱变(过度攻击(Bashing))
本文描述的CRISPR系统可用于原位饱和诱变。在一些实施方式中,混合指导RNA文库可用于对特定基因或调节元件进行原位饱和诱变。这样的方法可以揭示这些基因或调节元件(例如,增强子)的关键最小特征和离散脆弱性(discrete vulnerabilities)。这些方法描述于例如Canver等人,“BCL11A enhancer dissection by Cas9-mediated in situsaturating mutagenesis[通过Cas9介导的原位饱和诱变进行的BCL11A增强子解析],”Nature[自然]527(7577):192-7,2015中,将所述文献通过引用以其全文并入本文。
RNA相关应用
本文描述的CRISPR系统可具有多种RNA相关应用,例如,调节基因表达、降解RNA分子、抑制RNA表达、筛选RNA或RNA产物、确定lincRNA或非编码RNA的功能、诱导细胞休眠、诱导细胞周期停滞、减少细胞生长和/或细胞增殖、诱导细胞无能、诱导细胞凋亡、诱导细胞坏死、诱导细胞死亡和/或诱导程序性细胞死亡。对这些应用的详细描述可见于例如WO 2016/205764 A1中,将所述文献通过引用以其全文并入本文。在不同的实施方式中,本文描述的方法可以在体外、在体内或离体进行。
例如,可以将本文描述的CRISPR系统向患有疾病或障碍的受试者施用,以靶向处于患病状态中的细胞(例如,癌细胞或受感染原感染的细胞)并诱导所述细胞中的细胞死亡。例如,在一些实施方式中,本文描述的CRISPR系统可用于靶向癌细胞并诱导所述癌细胞中的细胞死亡,其中所述癌细胞来自患有以下的受试者:威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病、慢性骨髓性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。
调节基因表达
本文描述的CRISPR系统可用于调节基因表达。所述CRISPR系统可以与合适的指导RNA一起使用,以经由RNA加工的控制来靶向基因表达。所述RNA加工的控制可以包括例如RNA加工反应,如RNA剪接(例如,可变剪接)、病毒复制和tRNA生物合成。与合适的指导RNA组合的RNA靶向蛋白也可用于控制RNA激活(RNAa)。RNA激活是小RNA指导的和Argonaute(Ago)依赖性基因调节现象,其中启动子靶向的短双链RNA(dsRNA)在转录/表观遗传水平上诱导靶基因表达。RNAa导致基因表达的促进,因此可以通过破坏或减少RNAa来实现对基因表达的控制。在一些实施方式中,所述方法包括使用RNA靶向CRISPR作为例如干扰核糖核酸(如siRNA、shRNA或dsRNA)的取代物。调节基因表达的方法描述于例如WO 2016205764中,将所述文献通过引用以其全文并入本文。
控制RNA干扰
对干扰RNA或微小RNA(miRNA)的控制可以通过减少所述干扰RNA或miRNA在体内或体外的寿命来帮助减少脱靶效应。在一些实施方式中,靶RNA可以包括干扰RNA,即,参与RNA干扰途径的RNA,如小发夹RNA(shRNA)、小干扰(siRNA)等。在一些实施方式中,靶RNA包括例如miRNA或双链RNA(dsRNA)。
在一些实施方式中,如果选择性地表达RNA靶向蛋白和合适的指导RNA(例如在空间或时间上,在受调节的启动子(例如组织或细胞周期特异性启动子)和/或增强子的控制下),则这可以用于保护细胞或系统(在体内或体外)免受那些细胞中的RNA干扰(RNAi)。在不需要RNAi的邻近组织或细胞中,或者出于对表达和不表达CRISPR相关蛋白和合适的crRNA的细胞或组织进行比较(即,分别为RNAi不受控制和受控制的情况)的目的,这可能是有用的。所述RNA靶向蛋白可用于控制或结合包含RNA或由其组成的分子,如核酶、核糖体或核糖开关。在一些实施方式中,所述指导RNA可以将所述RNA靶向蛋白募集到这些分子中,使得所述RNA靶向蛋白能够与它们结合。这些方法描述于例如WO 2016205764和WO2017070605中,将所述两个文献通过引用以其全文并入本文。
修饰核糖开关和控制代谢调节
核糖开关是信使RNA的调节区段,其结合小分子并继而调节基因表达。这种机制允许细胞感应这些小分子的细胞内浓度。特定的核糖开关典型地通过改变该基因的转录、翻译或剪接来调节其相邻基因。因此,在一些实施方式中,可以通过使用与合适的指导RNA组合的RNA靶向蛋白以靶向核糖开关来控制核糖开关活性。这可以通过切割所述核糖开关或与其结合来实现。使用CRISPR系统控制核糖开关的方法描述于例如WO 2016205764和WO2017070605中,将所述两个文献通过引用以其全文并入本文。
RNA修饰
在一些实施方式中,本文描述的CRISPR相关蛋白可以与碱基编辑结构域,如ADAR1、ADAR2、APOBEC或激活诱导的胞苷脱氨酶(AID)融合,并且可以用于修饰RNA序列(例如,mRNA)。在一些实施方式中,所述CRISPR相关蛋白包括一个或多个突变(例如,在催化结构域中),这使得所述本发明CRISPR相关蛋白不能切割RNA(例如,本文描述的工程化Cas13f蛋白的dCas13f版本)。
在一些实施方式中,这样的CRISPR相关蛋白可以与RNA结合融合多肽一起使用,所述RNA结合融合多肽包含与RNA结合结构域(如MS2(也称为MS2外壳蛋白)、Qβ(也称为Qβ外壳蛋白)或PP7(也称为PP7外壳蛋白))融合的碱基编辑结构域(例如,ADAR1、ADAR2、APOBEC或AID)。
在一些实施方式中,所述RNA结合结构域可以与本文描述的系统的crRNA上(例如,当所述crRNA在效应子-crRNA复合物中时)的特定序列(例如,适配序列)或二级结构基序结合,从而将所述RNA结合融合多肽(其具有碱基编辑结构域)募集至所述效应子复合物中。例如,在一些实施方式中,所述CRISPR系统包括CRISPR相关蛋白、具有适配序列(例如,MS2结合环、Qβ结合环或PP7结合环)的crRNA、以及具有与RNA结合结构域融合的碱基编辑结构域的RNA结合融合多肽,所述RNA结合结构域与所述适配序列特异性结合。在该系统中,所述CRISPR相关蛋白与具有所述适配序列的crRNA形成复合物。此外,所述RNA结合融合多肽与所述crRNA结合(经由所述适配序列),从而形成可以修饰靶RNA的三分复合物(tripartitecomplex)。
使用CRISPR系统进行碱基编辑的方法描述于例如国际公布号WO 2017/219027中,将所述文献通过引用以其全文并且特别是关于其对RNA修饰的讨论并入本文。
RNA剪接
在一些实施方式中,本文描述的工程化Cas13f蛋白(其基本上缺乏旁切活性)的灭活的或dCas13f版本(例如,在催化结构域中具有一个或多个另外的突变的工程化CRISPR相关蛋白)可用于靶向RNA转录物上的特定剪接位点并与其结合。所述灭活的CRISPR相关蛋白与RNA的结合可在空间上抑制剪接体与转录物的相互作用,从而能够改变特定转录物同种型的生成频率。这样的方法可用于通过外显子跳跃(exon skipping)来治疗疾病,使得可以在成熟的蛋白中跳过具有突变的外显子。使用CRISPR系统改变剪接的方法描述于例如国际公布号WO 2017/219027中,将所述文献通过引用以其全文并且特别是关于其对RNA剪接的讨论并入本文。
治疗性应用
本文描述的CRISPR系统可以具有多种治疗性应用。这样的应用可基于本发明工程化Cas13f(例如,工程化CRISPR-Cas13f系统)的以下一种或多种体外和体内能力:诱导细胞衰老、诱导细胞周期停滞、抑制细胞生长和/或增殖、诱导细胞凋亡、诱导坏死等。
在一些实施方式中,新的工程化CRISPR系统可用于治疗各种疾病和障碍,例如遗传障碍(例如,单基因疾病)、可通过核酸酶活性(例如,Pcsk9靶向、杜氏肌营养不良(DMD)、BCL11a靶向)治疗的疾病、以及多种癌症等。
在一些实施方式中,本文描述的CRISPR系统可用于编辑靶核酸以修饰所述靶核酸(例如,通过插入、缺失或突变一个或多个核酸残基)。
在一个方面,本文描述的CRISPR系统可用于治疗由RNA、毒性RNA和/或突变RNA(例如,剪接缺陷或截短)的过表达引起的疾病。例如,毒性RNA的表达可以与核包涵体的形成以及脑、心脏或骨骼肌的迟发型退行性变化相关。在一些实施方式中,所述障碍是强直性肌营养不良。在强直性肌营养不良中,所述毒性RNA的主要致病作用是隔离(sequester)结合蛋白并损害可变剪接的调节(参见例如,Osborne等人,“RNA-dominant diseases[RNA显性疾病],”Hum.Mol.Genet.[人类分子遗传学],2009年4月15日;18(8):1471-81)。遗传学家对强直性肌营养不良(营养不良性肌强直(DM))特别感兴趣,因为它产生极其广泛的临床特征。DM的经典形式(现在称为1型DM(DM1))由编码细胞溶质蛋白激酶的基因DMPK的3'-非翻译区(UTR)中CTG重复序列的扩增引起。如本文描述的CRISPR系统可以靶向过表达的RNA或毒性RNA,例如DMPK基因或DM1骨骼肌、心脏或脑中的任一错误调节的可变剪接。
本文描述的CRISPR系统还可以靶向影响RNA依赖性功能的反式作用突变,所述突变导致多种疾病,例如像普拉德-威利综合征(Prader Willi syndrome)、脊髓性肌萎缩(SMA)和先天性角化不良。可以使用本文描述的CRISPR系统治疗的疾病列表汇总于Cooper等人,“RNA and disease[RNA和疾病],”Cell[细胞],136.4(2009):777-793和WO 2016/205764 A1中,将所述两个文献通过引用以全文并入本文。本领域的技术人员将理解如何使用新的CRISPR系统治疗这些疾病。
本文描述的CRISPR系统还可用于治疗各种tau蛋白病,包括例如原发性和继发性tau蛋白病,如原发性年龄相关性tau蛋白病(PART)/神经原纤维缠结(NFT)优势型老年性痴呆(其中NFT类似于在阿尔茨海默病(AD)中见到的那些,但没有斑块)、拳击性痴呆(慢性创伤性脑病)和进行性核上性麻痹。tau蛋白病的可用列表和治疗这些疾病的方法描述于例如WO 2016205764中,将所述文献通过引用以其全文并入本文。
本文描述的CRISPR系统还可用于靶向破坏顺式作用剪接代码的突变,所述突变可导致剪接缺陷和疾病。这些疾病包括例如,由SMN1基因的缺失导致的运动神经元退行性疾病(例如,脊髓性肌萎缩)、杜氏肌营养不良(DMD)、17号染色体相关的额颞叶痴呆合并帕金森综合征(FTDP-17)、以及囊性纤维化。
本文描述的CRISPR系统可进一步用于抗病毒活性,特别是抗RNA病毒。所述CRISPR相关蛋白可以使用经选择以靶向病毒RNA序列的合适的指导RNA来靶向病毒RNA。
本文描述的CRISPR系统还可用于在受试者(例如,人受试者)中治疗癌症。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子是异常的(例如,包含点突变或者经可变剪接)并见于癌细胞中,以诱导癌细胞中的细胞死亡(例如,经由细胞凋亡)。
本文描述的CRISPR系统还可用于在受试者(例如,人受试者)中治疗自身免疫疾病或障碍。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子是异常的(例如,包含点突变或者经可变剪接)并见于负责引起自身免疫疾病或障碍的细胞中。
此外,本文描述的CRISPR系统还可用于在受试者中治疗感染性疾病。例如,本文描述的CRISPR相关蛋白可以用靶向RNA分子的crRNA编程,所述RNA分子由感染原(例如,细菌、病毒、寄生物或原生动物)表达,以靶向并诱导感染原细胞中的细胞死亡。所述CRISPR系统还可用于治疗细胞内感染原感染宿主受试者细胞的疾病。通过对所述CRISPR相关蛋白进行编程以靶向由感染原基因编码的RNA分子,可以靶向受感染原感染的细胞并诱导细胞死亡。
此外,体外RNA感应测定可用于检测特定RNA底物。所述CRISPR相关蛋白可用于活细胞中基于RNA的感应。应用的实例是通过感应例如疾病特异性RNA进行的诊断。
本文描述的CRISPR系统的治疗性应用的详细描述可见于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述靶RNA是与眼睛疾病或障碍相关的靶基因的转录物(例如,mRNA)。
在一些实施方式中,所述眼睛疾病或障碍是阿米巴角膜炎、真菌性角膜炎、细菌性角膜炎、病毒性角膜炎、盘尾丝虫性角膜炎、角膜结膜炎、细菌性角膜结膜炎、病毒性角膜结膜炎、春季角膜结膜炎、特应性角膜结膜炎、角膜营养不良性疾病、富克斯内皮营养不良、干燥综合征、史-约综合征、自身免疫性干眼病、环境性干眼病、角膜新生血管形成疾病、角膜移植后排斥反应的预防和治疗、自身免疫性葡萄膜炎、感染性葡萄膜炎、非感染性葡萄膜炎、前葡萄膜炎、后葡萄膜炎(包括弓形虫病)、泛葡萄膜炎、玻璃体或视网膜的炎性疾病、眼内炎的预防和治疗、黄斑水肿、黄斑变性、湿性年龄相关性黄斑变性(湿性AMD)、干性年龄相关性黄斑变性(干性AMD)、糖尿病性黄斑水肿(DME)、过敏性结膜炎、增殖性和非增殖性糖尿病性视网膜病变、高血压性视网膜病变、视网膜的自身免疫性疾病、原发性和转移性眼内黑素瘤、其他眼内转移性肿瘤、开角型青光眼、斯特格氏病、眼底黄色斑点症、闭角型青光眼、色素性青光眼、视网膜色素变性(RP)、莱伯氏先天性黑矇(LCA)、厄舍综合征、无脉络膜、视杆-视锥细胞或视锥-视杆细胞营养不良、纤毛病、线粒体障碍、进行性视网膜萎缩、退行性视网膜疾病、地图状萎缩、家族性或获得性黄斑病变、视网膜光感受器疾病、基于视网膜色素上皮的疾病、黄斑囊样水肿、视网膜脱离、外伤性视网膜损伤、医源性视网膜损伤、黄斑裂孔、黄斑毛细血管扩张、神经节细胞疾病、视神经细胞疾病、视神经病变、缺血性视网膜疾病、早产儿视网膜病变、视网膜血管阻塞、家族性大动脉瘤、视网膜血管疾病、眼血管疾病、血管疾病、缺血性视神经病变疾病、糖尿病性视网膜水肿、由视网膜下新生血管形成引起的老年性黄斑变性、近视性视网膜病变、视网膜缺血、脉络膜血管功能不全、脉络膜血栓形成和由颈动脉缺血引起的新生血管性视网膜病变、角膜新生血管形成、伴有渗出性或炎性组分的角膜疾病或混浊、弥漫性板层角膜炎、由于眼睛穿透伤或挫伤性眼损伤导致的新生血管形成、红斑虹膜炎、富克斯异色性虹膜睫状体炎、慢性葡萄膜炎、前葡萄膜炎、由手术如LASIK、LASEK、屈光手术、IOL植入引起的炎性病症;作为白内障手术并发症的不可逆角膜水肿、损伤或外伤引起的水肿、炎症、感染性和非感染性结膜炎、虹膜睫状体炎、虹膜炎、巩膜炎、巩膜外层炎、浅表点状角膜炎、圆锥角膜、后部多形性营养不良、富克斯营养不良、无晶状体性和假晶状体性大泡性角膜病变、角膜水肿、巩膜疾病、眼瘢痕性类天疱疮、睫状体扁平部炎、青光眼睫状体炎综合征、白塞病、福格特-小柳-原田综合征、超敏性反应、眼表障碍、结膜水肿、弓形虫病脉络膜视网膜炎、眼眶炎性假瘤、球结膜水肿、结膜静脉充血、眶周蜂窝组织炎、急性泪囊炎、非特异性血管炎、结节病、巨细胞病毒感染、及其组合。
在一些实施方式中,所述靶基因选自血管内皮生长因子A(VEGFA)、补体因子H(CFH)、年龄相关性黄斑病变易感因子2(ARMS2)、HtrA丝氨酸肽酶1(HTRA1)、ATP结合盒亚家族A成员4(ABCA4)、外周蛋白2(PRPH2)、腓骨蛋白-5(FBLN5)、ERCC切除修复6染色质重塑因子(ERCC6)、视网膜和前神经折叠同源框2(RAX2)、补体C3(C3)、Toll样受体4(TLR4)、胱抑素C(CST3)、CX3C趋化因子受体1(CX3CR1)、补体因子I(CFI)、补体C2(C2)、补体因子B(CFB)、补体C9(C9)、线粒体编码的TRNA亮氨酸1(UUA/G)(MT-TL-1)、补体因子H相关蛋白1(CFHR1)、补体因子H相关蛋白3(CFHR3)、睫状神经营养因子(CNTF)、色素上皮衍生因子(PEDF)、视杆细胞衍生的视锥细胞活力因子(RdCVF)、胶质细胞源性神经营养因子(GDNF)、肌球蛋白VIIA(MYO7A);中心体蛋白290(CEP290)、钙粘蛋白相关蛋白23(CDH23)、闭眼同源物(EYS)、Usherin蛋白(USH2A)、粘附G蛋白偶联受体V1(ADGRV1)、ALMS1中心体和基底体相关蛋白(ALMS1)、类视黄醇异构水解酶65kDa(RPE65)、芳基-烃相互作用蛋白样1(AIPL1)、鸟苷酸环化酶2D、视网膜(GUCY2D)、莱伯氏先天性黑矇5蛋白(LCA5)、视锥-视杆细胞同源框(CRX)、Clarin蛋白(CLRN1)、ATP结合盒亚家族A成员4(ABCA4)、视黄醇脱氢酶12(RDH12)、肌苷一磷酸脱氢酶1(IMPDH1)、碎屑细胞极性复合物组分1(CRB1)、卵磷脂视黄醇酰基转移酶(LRAT)、烟酰胺核苷酸腺苷酰基转移酶1(NMNAT1)、TUB样蛋白1(TULP1)、MER原癌基因、酪氨酸激酶(MERTK)、色素性视网膜炎GTP酶调节剂(RPGR)、ARL3 GTP酶的RP2激活剂(RP2)、X连锁色素性视网膜炎GTP酶调节剂相互作用蛋白1(RPGRIP)、环状核苷酸门控通道亚基α3(CNGA3)、环状核苷酸门控通道亚基β3(CNGB3)、G蛋白亚基α转导素2(GNAT2)、成纤维细胞生长因子2(FGF2)、促红细胞生成素(EPO)、BCL2细胞凋亡调节剂(BCL2)、BCL2样1(BCL2L1)、核因子κB(NFκB)、内皮抑素、血管抑素、fms样酪氨酸激酶受体(sFlt)、色素分散因子受体(Pdfr)、白细胞介素10(IL10)、可溶性白细胞介素17(sIL17R)、白细胞介素1受体拮抗剂(IL1-ra)、TNF受体超家族成员1A(TNFRSF1A)、TNF受体超家族成员1B(TNFRSF1B)、和白细胞介素4(IL4)。
在一些实施方式中,所述靶RNA是与神经退行性疾病或障碍相关的靶基因的转录物(例如,mRNA)。
在一些实施方式中,所述神经退行性疾病或障碍是酒精中毒、亚历山大病、阿尔珀斯病、阿尔茨海默病、肌萎缩侧索硬化(ALS)、共济失调毛细血管扩张症、神经元蜡样质脂褐质沉积症、巴滕病、牛海绵状脑病(BSE)、海绵状白质脑病、脑性瘫痪、科凯恩综合征、皮质基底节变性、克罗伊茨费尔特-雅各布病、额颞叶变性、亨廷顿病、HIV相关性痴呆、肯尼迪病、路易体痴呆、神经疏螺旋体病、原发性年龄相关性tau蛋白病(PART)/神经原纤维缠结优势型老年性痴呆、马查多-约瑟夫病、多系统萎缩、多发性硬化、多发性硫酸酯酶缺乏症、粘脂贮积病、发作性睡病、尼曼皮克病、帕金森病、皮克病、庞贝病、原发性侧索硬化、朊病毒病、神经元丧失、认知缺陷、运动神经元疾病、杜氏肌营养不良(DMD)、额颞叶痴呆、17号染色体相关的额颞叶痴呆合并帕金森综合征、Lytico-Bodig病(关岛帕金森-痴呆复合征)、神经轴索营养不良、雷夫叙姆病、希德氏病、继发于恶性贫血的亚急性脊髓联合变性、斯皮尔梅伊尔-沃格特-肖格伦-巴滕病、17号染色体相关的帕金森综合征(FTDP-17)、普拉德-威利综合征、强直性肌营养不良、慢性创伤性脑病包括拳击性痴呆、脊髓小脑性共济失调、脊髓性肌萎缩、斯蒂尔-理查森-奥尔谢夫斯基病、脊髓痨、C型尼曼皮克病(NPC1和/或NPC2缺陷)、史-莱-奥综合征(SLOS)、先天性胆固醇合成障碍、丹吉尔病、佩利措伊斯-梅茨巴赫病、神经元蜡样质脂褐质沉积症、原发性鞘糖脂沉积症、法伯病或多发性硫酸酯酶缺乏症、戈谢病、法布里病、GM1神经节苷脂沉积症、GM2神经节苷脂沉积症、克拉伯病、异染性脑白质营养不良(MLD)、NPC、GM1神经节苷脂沉积症、法布里病、神经退行性粘多糖贮积症、MPS I、MPS IH、MPS IS、MPS II、MPS III、MPS IIIA、MPS IIIB、MPS IIIC、MPS HID、MPS、IV、MPS IV A、MPSIV B、MPS VI、MPS VII、MPS IX、继发性溶酶体受累疾病、SLOS、丹吉尔病、神经节细胞胶质瘤、神经节细胞瘤、脑膜血管瘤病、脑炎后帕金森综合征、亚急性硬化性全脑炎、铅中毒性脑病、结节性硬化、哈勒沃登-施帕茨病、脂褐质沉积症、小脑性共济失调、帕金森综合征、路-巴综合征、多系统萎缩、额颞叶痴呆或下肢帕金森综合征、尼曼皮克病、C型尼曼皮克病、A型尼曼皮克病、泰-萨克斯病、小脑型多系统性萎缩(MSA-C)、伴有帕金森综合征的额颞叶痴呆、进行性核上性麻痹、小脑下跳性眼震、桑霍夫病或II型粘脂沉积症、或其组合。
在一些实施方式中,所述靶RNA是与癌症相关的靶基因的转录物(例如,mRNA)。
在一些实施方式中,所述癌症是癌、肉瘤、骨髓瘤、白血病、淋巴瘤和混合型肿瘤。可以通过本文描述的方法和组合物治疗的癌症的非限制性实例包括来自以下的癌细胞:膀胱、血液、骨、骨髓、脑、乳腺、结肠、食道、胃肠道、牙龈、头、肾、肝、肺、鼻咽、颈、卵巢、前列腺、皮肤、胃、睾丸、舌、或子宫。此外,所述癌症可以特别地属于以下组织学类型,但不限于这些:赘瘤,恶性;癌;癌,未分化;巨大及梭细胞癌;小细胞癌;乳头状癌;鳞状细胞癌;淋巴上皮癌;基底细胞癌;毛发基质(pilomatrix)癌;移行细胞癌;乳头状移行细胞癌;腺癌;胃泌素瘤,恶性;胆管癌;肝细胞癌;肝细胞癌合并胆管癌;小梁腺癌;腺样囊性癌;腺瘤息肉的腺癌;腺癌,家族性结肠息肉;实体癌;类癌瘤,恶性;细支气管肺泡(branchiolo-alveolar)腺癌;乳头状腺癌;嫌色细胞癌;嗜酸性细胞癌;嗜酸性腺癌;嗜碱性粒细胞癌;透明细胞腺癌;颗粒细胞癌;滤泡状腺癌;乳头状和滤泡状腺癌;非包膜性硬化性癌;肾上腺皮质癌;子宫内膜样癌;皮肤附器癌;顶浆(apocrine)腺癌;皮脂腺癌;耵聍(ceruminous)腺癌;黏液表皮样癌;囊腺癌;乳头状囊腺癌;乳头状浆液性囊腺癌;黏液性囊腺癌;黏液腺癌;印戒细胞癌;浸润性导管癌;髓样癌;小叶癌;炎性癌;佩吉特氏病,乳房;腺泡细胞癌;腺鳞癌;伴有鳞状化生的腺癌;胸腺瘤,恶性;卵巢间质瘤,恶性;卵泡膜细胞瘤(thecoma),恶性;粒层细胞瘤,恶性;及成纤维细胞瘤,恶性;支持细胞癌;睾丸间质细胞(leydig cell)瘤,恶性;脂质细胞瘤,恶性;副神经节瘤,恶性;乳房外副神经节瘤,恶性;嗜铬细胞瘤;血管球肉瘤(glomangiosarcoma);恶性黑素瘤;无黑素性黑素瘤;浅表扩散性黑素瘤;巨大色素痣中的恶性黑素瘤;上皮样细胞黑素瘤;恶性蓝痣;肉瘤;纤维肉瘤;恶性纤维组织细胞瘤;黏液肉瘤;脂肪肉瘤;平滑肌肉瘤;横纹肌肉瘤;胚胎性横纹肌肉瘤;腺泡状横纹肌肉瘤;间质肉瘤;混合瘤,恶性;苗勒氏混合瘤(mullerian mixed tumor);肾母细胞瘤;肝母细胞瘤;癌肉瘤;间叶瘤,恶性;布伦纳瘤,恶性;叶状瘤,恶性;滑膜肉瘤;间皮瘤,恶性;无性细胞瘤;胚胎癌;畸胎瘤,恶性;卵巢甲状腺肿,恶性;绒毛膜癌;中肾瘤,恶性;血管肉瘤;血管内皮瘤,恶性;卡波西肉瘤;血管外皮细胞瘤,恶性;淋巴管肉瘤;骨肉瘤;骨旁骨肉瘤;软骨肉瘤;软骨母细胞瘤,恶性;间叶性软骨肉瘤;骨巨细胞瘤;尤因肉瘤;牙源性肿瘤,恶性;成釉细胞牙肉瘤;成釉细胞瘤,恶性;成釉细胞纤维肉瘤;松果体瘤,恶性;脊索瘤;胶质瘤,恶性;室管膜瘤;星形细胞瘤;原生质性星形细胞瘤;纤维型星形细胞瘤;星形母细胞瘤;胶质母细胞瘤;少突神经胶质瘤;成少突神经胶质瘤;原始神经外胚叶肿瘤;小脑肉瘤;神经节神经母细胞瘤;成神经细胞瘤;视网膜母细胞瘤;嗅神经源性肿瘤;脑膜瘤,恶性;神经纤维肉瘤;神经鞘瘤,恶性;颗粒细胞瘤,恶性;恶性淋巴瘤;霍奇金病;霍奇金淋巴瘤;副肉芽肿;小淋巴细胞性恶性淋巴瘤;弥漫性大细胞恶性淋巴瘤;滤泡型恶性淋巴瘤;蕈样肉芽肿;其他指定的非霍奇金淋巴瘤;恶性组织细胞增生症;多发性骨髓瘤;肥大细胞肉瘤;免疫增生性小肠病;白血病;淋巴样白血病;浆细胞白血病;红白血病;淋巴肉瘤细胞白血病;骨髓性白血病;嗜碱性粒细胞白血病;嗜酸性粒细胞白血病;单核细胞白血病;肥大细胞白血病;巨核细胞白血病;髓系肉瘤;浆细胞瘤、结直肠癌、直肠癌和毛细胞白血病。
在一些实施方式中,所述靶RNA是与选自以下疾病相关的转录物(例如,mRNA):(以“疾病或障碍-因果关系基因或转录物”的格式显示)
神经元的:
雷特综合征-MECP2、
MDS-MECP2、
Angles综合征-UBE3A-ATS、
AADC缺乏症-AADC、
海绵状白质脑病-ASPA、
婴儿后期神经元类脂褐质病(Late infantile neuronal ceroidlipofuscinosis)-CLN2(也称为TPP1)、
弗里德赖希共济失调-FRDA(也称为FXN)、
巨轴突神经病-GAN、
莱伯遗传性视神经病变-ND1/ND4;
眼的:
全色盲-CNGA3、
莱伯氏先天性黑矇10蛋白-CEP290、
视网膜色素变性-RHO;
肌肉的:
dysferlin肌病-DYSF、
达农病(Danon Disease)-LAMP2、
1型强直性肌营养不良(DM1)-DMPK;
耳的:
彭德莱综合征-SLC26A4、
Wolfram综合征-WFS1、
斯蒂克勒综合征(Stickler syndrome)-COL11A2、
非综合征型耳聋-GJB2/OTOF/Myo6/STRC/KCNQ4/TECTA;
肝的:
纯合子家族性高胆固醇血症-LDLR/PCSK9、
α-1抗胰蛋白酶缺乏症-SERPINA1;
其他:
苯丙酮尿症-苯丙氨酸羟化酶(PAH)、
克里格勒-纳贾尔综合征(Crigler-Najjar Syndrome)-UGT1A1、
鸟氨酸氨甲酰基转移酶(OTC)缺乏症-OTC、
糖原贮积症IA型-G6Pase。
细胞及其后代
在某些实施方式中,本公开的方法可用于将本文描述的CRISPR系统引入细胞中,并引起所述细胞和/或其后代改变一种或多种细胞产物(如抗体、淀粉、乙醇、或任何其他所希望的产物)的产生。这样的细胞及其后代在本公开的范围内。
在某些实施方式中,本文描述的方法和/或CRISPR系统导致细胞的一种或多种RNA产物的翻译和/或转录的修饰。例如,所述修饰可导致RNA产物的转录/翻译/表达增加。在其他实施方式中,所述修饰可导致RNA产物的转录/翻译/表达降低。
在某些实施方式中,所述细胞是原核细胞。
在某些实施方式中,所述细胞是真核细胞,如哺乳动物细胞,包括人细胞(原代人细胞或已建立的人细胞系)。在某些实施方式中,所述细胞是非人哺乳动物细胞,如来自非人灵长类动物(例如,猴)、母牛/公牛/牛、绵羊、山羊、猪、马、狗、猫、啮齿动物(如兔子、小鼠、大鼠、仓鼠等)的细胞。在某些实施方式中,所述细胞来自鱼(如鲑鱼)、鸟(如禽鸟,包括鸡、鸭、鹅)、爬行动物、贝类(例如,牡蛎、蛤蜊、龙虾、对虾)、昆虫、蠕虫、酵母等。在某些实施方式中,所述细胞来自植物,如单子叶植物或双子叶植物。在某些实施方式中,所述植物是粮食作物,如大麦、木薯、棉花、落花生或花生、玉蜀黍、小米、油棕果、马铃薯、干豆、油菜籽或低芥酸菜籽(canola)、稻、黑麦、高粱、大豆、甘蔗、甜菜、向日葵和小麦。在某些实施方式中,所述植物是谷类(大麦、玉蜀黍、小米、稻、黑麦、高粱和小麦)。在某些实施方式中,所述植物是块茎(木薯和马铃薯)。在某些实施方式中,所述植物是糖料作物(甜菜和甘蔗)。在某些实施方式中,所述植物是含油作物(大豆、落花生或花生、油菜籽或低芥酸菜籽、向日葵和油棕果)。在某些实施方式中,所述植物是纤维作物(棉花)。在某些实施方式中,所述植物是树木(如桃树或油桃树、苹果树或梨树、坚果树(如杏仁树或核桃树或开心果树)、或柑橘树(例如,橙树、葡萄柚树或柠檬树))、草、蔬菜、水果或藻类。在某些实施方式中,所述植物是茄属植物;芸苔属(Brassica)植物;莴苣属(Lactuca)植物;菠菜属(Spinacia)植物;辣椒属(Capsicum)植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。
相关方面提供使用本文描述的CRISPR系统通过本公开的方法修饰的细胞或其后代。
在某些实施方式中,所述细胞在体外、在体内或离体进行修饰。
在某些实施方式中,所述细胞是干细胞。
8.递送
通过本公开和本领域的知识,本文描述的CRISPR系统或本文描述的其任一组分(Cas13f蛋白、其衍生物、功能性片段或各种融合物或加合物,以及指导RNA/crRNA)、其核酸分子、和/或编码或提供其组分的核酸分子可以通过各种递送系统(如载体,例如质粒和病毒递送载体)使用本领域中任何合适的手段递送,所述CRISPR系统包含工程化Cas13f蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些。这样的方法包括(但不限于)电穿孔、脂质转染、显微注射、转染、超声、基因枪等。
在某些实施方式中,所述CRISPR相关蛋白和/或任一RNA(例如,指导RNA或crRNA)和/或辅助蛋白可以使用合适的载体递送,所述载体例如质粒或病毒载体(如腺相关病毒(AAV)、慢病毒、腺病毒、逆转录病毒载体和其他病毒载体、或其组合)。可以将所述蛋白和一种或多种crRNA包装到一种或多种载体(例如,质粒或病毒载体)中。对于细菌应用,可以使用噬菌体将编码本文描述的CRISPR系统的任一组分的核酸递送至细菌。示例性噬菌体包括但不限于T4噬菌体、Mu、λ噬菌体、T5噬菌体、T7噬菌体、T3噬菌体、Φ29、M13、MS2、Qβ和ΦX174。作为将单链(ss)DNA序列包装为AAV颗粒的载体基因组的替代,最近开发了将RNA序列作为载体基因组包装到AAV颗粒中的系统和方法,并可应用于本文。参见PCT/CN2022/075366,将所述文献通过引用以其全文并入本文。
在一些实施方式中,通过例如肌内注射、静脉内施用、经皮施用、鼻内施用、口服施用或粘膜施用将所述载体(例如,质粒或病毒载体)递送至感兴趣的组织。这样的递送可以经由单剂量或多剂量进行。本领域技术人员应理解,本文待递送的实际剂量可取决于多种因素而大幅变化,如载体选择、靶细胞、生物、组织、待治疗受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用模式、所寻求的转化/修饰的类型等。
在某些实施方式中,所述递送经由腺病毒进行,其可以是含有至少1×105个颗粒(也称为颗粒单位,pu)的腺病毒的单剂量。在一些实施方式中,所述剂量优选地是至少约1×106个颗粒、至少约1×107个颗粒、至少约1×108个颗粒、和至少约1×109个颗粒的腺病毒。所述递送方法和所述剂量描述于例如WO 2016205764 A1和美国专利号8,454,972 B2中,将所述两个文献通过引用以全文并入本文。
在一些实施方式中,所述递送经由质粒进行。所述剂量可以是足够数量的质粒以引发响应。在一些情况下,质粒组合物中质粒DNA的合适量可以是从约0.1至约2mg。质粒将通常包括(i)启动子;(ii)编码靶向核酸的CRISPR相关蛋白和/或辅助蛋白的序列,每个序列与启动子(例如,相同的启动子或不同的启动子)可操作地连接;(iii)可选择标志物;(iv)复制起点;以及(v)位于(ii)的下游并与其可操作地连接的转录终止子。质粒还可以编码CRISPR复合物的RNA组分,但这些组分中的一种或多种可以替代地在不同的载体上编码。施用频率在医学或兽医学从业者(例如,医师、兽医师)或本领域技术人员的范围内。
在另一实施方式中,所述递送经由脂质体或脂质转染配制品等进行,并且可以通过本领域技术人员已知的方法制备。这样的方法描述于例如WO 2016205764和美国专利号5,593,972、5,589,466、和5,580,859中,将各个文献通过引用以其全文并入本文。
在一些实施方式中,所述递送经由纳米颗粒或外泌体进行。例如,已表明外泌体在递送RNA方面特别有用。
将新的CRISPR系统的一种或多种组分引入细胞中的另外的手段是通过使用细胞穿透肽(CPP)。在一些实施方式中,细胞穿透肽与所述CRISPR相关蛋白连接。在一些实施方式中,所述CRISPR相关蛋白和/或指导RNA与一种或多种CPP偶联以有效地将它们转运到细胞(例如,植物原生质体)内。在一些实施方式中,所述CRISPR相关蛋白和/或一种或多种指导RNA由一种或多种环状或非环状DNA分子编码,所述环状或非环状DNA分子与一种或多种CPP偶联用于细胞递送。
CPP是少于35个氨基酸的短肽,所述短肽源自能够以非受体依赖性方式跨细胞膜转运生物分子的蛋白或嵌合序列。CPP可以是阳离子肽、具有疏水性序列的肽、两亲性肽、具有富含脯氨酸且抗微生物的序列的肽、以及嵌合肽或二分肽。CPP的实例包括例如Tat(其是1型HIV病毒复制所需的核转录激活蛋白)、穿膜肽、卡波西成纤维细胞生长因子(FGF)信号肽序列、整合素β3信号肽序列、聚精氨酸肽Args序列、富含鸟嘌呤的分子转运蛋白和甜箭肽。CPP和使用它们的方法描述于例如等人,“Prediction of cell-penetratingpeptides[细胞穿透肽的预测],”Methods Mol.Biol.[分子生物学方法],2015;1324:39-58;Ramakrishna等人,“Gene disruption by cell-penetrating peptide-mediateddelivery of Cas9 protein and guide RNA[通过细胞穿透肽介导的Cas9蛋白和指导RNA的递送来破坏基因],”Genome Res.[基因组研究],2014年6月;24(6):1020-7;以及WO2016205764 A1中;将各个文献通过引用以其全文并入本文。
用于本文描述的CRISPR系统的各种递送方法还描述于例如美国专利号8,795,965、EP 3009511、WO 2016205764和WO 2017070605中;将各个文献通过引用以其全文并入本文。
作为将单链(ss)DNA序列包装为AAV颗粒的载体基因组的替代,最近开发了将RNA序列作为载体基因组包装到AAV颗粒中的系统和方法,并可应用于本文。参见PCT/CN2022/075366,将所述文献通过引用以其全文并入本文。
当载体基因组为例如PCT/CN2022/075366中的RNA时,为了进行简单描述和声明,本文中描述的用于DNA载体基因组的序列元件,当存在于RNA载体基因组中时,一般应认为适用于RNA载体基因组,除了DNA序列中的脱氧核糖核苷酸是RNA序列中相应的核糖核苷酸(例如dT相当于U,并且dA相当于A)和/或DNA序列中的元件被替换为在RNA序列中具有相应功能的相应元件,或因其功能在RNA序列中不需要而被省略,和/或引入RNA载体基因组所必需的额外元件。
如本文所用,编码序列(例如,作为本文中AAV载体基因组的序列元件)被解释、理解和认为覆盖并涵盖DNA编码序列和RNA编码序列两者。当它是DNA编码序列时,可以从DNA编码序列转录RNA序列,并且任选地可以根据需要进一步从转录的RNA序列翻译蛋白质。当它是RNA编码序列时,RNA编码序列本身可以是供使用的RNA序列(尽管RNA编码序列似乎不编码某物),或者RNA序列可以例如通过RNA加工由RNA编码序列产生(尽管RNA编码序列似乎不编码某物),或者可以从RNA编码序列翻译蛋白质。
例如,(例如,Cas13f,NLS)编码序列(编码(例如Cas13f、NLS)多肽)覆盖(例如,Cas13f、NLS)多肽从其表达(例如,经由转录和翻译间接地)的(例如,Cas13f、NLS)DNA编码序列或(例如,Cas13f、NLS)多肽从其翻译(直接地)的(例如,Cas13f、NLS)RNA编码序列。
例如,(例如,gRNA)编码序列(编码RNA(例如,gRNA)的序列)覆盖RNA序列(例如,gRNA序列或阵列)从其转录的(例如,gRNA)DNA编码序列,或(例如,gRNA)RNA编码序列(1)其本身就是供使用的RNA序列(例如,gRNA序列或阵列),或(2)例如通过RNA加工从其产生gRNA序列或阵列。
在RNA AAV载体基因组的一些实施方式中,5'-ITR和/或3'-ITR作为DNA包装信号将是不必要的并且可以将其省略,但是可以引入RNA包装信号。
在AAV RNA载体基因组的一些实施方式中,驱动DNA序列转录的启动子将是不必要的,并且可以至少将其部分省略。
在AAV RNA载体基因组的一些实施方式中,polyA信号序列将是不必要的并且可以将其省略,但是可以引入polyA尾巴。
类似地,可以将AAV DNA载体基因组的其他DNA元件省略或替换为相应的RNA元件和/或可以引入新的RNA元件,以适应由rAAV颗粒递送RNA载体基因组的策略。
9.试剂盒
本公开的另一方面提供试剂盒,所述试剂盒包含本文描述的本发明CRISPR-Cas系统的任何两种或更多种组分,所述本发明CRISPR-Cas系统包含工程化Cas13f蛋白,例如基本上缺乏旁切活性或具有增强的旁切活性的那些,如Cas13f蛋白、其衍生物、功能性片段或各种融合物或加合物、指导RNA/crRNA、其复合物、涵盖它们的载体、或涵盖它们的宿主。
在某些实施方式中,所述试剂盒进一步包括使用其中涵盖的组分的说明,和/或与可在别处获得的其他组分组合的说明。
在某些实施方式中,所述试剂盒进一步包含一种或多种核苷酸,例如对应于以下的一种或多种核苷酸:可用于将指导RNA编码序列插入载体中并将所述编码序列与所述载体的一种或多种控制元件可操作地连接的那些。
在某些实施方式中,所述试剂盒进一步包含一种或多种缓冲液,所述缓冲液可用于溶解任一所述组分和/或为一种或多种所述组分提供合适的反应条件。这样的缓冲液可以包括以下中的一种或多种:PBS、HEPES、Tris、MOPS、Na2CO3、NaHCO3、NaB、或其组合。在某些实施方式中,所述反应条件包括适当的pH,如碱性pH。在某些实施方式中,所述pH在7-10之间。
在某些实施方式中,任一种或多种所述试剂盒组分可以储存在合适的容器中。
本公开在以下实施例中进一步描述,所述实施例不限制权利要求中所描述的本公开的范围。
进一步的实施方式在以下实施例中进行了说明,这些实施例仅用于说明目的,并不旨在限制本公开的范围。
实施例
实施例1针对旁切活性对Cas13f的工程化
本实施例证明,通过引入一个或多个特定氨基酸突变,可以降低或增加参考Cas13f多肽(野生型,“WT”,SEQ ID NO:1)的间隔序列非依赖性旁切活性(“旁切活性”,“脱靶切割活性”),同时保持间隔序列特异性切割活性(“切割活性”,“中靶切割活性”)。
设计和构建:
使用了公开可获得的在线工具TASSER预测参考Cas13f多肽的3D结构,并且如图1中所示,使用PyMOL对预测结构进行了可视化,以预测3D中各个结构性结构域的位置。
构建了单质粒哺乳动物双荧光报告系统,以检测Cas13f突变体的旁切活性,如图2中所示。
所述质粒包含在CAG启动子和poly A序列的调控下侧接5’和3’SV40 NLS(SEQ IDNO:5)编码序列的Cas13f突变体编码序列、在SV40启动子和poly A序列的调控下的EGFP绿色荧光报告基因(其RNA转录物作为切割活性的RNA靶标)、在SV40启动子和poly A序列的调控下的mCherry红色荧光报告基因(其RNA转录物作为旁切活性的RNA靶标)、以及在U6启动子的调控下编码5'-DR序列(SEQ ID NO:2)-EGFP-靶向间隔序列(SEQ ID NO:6)-DR序列(SEQ ID NO:2)-3'构型的gRNA的序列。
选择了参考Cas13f多肽的HEPN1、HEPN2、IDL和Hel1-3结构域来生成Cas13f诱变文库。在这些结构域(F1-F10和F38-F47,图3)上选择了20个小区段,除了F45V1和F45V2具有9个残基之外,其余每个小区段具有17个残基。
为了设计Cas13f突变体,在几个版本中,将每个区段的所有非Ala(A)残基用Ala(A)残基取代,并且在几个版本中,将每个区段的所有Ala(A)残基用Val(V)残基取代。例如,对于F1区段,设计了F1V1-F1V4突变。在每个版本中,将大约4-5个总突变引入每个区段中。如此产生的Cas13f突变体和突变区段的氨基酸序列在下表1中提供,并且每个Cas13f突变体的其他部分与SEQ ID NO:1的参考Cas13f多肽相同。
表1.Cas13f突变体的设计
转染和检测:
根据标准方法将HEK293T细胞在24孔组织培养板中培养12小时,然后使用标准聚乙烯亚胺(PEI)转染将质粒转染到细胞中。然后将经转染的细胞在37℃在5%的CO2下培养约48小时。然后通过流式细胞术分析培养的细胞。
每个Cas13f突变体的切割活性与EGFP阳性细胞的百分比比例(%EGFP)呈负相关。%EGFP+越低,切割活性就越高。每个Cas13f突变体的旁切活性与mCherry阳性细胞的百分比比例(%mCherry)呈负相关。%mCherry+越高,旁切活性就越低。使用无切割和旁切活性的死Cas13f(“dCas13f”,“死”)(基于SEQ ID NO:1的参考Cas13f多肽在HEPN结构域中具有R77A、H82A、R764A和H769A突变的Cas13f突变体)作为阴性对照。
结果:
流式细胞术结果(表2,图4)显示了Cas13f突变体的切割和旁切活性。位于图4左上区域的Cas13f突变体具有低旁切活性(高%mCherry)和高切割活性(低%EGFP)。
表2.表1中Cas13f突变体的平均切割和旁切活性(n=3)
/>
/>
发现在F7、F10、F40、F38或F46中,特别是F7V2、F10V1、F10V4、F40V2、F40V4、F38V2或F46V3中,具有突变的Cas13f突变体表现了相对较低的%EGFP,但更高或更低的%mCherry,指示这些突变体保持了高切割活性,但大大降低或增强了旁切活性。
通过生成多种具有单个或多个(例如,双重、三重或四重)组合突变的额外的突变体,在这些突变体的这些区域(F10V1、F10V4、F38V2、F40V2、F40V4、F46V1和F46V3)中或附近进行了第二轮诱变研究。这些突变体的突变区段的序列列于下表3中,并且其切割和旁切活性列于下表4和图5中。
表3.Cas13f突变体的设计
/>
表4.表3中Cas13f突变体的平均切割和旁切活性(n=3)
/>
/>
表5.来自表2和表4的一些Cas13f突变体的平均切割和旁切活性(n=3)
总体而言,表5中的Cas13f突变体表现了低旁切活性(例如,≤25%的旁切活性表示为≥75%的mCherry+细胞)和高切割活性(例如,≥75%的切割活性表示为≤25%的EGFP+细胞),其包括F40S23(含有Y666A和Y677A突变,所述Cas13f突变体被命名为SEQ ID NO:3全长的“Cas13f v2”)。
一些其他Cas13f突变体保留了高切割活性(例如,≥75%的切割活性表示为≤25%EGFP+细胞),但也保持了高旁切活性(例如,≥75%的旁切活性表示为≤25%的mCherry+细胞)。这样的Cas13f突变体可用于检测方法,例如依赖于切割和旁切活性的SHERLOCK。
实施例2针对增加的切割活性对Cas13f的工程化
在实施例1中,已针对低间隔序列非依赖性旁切活性(“旁切活性”,“脱靶切割活性”)对Cas13f突变体进行筛选。为了进一步提高间隔序列特异性切割活性(“切割活性”,“中靶切割活性”),同时确保没有或低旁切活性,将一个或多个突变(表6)进一步引入实施例1中开发的突变体F40S23(Cas13f-Y666A,Y677A,或命名为Cas13f v2,SEQ ID NO:3)。
本实施例证明,通过引入一个或多个特定氨基酸突变,可以增加Cas13f v2的切割活性。
表6.用于引入Cas13f v2的可用突变
突变 实施例1中对应的突变名称
D160A F10S6
Q163A F10S9
D642A F38S12
L631A F38S1
P667A F40S3
H638A F38S8
T647A F38S17
D762A F46S6
L634A F38S4
L641A F38S11
V670A F40S6
A763V F46S7
T161A F10S7
设计和构建:
构建了两质粒哺乳动物荧光报告系统,用于检测Cas13f突变体的切割活性。
如图6中所示,一个质粒包含ATXN2 cDNA编码序列(其RNA转录物作为切割靶标),随后是在SV40启动子和poly A序列的调控下的p2A(自切割肽)和EGFP报告基因(SEQ IDNO:7)。EGFP mRNA与来自质粒的ATXN2 RNA转录物一起转录以形成嵌合转录物。当作为嵌合转录物的一部分的ATXN2 RNA转录物被ATXN2靶向gRNA指导的Cas13f突变体切割时,作为嵌合转录物的另一部分的EGFR mRNA也会由于例如总RNA不稳定性而逐渐降解,导致EGFP(绿色)的荧光强度降低。
另一个质粒包含在Cbh启动子和poly A序列的调控下侧接5’和3’SV40 NLS(SEQID NO:5)编码序列的Cas13f突变体编码序列、在U6启动子的调控下编码5’-DR序列(SEQ IDNO:2)-AXTN2-靶向间隔序列(SEQ ID NO:8)-DR序列(SEQ ID NO:2)-3’构型的gRNA的序列、以及在SV40启动子和poly A序列的调控下的mCherry报告基因(其RNA转录物作为旁切靶标)。作为阴性对照,使用非靶向间隔序列(“NT”,SEQ ID NO:9)代替AXTN2-靶向间隔序列(SEQ ID NO:8)。在Cas13f突变体保留旁切活性的情况下,mCherry RNA转录物可能被切割,导致mCherry(红色)的荧光强度降低。
用Rho cDNA编码序列,随后是p2A(自切割肽)和EGFP报告基因(SEQ ID NO:10)以及Rho-靶向间隔序列(SEQ ID NO:11)构建了一对类似的质粒,用于额外的测试。
转染和检测:
为了评估Cas13f突变体在哺乳动物细胞中的切割和旁切活性,将两个质粒共转染至HEK293T细胞。共转染后72小时,通过荧光测量测量EGFP和mCherry的表达水平。低EGFP平均荧光强度(MFI)指示所希望的高切割活性。高mCherry MFI指示所希望的旁切活性低或没有。
根据标准细胞培养方法,使HEK293T细胞在24孔组织培养板中生长至合适的密度,然后使用PEI转染试剂用两种质粒转染细胞。将经转染的细胞在37℃在5%的CO2下在培养箱中培养约72小时,然后用FACS测量所述细胞中的EGFP和mCherry荧光信号。选择了导致低EGFP MFI和高mCherry MFI的Cas13f突变体。
Cas13f突变体的所有MFI结果(平均值±SD)均相对于阴性对照归一化。
对另一个基因组位点SOD1进行RT-qPCR,以研究指示Cas13f突变体的切割活性的SOD1 mRNA敲低。根据标准细胞培养方法,使Cos7细胞在6孔组织培养板中生长至合适的密度,然后使用PEI转染试剂用Cas13f突变体编码质粒(使用SEQ ID NO:12的SOD1-靶向间隔序列)转染细胞。72小时后,通过流式分选对前30%的量的mCherry阳性细胞进行分选,从阳性细胞中提取总RNA,并且通过RT-qPCR测量SOD1 mRNA水平,并将其相对于管家基因GAPDH归一化。
结果:
位于图7左上区域的Cas13f突变体不仅具有比Cas13f v2更高的切割活性(低EGFPMFI),而且还具有更低的旁切活性(高mCherry MFI)(表7)。其中,v2+L641A被命名为Cas13fv2.5。
表7.如通过MFI呈现的Cas13f突变体的平均切割和旁切活性,其中gRNA靶向ATXN2RNA转录物(间隔序列,SEQ ID NO:8)(n=3)
突变体 mCherry的MFI EGFP的MFI
NT 1.000 1.000
v2 0.781 0.590
v2+D160A 0.908 0.449
v2+P667A 1.060 0.440
v2+T647A 1.122 0.456
v2+D762A 1.156 0.403
v2+L641A 1.097 0.424
v2+A763V 1.003 0.579
v2+T161A 1.078 0.454
RT-qPCR结果显示与Cas13f v2相比,所指示的Cas13f突变体的SOD1 mRNA敲低效率有所提高(图8,表8)。
表8.通过Cas13f突变体的RT-qPCR的Cos7细胞中平均SOD1 mRNA水平,n=3(间隔序列,SEQ ID NO:12)(n=3)
突变体 平均的SOD1 mRNA水平
NT 1.001
v2 0.562
v2+D160A 0.233
v2+D642A 0.153
v2+L631A 0.221
v2+P667A 0.218
v2+H638A 0.208
v2+T647A 0.166
v2+D762A 0.189
v2+L634A 0.197
v2+L641A 0.171
v2+V670A 0.208
v2+T161A 0.285
上述结果表明,向Cas13f v2中额外引入表6中所列的单点突变,增强了切割活性,同时保持甚至降低了Cas13f v2的旁切活性。
基于上述结果并采用相同的实验程序,随后将单一突变成对组合以引入Cas13fv2。其中,Cas13f v2+D160A和D642A被命名为Cas13f v3(SEQ ID NO:4)。
表9.如通过MFI呈现的Cas13f突变体的平均切割和旁切活性,其中gRNA靶向RhoRNA转录物(间隔序列,SEQ ID NO:11)(n=3)(图9)
突变体 mCherry的MFI EGFP的MFI
NT 1.000 1.000
v2 0.869 0.665
v2+D160A 0.892 0.578
v2+D642A 1.084 0.497
v2+L631A 0.921 0.533
v2+P667A 0.964 0.528
v2+H638A 0.913 0.540
v2+L634A 0.956 0.620
v2+L641A 1.058 0.636
v2+L631A&H638A 0.978 0.640
v2+L631A&L641A 1.055 0.840
v2+L631A&D642A 0.966 0.655
v2+D160A&L631A 0.968 0.469
v2+H638A&L641A 0.909 0.700
v2+H638A&D642A 0.921 0.464
v2+L641A&D642A 0.995 0.551
v2+D160A&D642A(Cas13f v3) 1.113 0.430
表10.如通过MFI呈现的Cas13f突变体的平均切割和旁切活性,其中gRNA靶向EGFPRNA转录物(间隔序列,SEQ ID NO:6)(n=3)(图10,左小图)
突变体 mCherry的MFI EGFP的MFI
NT 1.000 1.000
v2 1.024 0.374
v2+D160A 0.709 0.301
v2+H638A 0.889 0.259
v2+D642A 0.885 0.265
v3 0.982 0.283
v2+H638A&D642A 0.957 0.284
表11.如通过MFI呈现的Cas13f突变体的平均切割和旁切活性,其中gRNA靶向ATXN2 RNA转录物(间隔序列,SEQ ID NO:8)(n=3)(图10,右小图)
突变体 mCherry的MFI EGFP的MFI
NT 1.000 1.000
v2 0.891 0.510
v2+D160A 1.492 0.209
v2+H638A 0.161 0.679
v2+D642A 1.425 0.313
v3 1.335 0.202
v2+H638A&D642A 1.338 0.225
表12.通过Cas13f突变体的RT-qPCR的Cos7细胞中平均SOD1 mRNA水平,n=3(间隔序列,SEQ ID NO:12)(n=3)(图11)
蛋白质 平均的SOD1 mRNA水平
NT 1.005
v2 0.307
v3 0.125
v2+H638A&D642A 0.202
其中,流式细胞术结果(图9-10、表9-11)和RT-qPCR结果(图11、表12)均显示与Cas13f v2相比,Cas13f v3具有更高的切割活性和更低的旁切活性。
实施例3针对增加的切割活性对Cas13f的进一步工程化
本实施例证明,通过引入特定氨基酸突变,可以增加Cas13f v3的切割活性。
设计和构建:
RNA是带负电荷的分子,其偏向于与蛋白质中带正电荷的碱性氨基酸相互作用。为了获得切割活性增加的Cas13f突变体,将Cas13f v3蛋白中除HEPN1和HEPN2结构域中的非碱性氨基酸外的一种非碱性氨基酸突变为精氨酸(R,一种常见的带正电荷的碱性氨基酸),以基于Cas13f v3构建Cas13f突变体(图12)。
构建了两质粒哺乳动物荧光报告系统,用于检测Cas13f突变体的切割活性,如图13中所示。
一个质粒包含在SV40启动子和poly A序列的调控下的红色荧光报告基因(mCherry),在Cbh启动子和poly A序列的调控下侧接5'末端和3'末端SV40 NLS(SEQ IDNO:5)编码序列的Cas13f突变体编码序列,以及在CMV启动子和poly A序列的调控下的BFP荧光报告基因。BFP的蓝色荧光指示质粒在宿主细胞中成功转染和表达。
另一个质粒包含在U6启动子的调控下编码5'-DR序列(SEQ ID NO:2)-mCherry-靶向间隔序列(SEQ ID NO:13)-DR序列(SEQ ID NO:2)-3'构型的gRNA的序列。作为阴性对照,使用非靶向间隔序列(“NT”,SEQ ID NO:14)代替质粒中的mCherry-靶向间隔序列(SEQ IDNO:13)。
转染和检测:
根据标准方法将HEK293T细胞在24孔组织培养板中培养12小时,然后使用标准聚乙烯亚胺(PEI)转染将两个质粒共转染到细胞中。然后将经转染的细胞在37℃在5%的CO2下培养约48小时。然后通过流式细胞术分析培养的细胞。每个Cas13f突变体的切割活性计算为BFP阳性细胞(“BFP+”,指示质粒转染和表达成功)的平均红色荧光强度(“RFP MFI”,较弱的RFP MFI指示切割活性较高)。
结果:
将Cas13f突变体与Cas13f v3进行分批测试,从而排除转染效率对切割活性的影响。流式细胞术结果显示每个具有单个氨基酸取代为R的Cas13f突变体的RFP MFI。其中,与Cas13f v3相比,在基于Cas13f v3的183、189、200、202、205、214、233、276、282、283、299、314、520、258、259、339、410、433、595、598、213、338、508、或526位置处具有单个氨基酸取代为R的Cas13f突变体具有更弱的RFP MFI,指示切割活性增加(表13-16和图14-17)。
表13.Cas13f突变体BFP阳性细胞的平均RFP MFI(n=2)(图14)
表14.Cas13f突变体BFP阳性细胞的平均RFP MFI(n=2或1)(图15)
表15.Cas13f突变体BFP阳性细胞的平均RFP MFI(n=2)(图16)
表16.Cas13f突变体BFP阳性细胞的平均RFP MFI(n=2或1)(图17)
***
在不背离本发明的范围和精神的情况下,本发明的所描述的方法、药物组合物和试剂盒的各种修改和变化对本领域的技术人员将是显而易见的。尽管本发明已经结合特定的实施方式进行了说明,但是应当理解能够进行进一步的修改,并且要求保护的本发明不应该不当地受限于此类特定的实施方式。实际上,对于该领域的技术人员显而易见的、用于执行本发明的所描述的方式的各种修改旨在落入本发明的范围内。本申请意在涵盖任何一般而言依循本发明的原理的变化、用途或改编,且包括这样的偏离本公开的内容:其在本发明所属领域的已知或惯常操作内、且可适用于此前所示的基本特征。
示例性序列
参考Cas13f多肽,SEQ ID NO:1
Cas13f DR序列,SEQ ID NO:2
GCTGTGATAGACCTCGATTTGTGGGGTAGTAACAGC
Cas13f v2蛋白序列(Cas13f-Y666A,Y677A),SEQ ID NO:3
Cas13f v3(Cas13f-D160A、D642A、Y666A、Y677A)蛋白序列,SEQ ID NO:4
SV40 NLS序列,SEQ ID NO:5
PKKKRKV
EGFP-靶向间隔序列,SEQ ID NO:6
gtcctccttgaagtcgatgcccttcagctc
ATXN2 cDNA-p2a-EGFP编码序列,SEQ ID NO:7
atgccatcaagatccacttctcacacttcagatttcaacccgaattctggttcagaccaaagagtagttaatggaggtgttccctggccatcgccttgcccatctccttcctctcgcccaccttctcgctaccagtcaggtcccaactctcttccacctcgggcagccacccctacacggccgccctccaggcccccctcgcggccatccagacccccgtctcacccctctgctcatggttctccagctcctgtctctactgtcgacgccactaacttctccctgttgaaacaagcaggggatgtcgaagagaatcccgggccagtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtga
ATXN2-靶向间隔序列,SEQ ID NO:8
gtagagacaggagctggagaaccatgagca
非靶向间隔序列,SEQ ID NO:9
gagacccagatctgccggtctct
Rho cDNA-p2a-EGFP编码序列,SEQ ID NO:10
atgaatggcacagaaggccctaacttctacgtgcccttctccaatgcgacgggtgtggtacgcagccacttcgagtacccacagtactacctggctgagccatggcagttctccatgctggccgcctacatgtttctgctgatcgtgctgggcttccccatcaacttcctcacgctctacgtcaccgtccagcacaagaagctgcgcacgcctctcaactacatcctgctcaacctagccgtggctgacctcttcatggtcctaggtggcttcaccagcaccctctacacctctctgcatggatacttcgtcttcgggcccacaggatgcaatttggagggcttctttgccaccctgggcggtgaaattgccctgtggtccttggtggtcctggccatcgagcggtacgtggtggtgtgtaagcccgtcgacgccactaacttctccctgttgaaacaagcaggggatgtcgaagagaatcccgggccagtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtga
Rho-靶向间隔序列,SEQ ID NO:11
gaagccacctaggaccatgaagaggtcagc
SOD1-靶向间隔序列,SEQ ID NO:12
gcctctcttcatcctttggcccaccgtgtt
mCherry-靶向间隔序列,SEQ ID NO:13
gcagcttcaccttgtagatgaactcgccgt
非靶向间隔序列,SEQ ID NO:14
ggtcttcgatattcaagcgtcggaagacct

Claims (52)

1.一种工程化Cas13f多肽,其中所述工程化Cas13f多肽:
(1)包含在空间上接近以下的区域中的突变:a)(例如,SEQ ID NO:1的)参考Cas13f多肽的N-末端内切核酸酶催化RXXXXH基序(例如,N-末端内切核酸酶催化RNFYSH基序),和/或b)所述(例如,SEQ ID NO:1的)参考Cas13f多肽的C-末端内切核酸酶催化RXXXXH基序(例如,C-末端内切核酸酶催化RNKALH基序);
(2)基本上保留(例如,具有至少约50%、60%、70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%或更多的)所述(例如,SEQID NO:1的)参考Cas13f多肽对与间隔序列互补的靶RNA的间隔序列特异性切割活性;并且
(3)基本上缺乏(例如,具有不超过约50%、45%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%或更少的)所述(例如,SEQ ID NO:1的)参考Cas13f多肽对不与所述间隔序列结合的非靶RNA的间隔序列非依赖性旁切活性。
2.如权利要求1所述的工程化Cas13f多肽,其中所述区域包括距离所述N-末端内切核酸酶催化RXXXXH基序或所述C-末端内切核酸酶催化RXXXXH基序的任何残基在140、130、120、110、100、90、80、70、60、50、40、30、20或10个氨基酸以内的残基。
3.如权利要求1所述的工程化Cas13f多肽,其中所述区域包括距离所述N-末端内切核酸酶催化RXXXXH基序或所述C-末端内切核酸酶催化RXXXXH基序的任何残基在100、110、120或130个残基以外,但在空间上在所述N-末端内切核酸酶催化RXXXXH基序或所述C-末端内切核酸酶催化RXXXXH基序的任何残基的约1埃至约10埃以内或约5埃的残基。
4.如权利要求1-3中任一项所述的工程化Cas13f多肽,其中所述区域包含对应于SEQID NO:1的所述参考Cas13f多肽的以下结构域的残基、基本上由其组成、或由其组成:HEPN1结构域(例如,残基1-168)、IDL结构域(例如,残基168-185)、Helical1结构域(例如,Helical1-1(Hel1-1)结构域(例如,残基185-234)、Helical1-2(Hel1-2)结构域(例如,残基281-346)、Helical1-3(Hel1-3)结构域(例如,残基477-644))、Helical2结构域(例如,残基346-477)、或HEPN2结构域(例如,残基644-790)。
5.如权利要求1-4中任一项所述的工程化Cas13f多肽,其中所述突变包含在所述区域内的一段约8个至约20个(例如,约9个或约17个)连续氨基酸内的以下、基本上由其组成、或由其组成:
(a)一个或多个(例如,1、2、3、4、5或更多个)非Ala(A)残基至Ala(A)残基的取代;
(b)一个或多个(例如,1、2、3、4、5或更多个)带电荷的残基、含氮侧链基团的残基、大的(如F或Y)残基、脂肪族残基、和/或极性残基至电荷中性的短链脂肪族残基(如A、V或I)的取代;
(c)一个或多个(例如,1、2、3、4、5或更多个)Ile(I)和/或Leu(L)残基至Ala(A)残基的取代;和/或
(d)一个或多个(例如,1、2、3、4、5或更多个)Ala(A)残基至Val(V)残基的取代。
6.如权利要求5所述的工程化Cas13f多肽,其中所述一个或多个非Ala残基和/或所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、E、Y、S、T、L残基或其组合。
7.如权利要求6所述的工程化Cas13f多肽,其中所述一个或多个非Ala残基和/或所述一个或多个带电荷的或极性残基包含N、Q、R、K、H、D、Y、L残基或其组合。
8.如权利要求5-7中任一项所述的工程化Cas13f多肽,其中所述一段内的一个或多个Y残基被取代。
9.如权利要求8所述的工程化Cas13f多肽,其中所述一个或多个Y残基对应于SEQ IDNO:1的所述参考Cas13f多肽的Y666和/或Y677。
10.如权利要求5-9中任一项所述的工程化Cas13f多肽,其中所述一段内的一个或多个D残基被取代。
11.如权利要求10所述的工程化Cas13f多肽,其中所述一个或多个D残基对应于SEQ IDNO:1的所述参考Cas13f多肽的D160和/或D642。
12.如权利要求5-11中任一项所述的工程化Cas13f多肽,其中所述电荷中性的短链脂肪族残基是Ala(A)。
13.如权利要求1-12中任一项所述的工程化Cas13f多肽,其中所述突变包含以下、基本上由以下组成、或由以下组成:
(a)在所述区域内的所述一段约8个至约20个(例如,约9个或约17个)连续氨基酸中的1、2、3、4或5个所述段内的取代;
(b)对应于以下突变(例如,表1-5中的任何一个)或其组合的突变,所述突变导致工程化Cas13f多肽具有至少约75%的间隔序列特异性切割活性和不超过约25%的间隔序列非依赖性旁切活性;和/或
(c)对应于表5中的F7V2、F10V1、F10V4、F40V4、F40S22、F40S26、F40S36、F10S21、F10S24、F10S26、F10S27、F10S33、F10S34、F10S35、F10S36、F10S45、F10S46、F10S48、F10S49、F40S23、或F40S27突变或其组合的突变。
14.如权利要求1-13中任一项所述的工程化Cas13f多肽,其中所述工程化Cas13f多肽保留SEQ ID NO:1的所述参考Cas13f多肽对所述靶RNA的间隔序列特异性切割活性的至少约50%、60%、70%、72.5%、75%、77.5%、80%、82.5%、85%、87.5%、90%、92.5%、95%、96%、97%、98%、99%或更多;
其中所述工程化Cas13f多肽具有SEQ ID NO:1的所述参考Cas13f多肽对所述非靶RNA的间隔序列非依赖性旁切活性的不超过50%、45%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%或更少;和/或
其中所述工程化Cas13f多肽具有SEQ ID NO:1的所述参考Cas13f多肽对所述靶RNA的间隔序列特异性切割活性的至少约80%,以及SEQ ID NO:1的所述参考Cas13f多肽对所述非靶RNA的间隔序列非依赖性旁切活性的不超过约40%。
15.如权利要求14所述的工程化Cas13f多肽,其中所述突变是F40S23(即,Y666A/Y677A双重突变)。
16.如权利要求15所述的工程化Cas13f多肽,所述工程化Cas13f多肽包含SEQ ID NO:3的氨基酸序列、基本上由其组成、或由其组成。
17.如权利要求1-16中任一项所述的工程化Cas13f多肽,所述工程化Cas13f多肽进一步包含对应于表6中任何一个、两个或更多个(例如,3、4或5个以上)突变(如,D160A、D642A和/或L641A)的组合的突变。
18.如权利要求1-17中任一项所述的工程化Cas13f多肽,其中所述突变是表6中任何一个、两个或更多个(例如,3、4或5个以上)单一突变(如,D160A、D642A和/或L641A)与F40S23(即,Y666A/Y677A双重突变)的组合。
19.如权利要求1-18中任一项所述的工程化Cas13f多肽,其中所述突变是Y666A/Y677A双重突变与选自D160A、L641A和D642A的1、2或3个突变的组合。
20.如权利要求1-19中任一项所述的工程化Cas13f多肽,其中所述突变是表7-12中的任何组合突变。
21.如权利要求20所述的工程化Cas13f多肽,其中所述突变是D160A/D642A/Y666A/Y677A四重突变。
22.如权利要求1-21中任一项所述的工程化Cas13f多肽,其中所述工程化Cas13f多肽与SEQ ID NO:3的工程化Cas13f多肽相比具有增加的间隔序列特异性切割活性。
23.如权利要求1-22中任一项所述的工程化Cas13f多肽,其中所述突变是对应于表13-16中的突变与D160A/D642A/Y666A/Y677A突变的组合的突变。
24.如权利要求1-23中任一项所述的工程化Cas13f多肽,所述工程化Cas13f多肽包含SEQ ID NO:4的氨基酸序列、基本上由其组成、或由其组成。
25.如权利要求1-24中任一项所述的工程化Cas13f多肽,所述工程化Cas13f多肽进一步包含非碱性氨基酸残基至Arg(R)残基的氨基酸取代;
任选地进一步包含对应于表13-16中任何一个、两个或更多个(例如,3、4或5个以上)单一突变的组合的突变。
26.如权利要求1-25中任一项所述的工程化Cas13f多肽,其中所述工程化Cas13f多肽与SEQ ID NO:4的工程化Cas13f多肽相比具有增加的间隔序列特异性切割活性。
27.如权利要求1-26中任一项所述的工程化Cas13f多肽,所述工程化Cas13f多肽与SEQID NO:1的所述参考Cas13f多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%且小于100%的序列同一性。
28.如权利要求1-27中任一项所述的工程化Cas13f多肽,所述工程化Cas13f多肽进一步包含核定位信号(NLS)序列或核输出信号(NES);任选地包含N-末端和/或C-末端NLS。
29.一种多核苷酸,所述多核苷酸编码如权利要求1-28中任一项所述的工程化Cas13f多肽;
任选地,所述多核苷酸经密码子优化以在真核生物、哺乳动物如人或非人哺乳动物、植物、昆虫、鸟、爬行动物、啮齿动物(例如,小鼠、大鼠)、鱼、蠕虫/线虫或酵母中表达。
30.一种CRISPR-Cas13f系统,所述CRISPR-Cas13f系统包含:
a)权利要求1-28中任一项所述的工程化Cas13f多肽或其多核苷酸编码序列(例如,DNA编码序列或RNA编码序列);以及
b)指导RNA(gRNA)或其多核苷酸编码序列(例如,DNA编码序列或RNA编码序列),所述gRNA包含:
i.能够与所述工程化Cas13f多肽形成复合物的同向重复(DR)序列;和
ii.能够与靶RNA杂交并将所述复合物引导或募集至所述靶RNA的间隔序列;
任选地,其中所述DR序列具有与SEQ ID NO:2的二级结构基本上相同的二级结构;以及
任选地,其中所述间隔序列的长度为至少15个核苷酸,任选地为30个核苷酸。
31.一种载体,所述载体包含权利要求29所述的多核苷酸;
任选地,其中所述多核苷酸与启动子和任选的增强子可操作地连接;
任选地,其中所述启动子是组成型启动子,诱导型启动子,广谱启动子,或者细胞、组织或器官特异性启动子;
任选地,其中所述载体是质粒;
任选地,其中所述载体是逆转录病毒载体、噬菌体载体、腺病毒载体、单纯疱疹病毒(HSV)载体、AAV载体或慢病毒载体;
任选地,其中所述AAV载体是血清型为AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV 11、AAV 12、AAV 13、AAV.PHP.eB或AAV-DJ的重组AAV载体;和/或
任选地,其中所述AAV载体是包封RNA的AAV载体。
32.一种递送系统,所述递送系统包含(1)递送媒介物,和(2)权利要求1-28中任一项所述的工程化Cas13f多肽、权利要求29所述的多核苷酸、权利要求30所述的CRISPR-Cas13f系统、或权利要求31所述的载体;
任选地,其中所述递送媒介物是纳米颗粒(例如,LNP)、脂质体、外泌体、微泡或基因枪。
33.一种细胞或其后代,所述细胞或其后代包含权利要求1-28中任一项所述的工程化Cas13f多肽、权利要求29所述的多核苷酸、权利要求30所述的CRISPR-Cas13f系统、权利要求31所述的载体、或权利要求32所述的递送系统;
任选地,其中所述细胞是真核细胞(例如,非人哺乳动物细胞、人细胞或植物细胞)或原核细胞(例如,细菌细胞)。
34.一种非人类多细胞真核生物,所述非人类多细胞真核生物包含权利要求33所述的细胞或后代;
任选地,其中所述非人类多细胞真核生物是针对人遗传障碍的动物(例如,啮齿动物或灵长类动物)模型。
35.一种修饰靶RNA的方法,所述方法包括使所述靶RNA与权利要求30所述的CRISPR-Cas13f系统、权利要求31所述的载体、权利要求32所述的递送系统、或权利要求33所述的细胞或后代接触。
36.如权利要求35所述的方法,其中通过由所述工程化Cas13f多肽进行切割来修饰所述靶RNA。
37.如权利要求35或36所述的方法,其中所述靶RNA是mRNA、tRNA、rRNA、非编码RNA、lncRNA或核RNA。
38.如权利要求35-37中任一项所述的方法,其中在所述工程化Cas13f多肽和所述指导RNA的所述复合物与所述靶RNA结合后,所述工程化Cas13f多肽不表现表现出实质性的(或可检测的)间隔序列非依赖性旁切活性。
39.如权利要求35-38中任一项所述的方法,其中所述靶RNA在细胞内。
40.如权利要求39所述的方法,其中所述细胞是癌细胞。
41.如权利要求39所述的方法,其中所述细胞受感染原感染。
42.如权利要求41所述的方法,其中所述感染原是病毒、朊病毒、原生动物、真菌或寄生物。
43.如权利要求39所述的方法,其中所述细胞是神经元细胞(例如,星形胶质细胞、神经胶质细胞(例如,穆勒神经胶质细胞、少突胶质细胞、室管膜细胞、施万细胞、NG2细胞或卫星细胞))。
44.如权利要求35-43中任一项所述的方法,其中所述CRISPR-Cas13f系统由以下编码:编码所述工程化Cas13f多肽的第一多核苷酸,以及包含或编码所述指导RNA的第二多核苷酸,其中所述第一多核苷酸和所述第二多核苷酸被引入所述细胞中。
45.如权利要求44所述的方法,其中通过同一个载体将所述第一多核苷酸和所述第二多核苷酸引入所述细胞中。
46.如权利要求35-45中任一项所述的方法,所述方法导致以下中的一项或多项:(i)体外或体内诱导细胞衰老;(ii)体外或体内细胞周期停滞;(iii)体外或体内细胞生长抑制;(iv)体外或体内诱导无能;(v)体外或体内诱导细胞凋亡;以及(vi)体外或体内诱导坏死。
47.一种在有需要的受试者中治疗病症或疾病的方法,所述方法包括向所述受试者施用包含以下的组合物:权利要求30所述的CRISPR-Cas13f系统、权利要求31所述的载体、权利要求32所述的递送系统、或权利要求33所述的细胞或后代;其中,在施用后,所述工程化Cas13f多肽切割所述靶RNA,从而治疗所述受试者的所述病症或疾病。
48.如权利要求47所述的方法,其中所述病症或疾病是神经病症、癌症、感染性疾病或遗传障碍。
49.如权利要求48所述的方法,其中所述癌症是威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、胶质母细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞白血病、慢性骨髓性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。
50.如权利要求48所述的方法,其中所述神经病症是青光眼,与年龄相关的RGC丧失,视神经损伤,视网膜缺血,莱伯遗传性视神经病变,与RGC神经元退化相关的神经病症,与有需要的受试者的纹状体中功能性神经元退化相关的神经病症,帕金森病,阿尔茨海默病,亨廷顿病,精神分裂症,抑郁症,药物成瘾,运动障碍如舞蹈病、舞蹈徐动症和动作障碍,双相障碍,自闭症谱系障碍(ASD)或功能失调。
51.如权利要求47-50中任一项所述的方法,所述方法是体外方法、体内方法或离体方法。
52.一种CRISPR-Cas13f复合物,所述CRISPR-Cas13f复合物包含权利要求1-28中任一项所述的工程化Cas13f多肽以及包含DR序列和间隔序列的指导RNA,所述DR序列与所述工程化Cas13f多肽结合,所述间隔序列能够与靶RNA杂交并且将所述复合物引导或募集至所述靶RNA;
任选地,其中所述靶RNA由真核DNA编码;
任选地,其中所述真核DNA是非人哺乳动物DNA、非人灵长类动物DNA、人DNA、植物DNA、昆虫DNA、鸟DNA、爬行动物DNA、啮齿动物DNA、鱼DNA、蠕虫/线虫DNA、或酵母DNA;
任选地,其中所述靶RNA是mRNA;和/或
任选地,其中所述CRISPR-Cas13f复合物进一步包含靶RNA,所述靶RNA包含能够与所述间隔序列杂交的序列。
CN202280007043.5A 2021-09-29 2022-09-29 工程化CRISPR-Cas13f系统及其用途 Pending CN116490615A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2021/121926 2021-09-29
PCT/CN2021/121926 WO2022068912A1 (en) 2020-09-30 2021-09-29 Engineered crispr/cas13 system and uses thereof
CN2022083461 2022-03-28
CNPCT/CN2022/083461 2022-03-28
PCT/CN2022/122833 WO2023051734A1 (en) 2021-09-29 2022-09-29 Engineered crispr-cas13f system and uses thereof

Publications (1)

Publication Number Publication Date
CN116490615A true CN116490615A (zh) 2023-07-25

Family

ID=85780437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280007043.5A Pending CN116490615A (zh) 2021-09-29 2022-09-29 工程化CRISPR-Cas13f系统及其用途

Country Status (2)

Country Link
CN (1) CN116490615A (zh)
WO (1) WO2023051734A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117887841A (zh) * 2024-03-08 2024-04-16 北京市眼科研究所 基于CRISPR/Cas12的一步法检测Leber遗传性视神经病变的组合物、试剂盒及应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10476825B2 (en) * 2017-08-22 2019-11-12 Salk Institue for Biological Studies RNA targeting methods and compositions
CA3111432A1 (en) * 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems
JP7412586B2 (ja) * 2020-02-28 2024-01-12 ヒュイダジェネ・セラピューティックス・カンパニー・リミテッド VI-E型及びVI-F型CRISPR-Casシステム並びにそれらの使用
WO2022068912A1 (en) * 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117887841A (zh) * 2024-03-08 2024-04-16 北京市眼科研究所 基于CRISPR/Cas12的一步法检测Leber遗传性视神经病变的组合物、试剂盒及应用

Also Published As

Publication number Publication date
WO2023051734A1 (en) 2023-04-06

Similar Documents

Publication Publication Date Title
CN116590257B (zh) VI-E型和VI-F型CRISPR-Cas系统及其用途
US11667903B2 (en) Tracking and manipulating cellular RNA via nuclear delivery of CRISPR/CAS9
AU2017283713B2 (en) Type VI CRISPR orthologs and systems
KR20210053898A (ko) 신규 crispr 효소 및 시스템
JP2023052236A (ja) 新規vi型crisprオルソログ及び系
JP2022000041A (ja) 標的化核酸編集のための系、方法、及び組成物
KR20220032050A (ko) 조작된 casx 시스템
JP2020537516A (ja) 標的化された核酸編集のためのシステム、方法、及び組成物
WO2022068912A1 (en) Engineered crispr/cas13 system and uses thereof
WO2019090175A1 (en) Novel crispr-associated transposon systems and components
CN116490615A (zh) 工程化CRISPR-Cas13f系统及其用途
US20220389398A1 (en) Engineered crispr/cas13 system and uses thereof
WO2023274226A1 (en) Crispr/cas system and uses thereof
WO2023030340A1 (en) Novel design of guide rna and uses thereof
WO2022188039A1 (en) Engineered crispr/cas13 system and uses thereof
CN117545839A (zh) 工程化CRISPR-Cas13f系统及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231225

Address after: Room 1002, Unit 1, Building 7, No. 160, Basheng Road, Free Trade Experimental Zone, Pudong New Area, Shanghai, March 2012

Applicant after: Huida (Shanghai) Biotechnology Co.,Ltd.

Applicant after: Huida Gene Therapy (Singapore) Private Ltd.

Address before: Room 1002, Unit 1, Building 7, No. 160, Basheng Road, Free Trade Experimental Zone, Pudong New Area, Shanghai, March 2012

Applicant before: Huida (Shanghai) Biotechnology Co.,Ltd.