CN118019857A - 改良的crispr-cas技术 - Google Patents

改良的crispr-cas技术 Download PDF

Info

Publication number
CN118019857A
CN118019857A CN202280064577.1A CN202280064577A CN118019857A CN 118019857 A CN118019857 A CN 118019857A CN 202280064577 A CN202280064577 A CN 202280064577A CN 118019857 A CN118019857 A CN 118019857A
Authority
CN
China
Prior art keywords
nucleic acid
target nucleic
guide
cas protein
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280064577.1A
Other languages
English (en)
Inventor
P·拉梅什
W·J·布莱克
B·J·曼宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sherlock Biosciences Inc
Original Assignee
Sherlock Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sherlock Biosciences Inc filed Critical Sherlock Biosciences Inc
Publication of CN118019857A publication Critical patent/CN118019857A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

已发现多种成簇的规律间隔的短回文重复序列‑CRISPR相关(“Cas”)蛋白具有旁切(反式)裂解活性和改良的热稳定性,可用于在例如检测(例如,诊断)系统中检测感兴趣的特定核酸和作为治疗剂。本公开提供了改良的CRISPR‑CAS蛋白(例如,改良的热稳定性)。

Description

改良的CRISPR-CAS技术
背景技术
已发现多种成簇的规律间隔的短回文重复序列-CRISPR相关(“Cas”)蛋白具有旁切(反式)裂解活性和改良的热稳定性,可用于在例如检测(例如,诊断)系统中检测感兴趣的特定核酸和作为治疗剂(例如,基因编辑)。参见,例如,Sashital Genome Med 2018:10,32的综述。
发明内容
本公开提供了特征在于热稳定活性和/或Cas蛋白旁切活性的改良的CRISPR-Cas蛋白。本公开还提供了改良的向导RNA技术。
本公开尤其确认了某些Cas酶的使用问题的根源,特别包括在某些旁切活性测定中。例如,本公开记载,某些用途,包括例如某些此类旁切活性测定,包括涉及在高温下孵育一段时间的步骤,并且各种Cas酶在此类条件下可能不够稳定而无法保持足够的活性(例如,旁切活性)水平。在许多实施方案中,这一步骤可以是或包括核酸延伸和/或扩增步骤。
可替代地或附加地,本公开提供了以下见解:使用Cas酶的各种反应的特别理想的实施方案,包括例如某些旁切活性测定,是可以在单个反应容器(即,所谓的“一锅”)测定中进行的反应。本公开认识到其活性(例如,旁切裂解活性)不够稳定而无法在任何和所有高温步骤(其可以是或包括例如一个或多个核酸延伸和/或扩增步骤)中维持足够活性的Cas酶在此类一锅测定中可能没有用。本公开进一步记载,某些Cas蛋白(例如,Cas13和Cas12)在相关温度下,例如,在通常进行核酸延伸和/或扩增反应的温度下(例如,高于约60-65℃)不够稳定。
本公开涵盖以下认识:各种Cas蛋白(例如,Cas9)的热稳定变体已有描述并且/或者可以其他方式公开获得(参见,例如,Mougiakos等人Nat Commun.8:1647,2017)。本领域技术人员能够将此类热稳定变体与相关非热稳定同源物(例如,直系同源物)相比较,以便评估可为实现热稳定性所必需和/或足够的序列变化和/或元件,并且此外,可以在其他同源物(例如,直系同源物)中鉴定此类序列变化和/或元件,并且/或者可以将所述变化和/或元件引入其中。另外,本领域技术人员熟知天然存在的热稳定的Cas蛋白的潜在来源(例如,在高温条件下诸如在海喷口中存活,或者在其他方面嗜热的微生物中)。因此,本领域技术人员通过阅读本公开可以容易地鉴定和/或开发适当的热稳定的Cas蛋白以如本文所述来使用。
在一些实施方案中,可用的热稳定的Cas蛋白是Cas12或Cas13同源物(例如,直系同源物)。在一些实施方案中,可用的热稳定的Cas蛋白是Cas酶,其包含与SEQ ID No.1-10中的任一个具有80%、85%、90%、99%或100%序列同一性的氨基酸序列。
可替代地或附加地,在一些实施方案中,可用的热稳定的Cas蛋白在高于约50℃的温度下起作用(例如,其旁切裂解活性充分发挥功能);在一些实施方案中,高于选自由以下组成的组的温度:约55℃、约56℃、约57℃、约58℃、约59℃、约60℃、约61℃、约62℃、约63℃、约64℃、约65℃、约66℃、约67℃、约68℃、约69℃、约70℃、约71℃、约72℃、约73℃、约74℃、约75℃、约76℃、约77℃、约78℃、约79℃、约80℃、约81℃、约82℃、约83℃、约84℃、约85℃、约86℃、约87℃、约88℃、约89℃、约90℃、约91℃、约92℃、约93℃、约94℃、约95℃、约96℃、约97℃、约98℃、约99℃、约100℃或其组合。在许多实施方案中,可用的热稳定的Cas蛋白在高于约60℃的温度下起作用(例如,其旁切裂解活性充分发挥功能)。
在一些实施方案中,可用的热稳定的Cas蛋白在进行核酸延伸和/或扩增反应的温度范围内起作用(例如,其旁切裂解活性充分发挥功能);本领域技术人员完全熟悉各种此类反应和所述蛋白起作用的温度范围。在一些实施方案中,此温度范围可高于选自由以下组成的组的温度:约60℃、约61℃、约62℃、约63℃、约64℃、65℃、约66℃、约67℃、约68℃、约69℃、约70℃、约71℃、约72℃、约73℃、约74℃、约75℃、约76℃、约77℃、约78℃、约79℃、约80℃、约81℃、约82℃、约83℃、约84℃、约85℃、约86℃、约87℃、约88℃、约89℃、约90℃、约91℃、约92℃、约93℃、约94℃、约95℃、约96℃、约97℃、约98℃、约99℃、约100℃或其组合。在一些实施方案中,温度范围可为约60℃至约90℃。在一些实施方案中,温度范围可为约60℃至约80℃。在一些实施方案中,温度范围可为约60℃至约75℃。在一些实施方案中,温度范围可为约65℃至约90℃。在一些实施方案中,温度范围可为约60℃至约80℃。在一些实施方案中,温度范围可为约60℃至约75℃。
因此,如本文所阐明,在一些实施方案中,可用的热稳定的Cas蛋白是Cas12或Cas13同源物(例如,直系同源物),例如,包含与SEQ ID No.1-10中的任一个具有80%、85%、90%、99%或100%序列同一性的氨基酸序列的Cas酶,其在高于约50℃并且在一些实施方案中高于约60℃,例如在约60-65℃内和/或高于约60-65℃的温度下是热稳定的。本领域技术人员通过阅读本公开尤其将认识到,在一些实施方案中,可用的热稳定的Cas蛋白是Cas12(例如,SEQ ID NO 1-10,或其例如与其具有至少90%、95%、99%或更大的氨基酸序列同一性的变体)或Cas13(或其例如与其具有至少90%、95%、99%或更大的氨基酸序列同一性的变体),其活性(例如,其靶标结合和旁切裂解活性)例如在60-65℃范围内的温度下是足够热稳定的,以便在如本文所述的测定(例如,在一些实施方案中,一锅测定)中起作用。例如,在一些实施方案中,足够的热稳定活性是与如本文所述的适当的参考热稳定Cas蛋白(例如,Aac或RS9)合理地可比较的活性(例如,在约25%内)。
在一些实施方案中,本公开描述了一种检测方法,其包括以下步骤:使CRISPR-Cas复合物与可能包含靶核酸序列的核酸的样品接触,所述CRISPR-Cas复合物包含:在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和经选择或工程化以与靶核酸序列互补的向导RNA。
在一些实施方案中,接触步骤包括使CRISPR-Cas复合物和样品与易于通过Cas蛋白旁切活性裂解的报告子接触。在一些实施方案中,接触步骤包括在高于该温度下孵育一段时间。在一些实施方案中,检测方法还包括扩增存在于样品中的核酸的步骤。在一些实施方案中,扩增步骤利用热稳定的核酸聚合酶。在一些实施方案中,扩增和接触步骤在单一容器中进行。
在一些实施方案中,Cas蛋白是Cas12蛋白。在一些实施方案中,Cas蛋白具有与SEQID NO:1具有至少80%同一性的氨基酸序列。在一些实施方案中,Cas蛋白具有与SEQ IDNO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,Cas蛋白具有与SEQ ID No.1-10中的任一个具有至少80%序列同一性的氨基酸序列。在一些实施方案中,Cas蛋白具有与SEQ ID No.1-10中的任一个具有80%序列同一性的氨基酸序列。
在一些实施方案中,在使用具有旁切裂解活性的Cas蛋白进行检测测定的方法中,改良包括使用具有热稳定的旁切裂解活性的Cas蛋白。在一些实施方案中,Cas蛋白是Cas12蛋白。在一些实施方案中,Cas蛋白具有与SEQ ID NO:1具有至少80%同一性的氨基酸序列。在一些实施方案中,Cas蛋白具有与SEQ ID NO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,Cas蛋白具有与SEQ ID No.1-10中的任一个具有至少80%序列同一性的氨基酸序列。在一些实施方案中,进行检测测定的方法在单一反应容器中进行。在一些实施方案中,热稳定的旁切裂解活性在高于约60℃温度下是热稳定的。在一些实施方案中,热稳定的旁切裂解活性在高于约65℃温度下是热稳定的。
本领域技术人员知道用于定义例如Cas12型与Cas13型Cas蛋白的用于Cas蛋白的分类系统。具体地说,本领域技术人员熟悉Cas12与Cas13特有的序列元件。参见,例如Koonin等人,Curr Opin Microbiol.,2017年6月;37:67-78,Makarova等人,Nat RevMicrobiol.,2015年11月;13(11):722736;Shmakov等人,Mol Cell.,2015年11月5日;60(3):385-397;Yan和Hunnewell等人,Science,2018年12月6日;Yan等人,Mol Cell.,2018年4月19日;70,327339;Makarova等人,Nat Rev Microbiol.,2011年6月;9(6):467-477;Makarova等人,CRISPR Journal,2018,第1卷,第5期;Shmakov等人,Nat Rev Microbiol.,2017年3月;15(3):169-182;Yan和Hunnewell等人,Science,2019年1月4日;363,88-91;Abudayyeh等人,Science,2016年8月5日;353,6299;Gootenberg和Abudayyeh等人,Science,2017年4月28日,356,438-442;Gootenberg和Abudayyeh等人,Science,2018年4月27日;360,439-444。
本领域技术人员将进一步认识到,在许多实施方案中,如本公开所提供的Cas12(例如,热稳定的Cas12)的特征在于与例示的Cas蛋白(例如,SEQ ID NO:1-10中的任一个)的总体序列相似性程度和/或Cas12、Cas13、其亚种和/或热稳定的Cas蛋白所特有的一个或多个序列元件的存在。在一些实施方案中,特征性序列元件的存在和可合理地较低的特定总体序列同一性——例如特征性序列元件的40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)指示如本文所述的所提供的Cas蛋白。可替代地,在一些实施方案中,如本文所述的所提供的Cas蛋白表现出与例示的Cas(例如,SEQ ID NO:1-10中的任一个)的高序列同一性(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%),而与此类特征性序列元件的存在无关。在一些实施方案中,一个或多个特征性序列元件和高的(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)序列同一性均存在。
在一些方面,本公开提供了一种检测方法,其包括以下步骤:使CRISPR-Cas复合物与可能包含靶核酸序列的样品接触,所述CRISPR-Cas复合物包含:在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和经选择或工程化以与靶核酸序列互补的向导RNA。在一些实施方案中,接触步骤包括使CRISPR-Cas复合物和样品与易于通过Cas蛋白旁切活性裂解的报告子接触。在一些实施方案中,接触步骤包括在高于所述温度下孵育一段时间。
在一些实施方案中,所提供的检测方法包括(例如,还包括)扩增存在于样品中的核酸的步骤。在一些实施方案中,扩增步骤可利用热稳定的核酸聚合酶。在一些实施方案中,扩增和接触步骤在单一容器中和/或在没有间插组分移除步骤和/或洗涤步骤的情况下进行。
在一些实施方案中,本文所述的技术利用为Cas12蛋白的Cas蛋白。在一些实施方案中,这种Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID No.1-10中的任一个具有至少80%序列同一性的氨基酸序列。在一些实施方案中,这种Cas蛋白具有与SEQ ID No.1-10中的一个或多个具有至少80%序列同一性的氨基酸序列。
在一些方面,本公开提供了使用具有旁切裂解活性的Cas蛋白进行检测测定的改良方法,改良包括使用具有热稳定的旁切裂解活性的Cas蛋白。在一些实施方案中,用于此类实施方案中的Cas蛋白是Cas12蛋白。在一些实施方案中,所利用的Cas蛋白具有与SEQ IDNO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID No.1-10中的一个或多个具有至少80%序列同一性的氨基酸序列。
在一些实施方案中,进行检测测定的所提供的方法(例如,改良方法)在单一反应容器中进行。在一些实施方案中,在利用具有热稳定的旁切裂解活性的Cas蛋白的所提供的技术中,这种活性在高于约60℃温度下是热稳定的。在一些实施方案中,这种活性在高于约65℃温度下是热稳定的。在一些实施方案中,Cas蛋白具有与SEQ ID No.1-10中的一个或多个具有至少80%序列同一性的氨基酸序列。
在一些方面,本公开提供了组合物(并且具体地,工程化的或另外非天然存在的组合物),其包含:(a)在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和(b)至少一种能够与这种热稳定的Cas蛋白形成复合物并且引导复合物与靶核酸序列结合的向导。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID NO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列。在一些实施方案中,所利用的至少一种向导包括能够与两种不同的靶核酸序列或靶核酸序列的不同区域杂交的两种向导序列。在一些实施方案中,所利用的至少一种向导包括能够与多种不同的靶核酸序列或靶核酸序列的多个不同区域杂交的多种向导序列。在一些实施方案中,所利用的向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。在一些实施方案中,所利用的向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
在一些方面,本公开提供了组合物(并且具体地,工程化的或另外非天然存在的组合物),其包含:(a)多核苷酸,其编码在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和至少一种能够与Cas蛋白形成复合物并且引导复合物与靶核酸序列结合的向导。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID NO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列。在一些实施方案中,所利用的至少一种向导包括能够与两种不同的靶核酸序列或靶核酸序列的不同区域杂交的两种向导序列。在一些实施方案中,所利用的至少一种向导包括能够与多种不同的靶核酸序列或靶核酸序列的多个不同区域杂交的多种向导序列。在一些实施方案中,所利用的向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。在一些实施方案中,所利用的向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
在一些方面,本公开提供了用于修饰靶核酸中的核苷酸的组合物(并且具体地,工程化的或另外非天然存在的组合物),其包含在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白。在一些实施方案中,组合物包含(例如,还包含)至少一种能够与Cas蛋白形成复合物并且引导复合物与靶核酸序列结合的向导序列。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。在一些实施方案中,所利用的Cas蛋白具有与SEQ ID NO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列。在一些实施方案中,所利用的Cas蛋白已经过修饰,以便减少脱靶效应。在一些实施方案中,靶核酸中的核苷酸的修饰治疗由点突变引起的疾病。在一些实施方案中,靶核酸中的核苷酸的修饰使由靶核酸序列编码的基因失活。在一些实施方案中,靶核酸中的核苷酸的修饰改变由靶核酸序列编码的基因产物。在一些实施方案中,靶核酸中的核苷酸的修饰改变由靶核酸序列编码的基因产物的表达水平。在一些实施方案中,所利用的至少一种向导包括能够与两种不同的靶核酸序列或靶核酸序列的不同区域杂交的两种向导序列。在一些实施方案中,所利用的至少一种向导包括能够与多种不同的靶核酸序列或靶核酸序列的多个不同区域杂交的多种向导序列。在一些实施方案中,所利用的向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。在一些实施方案中,所利用的向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
在一些方面,本公开提供了一种载体系统,其包含有包含以下的一种或多种载体:(a)第一调控元件,其可操作地连接至编码在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白的核苷酸序列;和(b)第二调控元件,其可操作地连接至编码向导的核苷酸序列。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。在一些实施方案中,核苷酸序列编码具有与SEQ IDNO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列的Cas蛋白。在一些实施方案中,编码Cas蛋白的核苷酸序列是密码子优化的。在一些实施方案中,(a)和(b)包含在单一载体中。在一些实施方案中,(a)和(b)包含在单独的载体中。在一些实施方案中,载体系统包含病毒载体。
在一些方面,本公开提供了一种裂解细胞中的至少一种靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导接触,其中Cas蛋白能够与至少一种向导形成复合物并且在至少一种靶核酸中引起断裂。
在一些方面,本公开提供了一种改变细胞中的至少一种靶核酸的表达的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导接触,其中Cas蛋白能够与至少一种向导形成复合物并且在至少一种靶核酸中引起断裂。
在一些方面,本公开提供了一种改变细胞中的至少一种靶核酸的表达的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导接触,其中Cas蛋白能够与至少一种向导形成复合物并且编辑至少一种靶核酸序列。
在一些方面,本公开提供了一种修饰细胞中的至少一种靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导接触,其中Cas蛋白能够与至少一种向导形成复合物并且编辑至少一种靶核酸序列。
在一些实施方案中,编辑靶核酸包括将有效负载核酸插入靶核酸序列处。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列的Cas蛋白。在一些实施方案中,所利用的至少一种向导包括能够与两种不同的靶核酸序列或靶核酸的不同区域杂交的两种向导序列。在一些实施方案中,所利用的至少一种向导包括能够与多种不同的靶核酸序列或靶核酸的多个不同区域杂交的多种向导序列。在一些实施方案中,所利用的向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。在一些实施方案中,所利用的向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
在一些方面,本公开提供了一种编码在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白的核酸。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列的Cas蛋白。
在一些方面,本公开提供了一种治疗有需要的受试者的病症或疾病的方法,其包括向受试者施用在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与靶核酸杂交的向导。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。在一些实施方案中,核苷酸序列编码具有与SEQ ID NO:1-10中的一个或多个具有至少80%序列同一性的氨基酸序列的Cas蛋白。在一些实施方案中,所利用的至少一种向导包括能够与两种不同的靶核酸序列或靶核酸的不同区域杂交的两种向导序列。在一些实施方案中,所利用的至少一种向导包括能够与多种不同的靶核酸序列或靶核酸的多个不同区域杂交的多种向导序列。在一些实施方案中,所利用的至少一种向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。在一些实施方案中,所利用的至少一种向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。在一些实施方案中,所利用的Cas蛋白能够与向导形成复合物并且在靶核酸中引起断裂。在一些实施方案中,所利用的Cas蛋白能够与向导形成复合物并且编辑靶核酸序列。
在一些方面,本公开提供了组合物,其中Cas蛋白与修饰实体缔合。在一些实施方案中,修饰实体是腺苷脱氨酶。在一些实施方案中,修饰实体是胞苷脱氨酶。
在一些方面,本公开提供了包含本公开的Cas蛋白的药物组合物。
在一些方面,本公开提供了一种表征Cas蛋白的方法,其包括评估以下中的一个或多个:(a)顺式裂解活性;(b)反式裂解活性;(c)灵敏度;(d)对RNA或DNA靶核酸的偏好;(e)对RNA或DNA非靶核酸的偏好;以及(f)酶稳定性。
附图说明
图1展示了候选热稳定Cas蛋白Pal1、Pal2低MW、Pal2高MW和Pal3的示例性表征。
图2展示了示例性的Pal1和Pal2在56℃下的活性。
图3展示了在具有不同的示例性向导的情况下,Pal1在37℃、56℃和70℃下的示例性活性。
图4展示了与对照相比,Pal1在56℃和70℃下的示例性活性。这些数据表明Pal1的活性对于靶DNA具有特异性。
图5展示了Pal1的示例性温度概况。
图6展示了在具有不同的示例性向导的情况下,Pal2高MW在37℃、56℃和70℃下的示例性活性。
图7展示了与对照相比,Pal2高MW在56℃下的示例性活性。这些数据表明Pal2高MW的活性对于靶DNA具有特异性。
图8展示了Pal2高MW的示例性温度概况。
图9展示了遵循供应商(ThermoFisher)推荐方案进行的示例性蛋白质热移测定。简单地说,将Cas酶(PAL1、PAL2、PAL3、PAL4、PAL5、PAL6、PAL8、PAL9或PAL10)(500ng/uL)与蛋白质热移染料(8x)蛋白质热移缓冲液混合并且放置在QuantStudio 5qPCR仪器中,以便追踪随着温度缓慢增加引起的荧光变化。提取解链温度(Tm)的数据分析通过获得X4-M4通道中的原始荧光强度的一阶导数来进行。
图10:展示了与靶向SARS CoV2的N基因或Orf1ab基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL5 Cas12b的旁切活性信号。非靶标对照(NTC)以灰色示出。靶标以纯化的体外转录(IVT)RNA形式提供。
图11:展示了与靶向SARS CoV2的N基因或Orf1ab基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL5 Cas12b的旁切活性信号。非靶标对照(NTC)以灰色示出。首先使用LAMP扩增以低浓度提供的靶标,同时使用PAL5 Cas12b检测其产物。
图12:展示了与靶向Sars CoV2的N基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL8 Cas12b的旁切活性信号。存在表现出高于背景的明确信号的所测试的sgRNA的两种变体(N-1)和(N-5)。非靶标对照(NTC)以灰色示出。靶标以纯化的体外转录(IVT)RNA形式提供。
图13:展示了与靶向SARS CoV2的N基因(SCoV2-N1)的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL8 Cas12b的旁切活性信号。非靶标对照(NTC)以灰色示出。首先使用LAMP扩增以低浓度提供的靶标,同时使用PAL8 Cas12b检测其产物。
图14:展示了与靶向SARS CoV2的N基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL9 Cas12b的旁切活性信号。存在表现出高于背景的明确信号的所测试的sgRNA的三种变体(N-1)、(N-2)和(N-3)。非靶标对照(NTC)以灰色示出。靶标以纯化的体外转录(IVT)RNA形式提供。
图15:展示了与靶向Sars CoV2的N基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL9 Cas12b的旁切活性信号。非靶标对照(NTC)以灰色示出。存在表现出高于背景的明确信号的所测试的sgRNA的三种变体(N-1)、(N-2)和(N-3)。首先使用LAMP扩增以低浓度提供的靶标,同时使用PAL9 Cas12b检测其产物。
图16:展示了与靶向SARS CoV2的N基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL10 Cas12b的旁切活性信号。存在表现出高于背景的明确信号的所测试的sgRNA的两种变体(N-1)和(N-3)。非靶标对照(NTC)以灰色示出。靶标以纯化的体外转录(IVT)RNA形式提供。
图17:展示了与靶向Sars CoV2的N基因的工程化的单一向导RNA(sgRNA)复合的热稳定的PAL10 Cas12b的旁切活性信号。非靶标对照(NTC)以灰色示出。存在表现出高于背景的明确信号的所测试的sgRNA的两种变体(N-1)和(N-3)。首先使用LAMP扩增以低浓度提供的靶标,同时使用PAL10 Cas12b检测其产物。
具体实施方式
定义
施用:如本文所用,术语“施用”通常是指将组合物施用于受试者或系统。本领域普通技术人员知道可在适当的情况下用于施用于受试者例如人的各种途径。例如,在一些实施方案中,施用可以是眼部、经口、肠胃外、局部施用等。在一些具体实施方案中,施用可以是支气管(例如,通过支气管滴注)、经颊、真皮(其可以是或包括,例如,真皮局部施用、皮内施用、皮间施用、透皮施用等中的一种或多种)、肠内、动脉内、皮内、胃内、髓内、肌内、鼻内、腹膜内、鞘内、静脉内、心室内、特定器官内(例如,肝内)、粘膜、鼻腔、口腔、直肠、皮下、舌下、局部、气管(例如,通过气管内滴注)、阴道、玻璃体施用等。在一些实施方案中,施用可涉及间歇性给药(例如,多个剂量在时间上分开)和/或周期性给药(例如,个别剂量分开一段共同的时间)。在一些实施方案中,施用可涉及连续给药(例如,灌注)至少一段选定时间。
剂:如本文所用,术语“剂”可指任何化学类别的化合物、分子或实体,包括例如小分子、多肽、核酸、糖、脂质、金属或其组合或复合物。在一些实施方案中,术语“剂”可指包含聚合物的化合物、分子或实体。在一些实施方案中,该术语可指包含一个或多个聚合物部分的化合物或实体。在一些实施方案中,术语“剂”可指基本上不含特定聚合物或聚合物部分的化合物、分子或实体。在一些实施方案中,该术语可指缺少或基本上不含任何聚合物或聚合物部分的化合物、分子或实体。
氨基酸:在其最广泛的意义上,如本文所用,术语“氨基酸”是指例如通过形成一个或多个肽键,可以并入、并入或已经并入多肽链中的化合物和/或物质。在一些实施方案中,氨基酸具有一般结构H2N-C(H)(R)-COOH。在一些实施方案中,氨基酸是天然存在的氨基酸。在一些实施方案中,氨基酸是非天然氨基酸;在一些实施方案中,氨基酸是D-氨基酸;在一些实施方案中,氨基酸是L-氨基酸。“标准氨基酸”是指通常发现于天然存在的肽中的二十种标准L-氨基酸中的任一种。“非标准氨基酸”是指除了标准氨基酸以外的任何氨基酸,不论其是合成制备的还是获自天然来源。在一些实施方案中,氨基酸,包括多肽中的羧基和/或氨基末端氨基酸,与以上一般结构相比可以包含结构修饰。例如,在一些实施方案中,与一般结构相比,氨基酸可通过甲基化、酰胺化、乙酰化、聚乙二醇化、糖化、磷酸化和/或取代(例如,氨基、羧酸基团、一个或多个质子和/或羟基)进行修饰。在一些实施方案中,与包含在其他方面相同的未修饰氨基酸的多肽相比,这种修饰可例如改变包含修饰氨基酸的多肽的循环半衰期。在一些实施方案中,与包含在其他方面相同的未修饰氨基酸的多肽相比,这种修饰不显著改变包含修饰氨基酸的多肽的相关活性。如从上下文将清楚的,在一些实施方案中,术语“氨基酸”可用于指游离氨基酸;在一些实施方案中,可用于指多肽的氨基酸残基。
类似物:如本文所用,术语“类似物”是指与参考物质共有一个或多个特定的结构特征、元件、组分或部分的物质。通常,“类似物”表现出与参考物质的显著结构相似性,例如共有核心或一致结构,但是也以一种或多种某些个别方式有所不同。在一些实施方案中,类似物是可以例如通过参考物质的化学操纵由参考物质产生的物质。在一些实施方案中,类似物是可以通过进行与产生参考物质的过程基本上类似(例如,与其共有多个步骤)的合成过程产生的物质。在一些实施方案中,类似物可以通过进行与用于产生参考物质的过程不同的合成过程产生。
动物:如本文所用,是指动物界的任何成员。在一些实施方案中,“动物”是指任一性别并且处于任何发育阶段中的人。在一些实施方案中,“动物”是指处于任何发育阶段中的非人动物。在某些实施方案中,非人动物是哺乳动物(例如,啮齿动物、小鼠、大鼠、兔、猴、犬、猫、绵羊、牛、灵长类动物和/或猪)。在一些实施方案中,动物包括但不限于哺乳动物、鸟类、爬行动物、两栖动物、鱼、昆虫和/或蠕虫。在一些实施方案中,动物可以是转基因动物、遗传工程化动物和/或克隆。
大约:如本文所用,如应用于一个或多个感兴趣的值的术语“大约”或“约”是指与所陈述的参考值类似的值。在某些实施方案中,术语“大约”或“约”是指在任一方向上(大于或小于)落在所陈述的参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更少以内的值范围,除非另外说明或另外从上下文显而易见(所述数字超过可能值的100%的情况除外)。
结合:应了解,如本文所用的术语“结合”通常是指两个或更多个实体之间或之中的非共价缔合。“直接”结合涉及实体或部分之间的物理接触;间接结合涉及通过与一个或多个中间实体的物理接触实现的物理相互作用。两个或更多个实体之间的结合通常可以在各种情形中的任一种中进行评估——包括当孤立地研究相互作用的实体或部分时或在更复杂系统的情形中(例如,在共价或以其他方式与承载实体缔合时和/或在生物系统或细胞中)。如果在所评估的条件下,相关实体更可能彼此缔合,而不是与其他可获得的结合配偶体缔合,则这两个实体之间的结合可被视为“特异性的”。
生物样品:如本文所用,术语“生物样品”通常是指获自或衍生自如本文所述的感兴趣的生物来源(例如,组织或有机体或细胞培养物)的样品。在一些实施方案中,感兴趣的来源包括有机体,诸如动物或人。在一些实施方案中,生物样品是或包括生物组织或流体。在一些实施方案中,生物样品可以是或包括骨髓;血液;血细胞;腹水;组织或细针活检样品;含有细胞的体液;自由漂浮的核酸;痰液;唾液;尿液;脑脊液、腹膜液;胸腔积液;粪便;淋巴;妇科流体;皮肤拭子;阴道拭子;口腔拭子;鼻拭子;洗涤液或灌洗液,诸如导管灌洗液或支气管肺泡灌洗液;抽吸物;刮擦物;骨髓标本;组织活检标本;手术标本;粪便、其他体液、分泌物和/或排泄物;和/或由此产生的细胞等。在一些实施方案中,生物样品是或包括获自个体的细胞。在一些实施方案中,所获得的细胞是或包括来自获得样品的个体的细胞。在一些实施方案中,样品是通过任何适当的手段直接获自感兴趣的来源的“原始样品(primary sample)”。例如,在一些实施方案中,原始生物样品通过选自由以下组成的组的方法获得:活检(例如,细针抽吸或组织活检)、手术、收集体液(例如,血液、淋巴、粪便等)等。在一些实施方案中,如从上下文将清楚的,术语“样品”是指通过处理原始样品(例如,通过从其中移除一种或多种组分和/或向其中添加一种或多种剂)获得的制剂。例如,使用半透膜过滤。这种“经处理的样品”可包括例如从样品中提取或通过使原始样品经受诸如mRNA的扩增或逆转录、某些组分的分离和/或纯化等的技术获得的核酸或蛋白质。
癌症:术语“癌症”、“恶性肿瘤”、“赘生物(neoplasm)”、“肿瘤”和“癌瘤(carcinoma)”在本文用于指表现出相对异常、不受控制和/或自主的生长,使得其表现出特征在于细胞增殖显著失去控制的异常生长表型的细胞。在一些实施方案中,肿瘤可以是或包括癌症前期(例如,良性)、恶性、转移前、转移性和/或非转移性的细胞。在一些实施方案中,相关癌症的特征可在于实体肿瘤。在一些实施方案中,相关癌症的特征可在于血液肿瘤。一般来说,本领域已知的不同类型癌症的实例包括例如造血系统癌症,包括白血病、淋巴瘤(霍奇金和非霍奇金)、骨髓瘤和骨髓增殖性病症;肉瘤,黑色素瘤,腺瘤,实体组织癌,口腔、咽喉、喉和肺的鳞状细胞癌,肝癌,泌尿生殖系统癌诸如前列腺癌、宫颈癌、膀胱癌、子宫癌和子宫内膜癌以及肾细胞癌,骨癌,胰腺癌,皮肤癌,皮肤或眼内黑色素瘤,内分泌系统癌,甲状腺癌,甲状旁腺癌,头颈癌,乳腺癌,胃肠癌和神经系统癌,良性病变诸如乳头状瘤等。
载剂:如本文所用,是指与组合物一起施用的稀释剂、佐剂、赋形剂或媒介物。在一些示例性实施方案中,载剂可以包括无菌液体,例如像水和油,包括石油、动物油、植物油或合成来源的油,例如像花生油、大豆油、矿物油、芝麻油等。在一些实施方案中,载剂是或包括一种或多种固体组分。
组合物:本领域技术人员将认识到,如本文所用的术语“组合物”可用于指包含一种或多种指定组分的离散物理实体。通常,除非另外规定,否则组合物可以是任何形式——例如,气体、凝胶、液体、固体等。
包括:本文描述为“包括”一个或多个指定元件或步骤的组合物或方法是开放式的,意味着指定元件或步骤是必需的,但是在组合物或方法的范围内,可添加其他元件或步骤。为了避免累赘陈述,还应了解,描述为“包括(comprising)”(或“包括(comprises)”)一个或多个指定元件或步骤的任何组合物或方法还描述“基本上由相同的指定元件或步骤组成”(或“基本上由其组成”)的对应的、更受限的组合物或方法,意味着组合物或方法包括指定的必需元件或步骤并且还可包括不实质性影响组合物或方法的基本和新颖特征的附加元件或步骤。还应了解,本文描述为“包括”一个或多个指定元件或步骤或“基本上由其组成”的任何组合物或方法还描述“由指定元件或步骤组成”(或“由其组成”)的对应的、更受限且封闭式的组合物或方法,不包括任何其他未指定的元件或步骤。在本文公开的任何组合物或方法中,任何指定的必需元件或步骤的已知或公开等效物可取代所述元件或步骤。
经设计:如本文所用,术语“经设计”是指具有以下条件的因子:(i)其结构通过或曾通过人工进行选择;(ii)通过需要人工的过程产生;和/或(iii)与天然物质和其他已知因子不同。
确定:本文所述的许多方法包括“确定”步骤。本领域普通技术人员通过阅读本说明书将认识到,这种“确定”可以利用本领域技术人员可获得的各种技术中的任一种,包括例如本文明确提及的特定技术或通过使用所述技术来完成。在一些实施方案中,确定涉及物理样品的操纵。在一些实施方案中,确定涉及数据或信息的考量和/或操纵,例如使用计算机或适于进行相关分析的其他处理单元。在一些实施方案中,确定涉及从来源接收有关信息和/或材料。在一些实施方案中,确定涉及将样品或实体的一个或多个特征与可比较的参考进行比较。
工程化:通常,术语“工程化的”是指通过人工来操纵的方面。例如,当在自然界中不彼此直接连接在一起的两个或更多个序列通过人工操纵以在工程化的多核苷酸中以所述顺序连接和/或当多核苷酸中的特定残基是非天然存在的并且/或者通过人工操作导致与在自然界中不与其连接的实体或部分连接时,多核苷酸被视为“工程化的”。例如,在本发明的一些实施方案中,工程化的多核苷酸包含在自然界中与第一编码序列可操作缔合但是不与第二编码序列可操作缔合的调控序列,其通过人工连接,使得其与第二编码序列可操作缔合。同等地,如果细胞或有机体经受操纵,使得相对于适当的参考细胞诸如未以此方式操纵的在其他方面相同的细胞,其遗传、表观遗传和/或表型特性(identity)得以改变,则所述细胞或有机体被视为“工程化的”。在一些实施方案中,操纵是或包括遗传操纵,使得其遗传信息改变(例如,先前不存在的新遗传物质例如通过转化、交配、体细胞杂交、转染、转导或其他机制引入,或先前存在的遗传物质例如通过取代或缺失突变或通过交配方案而被改变或移除)。在一些实施方案中,工程化的细胞是如下细胞,其经过操纵,使得相对于所述适当的参考细胞,其以改变的量和/或根据改变的时序包含和/或表达感兴趣的特定剂(例如,蛋白质、核酸和/或其特定形式)。作为惯例并且如本领域技术人员所理解的,工程化的多核苷酸或细胞的子代通常仍然被称为“工程化的”,即使实际操纵是对于先前实体进行的。
赋形剂:如本文所用,是指可包含在药物组合物中以便例如提供或有助于期望的稠度或稳定效应的非治疗剂。合适的药物赋形剂包括,例如,淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、二醇、水、乙醇等。
表达:如本文所用,术语核酸序列的“表达”是指由核酸序列产生任何基因产物。在一些实施方案中,基因产物可以是转录物。在一些实施方案中,基因产物可以是多肽。在一些实施方案中,核酸序列的表达涉及以下中的一个或多个:(1)由DNA序列产生RNA模板(例如,通过转录);(2)RNA转录物的加工(例如,通过剪接、编辑等);(3)将RNA翻译成多肽或蛋白质;和/或(4)多肽或蛋白质的翻译后修饰。
功能:如本文所用,“功能”生物分子是呈其表现出特性和/或活性的形式的生物分子,所述分子的特征在于所述特性和/或活性。生物分子可具有两种功能(即,双功能)或许多功能(即,多功能)。
基因:如本文所用,术语“基因”是指染色体中编码产物(例如,RNA产物和/或多肽产物)的DNA序列。在一些实施方案中,基因包括编码序列(即,编码特定产物的序列);在一些实施方案中,基因包括非编码序列。在一些特定实施方案中,基因可包括编码(例如,外显子)和非编码(例如,内含子)序列两者。在一些实施方案中,基因可包括一个或多个调控元件,其例如可控制或影响基因表达的一个或多个方面(例如,细胞类型特异性表达、诱导型表达等)。
基因产物或表达产物:如本文所用,术语“基因产物”或“表达产物”通常是指从基因转录的RNA(加工前和/或加工后)或由从基因转录的RNA编码的多肽(修饰前和/或修饰后)。
基因组:如本文所用,术语“基因组”是指个别有机体或细胞携带的总遗传信息,通过其染色体的完整DNA序列来表示。
同源性:如本文所用,术语“同源性”是指聚合物分子之间,例如,核酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。在一些实施方案中,如果聚合物分子的序列具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的同一性,则所述聚合物分子被视为彼此“同源”。在一些实施方案中,如果聚合物分子的序列具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的相似性,则所述聚合物分子被视为彼此“同源”。
宿主细胞:如本文所用,是指外源DNA(重组或以其他方式)引入其中的细胞。本领域技术人员在阅读本公开后将理解,此类术语不仅仅指特定的主题细胞,而且还指这种细胞的子代。因为由于突变或环境影响而导致某些修饰可发生在后续世代中,所以所述子代事实上可与亲本细胞不一致,但是仍然包括在如本文所用的术语“宿主细胞”的范围内。在一些实施方案中,宿主细胞包括选自任何生命王国的适合表达外源DNA(例如,重组核酸序列)的原核和真核细胞。示例性细胞包括原核生物和真核生物(单细胞或多细胞)的细胞、细菌细胞(例如,大肠杆菌、芽孢杆菌属物种、链霉菌属物种等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如,酿酒酵母(S.cerevisiae)、粟酒裂殖酵母(S.pombe)、巴斯德毕赤酵母(P.pastoris)、甲醇毕赤酵母(P.methanolica)等)、植物细胞、昆虫细胞(例如,SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人动物细胞、人类细胞,或细胞融合体,例如像杂交瘤或四源杂交瘤(quadroma)。在一些实施方案中,细胞是人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中,细胞是真核的并且选自以下细胞:CHO(例如,CHOKl、DXB-1 1CHO、Veggie-CHO)、COS(例如,COS-7)、视网膜细胞、Vero、CV1、肾(例如,HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60,(例如,BHK21)、Jurkat、Daudi、A431(表皮)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT 060562、塞尔托利细胞(Sertoli cell)、BRL 3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞,以及衍生自前述细胞的细胞系。在一些实施方案中,细胞包含一种或多种病毒基因。
人:在一些实施方案中,人是胚胎、胎儿、婴儿、儿童、青少年、成年人或老年人。
同一性:如本文所用,术语“同一性”是指聚合物分子之间,例如,核酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。在一些实施方案中,如果聚合物分子的序列具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的同一性,则所述聚合物分子被视为彼此“基本上相同”。两个核酸或多肽序列的同一性百分比的计算例如可以通过出于最佳比较目的对两个序列进行比对来进行(例如,为了最佳比对,可以将空位引入第一和第二序列中的一者或两者中并且出于比较目的,可以忽略不相同的序列)。在某些实施方案中,出于比较目的比对的序列的长度为参考序列的长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上100%。然后比较对应位置的核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的残基(例如,核苷酸或氨基酸)占据时,则所述分子在所述位置处是相同的。两个序列之间的同一性百分比随着序列共有的相同位置的数目而变化,考虑到为了最佳比对两个序列而需要引入的空位的数目和各空位的长度。两个序列之间的序列比较和同一性百分比的确定可以使用数学算法来完成。例如,两个核苷酸序列之间的同一性百分比可以使用已并入ALIGN程序(版本2.0)中的Meyers和Miller(CABIOS,1989,4:11-17)的算法来确定。在一些示例性实施方案中,用ALIGN程序进行的核酸序列比较使用PAM120权重残基表、空位长度罚分12和空位罚分4。两个核苷酸序列之间的同一性百分比可以替代地使用利用NWSgapdna.CMP矩阵的GCG软件包中的GAP程序来确定。
“改良”、“增加”、“抑制”或“减少”:如本文所用,术语“改良”、“增加”、“抑制”、“减少”或其语法等效物指示相对于基线或其他参考测量的值。在一些实施方案中,适当的参考测量可以是或包括在其他方面可比较的条件下,在不存在特定剂或治疗(例如,之前和/或之后)时,或在适当的可比较的参考剂的存在下,在特定系统中(例如,在单一个体中)的测量。在一些实施方案中,适当的参考测量可以是或包括在已知或预期在相关剂或治疗的存在下以特定方式作出反应的可比较系统中的测量。
腹膜内:如本文所用的短语“腹膜内施用”和“腹膜内地施用”具有其在本领域中理解的含义,是指将化合物或组合物施用到受试者的腹膜中。
体外:如本文所用的术语“体外”是指在人为环境中,例如,在试管或反应容器中、在细胞培养物中等,而不是在多细胞有机体内发生的事件。
体内:如本文所用,是指在多细胞有机体,诸如人和非人动物体内发生的事件。在基于细胞的系统的情形中,该术语可用于指在活细胞(而不是例如体外系统)内发生的事件。
分离:如本文所用,是指(1)与在最初产生(不论在自然界中和/或在实验环境中)时与其缔合的至少一些组分分离,和/或(2)通过人工来设计、产生、制备和/或制造的物质和/或实体。分离的物质和/或实体可从与其最初缔合的其他组分的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%分离。在一些实施方案中,分离的剂为约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%纯的。如本文所用,如果物质基本上不含其他组分,则所述物质是“纯的”。在一些实施方案中,如本领域技术人员将理解的,在与某些其他组分例如像一种或多种载剂或赋形剂(例如,缓冲剂、溶剂、水等)组合之后,物质仍可被视为“分离的”或甚至“纯的”;在此类实施方案中,物质的分离或纯度百分比在不包括此类载剂或赋形剂的情况下计算。仅给出一个实例,在一些实施方案中,当满足以下条件时,在自然界中出现的生物聚合物诸如多肽或多核苷酸被视为“分离的”:a)根据其起源或衍生来源,不与在自然界中,在其天然状态下伴随其的一些或所有组分缔合;b)其基本上不含与在自然界中产生其的物种相同的物种的其他多肽或核酸;c)通过不是在自然界中产生其的物种的细胞或其他表达系统来表达或以其他方式与来自所述细胞或系统的组分缔合。因此,例如,在一些实施方案中,化学合成或在与在自然界产生其的细胞系统不同的细胞系统中合成的多肽被视为“分离”多肽。可替代地或附加地,在一些实施方案中,经受了一种或多种纯化技术的多肽可被视为“分离”多肽,只要其与a)在自然界中与其缔合;和/或b)在最初产生时与其缔合的其他组分分离。
接头:如本文所用,用于指多元件剂(multi-element agent)的将不同元件彼此连接的那个部分。例如,本领域普通技术人员认识到,其结构包括两个或更多个功能或组织结构域的多肽通常包括将此类结构域彼此连接的处于此类结构域之间的氨基酸的链段。在一些实施方案中,包含接头元件的多肽具有通式S1-L-S2的总体结构,其中S1和S2可以是相同或不同的并且表示通过接头彼此缔合的两个结构域。在一些实施方案中,多肽接头的长度为至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个氨基酸。在一些实施方案中,接头的特征在于其倾向于不采用刚性三维结构,而是向多肽提供柔性。在将多肽工程化(例如,嵌合系统)时可以适当地使用的各种不同的接头元件是本领域中已知的(参见例如,Holliger,P.等人(1993)Proc.Natl.Acad.Sci.USA 90:6444-6448;Poljak,R.J.等人(1994)Structure 2:1121-1123)。
部分:本领域技术人员将认识到,“部分”是如本文所述的具有特定结构和/或活性的限定化学基团或实体。
核酸:如本文所用,在其最广泛的意义上,是指并入或可以并入寡核苷酸链中的任何化合物和/或物质。在一些实施方案中,核酸是通过磷酸二酯键并入或可以并入寡核苷酸链中的化合物和/或物质。如从上下文将清楚的,在一些实施方案中,“核酸”是指个别核酸残基(例如,核苷酸和/或核苷);在一些实施方案中,“核酸”是指包含个别核酸残基的寡核苷酸链。在一些实施方案中,“核酸”是或包含RNA;在一些实施方案中,“核酸”是或包含DNA。在一些实施方案中,核酸是、包含一个或多个天然核酸残基或由其组成。在一些实施方案中,核酸是、包含一个或多个核酸类似物或由其组成。在一些实施方案中,核酸类似物与核酸的不同之处在于其不利用磷酸二酯骨架。例如,在一些实施方案中,核酸是、包含一个或多个“肽核酸”或由其组成,其在本领域中是已知的并且在骨架中具有肽键代替磷酸二酯键,被视为在本发明的范围内。可替代地或附加地,在一些实施方案中,核酸具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键联,而不是磷酸二酯键。在一些实施方案中,核酸是、包含一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)或由其组成。在一些实施方案中,核酸是、包含一个或多个核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧腺苷、8-氧鸟苷、0(6)-甲基鸟嘌呤、2-硫胞苷、甲基化碱基、嵌入碱基以及其组合)或由其组成。在一些实施方案中,与天然核酸中的糖相比,核酸包含一种或多种经修饰的糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。在一些实施方案中,核酸具有编码功能基因产物诸如RNA或蛋白质的核苷酸序列。在一些实施方案中,核酸包括一个或多个内含子。在一些实施方案中,核酸通过从天然来源中分离、通过基于互补模板的聚合来酶促合成(体内或体外)、在重组细胞或系统中增殖以及化学合成中的一种或多种来制备。在一些实施方案中,核酸长至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施方案中,核酸部分或全部是单链;在一些实施方案中,核酸部分或全部是双链。在一些实施方案中,核酸具有核苷酸序列,所述核苷酸序列包含至少一个元件,所述元件编码多肽,或是编码多肽的序列的互补序列。在一些实施方案中,核酸具有酶促活性。
可操作地连接:如本文所用,是指其中所描述的部件处于允许其以其预期方式来起作用的关系中的并置。“可操作地连接至”功能元件的控制元件以一定方式缔合,所述方式使得功能元件的表达和/或活性在与控制元件相容的条件下实现。在一些实施方案中,“可操作地连接的”控制元件与感兴趣的编码元件相邻(例如,共价连接);在一些实施方案中,控制元件与感兴趣的功能元件反式起作用或以其他方式起作用。
经口:如本文所用的短语“经口施用”和“经口地施用”具有其在本领域中理解的含义,是指通过口腔施用化合物或组合物。
患者:如本文所用,术语“患者”是指例如出于实验、诊断、预防、美容和/或治疗目的,施用或可施用所提供的组合物的任何有机体。典型的患者包括动物(例如,哺乳动物,诸如小鼠、大鼠、兔、非人灵长类动物和/或人)。在一些实施方案中,患者是人。在一些实施方案中,患者患有或易患一种或多种病症或病状。在一些实施方案中,患者表现出病症或病状的一种或多种症状。在一些实施方案中,患者被诊断为患有一种或多种病症或病状。在一些实施方案中,病症或病状是或包括癌症,或存在一个或多个肿瘤。在一些实施方案中,患者正在接受或已接受用于诊断和/或治疗疾病、病症或病状的某些疗法。
有效负载:通常,如本文所用的术语“有效负载”是指可通过与另一实体缔合来递送或转运的剂。在一些实施方案中,这种缔合可以是或包括共价键;在一些实施方案中,这种缔合可以是或包括非共价相互作用。在一些实施方案中,缔合可以是直接的;在一些实施方案中,缔合可以是间接的。术语“有效负载”不限于特定化学特性或类型;例如,在一些实施方案中,有效负载可以是或包括例如任何化学类别的实体,包括例如脂质、金属、核酸、多肽、糖(例如,多糖)、小分子或其组合或复合物。在一些实施方案中,有效负载可以是或包括生物修饰剂、可检测剂(例如,染料、荧光团、放射性标记等)、检测剂、营养物、治疗剂等或其组合。在一些实施方案中,有效负载可以是或包括细胞或有机体,或其部分、提取物或组分。在一些实施方案中,有效负载可以是或包括天然产物,因为其在自然界中发现和/或获得;可替代地或附加地,在一些实施方案中,该术语可用于指一种或多种人造实体,因为其通过人工操作来设计、工程化和/或产生并且/或者不存在于自然界中。在一些实施方案中,有效负载可以是或包括呈分离或纯形式的剂;在一些实施方案中,这种剂可呈粗形式。
药学上可接受:如本文所用,短语“药学上可接受”是指在合理的医学判断范围内,适用于与人类和动物的组织接触而无过度毒性、刺激、过敏反应或其他问题或并发症,并且与合理的收益/风险比相称的那些化合物、材料、组合物和/或剂型。
药学上可接受的载剂:如本文所用,术语“药学上可接受的载剂”是指药学上可接受的材料、组合物或媒介物,诸如液体或固体填充剂、稀释剂、赋形剂或溶剂囊封材料,其涉及将主题化合物从一个器官或身体部分载运或转运至另一个器官或身体部分。各载剂必须在与制剂的其他成分相容并且对于患者无害的意义上是“可接受的”。可以用作药学上可接受的载剂的材料的一些实例包括:糖,诸如乳糖、葡萄糖和蔗糖;淀粉,诸如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,诸如羧甲基纤维素钠、乙基纤维素和乙酸纤维素;粉状黄蓍胶;麦芽;明胶;滑石;赋形剂,诸如可可脂和栓剂蜡;油类,诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;二醇,诸如丙二醇;多元醇,诸如甘油、山梨醇、甘露醇和聚乙二醇;酯类,诸如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,诸如氢氧化镁和氢氧化铝;海藻酸;无热原水;等渗盐水;林格氏溶液;乙醇;pH缓冲溶液;聚酯、聚碳酸酯和/或聚酐;以及其他用于药物制剂中的无毒相容物质。
药学上可接受的盐:如本文所用,术语“药学上可接受的盐”是指适合在药物情形中使用的化合物的盐,即,在合理的医学判断范围内,适合用于与人和低等动物的组织接触而没有不当的毒性、刺激、过敏反应等,并且与合理的收益/风险比相称的盐。药学上可接受的盐是本领域中熟知的。例如,S.M.Berge等人在J.Pharmaceutical Sciences,66:1-19(1977)中详细描述了药学上可接受的盐。在一些实施方案中,药学上可接受的盐包括但不限于无毒酸加成盐,其为与诸如盐酸、氢溴酸、磷酸、硫酸和高氯酸的无机酸,或与诸如乙酸、马来酸、酒石酸、柠檬酸、琥珀酸或丙二酸的有机酸,或通过使用诸如离子交换的用于本领域中的其他方法所形成的具有氨基的盐。在一些实施方案中,药学上可接受的盐包括但不限于己二酸盐、海藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙烷磺酸盐、甲酸盐、富马酸盐、葡庚糖酸盐、甘油磷酸盐、葡糖酸盐、半硫酸盐(hemisulfate)、庚酸盐、己酸盐、氢碘酸盐、2-羟基-乙烷磺酸盐、乳糖酸盐、乳酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、甲烷磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐(pamoate)、果胶酸盐(pectinate)、过硫酸盐、3-苯基丙酸盐、磷酸盐、苦味酸盐、特戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、对甲苯磺酸盐、十一烷酸盐、戊酸盐等。代表性的碱或碱土金属盐包括钠盐、锂盐、钾盐、钙盐、镁盐等。在一些实施方案中,药学上可接受的盐在适当时包括无毒铵、季铵和使用抗衡离子形成的胺阳离子,所述抗衡离子诸如卤化物、氢氧化物、羧酸根、硫酸根、磷酸根、硝酸根、具有1至6个碳原子的烷基、磺酸根和芳基磺酸根。
多肽:如本文所用,是指氨基酸的聚合物链。在一些实施方案中,多肽具有在自然界中存在的氨基酸序列。在一些实施方案中,多肽具有在自然界中不存在的氨基酸序列。在一些实施方案中,多肽具有工程化的氨基酸序列,因为其通过人工操作来设计和/或产生。在一些实施方案中,多肽可包含天然氨基酸、非天然氨基酸或两者,或由其组成。在一些实施方案中,多肽可包含仅天然氨基酸或仅非天然氨基酸,或由其组成。在一些实施方案中,多肽可包含D-氨基酸、L-氨基酸或两者。在一些实施方案中,多肽可包含仅D-氨基酸。在一些实施方案中,多肽可包含仅L-氨基酸。在一些实施方案中,多肽可包括一个或多个侧基或其他修饰,例如,修饰或连接至一个或多个氨基酸侧链,所述侧链在多肽的N端、多肽的C端,或其任何组合处。在一些实施方案中,此类侧基或修饰可选自由以下组成的组:乙酰化、酰胺化、脂化、甲基化、聚乙二醇化等,包括其组合。在一些实施方案中,多肽可以是环状的,并且/或者可包含环状部分。在一些实施方案中,多肽不是环状的,并且/或者不包含任何环状部分。在一些实施方案中,多肽是线性的。在一些实施方案中,多肽可以是或包含订合多肽(stapled polypeptide)。在一些实施方案中,术语“多肽”可随附于参考多肽、活性或结构的名称;在此类情况下,其在本文中用于指共有相关活性或结构并且因此可以被视为相同的多肽类别或家族的成员的多肽。对于每一个这种类别,本说明书提供并且/或者本领域技术人员将知道其氨基酸序列和/或功能已知的类别中的示例性多肽;在一些实施方案中,此类示例性多肽是多肽类别或家族的参考多肽。在一些实施方案中,多肽类别或家族的成员表现出与该类别的参考多肽,在一些实施方案中与该类别中的所有多肽的显著序列同源性或同一性、与其共有共同序列基序(例如,特征性序列元件),和/或与其共有共同活性(在一些实施方案中,处于可比较的水平下或在指定范围内)。例如,在一些实施方案中,成员多肽表现出至少约30-40%,并且通常大于约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的与参考多肽的总体序列同源性或同一性程度并且/或者包括至少一个表现出通常大于90%或甚至95%、96%、97%、98%或99%的非常高的序列同一性的区域(例如,保守区域,其在一些实施方案中可以是或包含特征性序列元件)。这种保守区域通常涵盖至少3-4个并且通常最多至20或更多个氨基酸;在一些实施方案中,保守区域涵盖具有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个连续氨基酸的至少一个链段。在一些实施方案中,相关多肽可包含亲本多肽的片段或由其组成。在一些实施方案中,可用多肽可包含多个片段或由其组成,与在感兴趣的多肽中的空间布置相比,所述片段中的每一个以相对于彼此的不同空间布置存在于同一亲本多肽中(例如,在亲本中直接连接的片段在感兴趣的多肽中可在空间上分开或反之亦然,并且/或者与在亲本中相比,片段可在感兴趣的多肽中以不同顺序存在),使得感兴趣的多肽是其亲本多肽的衍生物。在一些实施方案中,“多肽”可被称为“蛋白质”(例如,术语“Cas蛋白”可用于指如本文所定义的“Cas多肽”;在一些实施方案中,“Cas12蛋白”可通过考量与如本文所述的适当的参考多肽的同源性或同一性百分比,和/或所共有的特征性序列元件来与例如“Cas13蛋白”区分)。
蛋白质:如本文所用,术语“蛋白质”是指多肽(即,通过肽键彼此连接的至少两个氨基酸的串)。蛋白质可包括除了氨基酸以外的部分(例如,可以是糖蛋白、蛋白聚糖等)并且/或者可另外加工或修饰。本领域普通技术人员将认识到,“蛋白质”可以是如通过细胞产生的完整多肽链(具有或不具有信号序列),或可以是其特征性部分。本领域普通技术人员将认识到,蛋白质可以有时包括例如通过一个或多个二硫键连接或通过其他手段缔合的多于一个多肽链。多肽可包含L-氨基酸、D-氨基酸或两者并且可包含本领域中已知的各种氨基酸修饰或类似物中的任一种。可用的修饰包括,例如,末端乙酰化、酰胺化、甲基化等。在一些实施方案中,蛋白质可包含天然氨基酸、非天然氨基酸、合成氨基酸以及其组合。术语“肽”通常用于指具有少于约100个氨基酸、少于约50个氨基酸、少于20个氨基酸或少于10个氨基酸的长度的多肽。在一些实施方案中,蛋白质是抗体、抗体片段、其生物活性部分和/或其特征性部分。
纯的:如本文所用,如果剂或实体基本上不含其他组分,则其为“纯的”。例如,包含超过约90%的特定剂或实体的制剂通常被视为纯制剂。在一些实施方案中,剂或实体为至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%纯的。
重组:如本文所用,旨在指通过重组手段设计、工程化、制备、表达、产生、制造和/或分离的多肽,诸如使用转染到宿主细胞中的重组表达载体表达的多肽;从重组的组合人类多肽文库分离的多肽;从动物(例如,小鼠、兔、绵羊、鱼等)分离的多肽,对于编码多肽或其一种或多种组分、部分、元件或结构域和/或引导其表达的一种或多种基因或基因组分来说,所述多肽是转基因的或已经以其他方式操纵,以表达所述一种或多种基因或基因组分;和/或通过任何其他手段制备、表达、产生或分离的多肽,所述手段涉及剪接选定的核酸序列元件或将其彼此连接、化学合成选定的序列元件,和/或以其他方式产生编码多肽或其一种或多种组分、部分、元件或结构域并且/或者引导其表达的核酸。在一些实施方案中,此类选定的序列元件中的一个或多个存在于自然界中。在一些实施方案中,此类选定的序列元件中的一个或多个在计算机中设计。在一些实施方案中,一个或多个此类选定的序列元件由例如来自例如像感兴趣的来源有机体(例如,人、小鼠等)的生殖系中的天然或合成来源的已知序列元件的诱变(例如,体内或体外)产生。
参考:如本文所用,描述相对于其进行比较的标准或对照。例如,在一些实施方案中,将感兴趣的剂、动物、个体、群体、样品、序列或值与参考或对照剂、动物、个体、群体、样品、序列或值进行比较。在一些实施方案中,参考或对照基本上与感兴趣的测试或确定同时测试和/或确定。在一些实施方案中,参考或对照是任选地在有形媒体中具体实现的历史参考或对照。通常,如本领域技术人员将理解的,参考或对照在与所评估的参考或对照可比较的条件或情况下确定或表征。本领域技术人员将认识到何时存在足够的相似性以证明对特定的可能参考或对照的依赖和/或与其的比较是合理的。在一些实施方案中,适当的参考Cas蛋白序列可见于文献报道或序列数据库(例如,GENBANK)中。仅给出本领域技术人员已知的几个实例,在一些实施方案中,适当的参考Cas12蛋白或适当的参考Cas13蛋白可以是例如在以下文献中描述的蛋白质中的任一种:Koonin等人,Curr Opin Microbiol.,2017年6月;37:67-78;Makarova等人,Nat Rev Microbiol.,2015年11月;13(11):722-736;Shmakov等人,Mol Cell.,2015年11月5日;60(3):385-397;Yan和Hunnewell等人,Science,2018年12月6日;Yan等人,Mol Cell.,2018年4月19日;70,327-339;Makarova等人,Nat RevMicrobiol.,2011年6月;9(6):467-477;Makarova等人,CRISPR Journal,2018,第1卷,第5期;Shmakov等人,Nat Rev Microbiol.,2017年3月;15(3):169-182;Yan和Hunnewell等人,Science,2019年1月4日;363,88-91;Abudayyeh等人,Science,2016年8月5日;353,6299;Gootenberg和Abudayyeh等人,Science,2017年4月28日,356,438-442;Gootenberg和Abudayyeh等人,Science,2018年4月27日;360,439-444。可替代地,在一些实施方案中,本文所述的例示的Cas蛋白(例如,SEQ ID NO:1-10中的一个)可充当其他蛋白质相对于其进行比较的参考。
样品:如本文所用,术语“样品”通常是指获自或衍生自如本文所述的感兴趣的来源的材料的等分试样。在一些实施方案中,感兴趣的来源是生物或环境来源。在一些实施方案中,感兴趣的来源可以是或包括细胞或有机体,诸如微生物、植物或动物(例如,人)。在一些实施方案中,感兴趣的来源是或包括生物组织或流体。在一些实施方案中,生物组织或流体可以是或包括羊水、房水、腹水、胆汁、骨髓、血液、母乳、脑脊液、耵聍、乳糜、舌苔(chime)、射精、内淋巴、渗出物、粪便、胃酸、胃液、淋巴、粘液、心包液、外淋巴、腹膜液、胸腔积液、脓液、稀粘液(rheum)、唾液、皮脂、精液、血清、包皮垢、痰液、滑液、汗液、泪液、尿液、阴道分泌物、玻璃体液、呕吐物和/或其组合或组分。在一些实施方案中,生物流体可以是或包括细胞内流体、细胞外流体、血管内流体(血浆)、间质液、淋巴液和/或跨细胞液。在一些实施方案中,生物流体可以是或包括植物渗出物。在一些实施方案中,生物组织或样品可通过例如抽吸、活检(例如,细针或组织活检)、拭子(例如,口腔、鼻、皮肤或阴道拭子)、刮擦、手术、洗涤或灌洗(例如,支气管肺泡、导管、鼻、眼、口腔、子宫、阴道或其他洗涤或灌洗)来获得。在一些实施方案中,生物样品是或包括获自个体的细胞。在一些实施方案中,样品是通过任何适当的手段直接获自感兴趣的来源的“原始样品”。在一些实施方案中,如从上下文将清楚的,术语“样品”是指通过处理原始样品(例如,通过移除其中的一种或多种组分和/或向其中添加一种或多种剂)获得的制剂。例如,使用半透膜过滤。这种“经处理的样品”可包含,例如,从样品中提取或通过使原始样品经受诸如核酸的扩增或逆转录、某些组分的分离和/或纯化等的技术获得的核酸或蛋白质。
单核苷酸多态性(SNP):如本文所用,术语“单核苷酸多态性”或“SNP”是指已知替代性碱基将一个等位基因与另一个等位基因区分开的基因组中的特定碱基位置。在一些实施方案中,一个或几个SNP和/或CNP足以将复杂遗传变体彼此区分开,使得出于分析目的,一个或一组SNP和/或CNP可被视为特定的变体、性状、细胞类型、个体、物种等或其集合所特有的。在一些实施方案中,一个或一组SNP和/或CNP可被视为限定特定的变体、性状、细胞类型、个体、物种等或其集合。
受试者:如本文所用,术语“受试者”是指有机体,通常是哺乳动物(例如,人,在一些实施方案中包括产前的人形式)。在一些实施方案中,受试者患有相关疾病、病症或病状。在一些实施方案中,受试者易患疾病、病症或病状。在一些实施方案中,受试者表现出疾病、病症或病状的一种或多种症状或特征。在一些实施方案中,受试者未表现出疾病、病症或病状的任何症状或特征。在一些实施方案中,受试者是具有疾病、病症或病状的易感性或风险所特有的一种或多种特征的人。在一些实施方案中,受试者是患者。在一些实施方案中,受试者是施用和/或已施用诊断和/或疗法的个体。
基本上:如本文所用,术语“基本上”是指表现出感兴趣的特征或特性的完全或接近完全范围或程度的定性条件。生物领域的普通技术人员将理解,生物和化学现象很少(如果有的话)达到完全和/或进行至完全或者实现或避免绝对结果。因此,术语“基本上”在本文中用于捕获在许多生物和化学现象中固有的潜在缺少完全性。
治疗:如本文所用,术语“治疗(treatment)”(以及“治疗(treat)”或“治疗(treating)”)是指施用部分或完全减轻、改善、缓解、抑制特定疾病、病症和/或病状、延迟其发作、降低其严重程度和/或减少其一种或多种症状、特征和/或病因的发生率的疗法。在一些实施方案中,这种治疗可以是未表现出相关疾病、病症和/或病状的迹象的受试者和/或仅表现出疾病、病症和/或病状的早期迹象的受试者的治疗。可替代地或附加地,这种治疗可以是表现出相关疾病、病症和/或病状的一种或多种既定迹象的受试者的治疗。在一些实施方案中,治疗可以是被诊断为患有相关疾病、病症和/或病状的受试者的治疗。在一些实施方案中,治疗可以是已知具有在统计上与发展相关疾病、病症和/或病状的风险增加相关的一种或多种易感性因素的受试者的治疗。因此,在一些实施方案中,治疗可以是预防性的;在一些实施方案中,治疗可以是治疗性的。
肿瘤:如本文所用,术语“肿瘤”是指细胞或组织的异常生长。在一些实施方案中,肿瘤可包括癌症前期(例如,良性)、恶性、转移前、转移性和/或非转移性的细胞。在一些实施方案中,肿瘤与癌症相关,或是癌症的表现。在一些实施方案中,肿瘤可以是分散肿瘤或液体肿瘤。在一些实施方案中,肿瘤可以是实体肿瘤。
载体:如本文所用,是指能够转运其所连接的另一核酸的核酸分子。一种类型的载体是“质粒”,其是指另外的DNA区段可连接至其中的圆形双链DNA环。另一类型的载体是病毒载体,其中另外的DNA区段可连接到病毒基因组中。某些载体能够在引入其的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)可以在引入宿主细胞中后整合到宿主细胞的基因组中,并且由此与宿主基因组一起复制。另外,某些载体能够指导与其可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。标准技术可用于重组DNA、寡核苷酸合成以及组织培养和转化(例如,电穿孔、脂质转染)。酶促反应和纯化技术可根据制造商的说明书或如本领域中通常完成的或如本文所描述的来进行。前述技术和程序通常可根据常规方法进行,所述方法在本领域中是熟知的并且如在整个本说明书中引用和论述的各种一般和更具体的参考文献中描述。参见例如,Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)),其出于任何目的以引用方式并入本文。
某些实施方案的详细描述
CRISPR-Cas技术
通常,Cas蛋白和/或向导是CRISPR-Cas技术的主要组分。CRISPR-Cas技术或CRISPR-Cas系统是在CRISPR相关(“Cas”)基因的表达或其活性的引导中涉及的转录物和其他元件的统称,包括编码Cas基因的序列、tracr(反式活化CRISPR)序列(例如,tracrRNA或具有活性的部分tracrRNA)、tracr配合序列(在内源性CRISPR系统的情形中,涵盖“正向重复序列”和经tracrRNA加工的部分正向重复序列)、向导(在内源性CRISPR系统的情形中,也称为“间隔子”),或如本文所用的术语“RNA”(例如,引导Cas诸如本文公开的Cas蛋白的RNA,例如,CRISPR RNA和反式活化(tracr)RNA或单一向导RNA(sgRNA)(嵌合RNA))或来自CRISPR基因座的其他序列和转录物。通常,CRISPR-Cas技术的特征在于促进在靶核酸位点处形成CRISPR复合物的元件(在内源性CRISPR系统的情形中,也称为原间隔序列(protospacer))。在一些实施方案中,tracrRNA并非必需的。
在本公开的工程化的或非天然存在的技术的一些实施方案中,正向重复序列可涵盖天然存在的序列或非天然存在的序列。在一些实施方案中,正向重复序列(DR)可以是天然存在的长度和/或序列。在一些实施方案中,正向重复序列可以是36个核苷酸(nt)的长度,但是更长或更短的正向重复序列可以变化。例如,在一些实施方案中,正向重复序列可为30nt或更长,诸如30-100nt或更长。例如,正向重复序列可为30nt、40nt、50nt、60nt、70nt、70nt、80nt、90nt、100nt或更长的长度。在一些实施方案中,本公开的正向重复序列可以包括插入天然存在的正向重复序列的5’与3’末端之间的合成核苷酸序列。在某些实施方案中,插入序列可以是自身互补的,例如,20%、30%、40%、50%、60%、70%、80%、90%或100%自身互补的。此外,本公开的正向重复序列可包括核苷酸的插入,诸如适体或与衔接蛋白结合的序列(用于与功能结构域缔合)。在某些实施方案中,包含这种插入的正向重复序列的一个末端大约为短DR的第一半部并且另一末端大约为短DR的第二半部。在一些实施方案中,正向重复序列可在计算机中鉴定。
在一些实施方案中,Cas蛋白是热稳定的Cas蛋白。
在形成CRISPR复合物的情形中,“靶核酸序列”是指包含向导序列的向导与其具有(例如,被设计成具有)互补性的序列,其中靶核酸序列与向导序列之间的杂交促进CRISPR复合物的形成。在一些实施方案中,靶核酸包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶核酸位于细胞的细胞核或细胞质中。在一些实施方案中,靶核酸是离体的。在一些实施方案中,靶核酸存在于体外系统中。在一些实施方案中,靶核酸存在于样品中,例如,在生物样品中或在环境样品中。
在一些实施方案中,向导(例如,恒定结构域和/或间隔子)为约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、100、125、150、160、170、180、190或更多个核苷酸的长度。在一些实施方案中,向导为少于约200、190、180、170、160、150、140、130、120、110、100、90、80、75、50、45、40、35、30、25、20、15、12或更少核苷酸的长度。在一些实施方案中,向导长10-30个核苷酸,诸如长20-30个或20-40个核苷酸或更长,诸如长30个核苷酸或长约30个核苷酸,以有利于CRISPR-Cas效应物。在某些实施方案中,向导长10-30个核苷酸,诸如长20-30个核苷酸,诸如长30个核苷酸。在某些实施方案中,向导长90-200个核苷酸,诸如长100-190个核苷酸,诸如长110-180个核苷酸,诸如长120-170个核苷酸。向导引导CRISPR复合物以序列特异性方式结合靶核酸的能力可通过任何合适的测定来评估。例如,在一些实施方案中,将足以形成CRISPR复合物的CRISPR系统的组分,包括待测试的向导序列,提供给具有对应靶核酸序列的宿主细胞,诸如如在本文其他地方所讨论的,通过用编码CRISPR-Cas技术的组分的载体或载体系统转染,随后评估靶核酸序列内的优先裂解。类似地,在一些实施方案中,例如,通过提供靶核酸、CRISPR复合物的组分,包括待测试的向导序列和不同于测试向导序列的对照向导序列,并且在测试与对照向导序列反应之间对靶核酸序列处的结合或裂解速率进行比较,从而在试管中评估靶核酸的裂解。其他测定是可能的,并且将是本领域技术人员想得到的。
在一些实施方案中,向导序列与其对应靶核酸序列之间的互补性程度可为约或超过约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;在一些实施方案中,向导或RNA或crRNA可为约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸的长度;或在一些实施方案中,向导或RNA或crRNA可为少于约75、50、45、40、35、30、25、20、15、12、或更少核苷酸的长度;并且有利地,tracr RNA为30或50个核苷酸的长度。在一些实施方案中,向导序列与其对应靶核酸序列之间的互补性程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%或100%。在一些实施方案中,脱靶小于靶核酸序列与向导之间的互补性的100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%,有利地,脱靶为靶核酸序列与向导之间的互补性的100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%。
在一些实施方案中,裂解活性(例如,效率)的调节可以通过在向导序列与靶核酸序列之间,包括沿着向导序列/靶核酸序列的错配位置引入错配,例如,1个或更多个错配,诸如1个或2个错配来充分利用。不希望受任何一种理论的束缚,在一些实施方案中,通过选择沿着向导序列的错配位置,可以调节裂解活性(例如,效率)。例如,在一些实施方案中,如果(例如,在细胞群中)期望少于100%的靶标裂解,则可在向导序列中引入向导序列与靶核酸序列之间的1个或更多个,诸如优选2个错配。在一些实施方案中,错配位置沿着向导序列越居中,裂解活性越低(例如,
在一些实施方案中,CRISPR复合物(包含与靶核酸序列杂交并且与一种或多种Cas蛋白复合的向导序列)的形成在靶核酸序列中或附近(例如,距其1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)导致裂解。不希望受任何一种理论的束缚,靶核酸序列中或附近的裂解位点位置可取决于例如二级结构,尤其是在RNA靶标的情况下。在一些情况下,在内源性CRISPR系统的情形中,CRISPR复合物(包含与靶核酸序列杂交并且与一种或多种Cas蛋白复合的向导序列)的形成在靶核酸序列中或附近(例如,距其1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)导致一条或两条链(如果适用的话)的裂解。
热稳定的Cas蛋白
如本文所述,本公开确认了某些Cas蛋白,例如如上所述的具有旁切活性的Cas蛋白的问题根源在于某些此类蛋白活性在高温下不够稳定。例如,当在受益于或需要高温(例如,在进行核酸延伸和/或扩增的温度下)的系统或测定中,和/或在细胞或有机体(例如,仅在高温下存活或茁壮生长的嗜热有机体)中利用Cas蛋白时,上述情况可能特别具有挑战性。另外,本公开进一步令人惊讶地证明,对于一些蛋白质来说,在温度升高时的活性损失可为不可逆的。这一现实增加了本公开提供的见解的意义:具有热稳定活性的Cas蛋白(例如,“热稳定的Cas蛋白”),尤其包括具有热稳定的旁切活性的Cas蛋白,是尤其合乎需要的。
因此,本公开提供了改良的Cas蛋白,并且尤其提供了具有旁切活性的改良的Cas蛋白,并且此外,提供了利用如本文所述的热稳定的Cas蛋白(例如,其旁切活性是热稳定的)的改良技术。
在一些实施方案中,本公开提供了用于结合、检测和/或修饰靶核酸中的核苷酸的非天然存在的或工程化的组合物,其包含如本文所述的热稳定的Cas蛋白(例如,在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白)。在一些此类实施方案中,所提供的组合物包括非天然存在的或工程化的组合物,其包含如本文所述的热稳定的Cas蛋白(例如,在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白)和至少一种能够与热稳定的Cas蛋白形成复合物并且引导复合物与靶核酸结合的向导。在一些实施方案中,所提供的组合物包含Cas蛋白/向导复合物。在一些实施方案中,所提供的组合物包含与靶核酸结合的Cas蛋白/向导复合物。在一些实施方案中,所提供的组合物包含与易于旁切裂解的核酸组合的Cas蛋白;在一些此类实施方案中,此类易感性核酸不包括向导结合位点并且/或者不与确实包括这种向导结合位点的靶核酸连接和/或以其他方式与其缔合。在一些实施方案中,易感性核酸经标记,使得其裂解(例如,通过如本文提供的Cas蛋白的旁切活性)是可检测的(例如,通过释放荧光或可见颜色)。
在一些实施方案中,本公开提供了非天然存在的或工程化的组合物,其包含编码如本文所述的热稳定的Cas蛋白(例如,在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白)的多核苷酸;在一些此类实施方案中,所述组合物可与至少一种能够与Cas蛋白形成复合物并且引导复合物与靶核酸序列结合的向导组合(例如,与其组合使用)。
在一些实施方案中,本文提供的Cas酶(例如,具有热稳定的旁切裂解活性)是不具有可证明的旁切裂解活性,或具有可证明的旁切裂解活性,但是如本文描述,在高于相关温度下丧失这种活性的Cas酶的同源物(例如,直系同源物)。
在一些实施方案中,如本文所述的具有热稳定的旁切裂解活性的Cas酶是Cas12(例如,Cas12a或Cas12b)酶。在一些实施方案中,如本文所述的具有热稳定的旁切裂解活性的Cas酶是包含与SEQ ID No.1-10中的任一个具有80%、85%、90%、99%或100%序列同一性的氨基酸序列的Cas酶。在一些实施方案中,如本文所述的改良的旁切活性测定使用包含与SEQ ID No.1-10中的任一个具有80%、85%、90%、99%或100%序列同一性的氨基酸序列的Cas酶来进行。
密码子优化
不希望受任何一种理论的束缚,一些物种表现出密码子偏性(即,有机体的密码子使用差异),其可以与通过使用mRNA中的密码子翻译mRNA的效率相关,这与特定有机体中所述密码子的tRNA物类的丰度相对应。密码子优化的许多方法在本领域中是已知的。在一些实施方案中,通过计算方法来优化密码子。
在一些实施方案中,密码子优化是指通过相对于适当的参考序列(例如,天然序列),置换至少一个密码子(例如,1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个密码子)来修饰核酸序列以便增强在细胞中的表达。在一些实施方案中,适当的参考序列的密码子用在细胞的基因中更频繁使用或最频繁使用,同时保持由核酸序列编码的天然氨基酸序列的密码子来置换。
在一些实施方案中,编码本公开的Cas蛋白的核苷酸序列是密码子优化的。在一些实施方案中,编码本公开的Cas蛋白的核苷酸序列经密码子优化,以便在真核细胞中表达。在一些此类实施方案中,真核细胞是人细胞。在一些实施方案中,编码本公开的Cas蛋白的核苷酸序列经密码子优化,以便在原核细胞中表达。
修饰实体
在一些实施方案中,本公开的Cas蛋白与一种或多种修饰实体缔合(例如,融合,即,共价连接或非共价结合)为嵌合系统,其可以例如通过化学修饰核苷酸碱基来修饰(例如,编辑)核酸序列(例如,靶核酸序列)和/或核酸(例如,靶核酸)结构。
在一些实施方案中,修饰实体具有碱基编辑活性。在一些实施方案中,修饰实体是脱氨酶。在一些此类实施方案中,修饰实体是胞苷脱氨酶或其功能片段。在一些实施方案中,胞苷脱氨酶或其功能片段与本领域中已知的任何胞苷脱氨酶包含70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%98%、99%或更大的序列(即,核苷酸或氨基酸)同一性。在一些实施方案中,胞苷脱氨酶或其功能片段展示出胞苷脱氨酶活性(例如,将C转化为U)。在一些此类实施方案中,修饰实体是腺苷脱氨酶或其功能片段。在一些实施方案中,腺苷脱氨酶或其功能片段与本领域中已知的任何腺苷脱氨酶包含70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%98%、99%或更大的序列(即,核苷酸或氨基酸)同一性。在一些实施方案中,腺苷脱氨酶或其功能片段展示出腺苷脱氨酶活性(例如,将A转化为I)。
在一些实施方案中,修饰实体以位点特异性方式修饰靶核酸序列。在一些实施方案中,例如,修饰实体活性包括甲基转移酶活性、去甲基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性、去肉豆蔻酰化活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性或核酸酶活性,其中的任一种均可以修饰DNA或DNA相关多肽(例如,组蛋白或DNA结合蛋白)。
在一些实施方案中,本公开的嵌合系统包含一种修饰实体。在一些实施方案中,嵌合系统包含多种修饰实体(例如,至少两种修饰实体)。在一些实施方案中,嵌合系统包含Cas蛋白C末端的修饰实体。在一些实施方案中,嵌合系统包含Cas蛋白N末端的修饰实体。在一些实施方案中,嵌合系统的修饰实体和Cas蛋白直接连接。在一些实施方案中,嵌合系统的修饰实体和Cas蛋白间接连接(例如,通过接头)。
热稳定的Cas蛋白的示例性表征
本公开尤其提供了表征Cas蛋白(例如,本公开的热稳定的Cas蛋白)的方法。在一些实施方案中,针对以下中的一个或多个对Cas蛋白进行表征:顺式(例如,靶核酸)裂解活性、反式或“旁切”(例如,非靶核酸)裂解活性、灵敏度、对RNA和/或DNA靶核酸的偏好、对RNA和/或DNA非靶核酸的偏好,和/或酶稳定性。
在一些实施方案中,Cas蛋白以一种向导为特征。在一些实施方案中,Cas蛋白以多于一种向导(例如,2、3、4、5、6、7、8、9、10、25、50、75、100、250、500、750、1,000或更多种向导序列)为特征。在一些此类实施方案中,多于一种向导包含不同的向导序列。
在一些实施方案中,Cas蛋白在特定温度下进行表征。在一些此类实施方案中,特定温度包括25℃、30℃、35℃、37℃、40℃、42℃、45℃、47℃、50℃、52℃、54℃、55℃、56℃、57℃、58℃、60℃、62℃、65℃、67℃、70℃、72℃、80℃、90℃或100℃。在一些实施方案中,Cas蛋白在一定的温度范围内进行表征。在一些此类实施方案中,温度范围包括10-100℃、20-90℃、30-80℃、40-70℃、50-70℃、10-90℃、10-80℃、10-70℃、20-100℃、20-80℃、20-70℃、30-100℃、30-90℃或30-70℃。在一些实施方案中,Cas蛋白在多个温度下进行表征。在一些此类实施方案中,多个温度包括10-100℃之间的任何温度的任何组合。
顺式裂解活性
在一些实施方案中,针对顺式(例如,靶核酸)裂解活性对如本文所述的热稳定的Cas蛋白进行表征。在一些实施方案中,顺式裂解活性通过体外裂解测定来表征。在一些此类实施方案中,体外裂解测定包括,例如,在宿主细胞中表达Cas蛋白、制备细胞裂解物、制备(例如,扩增)靶核酸(例如,DNA和/或RNA)、将含有Cas的细胞裂解物与靶核酸和向导一起孵育,以及与适当的参考标准相比,评估裂解活性(例如,通过凝胶电泳、报告子)。在一些实施方案中,适当的参考标准是表达不表现出顺式裂解活性的对照蛋白(例如,绿色荧光蛋白)的宿主细胞。
在一些实施方案中,顺式裂解活性通过离体裂解测定来表征。在一些此类实施方案中,离体裂解测定包括,例如,在宿主细胞中表达Cas蛋白和向导、从宿主细胞中提取感兴趣的多核苷酸(例如,DNA和/或RNA),以及测序,以便确定裂解活性(例如,插入、缺失和/或突变模式)。在一些实施方案中,测序包括深度测序。在一些实施方案中,测序包括下一代测序。
在一些实施方案中,顺式裂解活性通过端点测定来表征。在一些实施方案中,顺式裂解活性通过动力学测定来表征。
反式裂解活性
在一些实施方案中,针对反式或“旁切”(例如,非靶核酸)裂解活性对如本文所述的Cas蛋白进行表征。反式或“旁切”活性是Cas蛋白结合靶核酸(例如,为“活化的”Cas蛋白)之后非靶核酸的非特异性裂解活性。在一些实施方案中,在识别靶核酸后,Cas蛋白的反式裂解活性被激活,使得其裂解非靶核酸(DNA或RNA或两者,取决于酶)。在一些实施方案中,反式裂解活性通过报告子来评估。在一些此类实施方案中,报告子包含相关的可裂解核酸(例如,DNA或RNA),其经适当地构造(例如,标记),使得其由于活化的旁切活性而导致的裂解是可检测的(例如,将荧光团与淬灭剂分离,使得荧光变得可检测等)。在一些实施方案中,使用阴性对照(例如,非靶核酸对照)。在一些此类实施方案中,反式裂解活性在体外评估。
在一些实施方案中,反式裂解活性通过端点测定来表征。在一些实施方案中,反式裂解活性通过动力学测定来表征。
灵敏度
在一些实施方案中,针对灵敏度对如本文所述的Cas蛋白进行表征。在一些实施方案中,灵敏度通过评估80%、85%、90%、95%、99%或更多时间可以检测、裂解和/或修饰的靶核酸的最低浓度来评估。在一些此类实施方案中,通过使Cas酶与靶核酸的稀释液(例如,连续稀释液)接触来评估靶核酸的检测、裂解和/或修饰,从而确定灵敏度。
对RNA或DNA靶核酸和/或非靶核酸的偏好
在一些实施方案中,针对RNA或DNA靶核酸(例如,顺式裂解活性)和/或非靶核酸(例如,反式或“旁切”裂解活性)的偏好对如本文所述的Cas蛋白进行表征。
在一些实施方案中,针对RNA或DNA靶核酸(例如,顺式裂解活性)的偏好对如本文所述的Cas蛋白进行表征。在一些此类实施方案中,通过与RNA靶核酸相比,比较使Cas蛋白与DNA靶核酸接触时的裂解活性来评估顺式Cas蛋白活性,从而对偏好进行表征。在一些实施方案中,DNA靶核酸是双链DNA。在一些实施方案中,DNA靶核酸是单链DNA。
在一些实施方案中,针对RNA或DNA非靶核酸(例如,反式或“旁切”裂解活性)的偏好对如本文所述的Cas蛋白进行表征。在一些此类实施方案中,通过与RNA非靶核酸相比,比较使Cas蛋白与DNA非靶核酸接触时的反式裂解活性来评估反式Cas蛋白活性,从而对偏好进行表征。在一些实施方案中,DNA非靶核酸是双链DNA。在一些实施方案中,DNA非靶核酸是单链DNA。在一些实施方案中,非靶核酸包含报告子(例如,报告子,其中裂解将荧光团与淬灭剂分离,使得荧光变得可检测等)。在一些此类实施方案中,报告子是DnaseAlert。在一些此类实施方案中,报告子是RnaseAlert。
酶稳定性
在一些实施方案中,针对酶稳定性对如本文所述的热稳定的Cas蛋白进行表征。在一些此类实施方案中,酶稳定性通过评估酶变性(例如,使用蛋白质解链法)进行表征。在一些实施方案中,评估酶变性包括将Cas蛋白与缓冲液和染料混合并且运行解链曲线。不希望受任何一种理论的束缚,在一些实施方案中,随着温度增加,Cas蛋白解折叠,暴露染料可以结合的疏水性区域。在染料结合后,染料发荧光。在一些此类实施方案中,相对于解链曲线的温度,对随着温度变化的荧光变化作图。在一些实施方案中,可以确定Cas蛋白的解链温度并且与适当的参考标准(例如,具有已知热稳定性的Cas蛋白,例如,Aac和/或RS9)进行比较。在一些此类实施方案中,解链温度的变化与蛋白稳定性(例如,热稳定性)和活性的变化相关。
靶核酸
在一些实施方案中,根据本公开的可用靶核酸不限于特定长度;在一些实施方案中,靶核酸是任何长度的核苷酸(寡核苷酸或多核苷酸),包含与向导序列杂交的序列。在一些实施方案中,靶核酸包含三维结构。在一些实施方案中,靶核酸序列包含编码和/或非编码区域。在一些实施方案中,靶核酸序列包含外显子、内含子、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、核酶、cDNA、质粒、载体、外源性核苷酸序列和/或内源性核苷酸序列。在一些实施方案中,靶核酸序列包含修饰核苷酸,例如,包括甲基化核苷酸或核苷酸类似物。在一些实施方案中,靶核酸序列可穿插有非核酸组分。在一些实施方案中,靶核酸是单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂合体,或包含嘌呤和嘧啶碱基或其他天然、化学或生化修饰的、非天然的或衍生的核苷酸碱基的聚合物。
在一些实施方案中,靶核酸被CRISPR-Cas技术识别并且结合如本文所述的Cas蛋白。在一些实施方案中,由于Cas蛋白结合和活性,靶核酸被修饰或裂解或者由靶核酸编码的基因的表达改变。在一些实施方案中,靶核酸序列包含特异性的、可识别的原间隔序列相邻基序(PAM)。
向导
在本公开的一些实施方案中,CRISPR-Cas技术包含至少一种包含向导序列的向导。在一些实施方案中,向导序列是具有足够互补性的核苷酸序列,使得向导能够与特定的靶核酸杂交。在一些实施方案中,向导包含与靶核酸序列互补的向导序列。在一些实施方案中,向导序列与靶核酸序列50%、60%、70%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多互补。在一些实施方案中,向导序列为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个核苷酸的长度。
在一些实施方案中,本公开的技术利用多种向导。在一些实施方案中,多种向导包括2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、250、500、750、1,000或更多种向导。在一些实施方案中,两种或更多种向导包含相同的向导序列。在一些实施方案中,两种或更多种向导包含不同的向导序列。在一些实施方案中,两种或更多种向导序列与相同靶核酸的不同靶位点杂交。在一些实施方案中,两种或更多种向导序列与不同的靶核酸序列杂交。
在一些实施方案中,向导引导CRISPR-Cas技术与靶核酸序列特异性地结合的能力可通过任何合适的测定来评估。例如,可将足以形成CRISPR复合物的本文公开的CRISPR-Cas技术的组分,包括待测试的向导序列,提供给具有对应(例如互补)靶核酸序列的细胞,诸如通过用编码CRISPR-Cas技术(例如,如在本文其他地方所讨论的)的组分的载体转染,随后表征靶核酸序列内的优先裂解。类似地,例如通过提供靶核酸、CRISPR-Cas技术的组分,包括待测试的向导和包含不同于测试向导序列的向导序列的对照向导,并且在测试与对照向导序列反应之间对靶核酸处的结合或裂解速率进行比较,可在试管中评估靶核酸的裂解。其他测定是可能的,并且将是本领域技术人员想得到的。向导序列可经选择,以靶向任何靶核酸序列。在一些实施方案中,靶核酸序列是细胞的基因组内的核酸序列。示例性靶核酸包括靶基因组中独特的核酸。
在一些实施方案中,组合物包含Cas蛋白和异源向导序列,例如,在自然界中,向导序列和Cas蛋白不存在于相同细胞或相同物种中。
在一些实施方案中,如本文所述的CRISPR-Cas技术使用包含向导序列的crRNA或类似多核苷酸,其中多核苷酸为RNA、DNA或RNA和DNA的混合物,并且/或者其中多核苷酸包含一个或多个核苷酸类似物。在一些此类实施方案中,该序列可以包含任何结构,包括但不限于天然crRNA的结构,诸如隆起、发夹或茎环结构。在一些实施方案中,包含向导序列的多核苷酸与可为RNA或DNA序列的第二多核苷酸序列形成双链体。
在一些实施方案中,本公开的向导包含非天然存在的核酸和/或非天然存在的核苷酸,和/或核苷酸类似物,和/或化学修饰。非天然存在的核酸可以包括,例如,天然和非天然存在的核苷酸的混合物。在一些实施方案中,非天然存在的核苷酸和/或核苷酸类似物在核糖、磷酸盐和/或碱基部分处被修饰。在一些实施方案中,向导包含核糖核苷酸和非核糖核苷酸。在一些此类实施方案中,向导包含一个或多个核糖核苷酸和一个或多个脱氧核糖核苷酸。在一些实施方案中,向导包含一个或多个非天然存在的核苷酸或核苷酸类似物诸如具有硫代磷酸酯键、硼烷磷酸酯(boranophosphate)键联的核苷酸、包含核糖环的2'与4'碳之间的亚甲基桥的锁核酸(LNA)核苷酸,或桥接核酸(BNA)。修饰核苷酸的其他实例包括但不限于2'-0-甲基类似物、2'-脱氧类似物、2-硫尿苷类似物、N6-甲基腺苷类似物或2'-氟类似物。修饰碱基的另外实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷(Y)、Nl-甲基假尿苷(me 1Y)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。向导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-0-甲基(M)、2'-0-甲基3'硫代磷酸酯(MS)、S-受限乙基(cEt)或2'-0-甲基3'硫代PACE(MSP)。在一些实施方案中,与未修饰的向导RNA相比,此类化学修饰的向导RNA可以包含增加的稳定性和增加的活性,然而中靶与脱靶特异性是不可预测的。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日线上发布;Allerson等人,J.Med.Chem.2005,48:901-904;Brams en等人,Front.Genet.,2012,3:154;Deng等人,PNAS,2015,112:11870-11875;Sharma等人,MedChemComm.,2014,5:1454-1471;Li等人,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。
在一些实施方案中,向导的5'和/或3'末端通过各种功能部分进行修饰,包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签。(参见Kelly等人,2016,J.Biotech.233:74-83)。在一些实施方案中,向导在与靶核酸结合的区域中包含核糖核苷酸,并且在与Cas蛋白结合的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在一些实施方案中,脱氧核糖核苷酸和/或核苷酸类似物并入向导序列中,诸如不限于5'和/或3'末端、茎-环区域以及种子区域。在一些实施方案中,修饰不在茎-环区域的5'-柄部中。在一些实施方案中,向导的茎-环区域的5'-柄部中的化学修饰可消除其功能(参见Li等人,Nature BiomedicalEngineering,2017,1:0066)。在一些实施方案中,向导序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸是化学修饰的。在一些实施方案中,向导的3'或5'末端处的3-5个核苷酸是化学修饰的。在一些实施方案中,仅将微小修饰(minor modification)引入种子区域中,诸如2'-F修饰。在一些实施方案中,将2'-F修饰引入向导的3'末端处。在一些实施方案中,向导的5'和/或3'末端处的三至五个核苷酸用T-O-甲基(M)、2'-0-甲基-3'-硫代磷酸酯(MS)、S-受限乙基(cEt)或2'-0-甲基-3'-硫代PACE(MSP)进行化学修饰。在一些实施方案中,此类修饰可以增强基因组编辑效率(参见Hendel等人,Nat.Biotechnol.(2015)33(9):985-989)。在一些实施方案中,向导的所有磷酸二酯键用硫代磷酸酯(PS)取代以便增强基因破坏水平。在一些实施方案中,向导的5'和/或3'末端处的超过五个核苷酸用2'-OMe、2'-F或S-受限乙基(cEt)进行化学修饰。在一些实施方案中,此类化学修饰的向导可以介导增强的基因破坏水平(参见Ragdarm等人,0215,PNAS,E7110-E7111)。在一些实施方案中,向导经修饰,以便在其3'和/或5'末端处包含化学部分。在一些实施方案中,此类部分包括但不限于胺、叠氮化物、炔烃、硫基、二苯并环辛炔(DBCO)或罗丹明(Rhodamine)。在一些实施方案中,化学部分通过接头诸如烷基链缀合至向导序列。在一些实施方案中,经修饰的向导的化学部分可以用于将向导连接至另一个分子,诸如DNA、RNA、蛋白质或纳米颗粒。在一些实施方案中,此类化学修饰的向导可以用于,例如,鉴定或富集通常通过CRISPR系统编辑的细胞(参见Lee等人,eLife,2017,6:e25312,DOI:10.7554)。
在一些实施方案中,向导的修饰是化学修饰、插入、缺失或分裂。在一些实施方案中,化学修饰包括但不限于并入2'-0-甲基(M)类似物、2'-脱氧类似物、2-硫尿苷类似物、N6-甲基腺苷类似物、2'-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷(Y)、Nl-甲基假尿苷(me1Y)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2'-O甲基-3'-硫代磷酸酯(MS)、S-受限乙基(cEt)、硫代磷酸酯(PS)或2'-0-甲基-3'-硫代PACE(MSP)。在一些实施方案中,向导包含一个或多个硫代磷酸酯修饰。在一些实施方案中,向导的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或25个核苷酸是化学修饰的。在一些实施方案中,种子区域中的一个或多个核苷酸是化学修饰的。在一些实施方案中,3'末端中的一个或多个核苷酸是化学修饰的。在一些实施方案中,5'-柄部中没有一个核苷酸是化学修饰的。在一些实施方案中,种子区域中的化学修饰是微小修饰,诸如并入2'-氟类似物。在一些实施方案中,CpflCrRNA的3'末端处的此类化学修饰改良基因切割效率(参见Li,等人,Nature BiomedicalEngineering,2017,1:0066)。
在一些实施方案中,向导的5'-柄部的环是修饰的。在一些实施方案中,向导的5'-柄部的环经修饰,以便具有缺失、插入、分裂或化学修饰。在一些实施方案中,环包含3、4或5个核苷酸。
在一些实施方案中,向导包含通过非磷酸二酯键化学连接或缀合的部分。在一些实施方案中,在非限制性实例中,向导序列包含正向重复序列部分和靶向序列部分,其通过非核苷酸环化学连接或缀合。在一些实施方案中,所述部分通过非磷酸二酯共价接头连接。共价接头的实例包括但不限于选自由以下组成的组的化学部分:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸盐、砜(fulfone)、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键联、形成C-C键的基团诸如Diels-Alder环加成对(cyclo-addition pair)或闭环复分解对(ring-closing metathesispair)以及迈克尔反应对(Michael reaction pair)。
在一些实施方案中,首先使用标准亚磷酰胺合成方案合成向导的部分(Herdewijn,P.编,Methods in Molecular Biology Col 288,OligonucleotideSynthesis:Methods and Applications,Humana Press,New Jersey(2012))。在一些实施方案中,非靶向向导部分可以使用本领域已知的标准方案官能化,以便含有用于连接的适当的官能团(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯羰基、咪唑基羰基、酰肼、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤烷基、磺酰基、烯丙基、炔丙基、二烯、炔烃和叠氮化物。在一些实施方案中,一旦向导的非靶向部分被官能化,就可以在两个寡核苷酸之间形成共价化学键或键联。化学键的实例包括但不限于基于以下的化学键:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸盐、砜、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键联、形成C-C键的基团诸如Diels-Alder环加成对或闭环复分解对以及迈克尔反应对。
在一些实施方案中,向导的一个或多个部分可以化学合成。在一些实施方案中,化学合成使用自动化的固相寡核苷酸合成机与2'-乙酰氧基乙基原酸酯(2'-ACE)(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2'-硫羰氨基甲酸酯(2'-TC)化学(Dellinger等人,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等人,Nat.Biotechnol.(2015)33:985-989)。
在一些实施方案中,向导部分可以使用各种生物缀合反应、环、桥和非核苷酸连结,通过糖、核苷酸间磷酸二酯键、嘌呤和嘧啶残基的修饰来共价连接。Sletten等人,Angew.Chem.Int.Ed.(2009)48:6974-6998;Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke等人,Oligonucleotides(2008)18:305-19;Watts,etak,Drug.Discov.Today(2008)13:842-55;Shukla等人,ChemMedChem(2010)5:328-49。
在一些实施方案中,向导部分可以使用点击化学共价连接。在一些实施方案中,向导部分可以使用三唑接头共价连接。在一些实施方案中,向导部分可以使用Huisgen 1,3-偶极环加成反应共价连接,所述反应涉及炔烃和叠氮化物来产生高度稳定的三唑接头(He等人,ChemBioChem(2015)17:1809-1812;WO 2016/186745)。在一些实施方案中,向导部分通过连接5'-己炔部分和3'-叠氮化物部分来共价连接。在一些实施方案中,5'-己炔向导部分和3'-叠氮化物向导部分中的任一者或两者可以用2'-乙酰氧基乙基原酸酯(2'-ACE)基团保护,其可以随后使用Dharmacon方案移除(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:318)。
在一些实施方案中,向导部分可以通过接头(例如,非核苷酸环)共价连接,所述接头包含诸如间隔物、附接物(attachments)、生物缀合物、发色团、报告基团、染料标记的RNA以及非天然存在的核苷酸类似物的部分。更具体地,用于本发明用途的合适的间隔物包括但不限于聚醚(例如,聚乙二醇、多元醇、聚丙二醇或乙二醇和丙二醇的混合物)、聚胺基团(例如,精胺、亚精胺及其聚合类似物)、聚酯(例如,聚(丙烯酸乙酯))、多聚磷酸二酯、亚烷基以及其组合。在一些实施方案中,合适的附接物包括可以添加至接头以便为接头增添附加特性的任何部分,诸如但不限于荧光标记。合适的生物缀合物包括但不限于肽、糖苷、脂质、胆固醇、磷脂、二酰基甘油和二烷基甘油、脂肪酸、烃、酶底物、类固醇、生物素、地高辛、碳水化合物、多糖。合适的发色团、报告基团和染料标记的RNA包括但不限于荧光染料诸如荧光素和罗丹明、化学发光、电化学发光和生物发光标志物化合物。将两种RNA组分缀合的示例性接头的设计还描述于WO 2004/015075中。
在一些实施方案中,根据本公开的可用接头(例如,非核苷酸环)不限于特定长度;在一些实施方案中,可用接头是任何长度的接头。在一些实施方案中,接头具有等于约0-16个核苷酸的长度。在一些实施方案中,接头具有等于约0-8个核苷酸的长度。在一些实施方案中,接头具有等于约0-4个核苷酸的长度。在一些实施方案中,接头具有等于约2个核苷酸的长度。示例性接头设计还描述于WO2011/008730中。
多重处理(Multiplexing)
在一些实施方案中,本文所述的CRISPR-Cas技术利用多种向导。不希望受任何一种理论的束缚,使用多种向导使得能够靶向多种靶核酸。在一些实施方案中,多种向导串联排列并且可以任选地通过核酸序列(例如,DR序列)分开。在一些实施方案中,串联的多于一种向导的位置不影响活性。
在一些实施方案中,如本文所述的CRISPR-Cas技术利用多种向导进行多重处理。在一些实施方案中,使用多于一种Cas蛋白。在一些实施方案中,使用单一Cas蛋白。在一些此类实施方案中,单一Cas蛋白与多种向导,例如,至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少750、至少1,000或更多种向导一起递送。
在一些实施方案中,向导或多种向导与多种靶核酸杂交。在一些实施方案中,CRISPR-Cas技术裂解和/或编辑多种靶核酸。在一些此类实施方案中,裂解和/或编辑造成靶核酸或多种靶核酸的核苷酸的突变、插入和/或缺失。在一些实施方案中,核苷酸的突变、插入和/或缺失导致由靶核酸编码或通过靶核酸的调控元件控制的基因的基因表达改变。
在一些实施方案中,多种向导序列能够与多种不同的靶核酸或相同靶核酸的不同区域(例如,序列)杂交。在一些实施方案中,使用具有多种如本文所述的向导的CRISPR-Cas技术提供用于改变多种基因产物的表达的方法。在一些实施方案中,所述方法包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与至少一种向导形成复合物并且在至少一种靶核酸中引起断裂。在一些实施方案中,所述方法包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导接触,其中Cas蛋白能够与至少一种向导形成复合物并且编辑至少一种靶核酸序列。
修饰靶核酸序列的方法
在一些实施方案中,本文所述的CRISPR-Cas技术可以用于修饰靶核酸序列(例如,基因编辑)。在一些实施方案中,修饰靶核酸序列可以在通过靶核酸序列调控或编码的基因产物的表达中导致基因沉默或表达水平的改变(例如,增加或减少)。在一些实施方案中,本公开的CRISPR-Cas技术可以用于靶核酸序列的位点特异性修饰。在一些实施方案中,靶核酸序列的位点特异性修饰在通过靶核酸序列调控或编码的基因产物的表达中导致基因沉默或表达水平的改变(例如,增加或减少)。因此,在一些实施方案中,如本文所述的CRISPR-Cas技术用于修饰靶核酸序列的方法中。在一些实施方案中,如本文所述的CRISPR-Cas技术用于修饰细胞(例如,原核或真核细胞)中的靶核酸的方法中。
在一些实施方案中,本公开的方法包括在细胞中诱导一种或多种核苷酸修饰,其包括向细胞递送如在本文其他地方讨论的载体或载体系统。在一些实施方案中,突变包括通过向导、RNA或sgRNA,在细胞的各靶核酸序列处引入、缺失或取代一个或多个核苷酸或有效负载。在一些实施方案中,突变包括通过向导,在所述细胞的各靶核酸序列处引入、缺失或取代1-75个核苷酸。在一些实施方案中,突变包括通过向导,在所述细胞的各靶核酸序列处引入、缺失或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。在一些实施方案中,突变包括通过向导,在所述细胞的各靶核酸序列处引入、缺失或取代5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。在一些实施方案中,突变包括通过向导,在所述细胞的各靶核酸序列处引入、缺失或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。在一些实施方案中,突变包括通过向导,在所述细胞的各靶核酸序列处引入、缺失或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。在一些实施方案中,突变包括通过向导,在所述细胞的各靶核酸序列处引入、缺失或取代40、45、50、75、100、200、300、400或500个核苷酸。
在一些实施方案中,为了使毒性和脱靶效应最小,对所递送的Cas mRNA或蛋白和向导的浓度进行控制。在一些实施方案中,例如,通过在细胞或真核生物动物模型中测试不同浓度并且使用深度测序分析潜在脱靶基因组基因座处的修饰程度,确定Cas mRNA或蛋白和向导的最佳浓度。
在一些实施方案中,本公开的技术提供了一种裂解细胞中的靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与至少一种向导序列形成复合物并且在至少一种靶核酸中引起断裂。
在一些实施方案中,本公开的技术提供了一种改变由细胞中的靶核酸调控或编码的基因的表达的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与至少一种向导序列形成复合物并且在至少一种靶核酸中引起断裂。
在一些实施方案中,本公开的技术提供了一种改变由细胞中的靶核酸调控或编码的基因的表达的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与至少一种向导序列形成复合物并且编辑至少一种靶核酸序列。
在一些实施方案中,本公开的技术提供了一种修饰细胞中的靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与至少一种向导序列形成复合物并且编辑至少一种靶核酸序列。
在一些实施方案中,一种方法包括使CRISPR-Cas技术与靶核酸结合并实现靶核酸的裂解。在一些实施方案中,CRISPR-Cas技术通过引入双链断裂来裂解靶核酸双链体(例如,DNA或RNA双链体)。在一些实施方案中,CRISPR-Cas技术通过引入单链断裂来裂解靶核酸双链体(例如,DNA或RNA双链体)。
在一些实施方案中,本文所述的CRISPR-Cas技术包含外源供体模板核酸(例如,DNA分子或RNA分子),其包含感兴趣的核酸序列(例如供体模板核酸序列)。在一些实施方案中,供体模板核酸序列与其置换的基因组序列不相同。在一些实施方案中,供体模板核酸序列相对于基因组序列可含有至少一个或多个单一碱基变化、插入、缺失、倒置或重排,只要存在支持同源介导修复的足够同源性即可。不希望受任何一种理论的束缚,在通过本文所述的CRISPR-Cas技术诱导的裂解事件消除时,细胞的分子机制在裂解事件的修复和/或消除中将利用外源供体模板核酸。可替代地,细胞的分子机制可以在裂解事件的修复和/或消除中利用内源性供体模板。
在一些实施方案中,供体模板核酸序列与裂解位点处的基因组序列包含足够的同源性,与距裂解位点例如约50个碱基、40个碱基、30个碱基、20个碱基、15个碱基、10个碱基、5个碱基或1个碱基内的侧接裂解位点的核苷酸序列包含例如70%、80%、85%、90%、95%或100%的同源性。不希望受任何一种理论的束缚,与侧接裂解位点的核苷酸序列的同源性支持其与其与之带有同源性的基因组序列之间的同源介导修复。例如,在一些实施方案中,供体与基因组序列之间的大约25、50、100或200个核苷酸,或超过200个核苷酸的序列同源性(或10与200之间的任何整数值,或更多的核苷酸)支持同源介导修复。
在一些实施方案中,根据本公开的可用供体模板核酸不限于特定长度;在一些实施方案中,供体模板核酸是任何长度的核苷酸(寡核苷酸或多核苷酸)。例如,在一些实施方案中,供体模板核酸包含10个核苷酸或更多、25个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1,000个核苷酸或更多、500个核苷酸或更多等。
插入
在一些实施方案中,如本文所述的CRISPR-Cas技术用于通过将一个或多个核苷酸插入靶核酸中来编辑靶核酸序列。在一些实施方案中,插入是无痕插入(例如,预期核酸序列插入靶核酸中在裂解事件消除时不导致另外的非预期核酸序列)。
在一些实施方案中,插入在编码基因产物的靶核酸序列的编码区域内导致移码突变。在一些实施方案中,本文提供的CRISR-Cas技术在靶核酸中导致少于50%、少于40%、少于30%、少于20%、少于19%、少于18%、少于17%、少于16%、少于15%、少于14%、少于13%、少于12%、少于11%、少于10%、少于9%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%、少于1%、少于0.9%、少于0.8%、少于0.7%、少于0.6%、少于0.5%、少于0.4%、少于0.3%、少于0.2%、少于0.1%、少于0.09%、少于0.08%、少于0.07%、少于0.06%、少于0.05%、少于0.04%、少于0.03%、少于0.02%或少于0.01%的插入形成。
在一些实施方案中,为了计算插入频率,针对侧接可发生插入的窗口两侧的两个10bp序列的精确匹配,对测序读段进行扫描。例如,如果未定位精确匹配,则将读段从分析中排除。如果此插入窗口的长度精确地匹配参考序列,则将读段归类为不含插入。如果插入窗口比参考序列长两个或更多个碱基,则将测序读段归类为插入。在一些实施方案中,本文提供的修饰实体可以限制核酸区域中的插入形成。在一些实施方案中,区域处于被修饰实体靶向的核苷酸处或为被修饰实体靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸之内的区域。
在一些实施方案中,在靶核酸处形成的插入的数目可以取决于核酸(例如,细胞的基因组内的靶核酸)暴露于修饰实体的时间量。在一些实施方案中,在靶核酸(例如,细胞的基因组内的核酸)暴露于修饰实体至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天之后确定插入的数目或比例。应了解,如本文所述的修饰实体的特征,在一些实施方案中,可以应用于嵌合系统或使用本文提供的嵌合系统的方法中的任一者。
缺失
在一些实施方案中,如本文所述的CRISPR-Cas技术用于通过使靶核酸的一个或多个核苷酸缺失来编辑靶核酸序列。
在一些实施方案中,缺失在编码基因产物的靶核酸序列的编码区域内导致移码突变。在一些实施方案中,本文提供的CRISPR-Cas技术在靶核酸中导致少于50%、少于40%、少于30%、少于20%、少于19%、少于18%、少于17%、少于16%、少于15%、少于14%、少于13%、少于12%、少于11%、少于10%、少于9%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%、少于1%、少于0.9%、少于0.8%、少于0.7%、少于0.6%、少于0.5%、少于0.4%、少于0.3%、少于0.2%、少于0.1%、少于0.09%、少于0.08%、少于0.07%、少于0.06%、少于0.05%、少于0.04%、少于0.03%、少于0.02%或少于0.01%的缺失形成。
在一些实施方案中,为了计算缺失频率,针对侧接可发生插入的窗口两侧的两个10bp序列的精确匹配,对测序读段进行扫描。例如,如果未定位精确匹配,则将读段从分析中排除。如果此缺失窗口的长度精确地匹配参考序列,则将读段归类为不含插入。如果插入窗口比参考序列短两个或更多个碱基,则将测序读段归类为缺失。在一些实施方案中,本文提供的修饰实体可以限制核酸区域中的缺失形成。在一些实施方案中,区域处于被修饰实体靶向的核苷酸处或为被修饰实体靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸之内的区域。
在一些实施方案中,在靶核酸处形成的缺失的数目可以取决于靶核酸(例如,细胞的基因组内的靶核酸)暴露于修饰实体的时间量。在一些实施方案中,在靶核苷酸序列(例如,细胞的基因组内的核酸)暴露于修饰实体至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天或至少14天之后确定缺失的数目或比例。应了解,如本文所述的修饰实体的特征,在一些实施方案中,可以应用于嵌合系统或使用本文提供的嵌合系统的方法中的任一者。
突变
在一些实施方案中,如本文所述的CRISPR-Cas技术可以用于通过使靶核酸的一个或多个核苷酸突变来编辑靶核酸序列。在一些实施方案中,突变是点突变。在一些实施方案中,突变是沉默突变(例如,相对于相关参考氨基酸序列,突变不导致氨基酸序列的变化)。在一些实施方案中,突变引入非天然存在的终止密码子。在一些实施方案中,突变引入非天然存在的起始密码子。在一些实施方案中,突变移除天然存在的终止密码子。在一些实施方案中,突变移除天然存在的起始密码子。
在一些实施方案中,期望产生和/或使用嵌合系统(例如,包含Cas蛋白和修饰实体,如本文其他地方所描述),其有效地修饰(例如,突变或脱氨基)靶核酸序列内的特定核苷酸,而不在靶核酸序列中产生大量插入或缺失。在一些实施方案中,本文公开的任何嵌合系统能够产生比插入/缺失更大比例的预期修饰(例如,点突变或脱氨基作用)。
在一些实施方案中,本公开的嵌合系统修饰靶核酸中的单一核苷酸。在一些实施方案中,修饰修复和/或校正G-A或C-T点突变、T-C或A-G点突变或致病性单核苷酸多态性。
在一些实施方案中,本文公开的任何嵌合系统能够在靶核酸序列(例如,受试者的基因组内的核酸)中有效地产生预期突变,例如像点突变,而不产生大量非预期突变,诸如非预期点突变。在一些实施方案中,本文提供的任何嵌合系统能够产生至少0.01%的预期突变(即,至少0.01%碱基编辑效率)。在一些实施方案中,本文提供的任何嵌合系统能够产生至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的预期突变。
在一些实施方案中,本文所述的嵌合系统能够产生大于1:1的预期点突变与插入/缺失或非预期点突变的比率。在一些实施方案中,本文提供的碱基编辑器能够产生为至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少8.5:1、至少9:1、至少10:1、至少11:1、至少12:1、至少13:1、至少14:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1或至少1000:1或更大的预期点突变与插入/缺失或非预期点突变的比率。
在一些实施方案中,预期突变和插入/缺失的数目可以使用例如如在以下文献中描述的任何合适的方法来确定:国际PCT申请号PCT/2017/045381(WO2018/027078)和PCT/US2016/058344(WO2017/070632);Komor,A.C.等人,“Programmable editing of a targetbase in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016);Gaudelli,N.M.等人,“Programmable base editing of A·T to G·C ingenomic DNA without DNA cleavage”Nature551,464-471(2017);以及Komor,A.C.等人,“Improved base excisi on repair inhibition and bacteriophage Mu Gam proteinyields C:G-to-T:A base editors with higher efficiency and product purity”Scien ce Advances 3:eaao4774(2017);其全部内容以引用形式据此并入。
基因表达水平的改变
在一些实施方案中,本公开的CRISPR-Cas技术用于改变(例如,增加或减少)通过靶核酸调控或编码的基因产物的基因表达。在一些实施方案中,基因表达水平通过例如基因或启动子插入、缺失、突变、基因表达失活、基因表达活化、酶工程、定向进化、基于知识的设计、随机诱变方法、基因改组和/或密码子优化来改变。
在一些实施方案中,基因表达水平的改变包括靶向于DNA。在一些实施方案中,靶向于DNA包括靶向于调控元件。在一些此类实施方案中,调控元件包括例如启动子、增强子、内部核糖体进入位点(IRES)以及其他表达控制元件(例如,转录终止信号,诸如多聚腺苷酸化信号和poly-U序列)。
在一些实施方案中,基因表达水平的改变包括靶向于RNA。在一些实施方案中,靶向于RNA包括靶向于RNA加工。在一些此类实施方案中,靶向于RNA加工包括靶向于例如RNA剪接(包括选择性剪接)、RNA聚合酶、病毒复制、tRNA生物合成和RNA活化。
有效负载
在一些实施方案中,本公开提供了在靶核酸的位点处靶向插入有效负载核酸的方法。在一些此类实施方案中,所述方法包括使靶核酸与本文所述的技术和有效负载核酸(例如,包含有效负载核酸的供体模板核酸)接触。在一些实施方案中,本公开提供了从靶核酸的位点处靶向切除有效负载核酸的方法,所述方法包括使靶核酸与本文所述的技术接触。
在一些实施方案中,供体模板核酸在载体诸如AAV病毒载体中,或以线性单链或双链DNA片段的形式递送。在一些实施方案中,为了通过同源介导修复(HDR)插入供体模板核酸,供体模板核酸包含待插入感兴趣的基因座中的有效负载核酸以及与侧接期望插入位点的内源性序列同源的侧接序列。在一些实施方案中,为了插入长度小于例如1kb的短有效负载,侧接同源序列可以是短的,例如,15至200个核苷酸范围内的长度。在其他情况下,为了插入例如1kb或更大长度的长有效负载,需要例如长度大于200个核苷酸的长同源侧接序列,以促进有效的HDR。在一些实施方案中,为了在与模板DNA侧接区域同源的序列之间进行HDR而将靶基因组基因座裂解可以显著增加HDR的频率。在一些实施方案中,促进HDR的裂解事件包括但不限于dsDNA裂解、双重切口和单链切口活性。
在一些实施方案中,有效负载核酸不限于特定核酸;在一些实施方案中,有效负载核酸包含任何感兴趣的核酸。在一些实施方案中,例如,有效负载核酸是线性或圆形的。在一些实施方案中,例如,有效负载核酸是质粒、病毒基因组、RNA和/或DNA多核苷酸。在一些实施方案中,有效负载核酸是修饰核酸。在一些实施方案中,供体模板核酸是双链的(例如,DNA或RNA)。在一些实施方案中,供体模板核酸是单链的(例如,DNA或RNA)。设计外源供体模板核酸的方法描述于例如WO2016094874中,其全部内容明确地以引用方式并入本文。在一些实施方案中,有效负载核酸是可用于治疗、预防和或诊断病症和/或疾病的核酸。
载体系统和载体
在一些实施方案中,本公开的CRISPR-Cas技术包括用于递送和/或表达Cas蛋白、嵌合系统、向导和/或供体模板核酸的系统。在一些实施方案中,系统包含载体和/或载体系统。递送向导和供体模板核酸的方法以及用于外源表达蛋白质和多肽的方法是本领域中熟知的并且技术人员将认识到,可以成功利用各种技术。
编码Cas蛋白和/或嵌合系统或提供本公开的向导或供体模板核酸的重组多核苷酸(例如,DNA或RNA)可通过各种可获得的方法制备。例如,期望序列可使用限制酶从DNA中切除,可使用例如聚合酶链反应由质粒或基因组多核苷酸序列扩增,或可使用化学合成技术合成。在一些实施方案中,利用已知方法的组合制备重组多核苷酸。
在一些实施方案中,将编码本公开的Cas蛋白和/或嵌合系统的重组多核苷酸克隆到能够表达Cas蛋白和/或嵌合系统的载体中。在一些实施方案中,将提供本公开的向导或供体模板核酸的重组多核苷酸克隆到载体中。克隆可根据各种可获得的方法(例如,Gibson组装、限制消化和连接等)进行。在一些实施方案中,载体是病毒载体。在一些实施方案中,载体是非病毒载体。在一些实施方案中,载体是质粒。
在一些实施方案中,能够表达的载体包含编码本公开的Cas蛋白和/或嵌合系统的重组多核苷酸,其可操作地连接至控制表达的一个或多个序列(例如,启动子、起始信号、终止信号、多聚腺苷酸化信号、活化剂、抑制剂等)。在一些实施方案中,控制表达的一个或多个序列经选择,以实现期望的表达水平。在一些实施方案中,利用多于一个控制表达的序列(例如,启动子)。在一些实施方案中,利用多于一个控制表达的序列(例如,启动子)来实现编码多种蛋白质和/或多肽的多种重组多核苷酸的期望表达水平。在一些实施方案中,多种重组蛋白和/或多肽由同一载体(例如,双顺反子载体、三顺反子载体、多顺反子)表达。在一些实施方案中,表达多种重组多肽,其中的每一种由单独载体表达。
在一些实施方案中,包含编码本公开的Cas蛋白和/或嵌合系统的重组多核苷酸的载体用于通过体外蛋白质合成来表达Cas蛋白和/或嵌合系统。
在一些实施方案中,包含编码本公开的Cas蛋白或嵌合系统的重组多核苷酸的能够表达的载体用于在宿主细胞中表达Cas蛋白或嵌合系统。在一些实施方案中,能够提供本公开的向导和/或供体模板核酸的载体用于将向导和/或供体模板核酸提供给宿主细胞。宿主细胞可选自各种适合表达本文公开的CRISPR-Cas技术的可获得且已知的宿主细胞(例如,人胚胎肾(HEK)细胞、悬浮HEK293细胞、中国仓鼠卵巢细胞)。
将载体引入宿主细胞中的各种方法是本领域中已知的。在一些实施方案中,可使用转染将载体引入宿主细胞中。在一些实施方案中,转染例如使用磷酸钙转染、脂质转染或聚乙烯亚胺介导的转染来完成。在一些实施方案中,可使用转导将载体引入宿主细胞中。
在一些实施方案中,在将载体引入宿主细胞中之后,对转化的宿主细胞进行培养,以允许所述重组多核苷酸的表达。在一些实施方案中,转化的宿主细胞培养至少12小时、16小时、20小时、24小时、28小时、32小时、36小时40小时、44小时、48小时、52小时、56小时、60小时、64小时、68小时、72小时或更长时间。转化的宿主细胞在根据选定的宿主细胞的需要的生长条件(例如,温度、二氧化碳水平、生长培养基)下培养。技术人员将认识到,选定的宿主细胞的培养条件是本领域中熟知的。
用途
如本文所述的CRISPR-Cas技术具有广泛多种用途,包括例如修饰(例如,缺失、插入、突变、易位、失活或活化)多种细胞类型和组织中的靶核酸序列和例如在基于特异性高灵敏度酶促报告解锁(specific high sensitivity enzymatic reporter unlocking,SHERLOCK)的测定中检测靶核酸(例如,DNA和/或RNA)。在一些实施方案中,本文所述的热稳定的Cas蛋白尤其可用于嗜热有机体中的靶核酸的基因编辑和/或检测。另外的应用包括但不限于追踪和标记核酸、富集测定(例如,从样品中提取期望序列)、检测循环肿瘤DNA、制备下一代文库、筛选药物、诊断和提供疾病和病症的预测、治疗各种遗传疾病或病症以及治疗各种非遗传疾病或病症,或通过操纵基因组来加强身体健康。
基因编辑
在一些实施方案中,使用本文所述的CRISPR-Cas技术进行基因编辑。在一些实施方案中,基因编辑导致基因沉默事件,或在期望靶基因的表达中导致表达的改变(例如,增加或减少)。因此,在一些实施方案中,本文所述的CRISPR-Cas技术用于改变通过靶核酸调控或编码的基因产物的表达水平的方法中。在一些实施方案中,本文所述的CRISPR-Cas技术用于修饰期望细胞中的靶核酸的方法中。在一些实施方案中,本文公开的技术提供了用于对细胞(例如,真核或原核)中的靶核酸进行位点特异性修饰的方法,以便实现所表达的基因产物的基因表达或功能的期望改变。
在一些实施方案中,本公开提供了工程化的非天然存在的CRISPR-Cas技术,其包含:在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和至少一种能够与热稳定的Cas蛋白形成复合物并且引导复合物与至少一种靶核酸结合的向导序列。
在一些实施方案中,本公开提供了裂解细胞中的至少一种靶核酸的方法,其包括:使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与至少一种向导序列形成复合物并且在至少一种靶核酸中引起断裂。
在一些实施方案中,本公开提供了改变细胞中的至少一种靶核酸的表达的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与向导序列形成复合物并且编辑至少一种靶核酸序列。
在一些实施方案中,本公开提供了修饰细胞中的至少一种靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导序列接触,其中Cas蛋白能够与向导序列形成复合物并且编辑至少一种靶核酸序列。
在一些实施方案中,本公开提供了改变细胞中的至少一种靶核酸的表达的方法,其包括:使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与至少一种靶核酸杂交的向导接触,其中Cas蛋白能够与至少一种向导形成复合物并且编辑至少一种靶核酸序列。
因此,在一些实施方案中,Cas蛋白与SEQ ID NO:1-10中的任一个具有约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性。在一些实施方案中,Cas蛋白与SEQ ID NO:1相同。在一些实施方案中,Cas蛋白与SEQ ID NO:2相同。
在一些实施方案中,本公开的方法包括使本公开的CRISPR-Cas系统与至少一种靶核酸接触并且实现至少一种靶核酸的裂解。在一些实施方案中,CRISPR-Cas技术通过引入双链断裂来裂解靶DNA或RNA双链体。在一些实施方案中,CRISPR-Cas技术通过引入单链断裂或切口来裂解靶DNA或RNA。
在一些实施方案中,CRISPR-Cas技术包含具有以位点特异性方式修饰靶DNA的修饰实体的嵌合系统,其中修饰活性包括甲基转移酶活性、去甲基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰化活性、去肉豆蔻酰化活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性或核酸酶活性,其中的任一种均可以修饰DNA或DNA相关多肽(例如,组蛋白或DNA结合蛋白)。
在一些实施方案中,CRISPR-Cas技术包含嵌合系统,所述系统包含可以通过对核苷酸碱基进行化学修饰来编辑DNA序列的一种或多种修饰实体,包括可以修饰腺苷或胞嘧啶碱基并且充当位点特异性修饰实体的脱氨酶。各种修饰实体是本领域中已知的并且可以用于本文所述的方法和系统中。整个本公开中的示例性修饰实体描述于例如Rees和LiuNature Review Genetics,2018,19(12):770-788中,其内容以引用方式并入本文。
在一些实施方案中,修饰实体活性导致引入一个或多个终止密码子,以便例如使一种或多种基因沉默。在一些实施方案中,修饰实体活性导致移除一个或多个终止密码子。在一些实施方案中,修饰实体活性导致引入一个或多个起始密码子。在一些实施方案中,修饰实体活性导致移除一个或多个起始密码子,以便例如使一种或多种基因沉默。在一些实施方案中,修饰实体通过改变氨基酸序列来导致蛋白质功能改变。
在一些实施方案中,本公开的Cas蛋白通过与组蛋白融合来表观遗传性地修饰靶核酸。在一些实施方案中,Cas蛋白通过与表观遗传修饰酶诸如读取、写入或擦除蛋白融合来表观遗传性地修饰靶核酸。在一些实施方案中,Cas蛋白与组蛋白修饰酶融合,以改变靶核酸的选定区域中的组蛋白修饰模式。组蛋白修饰可以许多不同的方式发生,包括例如甲基化、乙酰化、泛素化、磷酸化以及许多不同的组合,从而导致DNA的结构变化。在一些实施方案中,组蛋白修饰导致转录抑制或活化。
在一些实施方案中,本公开的Cas蛋白通过与转录活化蛋白、转录抑制蛋白、小分子/药物反应转录调控剂或可诱导的转录调控剂融合来增加或减少转录,从而调节靶核酸的转录。在一些实施方案中,CRISPR-Cas技术用于控制靶标编码mRNA(即,蛋白编码基因)的表达,其中结合导致基因表达增加或减少。
在一些实施方案中,CRISPR-Cas技术用于通过编辑遗传调控元件诸如启动子或增强子来控制基因调控。
在一些实施方案中,CRISPR-Cas技术用于控制靶标非编码RNA(包括tRNA、rRNA、snoRNA、siRNA、miRNA和长ncRNA)的表达。
在一些实施方案中,CRISPR-Cas技术用于染色质环结构的靶向工程化。不希望受任何一种理论的束缚,调控基因组区域之间的染色质环的靶向工程化提供了用于操纵内源性染色质结构并且使得能够形成新的增强子-启动子连接以便克服遗传缺陷或抑制异常增强子-启动子连接的手段。
在一些实施方案中,CRISPR-Cas技术用于活细胞成像。例如,在一些实施方案中,使荧光标记的Cas蛋白靶向至重复基因组区域诸如着丝粒和端粒,以便在整个细胞周期中追踪天然染色质基因座并确定3D核空间中的转录活性和非转录活性区域的差异定位。
治疗方法
如本领域技术人员将容易地了解的,在一些实施方案中,本文所述的CRISPR-Cas技术可用于各种治疗应用中的一种或多种中。因此,在一些实施方案中,提供了一种治疗有需要的受试者的病症或疾病的方法。在一些此类实施方案中,所述方法包括向受试者施用在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与靶核酸杂交的向导序列。
在一些实施方案中,本文公开的CRISPR-Cas技术可以用于编辑靶核酸序列,以修饰靶核酸(例如,通过插入、缺失一个或多个核苷酸或使其突变)。例如,在一些实施方案中,本文所述的CRISPR-Cas技术包含外源供体模板核酸(例如,DNA分子或RNA分子),其包含期望核酸序列(例如,有效负载核酸)。不希望受任何一种理论的束缚,在用本文所述的CRISPR-Cas技术诱导的裂解事件消除时,细胞的分子机器可以在裂解事件的修复和/或消除中利用外源供体模板核酸。可替代地或附加地,在一些实施方案中,细胞的分子机器可以在裂解事件的修复和/或消除中利用内源性模板。在一些实施方案中,使用本文所述的CRISPR-Cas技术修饰靶核酸,从而产生插入、缺失和/或点突变。在一些此类实施方案中,插入是无痕插入(即,将预期核酸序列插入靶核酸中在裂解事件消除时不产生另外的非预期核酸序列)。
在一些实施方案中,本文公开的CRISPR-Cas技术用于治疗各种疾病和病症,例如,遗传病症、单基因疾病、可以通过核酸酶活性治疗的疾病、各种癌症等。在一些实施方案中,本文所述的方法用于治疗受试者,例如,哺乳动物,诸如人患者。在一些实施方案中,哺乳动物受试者还可以是驯化哺乳动物,诸如但不限于犬、猫、马、猴、兔、大鼠、小鼠、奶牛、山羊或绵羊。
在一些实施方案中,本文公开的CRISPR-Cas技术用于通过插入有益临床变体或抑制性突变来校正致病性突变。
在一些实施方案中,本文公开的CRISPR-Cas技术用于治疗由RNA、毒性RNA和/或突变RNA(例如,剪接缺陷物或截短物)的过表达引起的疾病。
在一些实施方案中,本文公开的CRISPR-Cas技术靶向引起各种疾病的影响RNA依赖性功能的反式作用突变。
在一些实施方案中,本文公开的CRISPR-Cas技术用于靶向可导致剪接缺陷和疾病的破坏顺式作用剪接密码的突变。
在一些实施方案中,本文公开的CRISPR-Cas技术可用于尤其针对RNA病毒的抗病毒活性。在一些实施方案中,RNA病毒是例如沙粒病毒科(Arenaviridae)、动脉病毒科(Arteriviridae)、星状病毒科(Ast roviridae)、双核糖核酸病毒科(Birnaviridae)、玻那病毒科(Bornavirid ae)、布尼亚病毒科(Bunyaviridae)、杯状病毒科(Caliciviridae)、冠状病毒科(Coronaviridae)、黄病毒科(Flaviviridae)、丝状病毒科(Filoviri dae)、肝炎病毒科(Hepeviridae)、诺达病毒科(Nodaviridae)、线头病毒科(Nymaviridae)、正粘病毒科(Orthmyxoviridae)、副粘病毒科(Paramy xoviridae)、小双节核糖核酸病毒科(Picobirnaviridae)、小核糖核酸病毒科(Picornaviridae)、肺病毒科(Pneumoviridae)、呼肠孤病毒科(Reov iridae)、弹状病毒科(Rhabdoviridae)或披膜病毒科(Togaviridae)的病毒。在一些实施方案中,Cas蛋白使用经选择靶向病毒RNA序列的合适的RNA向导来靶向病毒RNA。
在一些实施方案中,本文公开的CRISPR-Cas技术用于治疗受试者(例如,哺乳动物受试者,例如,人受试者)的癌症。例如,在一些实施方案中,本文所述的Cas蛋白被编程为具有靶向异常的(例如,包含点突变或被选择性剪接)且存在于癌细胞中的RNA分子的向导,以便诱导癌细胞的细胞死亡(例如,通过细胞凋亡)。
此外,在一些实施方案中,本文所述的CRISPR-Cas技术用于治疗受试者的感染性疾病。例如,在一些实施方案中,本文所述的Cas蛋白被编程为具有靶向由感染原(例如,细菌、病毒、寄生虫或原虫)表达的RNA分子的向导序列,以便靶向并诱导感染原细胞的细胞死亡。在一些实施方案中,本文公开的CRISPR-Cas技术治疗细胞内感染原感染宿主受试者的细胞的疾病。在一些实施方案中,通过将Cas蛋白编程为靶向由感染原基因编码的RNA分子,被感染原感染的细胞被靶向并且诱导细胞死亡。
在一些实施方案中,本文公开的CRISPR-Cas技术可用于产生供治疗性递送的细胞。在一些实施方案中,CRISPR-Cas技术可用于产生,例如,嵌合抗原受体(CAR)T细胞、体细胞(例如,造血干细胞(HSC)、间质干细胞(MSC))以及永生细胞系(例如,神经干细胞系CTX)。在一些此类实施方案中,将通过CRISPR-Cas技术产生的细胞施用于受试者(例如,以治疗病症和/或疾病)。
在一些实施方案中,本文提供了组合物、药物组合物、载体、宿主细胞以及试剂盒,其包含本文所述的工程化系统的蛋白质和/或多核苷酸中的任一种。
旁切活性测定
本领域技术人员将立即认识到,本文提供的技术广泛地适用于实现广泛范围的核酸的检测,包括例如来自感染原(例如,病毒、微生物、寄生虫等)的核酸、指示特定生理状态或状况(例如,疾病、病症或病状例如像癌症或炎症性或代谢性疾病、病症或病状的存在或状态等)的核酸、产前核酸等。
在一些实施方案中,通过包括如本文所述的Cas酶和向导的测定检测靶核酸。在一些实施方案中,向导的结构可以影响Cas蛋白/向导复合物的活性。在一些实施方案中,Cas蛋白/向导复合物的结构有助于Cas旁切活性的热稳定性。
本领域技术人员非常清楚已经和正在开发的使用Cas蛋白旁切活性的有用检测(例如,诊断)测定的大量涌现。参见例如,Sashital Genome Med 2018:10,32。此外,本领域技术人员非常清楚基于Cas蛋白旁切活性的“CRISPR/Cas生物感测系统的详细分类”最近变得可公开获得。参见Li等人Trends Biotechnol.37:730,July 2019的综述。
特别受到关注的格式包括基于Cas13(例如,基于Cas13a或Cas13b)的系统,包括被称为“SHERLOCK”和/或“HUDSON”系统的那些(参见,例如,Gootenberg等人,Science 356:438,2017;Gootenberg等人,Science360:339,2018;Myhrvold等人,Science 360:444,2018;另外参见US10266887)和基于Cas12(例如,基于Cas12a或Cas12b)的系统,包括被称为“HOLMES”或“DETECTR”系统的那些(参见,例如,Cheng等人CN专利文件CN107488710A;PCT/CN18/82769和US16/631,157;Li等人Cell Disc.4:20,2018;Chen等人Science 360:436,2018;Li,L.等人2018年7月26日bioRxiv线上发布http://dx.doi.org/10.1101/362889;US10253365)。Cas13a和Cas13b酶已被用于SHERLOCK和/或HUDSON系统中;Cas 12a和Cas12b均类似。
如在本领域中已知,并且在本文引用的参考文献中所描述的,利用Cas蛋白旁切裂解活性的典型检测测定包括使包括具有旁切活性的Cas蛋白和与感兴趣的靶核酸序列互补的向导的适当的CRISPR-Cas复合物与可能含有靶核酸的样品接触。在识别靶核酸序列后,Cas蛋白的旁切活性被激活,使得其裂解无关核酸(DNA或RNA或两者,取决于酶)。提供相关可裂解核酸的报告子,其经适当地构造(例如,标记),使得其由于活化的旁切活性而导致的裂解是可检测的(例如,将荧光团与淬灭剂分离,使得荧光变得可检测等)。
在许多测定中,产生和/或扩增靶核酸序列(例如,从RNA复制至DNA和/或例如通过引物延伸、DNA复制(例如,通过聚合酶链反应)和/或转录来扩增)。参见例如,上述Li综述(Li等人Trends Biotechnol.37:730,2019年7月)的图3和4。
因此,在许多实施方案中,旁切活性测定包括以下步骤(1)靶核酸复制和/或扩增;(2)靶核酸结合;以及(3)信号释放和/或检测。
通常,将所提供的技术应用于一种或多种样品以评估样品中一种或多种靶核酸的存在和/或水平。在一些实施方案中,样品是生物样品;在一些实施方案中,样品是环境样品。在一些实施方案中,样品是粗样品(例如,原始样品或经历最少处理的样品)。
在一些实施方案中,将对样品进行以下处理(例如,将把核酸部分地或基本上从原始样品中分离或纯化);在一些实施方案中,将仅进行最少处理(即,样品将是粗样品)。
通常,如本文所述的旁切活性测定是体外测定。在一些实施方案中,所述测定可以是无细胞测定(例如,可基本上不含完整细胞,或在一些实施方案中,不含细胞碎片)。
在一些实施方案中,对样品进行如本文所述的旁切活性测定,所述样品是生物(例如,血液、唾液、泪液、尿液等)或环境(例如,土壤、水等)原始样品或由其制备。
在一些实施方案中,核酸检测和靶标结合步骤在单一容器中进行;在一些实施方案中,靶标结合和信号释放步骤在单一容器中进行;在一些实施方案中,(1)靶标复制和/或扩增;(2)靶标结合;以及(3)信号释放和/或检测的步骤在单一容器中进行;在一些实施方案中,所有步骤在单一容器中进行——即,所提供的改良测定是一锅测定。
在一些实施方案中,如本文所述的改良的旁切活性测定是体外测定。在一些实施方案中,所述测定可以是无细胞测定(例如,可基本上不含完整细胞,或在一些实施方案中,不含细胞碎片)。
在一些实施方案中,对样品进行如本文所述的改良的旁切活性测定,所述样品是生物(例如,血液、唾液、泪液、尿液等)或环境(例如,土壤、水等)原始样品或由其制备。
药物组合物
在一些实施方案中,本公开尤其提供了包含本公开的CRISPR-Cas技术的药物组合物。在一些实施方案中,药物组合物包含在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与热稳定的Cas蛋白形成复合物并且引导复合物与至少一种靶核酸结合的向导序列。在一些实施方案中,药物组合物还包含供体模板核酸。
在一些实施方案中,药物组合物包含可以表达和/或提供本公开的CRISPR-Cas技术的载体或载体系统。
在一些实施方案中,通过与适当的药学上可接受的载剂或稀释剂组合,将本公开的CRISPR-Cas技术配制成药物组合物。
在一些实施方案中,本公开的CRISPR-Cas技术在药学上可接受的媒介物中配制成药物组合物。在一些此类实施方案中,例如,药学上可接受的媒介物可以是监管机构批准的媒介物。
在一些实施方案中,媒介物是指与本发明的化合物一起配制以便施用于受试者的稀释剂、佐剂、赋形剂或载剂。在一些此类实施方案中,药物媒介物可以是脂质,例如,脂质体,例如,脂质体树状聚合物;液体,诸如水和油,包括石油、动物、植物或合成来源的油,诸如花生油、大豆油、矿物油、芝麻油等;盐水;阿拉伯树胶、明胶、淀粉糊、滑石、角蛋白、胶体二氧化硅、尿素等。在一些实施方案中,使用辅助剂、稳定剂、增稠剂、润滑剂和着色剂。在一些实施方案中,将药物组合物配制成固体、半固体、液体或气体形式的制剂,诸如片剂、胶囊剂、散剂、颗粒剂、软膏、溶液、栓剂、注射剂、吸入剂、凝胶剂、微球和气雾剂。
在一些实施方案中,本文所述的CRISPR-Cas技术的施用可以不同方式实现。在一些实施方案中,施用包括经口、经颊、直肠、肠胃外、腹膜内、皮内、透皮、气管内、眼内等施用。在一些实施方案中,CRISPR-Cas技术可在施用之后是全身性的或可通过使用区域性施用、壁内施用或使用用于将活性剂量保持在植入位点处的植入物而是局部性的。在一些实施方案中,CRISPR-Cas技术被配制用于实现即刻活性或可被配制用于持续释放。
在一些实施方案中,治疗方法包括治疗中枢神经系统的疾病或病症。在一些此类实施方案中,可能需要将CRISPR-Cas技术配制成横跨血脑屏障(BBB)的药物组合物。例如,在一些实施方案中,通过诸如甘露醇或白细胞三烯的渗透手段或通过使用血管活性物质诸如缓激肽在生化上穿过血脑屏障(BBB)的药物递送必然伴有BBB的破坏。在一些实施方案中,使用BBB开口将CRISPR-Cas技术靶向递送至大脑。在一些实施方案中,当组合物通过血管内注射来施用时,BBB破坏剂与本发明的治疗性组合物共同施用。在一些实施方案中,使用横跨BBB的其他策略,例如,使用内源性转运系统,包括小窝蛋白-1介导的转胞吞作用、载体介导的转运蛋白诸如葡萄糖和氨基酸载体、胰岛素或转铁蛋白的受体介导的转胞吞作用以及活性流出物转运蛋白诸如p-糖蛋白。
在一些实施方案中,CRISPR-Cas技术通过局部递送,例如,通过鞘内递送来递送至BBB后面。
在一些实施方案中,提供了有效量的包含CRISPR-Cas技术的制剂。在一些实施方案中,待施用的如本文所述的药物组合物的有效量或有效剂量的计算在本领域普通技术人员的技能范围内,并且对于本领域技术人员来说将是例行程序。在一些此类实施方案中,待施用的最终量将取决于施用途径和待治疗的病症或病状的性质。
在一些实施方案中,给予特定患者的有效量将取决于多种因素,其中的若干因素在各患者之间是不同的。有能力的临床医生将能够根据需要来确定施用于患者以停止或逆转疾病病状进展的药物组合物的有效量。例如,在一些实施方案中,使用LD50动物数据和剂可利用的其他信息,临床医生可以根据施用途径确定个体的最大安全剂量。在一些实施方案中,例如,鉴于将治疗性组合物施用到其中的流体主体更大,静脉内施用剂量可超过鞘内施用剂量。在一些实施方案中,药物组合物以更高剂量或以重复剂量施用,以便保持治疗浓度。使用普通技能,有能力的临床医生将能够在常规临床试验的过程中优化特定药物组合物的剂量。
在一些实施方案中,取决于期望的制剂,药物组合物包含药学上可接受的无毒载剂或稀释剂,其定义为常用于配制药物组合物以供动物或人施用的媒介物。在一些实施方案中,稀释剂经选择,以便不影响组合的生物活性。在一些此类实施方案中,例如,稀释剂是蒸馏水、缓冲水、生理盐水、PBS、林格氏溶液、葡萄糖溶液和汉克溶液(Hank'ssolution)。在一些实施方案中,药物组合物包含其他载剂、佐剂,或无毒的、非治疗性的、非免疫原性的稳定剂、赋形剂等。在一些实施方案中,药物组合物包含模拟生理条件的附加物质,诸如pH调整和缓冲剂、毒性调整剂、湿润剂和洗涤剂。
在一些实施方案中,药物组合物包含多种稳定剂中的任一种,诸如抗氧化剂。在一些实施方案中,其中药物组合物包含多肽,多肽与各种熟知化合物复合,所述化合物增强多肽的体内稳定性,或以其他方式增强其药理学特性(例如,相对于适当的参考标准,增加多肽的半衰期、减少其毒性以及增强溶解性或吸收)。不受限制地,此类修饰或复合剂的实例包括硫酸盐、葡糖酸盐、柠檬酸盐和磷酸盐。在一些实施方案中,包含组合物的核酸或多肽的药物组合物可以与相对于适当的参考标准,增强其体内属性的分子复合。此类分子包括例如碳水化合物、聚胺、氨基酸、其他肽、离子(例如,钠、钾、钙、镁、锰)和脂质。
在一些实施方案中,用于配制高纯度的药物组合物的组分基本上不含潜在有害的污染物(例如,至少国家食品(NF)级,通常至少分析级,并且更通常至少医药级)。在一些实施方案中,预期用于体内使用的组合物是无菌的。在一些实施方案中,只要给定的药物组合物必须在使用之前合成,所得产物通常基本上不含在合成或纯化过程期间可能存在的任何潜在毒性剂,尤其是任何内毒素。
在一些实施方案中,施用药物组合物以用于预防性和/或治疗性治疗。在一些实施方案中,药物组合物的毒性和治疗功效根据标准制药程序,诸如在细胞培养物和/或实验动物中确定,包括例如确定LD50(对于50%群体致死的剂量)和/或ED50(在50%群体中治疗有效的剂量)。
试剂盒
在另一方面,本公开提供了包含以上组合物和方法中公开的任何一种或多种元件的试剂盒。在一些实施方案中,试剂盒包含如本文所述的载体和/或载体系统。在一些实施方案中,试剂盒包括如本文所述的CRISPR-Cas技术的一种或多种组分,诸如Cas蛋白、向导、供体模板核酸和/或编码或提供所述组分的多核苷酸、载体和/或载体系统(例如,DNA或RNA)。在一些实施方案中,试剂盒包括使用试剂盒的一种或多种语言的说明书。在一些此类实施方案中,说明书针对本文所述的特定应用和/或方法。元件可个别地或组合提供。试剂盒可提供于任何合适的容器中。在一些实施方案中,合适的容器是例如小瓶、瓶子或管。
在一些实施方案中,试剂盒包括在使用本文所述的一种或多种元件的过程中使用的一种或多种试剂。试剂可提供于任何合适的容器中。例如,在一些实施方案中,试剂盒提供一种或多种反应或储存缓冲液。试剂可以在特定测定中可用的形式,或以需要在使用之前添加一种或多种其他组分的形式(例如,以浓缩物或冻干形式)提供。在一些实施方案中,缓冲液不限于特定缓冲液;在一些实施方案中,缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液以及其组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液具有约7至约10的pH。在一些实施方案中,试剂盒包括一种或多种与向导序列相对应的寡核苷酸,用于插入载体中以便将向导序列与调控元件可操作地连接。在一些实施方案中,试剂盒包括同源重组模板多核苷酸。在一些实施方案中,试剂盒包括一种或多种载体和/或一种或多种本文所述的多核苷酸。试剂盒可有利地允许提供本发明的系统的所有元件。
实施例
实施例1:示例性的热稳定Cas蛋白候选物
本实施例描述某些热稳定的Cas蛋白候选物。
表1:热稳定的Cas蛋白的示例性序列。
实施例2:另外的候选热稳定Cas蛋白的示例性表征
本实施例展示了示例性的热稳定Cas蛋白Pal1(SEQ ID NO.1)、Pal2低MW、Pal2高MW(SEQ ID NO.2)和Pal3(SEQ ID NO.3)的表征。在以DnaseAlert作为报告子的仅Cas反应中,在37℃和56℃下,每种酶与四种向导(指定为342-353)一起测试。对于每个反应,相对于时间对荧光信号作图(图1)。在56℃下,Pal1表现出对两种向导的低活性。对于Pal2低MW或Pal3,未观察到活性,而在56℃下,对于Pal2高MW,观察到对两种向导的活性。在56℃下,Pal1和Pal2活性在图2中示出。使用这些酶的研究的另外结果在图3-8中示出。可以看到,在56℃和70℃下,Pal1表现出对两种向导的活性;Pal1在57℃下表现出最大活性并且在至少67℃下表现出显著活性。在56℃下,Pal2高MW表现出对两种向导的活性;Pal2高MW也在47-52℃下表现出最大活性并且在最多至至少57℃下表现出显著活性。在37℃、56℃或70℃下,未观察到Pal2低MW或Pal3-6中的任一者的显著活性。因此,本领域技术人员应理解,这些酶至少在约56℃下和/或在56℃与70℃的范围内是热稳定的。这些特定的例示酶也可描述为热活性的,因为在诸如37℃的较低温度下,其相关活性大幅降低和/或检测不到。不希望受任何特定理论的束缚,应注意,嗜热有机体的酶通常可在此类温度下表现出降低的(或不可检测的)活性。
为了进一步对示例性的热稳定Cas蛋白Pal1(SEQ ID NO:1)、Pal2(SEQ ID NO:2)、Pal3(SEQ ID NO:3)、Pal4(SEQ ID NO:4)、Pal5(SEQ ID NO:5)、Pal6(SEQ ID NO:6)、Pal8(SEQ ID NO:8)、Pal9(SEQ ID NO:9)和Pal10(SEQ ID NO:10)进行表征,使用示例性蛋白解链法评估酶变性。将Cas蛋白与缓冲液和染料混合并且运行解链曲线。随着温度的增加,Cas蛋白解折叠。当示例性的Cas蛋白解折叠时,疏水性区域暴露,导致染料与Cas蛋白结合。在结合后,染料发荧光。相对于解链曲线的温度,对随着温度变化的荧光变化作图。计算Cas蛋白的解链温度并且与适当的参考标准(例如,具有已知热稳定性的Cas蛋白,例如,Aac和/或RS9)相比较。解链温度的变化与蛋白质稳定性(例如,热稳定性)和活性的变化相关(图9)。图9显示,Cas蛋白(PAL1-10)具有与参考热稳定蛋白Aac和RS9可比较的热稳定活性,即,Cas蛋白PAL1-10是热稳定的。
实施例3:与向导RNA复合的热稳定Cas蛋白的旁切活性信号
本实施例进一步展示了本文所述的Cas蛋白的旁切活性。与不同的工程化的向导RNA复合的热稳定Cas蛋白(PAL5、PAL8、PAL9和PAL10)的旁切活性在两种不同的测定中测试:没有靶标扩增的测定(仅cas)和具有靶标扩增的测定(RT-SLK)。将具有不同靶标和长度的向导RNA(SEQ ID NO:11-19)工程化。工程化的向导RNA在表2中示出。
表2:热稳定的Cas12b酶的单一向导RNA(sgRNA)序列。sgRNA恒定结构域为斜体并且间隔子为粗体。
仅Cas反应(图10、12、14和16):
仅Cas反应包含与工程化的向导RNA复合的相关Cas酶,所述向导RNA与其预期靶标杂交,所述靶标以纯gBlock DNA的形式供应。详细地说,对于仅Cas反应,靶标的扩增与Cas检测分开进行(仅Pal5)。在一些实验中,单链DNA靶标(寡核苷酸)以100nM的浓度直接添加到Cas反应物中。对于Pal5,从100cp/uL(200cp/反应)的SARS-CoV-2基因组RNA开始的LAMP扩增靶标使用N基因或O基因特异性LAMP引物在20uL反应物(1X Warmstart RT-LAMP混合物(NEB)、1X引子混合物)中扩增。将反应物在60C下孵育40min。对于所有仅Cas反应,将5uL的ssDNA靶标或LAMP扩增产物添加到250nM Pal酶、250nM相应向导、8mM MgCl2以及250nMDNAse Alert中。Cas酶的活化在60C下在QS5 PCR机器中监测并且每分钟测量荧光。
实时SHERLOCK(RT-SLK)反应(图11、13、15和17):
对于RT-SLK反应,首先使用LAMP来指数扩增靶核酸,同时使用与其向导RNA复合的Cas酶检测扩增材料。详细地说,对于RT-SLK反应,将基于LAMP的扩增与单一管中的Cas读出相结合。20uL RT-SLK反应物的最终浓度如下,1x Warmstart RT-LAMP混合物(NEB)与1xLAMP引物(引物集N或引物集O)、0.01U/uL TIPP(热稳定的无机磷酸酶(NEB))、125nM C7-FAM报告子或DNAse Alert(250nM)、250nM Cas酶和250nM相应向导RNA组合。作为起始靶标材料,使用100cp/uL(200cp/反应)的SARS-CoV-2基因组RNA并且将反应物放置在QS5 PCR机器中,在60C下孵育,监测并且每分钟测量荧光。
图10-17显示,所测试的热稳定Cas蛋白(PAL5、PAL8、PAL9和PAL10)在“一锅”检测测定中是有功能的,这使得能够进行简单的分子诊断。此外,图11、13、15和17显示,热稳定Cas蛋白PAL5、PAL8、PAL9和PAL10与诸如LAMP的化学致能扩增(RT-SLK反应)是相容的。将扩增和检测组合于一锅中的能力降低总体诊断测定或治疗测定的复杂性。
图10和11显示,通过简单地替换向导的可变结构域(在表2中以粗体标记),向导RNA实现了多种靶标,在此处为SCoV2-N或SCV2-O的检测。因此,与向导RNA crEF82或向导RNA crEF88复合的PAL5能够检测其靶标。两种向导RNA具有不同的性能水平但是均表现出高于背景的明确信号。
图14-17显示,与PAL9或PAL10复合的不同长度的向导RNA全部保留了完整功能(全部表现出高于背景的明确信号)。这证明与较长的向导RNA(例如,crJP103、crJP104或crJP107)相比,较小的向导RNA(例如,crJP105或crJP109)在诊断或治疗测定中不损害功能活性。
等效物
本领域技术人员将认识到,或能够仅使用常规实验来确定本文所述的本发明的特定实施方案的许多等效物。本发明的范围不旨在局限于上述说明书,而是如以下权利要求中所陈述:

Claims (80)

1.一种检测方法,其包括以下步骤:
使CRISPR-Cas复合物与可能包含靶核酸序列的样品接触,所述CRISPR-Cas复合物包含:
在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和
经选择或工程化以与靶核酸序列互补的向导RNA。
2.如权利要求1所述的方法,其中所述接触步骤包括使所述CRISPR-Cas复合物和样品与易于通过Cas蛋白旁切活性裂解的报告子接触。
3.如权利要求1或权利要求2所述的方法,其中所述接触步骤包括在高于所述温度下孵育一段时间。
4.如前述权利要求中任一项所述的方法,其还包括扩增存在于所述样品中的核酸的步骤。
5.如权利要求4所述的方法,其中所述扩增步骤利用热稳定的核酸聚合酶。
6.如权利要求4或权利要求5所述的方法,其中所述扩增步骤和所述接触步骤在单一容器中进行。
7.如权利要求1所述的方法,其中所述Cas蛋白是Cas12蛋白。
8.如权利要求7所述的方法,其中所述Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。
9.如权利要求7所述的方法,其中所述Cas蛋白具有与SEQ ID No.1-10中的任一个具有至少80%序列同一性的氨基酸序列。
10.如权利要求1所述的方法,其中所述Cas蛋白具有与SEQ ID No.1-10中的任一个具有80%序列同一性的氨基酸序列。
11.在一种使用具有旁切裂解活性的Cas蛋白来进行检测测定的方法中,改良包括使用具有热稳定的旁切裂解活性的Cas蛋白。
12.如权利要求11所述的改良,其中所述Cas蛋白是Cas12蛋白。
13.如权利要求12所述的改良,其中所述Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。
14.如权利要求12所述的改良,其中所述Cas蛋白具有与SEQ ID No.1-10中的任一个具有至少80%序列同一性的氨基酸序列。
15.如权利要求11所述的改良,其中进行检测测定的方法在单一反应容器中进行。
16.如权利要求11所述的改良,其中所述热稳定的旁切裂解活性在高于约60℃温度下是热稳定的。
17.如权利要求11所述的改良,其中所述热稳定的旁切裂解活性在高于约65℃温度下是热稳定的。
18.如权利要求11所述的改良,其中所述Cas蛋白具有与SEQ ID No.1-10中的任一个具有至少80%序列同一性的氨基酸序列。
19.一种非天然存在的或工程化的组合物,其包含:
(a)在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和
(b)至少一种能够与所述热稳定的Cas蛋白形成复合物并且引导所述复合物与靶核酸序列结合的向导。
20.如权利要求19所述的组合物,其中所述Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。
21.如权利要求19所述的组合物,其中所述Cas蛋白具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列。
22.如权利要求19所述的组合物,其中所述至少一种向导包括能够与两种不同的靶核酸序列或靶核酸序列的不同区域杂交的两种向导序列。
23.如权利要求19所述的组合物,其中所述至少一种向导包括能够与多种不同的靶核酸序列或靶核酸序列的多个不同区域杂交的多种向导序列。
24.如权利要求19所述的组合物,其中所述向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。
25.如权利要求19所述的组合物,其中所述向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
26.一种非天然存在的或工程化的组合物,其包含:
(a)多核苷酸,所述多核苷酸编码在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白;和
(b)至少一种能够与所述Cas蛋白形成复合物并且引导所述复合物与靶核酸序列结合的向导。
27.如权利要求26所述的组合物,其中所述Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。
28.如权利要求26所述的组合物,其中所述Cas蛋白具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列。
29.如权利要求26所述的组合物,其中所述至少一种向导包括能够与两种不同的靶核酸序列或靶核酸序列的不同区域杂交的两种向导序列。
30.如权利要求26所述的组合物,其中所述至少一种向导包括能够与多种不同的靶核酸序列或靶核酸序列的多个不同区域杂交的多种向导序列。
31.如权利要求26所述的组合物,其中所述向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。
32.如权利要求26所述的组合物,其中所述向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
33.一种用于修饰靶核酸中的核苷酸的非天然存在的或工程化的组合物,其包含在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白。
34.如权利要求33所述的组合物,其还包含至少一种能够与所述Cas蛋白形成复合物并且引导所述复合物与靶核酸序列结合的向导序列。
35.如权利要求33所述的组合物,其中所述Cas蛋白具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列。
36.如权利要求33所述的组合物,其中所述Cas蛋白具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列。
37.如权利要求33所述的组合物,其中所述Cas蛋白已被修饰以减少脱靶效应。
38.如权利要求33所述的组合物,其中所述靶核酸中的核苷酸的所述修饰治疗由点突变引起的疾病。
39.如权利要求33所述的组合物,其中所述靶核酸中的核苷酸的所述修饰使由所述靶核酸序列编码的基因失活。
40.如权利要求33所述的组合物,其中所述靶核酸中的核苷酸的所述修饰改变由所述靶核酸序列编码的基因产物。
41.如权利要求33所述的组合物,其中所述靶核酸中的核苷酸的所述修饰改变由所述靶核酸序列编码的基因产物的表达水平。
42.如权利要求34所述的组合物,其中所述至少一种向导包括能够与两种不同的靶核酸序列或靶核酸序列的不同区域杂交的两种向导序列。
43.如权利要求34所述的组合物,其中所述至少一种向导包括能够与多种不同的靶核酸序列或靶核酸序列的多个不同区域杂交的多种向导序列。
44.如权利要求34所述的组合物,其中所述向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。
45.如权利要求34所述的组合物,其中所述向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
46.一种载体系统,其包含有包含以下的一种或多种载体:
(a)第一调控元件,其可操作地连接至编码在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白的核苷酸序列;和
(b)第二调控元件,其可操作地连接至编码向导的核苷酸序列。
47.如权利要求46所述的载体系统,其中所述核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。
48.如权利要求46所述的载体系统,其中所述核苷酸序列编码具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列的Cas蛋白。
49.如权利要求46所述的载体系统,其中编码Cas蛋白的所述核苷酸序列是密码子优化的。
50.如权利要求46所述的载体系统,其中(a)和(b)包含在单一载体中。
51.如权利要求46所述的载体系统,其中(a)和(b)包含在单独的载体中。
52.如权利要求46所述的载体系统,其中所述载体系统包含病毒载体。
53.一种裂解细胞中的至少一种靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与所述至少一种靶核酸杂交的向导接触,其中所述Cas蛋白能够与所述至少一种向导形成复合物并且在所述至少一种靶核酸中引起断裂。
54.一种改变细胞中的至少一种靶核酸的表达的方法,其包括使所述细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与所述至少一种靶核酸杂交的向导接触,其中所述Cas蛋白能够与所述至少一种向导形成复合物并且在所述至少一种靶核酸中引起断裂。
55.一种改变细胞中的至少一种靶核酸的表达的方法,其包括使所述细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与所述至少一种靶核酸杂交的向导接触,其中所述Cas蛋白能够与所述至少一种向导形成复合物并且编辑所述至少一种靶核酸序列。
56.一种修饰细胞中的至少一种靶核酸的方法,其包括使细胞与在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与所述至少一种靶核酸杂交的向导接触,其中所述Cas蛋白能够与所述至少一种向导形成复合物并且编辑所述至少一种靶核酸序列。
57.如权利要求56所述的方法,其中编辑所述靶核酸包括在所述靶核酸序列处插入有效负载核酸。
58.如权利要求53-57中任一项所述的方法,其中核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。
59.如权利要求53-57中任一项所述的方法,其中核苷酸序列编码具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列的Cas蛋白。
60.如权利要求53-57中任一项所述的方法,其中所述至少一种向导包括能够与两种不同的靶核酸序列或靶核酸的不同区域杂交的两种向导序列。
61.如权利要求53-57中任一项所述的方法,其中所述至少一种向导包括能够与多种不同的靶核酸序列或靶核酸的多个不同区域杂交的多种向导序列。
62.如权利要求53-57中任一项所述的方法,其中所述向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。
63.如权利要求53-57中任一项所述的方法,其中所述向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
64.一种核酸,其编码在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白。
65.如权利要求65所述的核酸,其中核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。
66.如权利要求65所述的核酸,其中核苷酸序列编码具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列的Cas蛋白。
67.一种治疗有需要的受试者的病症或疾病的方法,其包括向所述受试者施用在高于至少60-65℃的温度下热稳定的具有旁切裂解活性的Cas蛋白和至少一种能够与靶核酸杂交的向导。
68.如权利要求67所述的方法,其中核苷酸序列编码具有与SEQ ID NO:1或SEQ ID NO:2具有至少80%同一性的氨基酸序列的Cas蛋白。
69.如权利要求67所述的方法,其中核苷酸序列编码具有与SEQ ID NO:1-10中的任一个具有至少80%序列同一性的氨基酸序列的Cas蛋白。
70.如权利要求67所述的方法,其中所述至少一种向导包括能够与两种不同的靶核酸序列或靶核酸的不同区域杂交的两种向导序列。
71.如权利要求67所述的方法,其中所述至少一种向导包括能够与多种不同的靶核酸序列或靶核酸的多个不同区域杂交的多种向导序列。
72.如权利要求67所述的方法,其中所述至少一种向导序列能够与原核细胞中的一种或多种靶核酸序列杂交。
73.如权利要求67所述的方法,其中所述至少一种向导序列能够与真核细胞中的一种或多种靶核酸序列杂交。
74.如权利要求67所述的方法,其中所述Cas蛋白能够与所述向导形成复合物并且在所述靶核酸中引起断裂。
75.如权利要求67所述的方法,其中所述Cas蛋白能够与所述向导形成复合物并且编辑所述靶核酸序列。
76.如权利要求1-45中任一项所述的组合物,其中所述Cas蛋白与修饰实体缔合。
77.如权利要求76所述的组合物,其中所述修饰实体是腺苷脱氨酶。
78.如权利要求76所述的组合物,其中所述修饰实体是胞苷脱氨酶。
79.一种如权利要求1-45中任一项所述的药物组合物。
80.一种表征Cas蛋白的方法,其包括评估以下中的一个或多个:
(a)顺式裂解活性;
(b)反式裂解活性;
(c)灵敏度;
(d)对RNA或DNA靶核酸的偏好;
(e)对RNA或DNA非靶核酸的偏好;以及
(f)酶稳定性。
CN202280064577.1A 2021-07-26 2022-07-26 改良的crispr-cas技术 Pending CN118019857A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163225802P 2021-07-26 2021-07-26
US63/225,802 2021-07-26
PCT/US2022/038352 WO2023009526A2 (en) 2021-07-26 2022-07-26 Improved crispr-cas technologies

Publications (1)

Publication Number Publication Date
CN118019857A true CN118019857A (zh) 2024-05-10

Family

ID=85088236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280064577.1A Pending CN118019857A (zh) 2021-07-26 2022-07-26 改良的crispr-cas技术

Country Status (10)

Country Link
EP (1) EP4377462A2 (zh)
JP (1) JP2024527933A (zh)
KR (1) KR20240051337A (zh)
CN (1) CN118019857A (zh)
AU (1) AU2022319703A1 (zh)
CA (1) CA3226885A1 (zh)
IL (1) IL310364A (zh)
MX (1) MX2024001267A (zh)
TW (1) TW202321454A (zh)
WO (1) WO2023009526A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202421795A (zh) 2022-07-01 2024-06-01 美商夏洛克生物科學公司 環境溫度核酸擴增及偵測

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102678809B1 (ko) * 2017-05-18 2024-06-26 더 브로드 인스티튜트, 인코퍼레이티드 표적화된 핵산 편집을 위한 시스템, 방법 및 조성물
US20190218544A1 (en) * 2017-10-31 2019-07-18 Takara Bio Usa, Inc. Gene editing, identifying edited cells, and kits for use therein
EP4253551A3 (en) * 2018-03-14 2024-01-24 Arbor Biotechnologies, Inc. Novel crispr dna and rna targeting enzymes and systems
US20200199555A1 (en) * 2018-12-05 2020-06-25 The Broad Institute, Inc. Cas proteins with reduced immunogenicity and methods of screening thereof

Also Published As

Publication number Publication date
AU2022319703A1 (en) 2024-02-29
KR20240051337A (ko) 2024-04-19
JP2024527933A (ja) 2024-07-26
WO2023009526A2 (en) 2023-02-02
MX2024001267A (es) 2024-04-18
CA3226885A1 (en) 2023-02-02
EP4377462A2 (en) 2024-06-05
TW202321454A (zh) 2023-06-01
WO2023009526A3 (en) 2023-09-28
IL310364A (en) 2024-03-01

Similar Documents

Publication Publication Date Title
RU2662932C2 (ru) Композиции и способы с участием нуклеиновых кислот, нацеленных на нуклеиновые кислоты
CN113939591A (zh) 编辑rna的方法和组合物
RU2759737C2 (ru) Новые минимальные utr-последовательности
JP5431351B2 (ja) バイサルファイト修飾された核酸を増幅およびコピーするための酵素
JP7006873B2 (ja) 突然変異細胞遊離遺伝子分離キット及びそれを用いた突然変異細胞遊離遺伝子分離方法
WO2024012300A1 (zh) 一种基因编辑的方法和用途
CN106460050A (zh) 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰
US20220073921A1 (en) Aptamer and use of the aptamer in the diagnosis and treatment of cancer
JP2022523055A (ja) Crispr活性をモジュレートするための系および方法
CN118019857A (zh) 改良的crispr-cas技术
US20230313231A1 (en) Rna and dna base editing via engineered adar
Wang et al. Positive association of RhoC gene overexpression with tumour invasion and lymphatic metastasis in gastric carcinoma
CN109295055B (zh) 基于C2c2的肿瘤相关突变基因的gRNA、检测方法、检测试剂盒
Marsden et al. Mouse embryonic fibroblasts isolated from Nthl1 D227Y knockin mice exhibit defective DNA repair and increased genome instability
Carvajal-Moreno et al. Use of CRISPR/Cas9 with Homology-Directed Repair to Gene-Edit Topoisomerase IIβ in Human Leukemia K562 Cells: Generation of a Resistance Phenotype
US20230348877A1 (en) Base editing enzymes
JP2003534789A (ja) Rna切断方法
TW202346580A (zh) Dna酶及其應用
JP6857420B2 (ja) がんの罹患の可能性の試験方法およびそれに用いる試験試薬
Jimenez Curiel Production of modRNA for in vivo prime editing and other therapeutic strategies
JP2024518413A (ja) 修飾ヌクレアーゼ
Zhang Control the Function of RNA by Site-Specific Bioconjugation
Ernst Regulation of the TET1 protein in active DNA demethylation
Dolan Characterization of the Type IE CRISPR System of T. Fusca and Its Application to Genome Editing
Gramling Genomic Instability-Indicated Mechanisms of Early Carcinogenesis Following Hepatocarcinogen Treatment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination