CN112639121A - 基于crispr双切口酶的扩增组合物、系统和方法 - Google Patents

基于crispr双切口酶的扩增组合物、系统和方法 Download PDF

Info

Publication number
CN112639121A
CN112639121A CN201980055278.XA CN201980055278A CN112639121A CN 112639121 A CN112639121 A CN 112639121A CN 201980055278 A CN201980055278 A CN 201980055278A CN 112639121 A CN112639121 A CN 112639121A
Authority
CN
China
Prior art keywords
nucleic acid
crispr
cas
nickase
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980055278.XA
Other languages
English (en)
Inventor
F·张
M·凯尔纳
J·戈滕贝格
O·阿布达耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Publication of CN112639121A publication Critical patent/CN112639121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/125Specific component of sample, medium or buffer
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文所公开的实施方案利用靶向RNA的效应子以提供稳健的基于CRISPR的核酸扩增方法和系统。本文所公开的实施方案可扩增双链核酸靶标和单链核酸靶标两者。此外,本文所公开的实施方案可与各种检测平台例如CRISPR‑SHERLOCK结合,以实现具有渺摩尔级灵敏度的检测和诊断。此类实施方案可用于人类健康的多种情形,包括例如病毒检测、细菌菌株分型、灵敏基因分型,和疾病相关无细胞DNA的检测。

Description

基于CRISPR双切口酶的扩增组合物、系统和方法
相关申请的交叉引用
本申请要求2018年11月14日提交的美国临时申请号62/767,059和2018年6月26日提交的美国临时申请62/690,278的权益。以上确认的申请的全部内容特此以引用方式完全并入本文。
关于联邦资助研究的声明
本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的授权号MH100706、MH110049和HL141201在政府支持下完成的。政府享有本发明的某些权利。
技术领域
本文所公开的主题总体上涉及与CRISPR效应系统的使用有关的核酸扩增方法、系统和快速诊断。
背景技术
核酸是生物信息的通用标志。在便携式平台上以高灵敏度和单碱基特异性快速检测核酸的能力具有彻底改革许多疾病的诊断和监测的潜力,提供有价值的流行病学信息,并作为普遍的科学工具。尽管已经开发了许多用于检测核酸的方法(Du等人,2017;Green等人,2014;Kumar等人,2014;Pardee等人,2014;Pardee等人,2016;Urdea等人,2006),但它们不可避免地受损于在灵敏度、特异性、简单性和速度之间进行权衡。举例来说,qPCR方法灵敏但昂贵,并且依赖于复杂仪器,限制了对于在实验室环境中训练有素的操作员的可用性。随着核酸诊断变得与各种医疗保健应用越来越相关,在低成本下提供高特异性和灵敏度的检测技术在临床和基础研究环境两者中将具有很大的实用性。
许多核酸扩增方法可用于各种检测平台。其中已经开发出等温核酸扩增方法,无需剧烈温度循环和复杂仪器即可进行扩增。这些方法包括基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)或切口酶扩增反应(NEAR)。然而,这些等温扩增方法可能仍需要初始变性步骤和多组引物。此外,将等温核酸扩增与便携式平台相结合的新方法(Du等人,2017;Pardee等人,2016),在护理点(POC)环境中提供了高检测特异性,但由于灵敏度低而应用有些局限。
发明内容
本公开总体上涉及基于切口酶的核酸扩增和检测方法。
在某些示例性实施方案中,本发明提供了一种扩增和/或检测靶双链核酸的方法,所述方法包括:(a)将包含靶双链核酸的样品与扩增反应混合物组合,所述扩增反应混合物包含:(i)扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向靶核酸上的第一位置的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向靶核酸的第二位置的第二指导分子;和(ii)聚合酶;(b)扩增靶核酸;(c)向反应混合物添加包含第一引物和第二引物的引物对,所述第一引物包含与靶核酸的第一位置互补的部分和包含第一指导分子的结合位点的部分,并且所述第二引物包含与靶核酸的第二位置互补的部分和包含第二指导分子的结合位点的部分;以及(d)通过在等温条件下重复延伸和切刻来进一步扩增靶核酸。
在实施方案中,第一位置和第二位置在靶核酸的同一链上。在其他实施方案中,第一位置和第二位置在双链靶核酸的第一链和第二链上。在其中第一位置和第二位置在靶核酸的第一链和第二链上的应用中,扩增可以包括:使用第一CRISPR/Cas复合物和第二CRISPR/Cas复合物切刻靶核酸的第一链和第二链并使用聚合酶置换并延伸切刻的链,从而在第一切口位点与第二切口位点之间产生包含靶核酸序列的双链体。
在某些实施方案中,基于Cas的切口酶可以选自由以下组成的组:Cas9切口酶、Cpf1切口酶和C2c1切口酶。
在一个实施方案中,基于Cas的切口酶是Cas9切口酶蛋白,所述Cas9切口酶蛋白在HNH结构域中包含突变。在一个实施方案中,基于Cas的切口酶是Cas9切口酶蛋白,所述Cas9切口酶蛋白包含对应于SpCas9中的N863A或者SaCas9中的N580A的突变。基于Cas的切口酶可以是来源于选自由以下组成的组的细菌种类的Cas9蛋白:化脓性链球菌(Streptococcuspyogenes)、金黄色葡萄球菌(Staphylococcus aureus)、嗜热链球菌(Streptococcusthermophilus)、变异链球菌(S.mutans)、无乳链球菌(S.agalactiae)、似马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌(S.pneumonia);空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌(C.coli);N.salsuginis、N.tergarcus;耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae);单核增生李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii)、土拉弗朗西斯菌(Francisella tularensis)1、易北普雷沃氏菌(Prevotella albensis)、毛螺菌科细菌(Lachnospiraceae bacterium)MC20171、解蛋白丁酸弧菌(Butyrivibrio proteoclasticus)、异域菌门细菌(Peregrinibacteriabacterium)GW2011_GWA2_33_10、俭菌超门细菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌属种(Smithella sp.)SCADC、氨基酸球菌属种(Acidaminococcus sp.)BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体(Candidatus Methanoplasmatermitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)3、解糖胨普雷沃氏菌(Prevotella disiens)和猕猴卟啉单胞菌(Porphyromonas macacae)。
在一个实施方案中,基于Cas的切口酶是Cpf1切口酶蛋白,所述Cpf1切口酶蛋白在Nuc结构域中包含突变。在另一个实施方案中,基于Cas的切口酶是Cpf1切口酶蛋白,所述Cpf1切口酶蛋白包含对应于AsCpf1中的R1226A的突变。基于Cas的切口酶可以是来源于选自由以下组成的组的细菌种类的Cpf1蛋白:土拉弗朗西斯菌(Francisella tularensis)、易北普雷沃氏菌(Prevotella albensis)、毛螺菌科细菌、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)、俭菌超门细菌(Parcubacteria bacterium)、史密斯氏菌属种(Smithella sp.)、氨基酸球菌属种(Acidaminococcus sp.)、毛螺菌科细菌、候选白蚁甲烷支原体(CandidatusMethanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)、稻田氏钩端螺旋体(Leptospira inadai)、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、解糖胨普雷沃氏菌(Prevotella disiens)和猕猴卟啉单胞菌(Porphyromonas macacae)、溶糊精琥珀酸弧菌(Succinivibriodextrinosolvens)、解糖胨普雷沃氏菌、嗜鳃黄杆菌(Flavobacterium branchiophilum)、孔兹氏创伤球菌(Helcococcus kunzii)、真杆菌属种(Eubacterium sp.)、微基因组菌(罗兹曼菌)(Microgenomates(Roizmanbacteria)bacterium)、黄杆菌属种、短普雷沃氏菌(Prevotella brevis)、山羊莫拉氏菌(Moraxella caprae)、口腔拟杆菌(Bacteroidetesoral)、犬嘴卟啉单胞菌(Porphyromonas cansulci)、琼氏互养菌(Synergistes jonesii)、布氏普雷沃氏菌(Prevotella bryantii)、厌氧弧菌属种(Anaerovibrio sp.)、溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)、候选甲烷嗜甲基菌(CandidatusMethanomethylophilus)、丁酸弧菌属种(Butyrivibrio sp.)、口腔无芽孢厌氧菌属种(Oribacterium sp.)、瘤胃假丁酸弧菌(Pseudobutyrivibrio ruminis)和产丁酸菌(Proteocatella sphenisci)。
在一个实施方案中,基于Cas的切口酶是C2c1切口酶蛋白,所述C2c1切口酶蛋白在Nuc结构域中包含突变。在另一个实施方案中,基于Cas的切口酶是C2c1切口酶蛋白,所述C2c1切口酶蛋白包含对应于AacC2c1中的D570A、E848A或D977A的突变。基于Cas的切口酶可以是来源于选自由以下组成的组的细菌种类的C2c1蛋白:抗酸土脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)、污染脂环酸芽孢杆菌(Alicyclobacilluscontaminans)、大孢束脂环酸芽孢杆菌(Alicyclobacillus macrosporangiidus)、外村尚芽孢杆菌(Bacillus hisashii)、候选林道菌(Candidatus Lindowbacteria)、非常脱硫弧菌(Desulfovibrio inopinatus)、硫歧化酶脱硫盐碱杆菌(Desulfonatronumthiodismutans)、迷踪菌门细菌(Elusimicrobia bacterium)RIFOXYA12、杂食菌门(Omnitrophica)WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌(Opitutaceae bacterium)TAV5、浮霉菌纲细菌(Phycisphaerae bacterium)ST-NAGAB-D1、浮霉菌门细菌(Planctomycetesbacterium)RBG_13_46_10、螺旋体属细菌(Spirochaetes bacterium)GWB1_27_13、疣微菌科细菌(Verrucomicrobiaceae bacterium)UBA2429、热生肿块芽胞杆菌(Tuberibacilluscalidus)、嗜热淀粉芽孢杆菌(Bacillus thermoamylovorans)、短芽孢杆菌属种(Brevibacillus sp.)CF112、芽孢杆菌属种(Bacillus sp.)NSP2.1、食丁酸盐还原硫酸盐小杆菌(Desulfatirhabdium butyrativorans)、草脂环酸芽孢杆菌(Alicyclobacillusherbarius)、弗氏柠檬酸杆菌(Citrobacter freundii)、土壤短芽孢杆菌(Brevibacillusagri)(例如BAB-2500)和结瘤甲基杆菌(Methylobacterium nodulans)。
在一个实施方案中,第一基于Cas的切口酶和第二基于Cas的切口酶是相同的。在另一个实施方案中,第一基于Cas的切口酶和第二基于Cas的切口酶是不同的。
DNA聚合酶可以选自缺乏5’至3’核酸外切酶活性的聚合酶,并且所述聚合酶还可以任选地缺乏3’至5’核酸外切酶活性。合适的DNA聚合酶的实例包括大肠杆菌DNA聚合酶I的核酸外切酶缺陷的Klenow片段(New England Biolabs,Inc.(Beverly,Mass.))、核酸外切酶缺陷的T7 DNA聚合酶(测序酶;USB,(Cleveland,Ohio))、大肠杆菌DNA聚合酶I的Klenow片段(New England Biolabs,Inc.(Beverly,Mass.))、Bst DNA聚合酶的大片段(NewEngland Biolabs,Inc.(Beverly,Mass.))、KlenTaq DNA聚合酶(AB Peptides,(St Louis,Mo.))、T5 DNA聚合酶(美国专利号5,716,819),和Pol III DNA聚合酶(美国专利号6,555,349)。对于解旋酶依赖性扩增,优选的是具有链置换活性的DNA聚合酶,诸如大肠杆菌DNA聚合酶I的核酸外切酶缺陷的Klenow片段、Bst DNA聚合酶大片段和测序酶。T7聚合酶是高保真的聚合酶,错误率为3.5×105,显著低于Tag聚合酶(Keohavong和Thilly,Proc.Natl.Acad.Sci.USA 86,9253-9257(1989))。然而,T7聚合酶不是热稳定的,因此不是用于需要热循环的扩增系统的最佳选择。在可以等温执行的HDA中,T7测序酶是用于扩增DNA的优选聚合酶之一。
在具体实施方案中,聚合酶可以选自由以下组成的组:Bst 2.0DNA聚合酶、Bst2.0WarmStart DNA聚合酶、Bst 3.0DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶和测序酶DNA聚合酶。
在某些实施方案中,聚合酶选自由以下组成的组:Bst 2.0DNA聚合酶、Bst2.0WarmStart DNA聚合酶、Bst 3.0DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶、Gst聚合酶、Taq聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、KlenTaq、Pol III DNA聚合酶、T5 DNA聚合酶和测序酶DNA聚合酶。可以在约50℃-59℃、约60℃-72℃或约37℃下执行靶核酸的扩增。在某些实施方案中,在恒温下执行靶核酸序列的扩增。在某些实施方案中,在一定温度范围内执行靶核酸的扩增。
在某些实施方案中,靶核酸序列的长度可以为约20-30个、约30-40个、约40-50个或约50-100个核苷酸。在某些实施方案中,靶核酸序列的长度可以为约100-200个、约100-500个或约100-1000个核苷酸。在其他实施方案中,靶核酸序列的长度可以为约1000-2000个、约2000-3000个、约3000-4000个或约4000-5000个核苷酸。
在另外的实施方案中,第一引物或第二引物还包含RNA聚合酶启动子。
在某些实施方案中,所述方法还可以包括通过选自由以下组成的组的方法来检测扩增的核酸:凝胶电泳、嵌入染料检测、PCR、实时PCR、荧光、荧光共振能量转移(FRET)、质谱、侧流测定、比色测定(HRP、ALP、基于金纳米颗粒的测定)和CRISPR-SHERLOCK。CRISPR-SHIRLOCK方法可以是基于Cas13的CRISPR-SHERLOCK方法。可以渺摩尔级灵敏度或飞摩尔级灵敏度检测靶核酸。
在某些实施方案中,靶核酸可以是DNA或RNA。DNA可以选自由以下组成的组:基因组DNA、线粒体DNA、病毒DNA、质粒DNA、无循环细胞DNA、环境DNA和合成双链DNA。在某些实施方案中,靶核酸可以是双链核酸或单链核酸。在靶核酸是单链核酸的情况下,此类单链核酸可以包括但不必限于单链病毒DNA、病毒RNA、信使RNA、核糖体RNA、转移RNA、微小RNA、短干扰RNA、小核RNA、合成RNA或合成单链DNA。
在一个实施方案中,样品是生物样品或环境样品。生物样品是血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液,或获自关节的流体,或皮肤或粘膜表面的拭子。在某些实施方案中,样品是获自人类患者的血液、血浆或血清。在另一个实施方案中,样品是植物样品。在另外的实施方案中,样品可以是粗样品或纯化的样品。
在另一方面,本公开提供了一种用于扩增和/或检测靶单链核酸的方法,所述方法包括:(a)将样品中的单链核酸转化为靶双链核酸;以及(b)执行前述方法的步骤。靶单链核酸可以是RNA分子。可以通过逆转录和扩增步骤将RNA分子转化为双链核酸。靶单链核酸可以选自由以下组成的组:单链病毒DNA、病毒RNA、信使RNA、核糖体RNA、转移RNA、微小RNA、短干扰RNA、小核RNA、合成RNA、长非编码RNA、微小RNA前体、dsRNA和合成单链DNA。
在另一方面,本公开提供了一种用于扩增和/或检测样品中的靶双链核酸的系统,所述系统包括:(a)扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向靶核酸的第一链的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向靶核酸的第二链的第二指导分子;(b)聚合酶;(c)至反应混合物的包含第一引物和第二引物的引物对,所述第一引物包含与靶核酸的第一链互补的部分和包含第一指导分子的结合位点的部分,并且所述第二引物包含与靶核酸的第二链互补的部分和包含第二指导分子的结合位点的部分;以及任选地(d)用于检测靶核酸的扩增的检测系统。基于Cas的切口酶可以选自由以下组成的组:Cas9切口酶、Cpf1切口酶、C2c1切口酶、Cas13a切口酶、Cas13b切口酶、Cas13c切口酶和Cas13d切口酶。聚合酶可以选自由以下组成的组:Bst 2.0DNA聚合酶、Bst 2.0WarmStartDNA聚合酶、Bst 3.0DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段BsuDNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶、Gst聚合酶、Taq聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、KlenTaq、Pol III DNA聚合酶、T5 DNA聚合酶和测序酶DNA聚合酶。在某些实施方案中,基于Cas的切口酶和聚合酶在相同温度下执行。在某些实施方案中,基于Cas的切口酶和聚合酶在不同温度下执行。
对于解旋酶依赖性扩增,优选的是具有链置换活性的DNA聚合酶,诸如大肠杆菌DNA聚合酶I的核酸外切酶缺陷的Klenow片段、Bst DNA聚合酶大片段和测序酶。T7聚合酶是高保真的聚合酶,错误率为3.5×105,这显著低于Taq聚合酶,并且可以在等温进行时使用(Keohavong和Thilly,Proc.Natl.Acad.Sci.USA 86,9253-9257(1989))。
在另一方面,本公开提供了一种用于扩增和/或检测样品中的靶单链核酸的系统,所述系统包括:(a)用于将靶单链核酸转化为双链核酸的试剂;以及(b)上述系统的用于扩增和/或检测靶双链核酸的组分。
在另一方面,本公开提供了一种用于扩增和/或检测样品中的靶双链核酸的试剂盒,所述试剂盒包括上述系统的用于扩增和/或检测靶双链核酸的组分和一套使用说明书。试剂盒还可以包括用于纯化样品中的双链核酸的试剂。
在另一方面,本公开提供了一种用于扩增和/或检测样品中的靶单链核酸的试剂盒,所述试剂盒包括上述系统的用于扩增和/或检测靶单链核酸的组分和一套使用说明书。试剂盒还可以包括用于纯化样品中的单链核酸的试剂。
结合以下对所说明的示例性实施方案的详细说明,示例性实施方案的这些和其他方面、目的、特征和优点对于本领域普通技术人员而言将变得显而易见。
附图说明
通过参考阐述了其中可能利用了本发明原理的说明性实施方案的以下详细说明及其附图,将获得对本发明的特征和优点的理解:
图1是根据某些示例性实施方案的可程序化的基于切口酶的扩增的示意图。
图2是示出切口酶扩增反应的优化的凝胶电泳图像。红色箭头指示靶标扩增带。
图3A是显示使用Nt.A1w1限制酶与20nM靶标的基于切口酶的线性扩增的图。图3B是显示使用T7错配的Cpf1与20nM靶标的基于切口酶的线性扩增的图。图3C是显示使用匹配的Cpf1与20nM靶标的基于切口酶的线性扩增的图。图3D是显示使用Nt.A1w1限制酶与20fM靶标的基于切口酶的线性扩增的图。图3E是显示使用T7错配的Cpf1与20fM靶标的基于切口酶的线性扩增的图。图3F是显示使用匹配的Cpf1与20fM靶标的基于切口酶的线性扩增的图。
图4A是显示利用SYTO嵌入染料的Nt.A1w1扩增和检测的图。图4B是显示利用SYTO嵌入染料的T7错配的Cpf1扩增和检测的图。图4C是显示利用SYTO嵌入染料的匹配的Cpf1扩增和检测的图。图4D是显示利用基于凝胶的读出的Nt.A1w1扩增和检测的图。图4E是显示利用基于凝胶的读出的T7错配的Cpf1扩增和检测的图。图4F是显示利用基于凝胶的读出的匹配的Cpf1扩增和检测的图。图4G是显示利用CRISPR-SHERLOCK的Nt.A1w1扩增和检测的图。图4H是显示利用CRISPR-SHERLOCK的T7错配的Cpf1扩增和检测的图。图4I是显示利用CRISPR-SHERLOCK的匹配的Cpf1扩增和检测的图。
图5是显示结合SYTO或CRISPR-SHERLOCK检测的基于切口酶的扩增结果的图,结果绘制为靶标/无靶标比。
图6A是显示变化的靶标浓度下的单独NEAR扩增的结果的图。图6B是显示变化的靶标浓度下的结合CRISPR-SHERLOCK检测的NEAR扩增的结果的图。
图7A是显示使用Bst 2.0热启动聚合酶在60℃下执行的NEAR扩增的结果的凝胶电泳图像。图7B是显示图119A的定量的图。图7C是显示使用Bst 2.0热启动聚合酶在60℃下执行的结合CRISPR-SHERLOCK的NEAR的结果的图。
图8A是显示在16min时间点用测序酶2.0在37℃下执行的NEAR扩增的图。图8B是显示在端点用测序酶2.0在37℃下执行的NEAR扩增的图。
图9是结合SHERLOCK检测的CRISPR-NEAR的示意图。
本文中的附图仅用于说明目的,而不一定按比例绘制。
具体实施方式
一般定义
除非另有规定,否则本文所用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。在分子生物学中常用的术语和技术的定义可以在以下文献中找到:Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook、Fritsch和Maniatis);Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等人编辑);the seriesMethods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson、B.D.Hames和G.R.Taylor编辑):Antibodies,A Laboratory Manual(1988)(Harlow和Lane编辑):Antibodies A Laboraotry Manual,第2版2013(E.A.Greenfield编辑);Animal Cell Culture(1987)(R.I.Freshney编辑);BenjaminLewin,Genes IX,Jones and Bartlet出版,2008(ISBN0763752223);Kendrew等人(编辑),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994(ISBN0632021829);Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,VCH Publishers,Inc.出版,1995(ISBN9780471185710);Singleton等人,Dictionary of Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),三月,Advanced Organic Chemistry Reactions,Mechanismsand Structure第4版,John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker和Janvan Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
除非上下文另有明确指示,否则如本文所用的单数形式“一个”、“一种”和“所述”包括单数和复数指示物。
术语“任选的”或“任选地”意指后续描述的事件、情形或替代物可能发生或可能不发生,并且该描述包括事件或情形发生的情况和不发生的情况。
通过端点表述的数值范围包括在对应范围内的所有数值和分数,以及所表述的端点。
如本文所用的术语“约”或“近似”当涉及诸如参数、量、时距等可测量的值时,有意涵盖指定值的变化和从指定值的变化,诸如指定值和从指定值+/-10%或更小、+/-5%或更小、+/-1%或更小和+/-0.1%或更小的变化,只要此类变化适于在所公开的发明中执行即可。应当理解,修饰语“约”或“近似”所涉及的值本身也是具体地且优选地公开的。
如本文所用,“生物样品”可以含有全细胞和/或活细胞和/或细胞碎片。生物样品可以含有(或来源于)“体液”。本发明涵盖以下实施方案,其中体液选自羊水、房水、玻璃体液、胆汁、血清、母乳、脑脊液、耳屎(耳垢)、乳糜、食糜、内淋巴液、外淋巴液、渗出液、粪便、女性射液、胃酸、胃液、淋巴液、粘液(包括鼻引流和痰)、心包液、腹膜液、胸膜液、脓液、发炎性分泌物、唾液、皮脂(皮油)、精液、痰涎、滑液、汗液、眼泪、尿液、阴道分泌物、呕吐物以及这些物质中一者或多者的混合物。生物样品包括细胞培养物、体液、来自体液的细胞培养物。体液可以例如通过穿刺或其他收集或采样程序从哺乳生物体获得。
术语“受试者”、“个体”和“患者”在本文中可互换使用,是指脊椎动物,优选地是哺乳动物,更优选地是人类。哺乳动物包括但不限于鼠、猴、人类、农场动物、运动型动物和宠物。还包括在体内获得或在体外培养的生物实体的组织、细胞和他们的子代。
现在将“C2c2”称为“Cas13a”,除非另有说明,否则这些术语在本文中可互换使用。术语“第29组”、“第30组”和Cas13b在本文中可互换使用。术语“Cpf1”和“Cas12a”在本文中可互换使用。术语“C2c1”和“Cas12b”在本文中可互换使用。
在下文中描述各种实施方案。应当指出的是,具体实施方案不旨在作为详尽的描述或作为对本文所论述的更广泛方面的限制。结合特定实施方案描述的一个方面不必限于该实施方案,而是可以与任何其他一个或多个实施方案一起实践。在本说明书通篇提及“一个实施方案”、“实施方案”、“示例性实施方案”意指结合实施方案描述的特定特征、结构或特性包括于本发明的至少一个实施方案中。因此,在本说明书通篇各处出现短语“在一个实施方案中”、“在实施方案中”或“示例性实施方案”不一定全部指代同一实施方案,但也有可能如此。此外,如本领域技术人员从本公开将明显了解的,在一个或多个实施方案中,特定特征、结构或特性可以按任何适合的方式组合。此外,虽然本文所述的一些实施方案包括其他实施方案中所包括的一些特征而非其他特征,但不同实施方案的特征的组合有意处于本发明的范围内。举例来说,在所附权利要求中,任何所要求保护的实施方案可以按任何组合使用。
本文所引用的所有公布、公布的专利文献和专利申请特此以引用方式并入,如同每个单独公布、公布的专利文献或专利申请被确切地且单独地指明为以引用方式整体并入。
综述
本文所公开的实施方案提供了利用基于CRISPR-Cas的切口酶在等温条件下扩增靶核酸的方法。
在另一方面,本文所公开的实施方案涉及用于扩增和/或检测样品中的靶双链核酸和靶单链核酸的系统。在某些实施方案中,所述系统包括扩增CRISPR系统、聚合酶、引物对和任选的用于检测靶核酸的扩增的检测系统。在某些示例性实施方案中,所述系统还可以包括用于将靶单链核酸转化为双链核酸的试剂。
在另一方面,本文所公开的实施方案涉及用于扩增和/或检测样品中的靶双链核酸或靶单链核酸的试剂盒。在某些示例性实施方案中,所述试剂盒可以包括用于纯化样品中的双链核酸或单链核酸的试剂和一套使用说明书。
扩增系统
提供了一种用于扩增样品中的靶双链核酸的系统。所述系统包括扩增CRISPR系统、聚合酶和引物对。在实施方案中,所述系统可以任选地包括检测系统,从而允许检测靶核酸。
扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物。每一CRISPR/Cas复合物包含基于Cas的切口酶和指导分子,所述指导分子优先结合靶分子,对靶分子具有特异性,例如具有足够的互补性以结合靶分子,从而将CRISPR/Cas复合物导向靶核酸。扩增系统包含聚合酶;包含反应混合物的第一引物和第二引物的引物对,所述第一引物包含与第一靶位置互补的部分和包含第一指导分子的结合位点的部分,并且所述第二引物包含与第二靶核酸位置互补的部分和包含第二指导分子的结合位点的部分;以及任选的用于检测靶核酸的扩增的检测系统。第一位置和第二位置可以在同一链上,在这种情况下,基于Cas的切口酶将在同一链上进行切刻,或者第一位置和第二位置可以在两条不同的链上。
CRISPR系统
本文所提供的CRISPR系统包含第一CRISPR-Cas复合物和第二CRISPR-Cas复合物。第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向靶核酸的第一位置的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向靶核酸的第二位置的第二指导分子。
在一方面,第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向靶核酸的第一链的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向靶核酸的第二链的第二指导分子。在一方面,第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向靶核酸的第一链上的第一位置的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向靶核酸的第一链上的第二位置的第二指导分子。
一般来讲,如本文中和诸如WO 2014/093622(PCT/US2013/074667)的文献中所用的CRISPR-Cas或CRISPR系统共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”和tracrRNA加工的部分正向重复序列)、指导序列(在内源性CRISPR系统的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas诸如Cas9的一种或多种RNA,例如CRISPR RNA和反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来讲,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源性CRISPR系统的情形中也称为原间隔区)。当CRISPR蛋白质是Cpf1蛋白质时,不需要tracrRNA。
如本文所用,术语“Cas”大体上是指CRISPR/Cas系统或复合物的(修饰的)效应蛋白,并且可以非限制性地是(修饰的)Cas9、(修饰的)Cas12(例如Cas12a“Cpf1”、Cas12b“C2c1”、Cas12c“C2c3”)、(修饰的)Cas13(例如Cas13a“C2c2”、Cas 13b“组29/30”、Cas13c、Cas13d)。术语“Cas”在本文中可以与术语“CRISPR”蛋白、“CRISPR/Cas蛋白”、“CRISPR效应子”、“CRISPR/Cas效应子”、“CRISPR酶”、“CRISPR/Cas酶”等互换使用,除非另外指明,如特定地且排他性地指代Cas9。应当理解,术语“CRISPR蛋白”可以与“CRISPR酶”互换使用,不论所述CRISPR蛋白与野生型CRISPR蛋白相比是否具有改变的,如增加的或降低的(或没有)酶活性。同样地,如本文所用,在某些实施方案中,在适当的情况下并且对技术人员而言是显而易见的,术语“核酸酶”可以指代催化活性已经改变,如具有增加的或降低的核酸酶活性,或者根本没有核酸酶活性、以及切口酶活性的修饰的核酸酶,以及如本文别处所定义的以其他方式修饰的核酸酶,除非另外指明,如特定地且排他性地指代未修饰的核酸酶。
在根据本发明的某些实施方案中,优选地相对于相应的野生型酶使CRISPR-Cas蛋白突变,使得所述突变的CRISPR-Cas蛋白缺乏切割含有靶序列的靶基因座的一条或两条DNA链的能力。
在某些实施方案中,CRISPR-Cas蛋白是仅切割一条DNA链的突变CRISPR-Cas蛋白,即切口酶。在某些实施方案中,切口酶在非靶序列(即,在靶序列的相反DNA链上并且是PAM序列的3’的序列)内切割。
本发明设想使用两种或更多种切口酶的方法,特别是双重或双切口酶方法。这导致靶DNA被两种Cas切口酶结合。此外,还设想可以使用不同的直系同源物,例如,在DNA的一条链(例如,编码链)上有Cas切口酶,并且在非编码或相反的DNA链或第二DNA靶位置上有直系同源物。直系同源物可以是但不限于Cas9切口酶,诸如SaCas9切口酶或SpCas9切口酶。可能有利的是使用两种需要不同PAM并可能具有不同指导物要求的不同直系同源物,由此允许使用者进行更大程度的控制。
CRISPR-Cas蛋白
编码CRISPR效应蛋白的核酸分子有利地是密码子优化的CRISPR效应蛋白。在这种情况下,密码子优化的序列的实例是对于在真核生物,例如人类中表达而优化(即,对于在人类中表达而优化),或对于如本文所论述的另一种真核生物、动物或哺乳动物中表达而优化的序列;参见例如WO 2014/093622(PCT/US2013/074667)中的SaCas9人类密码子优化的序列。虽然这是优选的,但将了解,其他实例可能存在,并且对于除人类以外的宿主种类的密码子优化或对于特定器官的密码子优化是已知的。在一些实施方案中,编码CRISPR效应蛋白的酶编码序列对于在特定细胞,诸如真核细胞中表达进行密码子优化。真核细胞可以是特定生物体的那些或来源于特定生物体的那些,所述生物体诸如植物或哺乳动物,包括但不限于人类,或如本文所论述的非人类真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、犬、家畜或非人类哺乳动物或灵长类动物。在一些实施方案中,可以排除有可能不会对人类或动物带来任何实质性医学益处的修改人类的种系遗传身份的过程和/或修改动物的遗传身份的过程,以及由此类过程产生的动物。一般来讲,密码子优化是指修饰核酸序列用于增强在目标宿主细胞中的表达的过程,这个过程是通过用在宿主细胞的基因中较频繁或最频繁使用的密码子替代原生序列的至少一个密码子(例如约或大于约1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时维持原生氨基酸序列。不同种类对特定氨基酸的某些密码子展现特定偏性。密码子偏性(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关,据信所述效率继而尤其取决于所翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。细胞中所选tRNA的主导性一般反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来调整基因用于给定的生物体中最佳基因表达。密码子使用表可容易得到,例如,在kazusa.orjp/codon/上可得的“密码子使用数据库(CodonUsage Database)”中,并且这些表可以按许多方式进行改编。参见Nakamura,Y.,等人“Codon usage tabulated from the international DNA sequence databases:statusfor the year 2000”Nucl.Acids Res.28:292(2000)。对于在特定宿主细胞中表达对特定序列进行密码子优化的计算机算法也可得到,诸如Gene Forge(Aptagen;Jacobus,PA)也可得到。在一些实施方案中,编码Cas的序列中的一个或多个密码子(例如1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在某些实施方案中,如本文所述的方法可以包括提供Cas转基因细胞,在所述Cas转基因细胞中提供或引入编码一种或多种指导RNA的一种或多种核酸,所述一种或多种核酸在细胞中与包含一种或多种目标基因的启动子的调控元件可操作地连接。如本文所用,术语“Cas转基因细胞”是指细胞,诸如真核细胞,其中Cas基因已经在基因组上整合。细胞的性质、类型或来源根据本发明并无特别限制。而且,Cas转基因引入细胞中的方式可以有变化并且可以是如本领域中已知的任何方法。在某些实施方案中,通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。在某些其他实施方案中,通过从Cas转基因生物体中分离细胞来获得Cas转基因细胞。通过实例并且不受限制,如本文所提及的Cas转基因细胞可以来源于Cas转基因真核生物,诸如Cas敲入真核生物。参考WO 2014/093622(PCT/US13/74667),以引用的方式并入本文中。可以修改针对靶向Rosa基因座的转让给SangamoBioSciences,Inc.的美国专利公布号20120017290和20110265198的方法以利用本发明的CRISPR Cas系统。还可以修改针对靶向Rosa基因座的转让给Cellectis的美国专利公布号20130236946的方法以利用本发明的CRISPR Cas系统。通过另一个实例,参考Platt等人(Cell;159(2):440-455(2014)),所述文献描述了Cas9敲入小鼠,以引用的方式并入本文中。Cas转基因还可以包含Lox-Stop-polyA-Lox(LSL)盒,从而促成由Cre重组酶可诱导的Cas表达。或者,可以通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。用于转基因的递送系统在本领域中是众所周知的。通过实例,可以借助于如本文别处也描述的载体(例如AAV、腺病毒、慢病毒)和/或颗粒和/或纳米颗粒递送将Cas转基因递送于例如真核细胞中。
技术人员将了解,如本文所提及的细胞,诸如Cas转基因细胞除了具有整合的Cas基因或当与能够将Cas导向靶基因座的RNA复合时由Cas的序列特异性作用产生的突变以外还可以包含基因组改变。
在某些方面,本发明涉及例如用于将Cas和/或能够将Cas导向靶基因座的RNA(即,指导RNA)递送至或引入细胞中以及用于繁殖这些组分(例如在原核细胞中)的载体。如本文所用,“载体”是允许或有助于实体从一种环境转移至另一种环境的工具。载体是复制子,诸如质粒、噬菌体或粘粒,可以向该复制子中插入另一个DNA区段以便使得该插入的区段复制。一般来讲,载体当与适当控制元件相关联时能够复制。一般来讲,术语“载体”是指能够转运它所连接的另一个核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离端、不包含游离端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域中已知的多核苷酸的其他种类。一种类型的载体是“质粒”,其是指环状双链DNA环,可以诸如通过标准分子克隆技术向该环中插入另外的DNA区段。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于包装到病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))中的载体中。病毒载体还包括由转染到宿主细胞中的病毒携带的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入到宿主细胞中之后被整合到宿主细胞的基因组中,并且因此随着宿主基因组一起复制。此外,某些载体能够引导它们可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。在重组DNA技术中有效用的常用表达载体常常呈质粒的形式。
重组表达载体可以包含处于适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含一个或多个调控元件,这些调控元件可以基于用于表达的宿主细胞来选择,可操作地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在意指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调控元件。关于重组和克隆方法,提及2004年9月2日以US2004-0171156A1公布的美国专利申请10/815,730,该专利的内容以引用方式整体并入本文。因此,本文所公开的实施方案还可以包括包含CRISPR效应系统的转基因细胞。在某些示例性实施方案中,转基因细胞可以充当个别离散体积。换句话说,可以将包含掩蔽构建体的样品例如在合适的递送囊泡中递送至细胞,并且如果靶标存在于递送囊泡中,则CRISPR效应子被激活并且生成可检测信号。
一个或多个载体可以包括一个或多个调控元件,例如一个或多个启动子。一个或多个载体可以包含Cas编码序列和/或单个,但可能还可以包含至少3个或8个或16个或32个或48个或50个指导RNA(例如sgRNA)编码序列,诸如1-2个、1-3个、1-4个、1-5个、3-6个、3-7个、3-8个、3-9个、3-10个、3-8个、3-16个、3-30个、3-32个、3-48个、3-50个RNA(例如sgRNA)。在单个载体中,可以存在每个RNA(例如sgRNA)的启动子,有利地当存在至多约16个RNA时;并且当单个载体提供多于16个RNA时,一个或多个启动子可以驱动多于一个RNA的表达,例如当存在32个RNA时,每个启动子可以驱动两个RNA的表达,并且当存在48个RNA时,每个启动子可以驱动三个RNA的表达。通过简单的算术和完善的克隆方案和本公开中的教义,本领域技术人员可以关于适合的示例性载体(诸如AAV)的一个或多个RNA和诸如U6启动子的适合启动子来容易地实施本发明。举例来说,AAV的包封限度为约4.7kb。单个U6-gRNA(加上用于克隆的限制性位点)的长度为361bp。因此,技术人员可以容易地将约12-16个,例如13个U6-gRNA盒装配至单个载体中。这可以通过任何适合的手段,诸如用于TALE组装的金门策略来组装(genome-engineering.org/taleffectors/)。技术人员还可以使用串联指导策略以使U6-gRNA的数目增加约1.5倍,例如,从12-16个,例如13个增加至约18-24个,例如约19个U6-gRNA。因此,本领域技术人员可以在单个载体,例如AAV载体中容易地达到约18-24个,例如约19个启动子-RNA,例如U6-gRNA。用于增加载体中启动子和RNA的数目的进一步方式是使用单个启动子(例如U6)以表达由可切割序列分离的RNA阵列。并且,用于增加载体中启动子-RNA的数目的更进一步方式是在编码序列或基因的内含子中表达由可切割序列分离的启动子-RNA阵列;并且在这种情况下,有利的是使用聚合酶II启动子,其可以具有增加的表达并且能够以组织特异性方式转录长RNA。(参见例如nar.oxfordjournals.org/content/34/7/e53.short and nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在有利的实施方案中,AAV可以包封靶向至多约50个基因的U6串联gRNA。因此,根据本领域中的知识和本公开中的教义,无需过度实验技术人员可以容易地制备和使用一个或多个载体,例如单个载体,所述载体表达多个RNA或指导物,所述个RNA或指导物处于一个或多个启动子控制下或者操作性地或功能性地连接至一个或多个启动子—尤其是本文所论述的数目的RNA或指导物。
指导RNA编码序列和/或Cas编码序列可以功能性地或操作性地连接至一个或多个调控元件,并且因此所述一个或多个调控元件驱动表达。一个或多个启动子可以是一个或多个组成型启动子和/或一个或多个条件型启动子和/或一个或多个诱导型启动子和/或一个或多个组织特异性启动子。启动子可以选自由以下组成的组:RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒劳斯肉瘤病毒(Rous sarcoma virus)(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子U6。
CRISPR-Cas蛋白可以额外地被修饰。如本文所用,关于CRISPR-Cas蛋白的术语“修饰的”通常是指与衍生其的野生型Cas蛋白相比,CRISPR-Cas蛋白具有一个或多个修饰或突变(包括点突变、截短、插入、缺失、嵌合体、融合蛋白等)。所谓衍生的,是指在与野生型酶具有高度序列同源性的意义上,衍生酶主要基于野生型酶,但是已经以本领域已知或如本文所述的某种方式对衍生酶进行了突变(修饰)。
对CRISPR-Cas蛋白的另外的修饰可能会或可能不会导致功能改变。举例来说,且特别地就CRISPR-Cas蛋白而言,不导致功能改变的修饰包括例如针对表达到特定宿主中进行密码子优化,或向核酸酶提供特定标记物(例如用于可视化)。可能导致功能改变的修饰还可以包括突变,包括点突变、插入、缺失、截短(包括拆分核酸酶)等,以及嵌合核酸酶(例如包含来自不同直系同源物或同系物的结构域)或融合蛋白。融合蛋白可包括但不限于例如与异源结构域或功能结构域(例如定位信号、催化结构域等)形成的融合物。在某些实施方案中,可以组合各种不同的修饰(例如,具有催化活性的突变核酸酶进一步融合至功能结构域(例如)以诱导DNA甲基化;或另一种核酸修饰,如包括但不限于断裂(例如通过不同的核酸酶(结构域))、突变、缺失、插入、替代、连接、消化、断裂或重组)。如本文所用,“改变的功能性”包括但不限于改变的特异性(例如改变的靶标识别、增加的(例如“增强的”Cas蛋白)或降低的特异性,或改变的PAM识别)、改变的活性(例如增加的或降低的催化活性,包括无催化活性的核酸酶或切口酶)和/或改变的稳定性(例如与去稳定结构域融合)。合适的异源结构域包括但不限于核酸酶、连接酶、修复蛋白、甲基转移酶、(病毒)整合酶、重组酶、转座酶、argonaute、胞苷脱氨酶、反转录子、II族内含子、磷酸酶、磷酸化酶、磺酰化酶(sulpfurylase)、激酶、聚合酶、核酸外切酶等。所有这些修饰的实例在本领域中都是已知的。将理解的是,如本文所提及的“修饰的”核酸酶,且特别地“修饰的”Cas或“修饰的”CRISPR-Cas系统或复合物优选地仍具有与多核酸相互作用或结合的能力(例如与指导分子复合)。这种修饰的Cas蛋白可与如本文所述的脱氨酶蛋白或其活性结构域组合。
在某些实施方案中,CRISPR-Cas蛋白可包含一种或多种使活性和/或特异性增强的修饰,例如包括使靶向或非靶向链稳定的突变残基(例如eCas9;“Rationallyengineered Cas9 nucleases with improved specificity”,Slaymaker等人(2016),Science,351(6268):84-88,以引用方式整体并入本文)。在某些实施方案中,工程化CRISPR蛋白的改变或修饰的活性包括增加的靶向效率或减少的脱靶结合。在某些实施方案中,工程化CRISPR蛋白的改变的活性包括修改的切割活性。在某些实施方案中,改变的活性包括对靶多核苷酸基因座的增加的切割活性。在某些实施方案中,改变的活性包括对靶多核苷酸基因座的降低的切割活性。在某些实施方案中,改变的活性包括对脱靶多核苷酸基因座的降低的切割活性。在某些实施方案中,修饰的核酸酶的改变的或修改的活性包括改变的解旋酶动力学。在某些实施方案中,修饰的核酸酶包含改变蛋白质与包含RNA的核酸分子(在Cas蛋白的情况下)、或靶多核苷酸基因座的链、或脱靶多核苷酸的链的缔合的修饰。在本发明的一方面,工程化CRISPR蛋白包含改变CRISPR复合物的形成的修饰。在某些实施方案中,改变的活性包括对脱靶多核苷酸基因座的增加的切割活性。因此,在某些实施方案中,相较于脱靶多核苷酸基因座,对靶多核苷酸基因座的特异性增加。在其他实施方案中,相较于脱靶多核苷酸基因座,对靶多核苷酸基因座的特异性降低。在某些实施方案中,突变导致脱靶效应(例如切割或结合特性、活性或动力学)降低,诸如在Cas蛋白的情况下,例如导致对靶标与指导RNA之间的错配的耐受性降低。其他突变可能导致脱靶效应(例如切割或结合特性、活性或动力学)增加。其他突变可能导致中靶效应(例如切割或结合特性、活性或动力学)增加或降低。在某些实施方案中,突变引起改变的(例如增加或降低的)解旋酶活性、功能性核酸酶复合物(例如CRISPR-Cas复合物)的缔合或形成。在某些实施方案中,突变导致PAM识别改变,即相较于未修饰的Cas蛋白,可能(另外地或替代地)识别不同的PAM(参见例如“Engineered CRISPR-Cas9 nucleases with altered PAM specificities”,Kleinstiver等人(2015),Nature,523(7561):481-485,以引用方式整体并入本文)。为了增强特异性,特别优选的突变包括带正电的残基和/或(进化的)保守的残基,诸如保守的带正电残基。在某些实施方案中,此类残基可被突变为不带电荷的残基,诸如丙氨酸。
基于Cas9的切口酶
在某些实施方案中,CRISPR切口酶是基于Cas9的切口酶。Cas9基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4基因以及CRISPR盒在同一基因座中。此外,Cas9蛋白含有可易于识别的C端区,所述区域与转座子ORF-B同源并且包括活性RuvC样核酸酶、精氨酸富集区。
在特定实施方案中,切口酶是来自包括以下的属的生物体的Cas9切口酶:链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属或棒状杆菌属。
在特定实施方案中,切口酶是来自包括以下的属的生物体的Cas9切口酶:肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属。
在另外的特定实施方案中,Cas9切口酶来自选自以下的生物体:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌。在特定实施方案中,切口酶是来自源自化脓性链球菌、金黄色葡萄球菌或嗜热链球菌Cas9的生物体的Cas9切口酶。
切口酶可以包含嵌合蛋白,所述嵌合蛋白包含来自第一效应蛋白(例如Cas9)直系同源物的第一片段和来自第二效应蛋白(例如Cas9)直系同源物的第二片段,并且其中第一应蛋白直系同源物和第二效应蛋白直系同源物是不同的。第一和第二效应蛋白(例如Cas9)直系同源物中的至少一者可以包含来自包括以下的生物体的效应蛋白(例如Cas9):链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cas9:链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属,其中第一片段和第二片段并非来自相同细菌;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自以下的Cas9:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌、土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌,其中第一片段和第二片段并非来自相同细菌。
在更优选的实施方案中,Cas9切口酶来源于选自以下的细菌种类:化脓性链球菌、金黄色葡萄球菌或嗜热链球菌Cas9。在某些实施方案中,Cas9p来源于选自以下的细菌种类:土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体、挑剔真细菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌。在某些实施方案中,Cas9p来源于选自以下的细菌种类:氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020。在某些实施方案中,效应蛋白来源于土拉弗朗西斯菌1的亚种,包括但不限于土拉弗朗西斯菌新凶手亚种。
在特定实施方案中,如本文所提及的Cas9的同系物或直系同源物与Cas9具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cas9的同系物或直系同源物与野生型Cas9具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在Cas9具有一个或多个突变(是突变的)的情况下,如本文所提及的所述Cas9的同系物或直系同源物与突变的Cas9具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,Cas9切口酶可以是包括但不限于以下的属的生物体的直系同源物:链球菌属种或葡萄球菌属;在特定实施方案中,Cas9蛋白可以是包括但不限于以下的种类的生物体的直系同源物:化脓性链球菌、金黄色葡萄球菌或嗜热链球菌Cas9。在特定实施方案中,如本文所提及的Cas9p的同系物或直系同源物与本文所公开的Cas9序列中的一者或多者具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cas9的同系物或直系同源物与野生型SpCas9、SaCas9或StCas9具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的Cas9切口酶与SpCas9、SaCas9或StCas9具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cas9蛋白与野生型SpCas9、SaCas9或StCas9具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。技术人员将理解,这包括Cas9蛋白的截短形式,由此在截短形式的长度上确定序列同一性。
修饰的Cas9蛋白
在特定实施方案中,令人感兴趣的是利用本文所定义的工程化的Cas9蛋白(诸如Cas9),其中所述蛋白与包含RNA的核酸分子复合以形成CRISPR复合物,其中当在CRISPR复合物中时,所述核酸分子靶向一个或多个靶多核苷酸基因座,所述蛋白与未修饰的Cas9蛋白相比包含至少一种修饰,并且其中包含修饰的蛋白的CRISPR复合物与包含未修饰的Cas9蛋白的复合物相比具有改变的活性。应当理解,当在本文中提及CRISPR“蛋白”时,Cas9蛋白优选地是修饰的CRISPR-Cas蛋白(举例来说,具有增加的或减少的(或没有)酶活性),如非限制地包括Cas9。术语“CRISPR蛋白”可以与“CRISPR-Cas蛋白”互换使用,不论所述CRISPR蛋白与野生型CRISPR蛋白相比是否具有改变的,如增加的或减少的(或没有)酶活性。
预测非结构化区的若干小段在Cas9一级结构之内。对于小的蛋白质序列的裂解和插入而言,不同的Cas9直系同源物内的暴露于溶剂且不保守的非结构化区是优选的侧面。另外,这些侧面可以用于在Cas9直系同源物之间产生嵌合蛋白。
基于以上信息,可以产生突变体,这些突变体使得酶失活或将双链核酸酶修饰为具有切口酶活性。在替代实施方案中,此信息用于开发具有减少的脱靶效应的酶(在本文别处描述)。
增强特异性,特别是通过减少脱靶效应来增强特异性的合适的Cas9酶修饰例如描述于PCT/US2016/038034中,该文献以引用方式整体并入本文。在特定实施方案中,通过使链分离不稳定,更具体地讲通过在Cas9酶中引入突变从而减少DNA相互作用区域中的正电荷来确保脱靶切割的减少(如本文所述,并且由Slaymaker等人2016(Science,1;351(6268):84-8)对Cas9进一步举例说明)。在另外的实施方案中,通过将突变引入Cas9酶中来确保脱靶切割的减少,所述突变影响靶链与指导RNA序列之间的相互作用,更具体地讲破坏了Cas9与靶DNA链的磷酸主链之间的相互作用,这种方式使得保留了靶标比活性但降低了脱靶活性(如Kleinstiver等人2016,Nature,28;529(7587):490-5对Cas9所描述)。在特定实施方案中,脱靶活性经由修饰的Cas9降低,其中与野生型Cas9相比,与靶链和非靶链的相互作用都有所修饰。
可以按各种组合使用以相对于脱靶活性增加或降低中靶活性和/或特异性,或者相对于脱靶结合增加或降低中靶结合和/或特异性的方法和突变可用于补偿或增强旨在促进其他效应的突变或修饰。此类旨在促进其他效应的突变或修饰包括对Cas9效应蛋白的突变或修饰和或对指导RNA的突变或修饰。
使用用于提高Cas9特异性的类似策略(Slaymaker等人2015“Rationallyengineered Cas9 nucleases with improved specificity”),通过使稳定非靶向DNA链的残基突变可以进一步提高Cas9的特异性。通过使用线性结构比对来预测1)Cas9的哪个结构域与DNA的哪条链结合,以及2)这些结构域中的哪些残基接触DNA,可以在没有晶体结构的情况下完成此操作。
然而,由于Cas9与已知蛋白的保守性差,此方法可能受到限制。因此,可能期望探测所有可能的DNA相互作用氨基酸(赖氨酸、组氨酸和精氨酸)的功能。
催化活性Cas9蛋白产生平切口,由此切割位点通常位于靶序列内。更特别地,平切口通常是PAM上游的2-3个核苷酸。在特定实施方案中,非靶链上的切口是PAM上游的3个核苷酸(即,在PAM上游的第3个核苷酸与第4个核苷酸之间),而靶链上的切口(即,与指导序列杂交的链)出现在互补链上的相同位置(这是3’链上PAM互补序列上游的3个核苷酸,或在PAM互补序列上游的核苷酸3与4之间)。
在某些实施方案中,使Cas9蛋白的一个或多个催化结构域(例如RuvC I、RuvC II和RuvC III,或Cas9蛋白的HNH结构域)突变以产生仅切割靶序列的一条DNA链的突变Cas蛋白。
作为进一步指导且非限制性地,例如来自化脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)将Cas9从切割两条链的核酸酶转化为切口酶(切割单条链)。使Cas9成为切口酶的突变的其他实例包括但不限于H840A、N854A和N863A。作为进一步指导,在酶不是SpCas9的情况下,可以在对应于SpCas9的位置10、762、840、854、863和/或986的任何或所有残基处进行突变(这可以例如通过标准序列比较工具确定)。特别地,在SpCas9中优选以下任何或所有突变:D10A、E762A、H840A、N854A、N863A和/或D986A;同样还设想了对于任何替代氨基酸的保守取代。
在第一优选实施方案中,CRISPR-Cas蛋白是具有无催化活性的HNH结构域的SpCas9切口酶(例如,具有N863A突变的SpCas9切口酶)。在第二优选实施方案中,CRISPR-Cas蛋白是具有无催化活性的HNH结构域的SaCas9(例如,具有N580A突变的SaCas9切口酶)。在第三优选实施方案中,CRISPR-Cas蛋白是HNH结构域部分或完全去除的SpCas9切口酶。在第四优选实施方案中,CRISPR-Cas蛋白是HNH结构域部分或完全去除的SaCas9。
在以上所述的某些Cas9酶中,酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于根据FnCas9蛋白或任何相应的直系同源物的位置D917、E1006、E1028、D1227、D1255A、N1257。在一方面,本发明提供了一种本文所论述的组合物,其中Cas9酶是失活的酶,根据FnCas9蛋白或Cas9直系同源物中的相应位置,所述酶包含一个或多个选自由以下组成的组的突变:D917A、E1006A、E1028A、D1227A、D1255A和N1257A。在一方面,本发明提供了一种本文所论述的组合物,其中根据FnCas9蛋白或Cas9直系同源物中的相应位置,CRISPR-Cas蛋白包含D917或E1006和D917,或D917和D1255。
在某些实施方案中,Cas9的修饰或突变包括RuvCI、RuvCIII、RuvCIII或HNH结构域中的突变。在某些实施方案中,相对于SpCas9的氨基酸位置编号,修饰或突变包括在以下位置中的一个或多个处的氨基酸取代:12、13、63、415、610、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311和1325;优选地是855、810、1003和1060;或848、1003。在某些实施方案中,在以下位置处的修饰或突变包括丙氨酸取代:63、415、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311或1325;优选地是855;810、1003和1060;848、1003和1060;或497、661、695和926。在某些实施方案中,修饰包括K855A;K810A、K1003A和R1060A;或K848A、K1003A(相对于SpCas9)和R1060A。在某些实施方案中,在某些实施方案中,修饰包括N497A、R661A、Q695A和Q926A(相对于SpCas9)。
作为进一步的实例,可是使Cas9的两个或更多个催化结构域(RuvC I、RuvC II和RuvC III或HNH结构域)突变以产生基本上缺乏所有DNA切割活性的突变Cas9。在一些实施方案中,将D10A突变与H840A、N854A或N863A突变中的一者或多者结合以产生基本上缺乏所有DNA切割活性的Cas9酶。在一些实施方案中,当突变酶的DNA切割活性相对于其非突变形式而言小于约25%、10%、5%、1%、0.1%、0.01%或更低时,认为CRISPR酶基本上缺乏所有DNA切割活性。在酶不是SpCas9的情况下,可以在对应于SpCas9的位置10、762、840、854、863和/或986的任何或所有残基处进行突变(这可以例如通过标准序列比较工具确定)。特别地,在SpCas9中优选以下任何或所有突变:D10A、E762A、H840A、N854A、N863A和/或D986A;同样还设想了对于任何替代氨基酸的保守取代。其他Cas9中的相应位置处的相同(或这些突变的保守取代)也是优选的。特别优选的是SpCas9中的D10和H840。然而,在其他Cas9中,对应于SpCas9 D10和H840的残基也是优选的。
在某些实施方案中,两个不同的嵌合gRNA可以与Cas9切口酶一起使用,它们将以与使用单个嵌合gRNA相似的效率一起引入靶位点的切割。可以通过这种方式降低脱靶效应,因为Cas9切口酶没有像野生型Cas9一样诱导双链断裂的能力。这种双切刻方法例如描述于PCT公布号WO2014093622和WO2014204725中,所述文献以引用方式并入本文。
Cas12蛋白
在某些示例性实施方案中,所述组合物、系统和测定可以包括多个Cas12直系同源物或与一个或多个Cas9直系同源物组合的一个或多个直系同源物。在某些示例性实施方案中,Cas12直系同源物是Cpf1直系同源物、C2c1直系同源物或C2c3直系同源物。
Cpf1直系同源物
本发明涵盖基于来源于被指代为亚型V-A的Cpf1基因座的野生型Cpf1效应蛋白的突变形式的切口酶的用途。在本文中,此类效应蛋白也称为“Cpf1p”,例如Cpf1蛋白(并且这种效应蛋白或Cpf1蛋白或来源于Cpf1基因座的蛋白也称为“CRISPR酶”)。目前,亚型V-A基因座包括cas1、cas2(指代为cpf1的独特基因)和CRISPR阵列。Cpf1(CRISPR相关蛋白Cpf1,亚型PREFRAN)是一种大蛋白(约1300个氨基酸),它含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,Cpf1缺乏所有Cas9蛋白中都存在的HNH核酸酶结构域,而RuvC样结构域在Cpf1序列中是连续的,相比之下Cas9含有长插入片段,包括HNH结构域。因此,在特定实施方案中,CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
术语“直系同源物(orthologue)”(在本文中也称为“直系同源物(ortholog)”)和“同系物(homologue)”(本文中也称为“同系物(homolog)”)在本领域中是众所周知的。作为进一步指导,如本文所用的蛋白质的“同系物”是与作为其同系物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。同系物和直系同源物可以通过同源建模(参见例如Greer,Science第228卷(1985)1055和Blundell等人Eur J Biochem vol 172(1988),513)或“结构BLAST”(Dey F,Cliff Zhang Q,Petrey D,Honig B.Toward a"structural BLAST":usingstructural relationships to infer function.Protein Sci.2013年4月;22(4):359-66.doi:10.1002/pro.2225.)。另参见Shmakov等人(2015)了解在CRISPR-Cas基因座领域中的申请。同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。
Cpf1基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4基因以及CRISPR盒(例如新凶手弗朗西斯菌(Francisella cf.novicida)Fx1的FNFX1_1431-FNFX1_1428)在同一基因座中。因此,此推定的新颖CRISPR-Cas系统的布局似乎与II-B型的布局类似。此外,与Cas9类似,Cpf1蛋白含有与转座子ORF-B同源的易于鉴定的C端区,并且包含活性的RuvC样核酸酶、精氨酸富集区和Zn指(不存在于Cas9中)。然而,与Cas9不同,Cpf1还存在于没有CRISPR-Cas环境的若干种基因组中,并且其与ORF-B的相对较高相似性表明其可能是转座子组分。表明如果此是真正的CRISPR-Cas系统并且Cpf1是Cas9的功能类似物,则其将是新颖CRISPR-Cas类型,即V型(参见Annotation and Classification ofCRISPR-Cas Systems.Makarova KS,Koonin EV.Methods Mol Biol.2015;1311:47-75)。然而,如本文所述,将Cpf1指代为亚型V-A以将其与C2c1p区分,该C2c1p不具有相同的结构域结构并且因此被指代为亚型V-B。
在特定实施方案中,效应蛋白是来自源自包括以下的属的生物体的Cpf1效应蛋白:链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属。
在另外的特定实施方案中,Cpf1效应蛋白来自选自以下的生物体:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌。
切口酶可以包含嵌合蛋白,所述嵌合蛋白包含来自第一效应蛋白(例如Cpf1)直系同源物的第一片段和来自第二效应蛋白(例如Cpf1)直系同源物的第二片段,并且其中第一应蛋白直系同源物和第二效应蛋白直系同源物是不同的。第一和第二效应蛋白(例如Cpf1)直系同源物中的至少一者可以包含来自包括以下的生物体的效应蛋白(例如Cpf1):链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cpf1:链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属,其中第一片段和第二片段并非来自相同细菌;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自以下的Cpf1:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌、土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌,其中第一片段和第二片段并非来自相同细菌。
在更优选的实施方案中,Cpf1p切口酶来源于选自以下的细菌种类:土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体、挑剔真细菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌。在某些实施方案中,Cpf1p来源于选自以下的细菌种类:氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020。在某些实施方案中,效应蛋白来源于土拉弗朗西斯菌1的亚种,包括但不限于土拉弗朗西斯菌新凶手亚种。
在一些实施方案中,Cpf1p切口酶来源于来自真杆菌属的生物体。在一些实施方案中,CRISPR切口酶来源于细菌种类直肠真杆菌的生物体。在一些实施方案中,野生型Cpf1效应蛋白的氨基酸序列对应于NCBI参考序列WP_055225123.1、NCBI参考序列WP_055237260.1、NCBI参考序列WP_055272206.1或GenBank ID OLA16049.1。在一些实施方案中,Cpf1效应蛋白与NCBI参考序列WP_055225123.1、NCBI参考序列WP_055237260.1、NCBI参考序列WP_055272206.1或GenBank ID OLA16049.1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或序列同一性。技术人员将理解,这包括Cpf1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。在一些实施方案中,Cpf1效应蛋白识别TTTN或CTTN的PAM序列。
在特定实施方案中,如本文所提及的Cpf1的同系物或直系同源物与Cpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf1的同系物或直系同源物与野生型Cpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在Cpf1具有一个或多个突变(是突变的)的情况下,如本文所提及的所述Cpf1的同系物或直系同源物与突变的Cpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,Cpf1蛋白可以是包括但不限于以下的属的生物体的直系同源物:氨基酸球菌属种、毛螺菌科细菌或牛眼莫拉氏菌;在特定实施方案中,V型Cas蛋白可以是包括但不限于以下的种的生物体的直系同源物:氨基酸球菌属种BV3L6、毛螺菌科细菌ND2006(LbCpf1)或牛眼莫拉氏菌237。在特定实施方案中,如本文所提及的Cpf1的同系物或直系同源物与本文所公开的Cpf1序列中的一者或多者具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf1as的同系物或直系同源物与野生型FnCpf1、AsCpf1或LbCpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的Cpf1蛋白与FnCpf1、AsCpf1或LbCpf1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf1蛋白与野生型AsCpf1或LbCpf1具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在特定实施方案中,本发明的Cpf1蛋白与FnCpf1具有少于60%的序列同一性。技术人员将理解,这包括Cpf1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。
在一些实施方案中,Cpf1切口酶在Nuc结构域中包含突变。在一些实施方案中,Cpf1切口酶能够切刻因靶向DNA链与指导分子之间异源双链体形成而移位的目标靶基因座处的非靶向DNA链。在一些实施方案中,Cpf1切口酶包含对应于AsCpf1中的R1226A的突变。
作为进一步指导且非限制性地,来自氨基酸球菌属种的Cpf1的Nuc结构域中的精氨酸至丙氨酸取代(R1226A)将Cpf1从切割两条链的核酸酶转化为切口酶(切割单条链)。本领域技术人员将理解,在酶不是AsCpf1的情况下,可以在相应位置的残基处形成突变。在特定实施方案中,Cpf1为FnCpf1,并且突变是在位置R1218处的精氨酸上。在特定实施方案中,Cpf1为LbCpf1,并且突变是在位置R1138处的精氨酸上。在特定实施方案中,Cpf1为MbCpf1,并且突变是在位置R1293处的精氨酸上。
C2c1直系同源物
本发明涵盖来源于被指代为亚型V-B的C2c1基因座的基于C2c1的切口酶的用途。在本文中,此类效应蛋白也称为“C2c1p”,例如C2c1蛋白(并且这种效应蛋白或C2c1蛋白或来源于C2c1基因座的蛋白也称为“CRISPR酶”)。目前,亚型V-B基因座包括cas1-Cas4融合物、cas2(指代为C2c1的独特基因)和CRISPR阵列。C2c1(CRISPR相关蛋白C2c1)是一种大蛋白(约1100-1300个氨基酸),它含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,C2c1缺乏所有Cas9蛋白中都存在的HNH核酸酶结构域,而RuvC样结构域在C2c1序列中是连续的,相比之下Cas9含有长插入片段,包括HNH结构域。因此,在特定实施方案中,CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
C2c1(也称为Cas12b)蛋白是RNA指导的核酸酶。其切割依赖于tracr RNA以募集包含指导序列和正向重复序列的指导RNA,其中所述指导序列与靶核苷酸序列杂交以形成DNA/RNA异源双链体。基于目前的研究,C2c1核酸酶活性还需要依赖于PAM序列的识别。C2c1PAM序列是T富集序列。在一些实施方案中,PAM序列是5’TTN 3'或5’ATTN 3',其中N是任何核苷酸。在特定实施方案中,PAM序列是5’TTC 3'。在特定实施方案中,PAM处于恶性疟原虫的序列之中。
C2c1在靶基因座处产生交错切口,在靶序列的PAM远端侧具有5’突出端或“粘性末端”。在一些实施方案中,5'突出端为7nt。参见Lewis和Ke,Mol Cell.2017年2月2日;65(3):377-379。
C2c1基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4基因以及CRISPR盒在同一基因座中。因此,此推定的新颖CRISPR-Cas系统的布局似乎与II-B型的布局类似。此外,与Cas9类似,C2c1蛋白含有活性的RuvC样核酸酶、精氨酸富集区和Zn指(不存在于Cas9中)。
在特定实施方案中,CRISPR切口酶是来自源自包括以下的属的生物体的C2c1切口酶:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、柠檬酸杆菌属、迷踪菌门、甲基杆菌属、杂食菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科。
在另外的特定实施方案中,C2c1切口酶来自选自以下的种类:抗酸土脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、候选林道菌属细菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫盐碱杆菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060)。
切口酶可以包含嵌合效应蛋白,所述嵌合蛋白包含来自第一效应蛋白(例如C2c1)直系同源物的第一片段和来自第二效应蛋白(例如C2c1)直系同源物的第二片段,并且其中第一应蛋白直系同源物和第二效应蛋白直系同源物是不同的。第一和第二效应蛋白(例如C2c1)直系同源物中的至少一者可以包含来自包括以下的生物体的效应蛋白(例如C2c1):脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、柠檬酸杆菌属、迷踪菌门、甲基杆菌属、杂食菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的C2c1:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、迷踪菌门、柠檬酸杆菌属、甲基杆菌属、杂食菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科,其中第一片段和第二片段并非来自相同细菌;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自以下的C2c1:抗酸土脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、候选林道菌属细菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫盐碱杆菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060),其中第一片段和第二片段并非来自相同细菌。
在更优选的实施方案中,C2c1p切口酶来源于选自以下的种类:抗酸土脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、候选林道菌属细菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫盐碱杆菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060)。在某些实施方案中,C2c1p来源于选自以下的细菌种类:嗜酸脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)。
在特定实施方案中,如本文所提及的C2c1的同系物或直系同源物与C2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1的同系物或直系同源物与野生型C2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在C2c1具有一个或多个突变(是突变的)的情况下,如本文所提及的所述C2c1的同系物或直系同源物与突变的C2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,C2c1蛋白可以是包括但不限于以下的属的生物体的直系同源物:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、柠檬酸杆菌属、迷踪菌门、甲基杆菌属、杂食菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科;在特定实施方案中,V型Cas蛋白可以是包括但不限于以下的种类的生物体的直系同源物:抗酸土脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、候选林道菌属细菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫盐碱杆菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060)。在特定实施方案中,如本文所提及的C2c1的同系物或直系同源物与本文所公开的C2c1序列中的一者或多者具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1的同系物或直系同源物与野生型AacC2c1或BthC2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的C2c1切口酶与AacC2c1或BthC2c1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1蛋白与野生型AacC2c1具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在特定实施方案中,本发明的C2c1蛋白与AacC2c1具有少于60%的序列同一性。技术人员将理解,这包括C2c1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。
在某些实施方案中,C2c1切口酶可以在体外系统或在细胞中瞬时或稳定地提供或表达,并被靶向或触发以非特异性地切割细胞核酸。在一个实施方案中,将C2c1工程化以敲减ssDNA,例如病毒ssDNA。在另一个实施方案中,将C2c1工程化以敲减RNA。可将所述系统设计成使得敲减依赖于细胞或体外系统中存在的靶DNA,或通过向系统或细胞中添加靶核酸来触发。
在某些实施方案中,C2c1蛋白是无催化活性的C2c1,其在RuvC结构域中包含突变。在一些实施方案中,无催化活性的C2c1蛋白包含对应于脂环酸芽孢杆菌C2c1中的氨基酸位置D570、E848或D977的突变。在一些实施方案中,无催化活性的C2c1蛋白包含对应于脂环酸芽孢杆菌C2c1中的D570A、E848A或D977A的突变。
在某些实施方案中,基于Cas的切口酶是在Nuc结构域中包含突变的C2c1切口酶。在一些实施方案中,C2c1切口酶包含对应于抗酸土脂环酸芽孢杆菌C2c1中的氨基酸位置R911、R1000或R1015的突变。在一些实施方案中,C2c1切口酶包含对应于抗酸土脂环酸芽孢杆菌C2c1中的R911A、R1000A或R1015A的突变。本领域技术人员将理解,在酶不是以上所列的CRISPR-Cas酶的情况下,可以在相应位置的残基处进行突变。
突变还可以在邻近残基处,例如在靠近以上指出的参与核酸酶活性的那些的氨基酸处进行。在一些实施方案中,仅RuvC结构域是失活的,而在其他实施方案中,另一推定的核酸酶结构域是失活的,其中效应蛋白复合物充当切口酶并且仅切割一条DNA链。在一些实施方案中,使用两个CRISPR-Cas变体(各自是不同的切口酶)来增加特异性,使用两个切口酶变体来切割靶标处的DNA(其中两个切口酶均切割DNA链,同时最小化或消除脱靶修饰,其中仅一条DNA链被切割并随后修复)。
在某些实施方案中,C2c1效应蛋白切割与目标靶位点相关或目标靶位点处的序列,作为包含两个C2c1效应蛋白分子的同源二聚体。在优选实施方案中,同源二聚体可以包含两个C2c1效应蛋白分子,这些分子在各自的RuvC结构域中包含不同的突变。
指导序列
如本文所用的术语“指导序列”、“crRNA”、“指导RNA”或“单指导RNA”或“gRNA”或“指导分子”是指包含与靶核酸序列具有足够互补性的任何多核苷酸序列的多核苷酸以与靶核酸序列杂交并且引导包含指导序列和CRISPR效应蛋白的靶向RNA的复合物序列特异性地结合至靶核酸序列。在一些示例性实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(NovocraftTechnologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。可以通过任何合适的测定来评定指导序列(在核酸靶向指导RNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的能力。举例来说,足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶核酸序列内的优先靶向(例如切割)。类似地,可以在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶核酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择指导序列并且因此选择核酸靶向指导以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在一些实施方案中,选择核酸靶向指导物以降低核酸靶向指导物内的二级结构程度。在一些实施方案中,当最佳折叠时,核酸靶向指导物的约或小于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸参与自身互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能(Gibbs free energy)。一种此类算法的实例是如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所描述的mFold。另一个示例性折叠算法是维也纳大学(University ofVienna)的理论化学研究所(Institute for Theoretical Chemistry)开发的使用质心结构预测算法的在线网络服务器RNAfold(参见例如A.R.Gruber等人,2008,Cell106(1):23-24;以及PA Carr和GM Church,2009,Nature Biotechnology27(12):1151-62)。
在某些实施方案中,指导RNA或crRNA可以包含正向重复(DR)序列和指导序列或间隔区序列,基本上由其组成,或由其组成。在某些实施方案中,指导RNA或crRNA可以包含融合或连接至指导序列或间隔区序列的正向重复序列,基本上由其组成,或由其组成。在某些实施方案中,正向重复序列可以位于指导序列或间隔区序列上游(即,5')。在其他实施方案中,正向重复序列可以位于指导序列或间隔区序列下游(即3')。
在某些实施方案中,crRNA包含茎环,优选单个茎环。在某些实施方案中,正向重复序列形成茎环,优选单个茎环。
在某些实施方案中,指导RNA的间隔区长度为15至35nt。在某些实施方案中,指导RNA的间隔区长度为至少15个核苷酸。在某些实施方案中,间隔区长度为15至17nt,例如15、16或17nt;17至20nt,例如17、18、19或20nt;20至24nt,例如20、21、22、23或24nt;23至25nt,例如23、24或25nt;24至27nt,例如24、25、26或27nt;27-30nt,例如27、28、29或30nt;30-35nt,例如30、31、32、33、34或35nt;或35nt或更长。
一般来讲,CRISPR-Cas、CRISPR-Cas9或CRISPR系统可以如在诸如WO 2014/093622(PCT/US2013/074667)的前述文献中那样使用并且共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因(特别地,在CRISPR-Cas9的情况下为Cas9基因)的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”和tracrRNA加工的部分正向重复序列)、指导序列(在内源性CRISPR系统的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas9的一种或多种RNA,例如CRISPR RNA和反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来讲,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源性CRISPR系统的情形中也称为原间隔区)。在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。与靶序列的互补对于切割活性很重要的指导序列的部分在本文中称为种子序列。靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中,并且可以包括处于存在于细胞内的线粒体、细胞器、囊泡、脂质体或粒子中或来自其的核酸。在一些实施方案中,特别是对于非核用途,NLS不是优选的。在一些实施方案中,CRISPR系统包含一个或多个核输出信号(NES)。在一些实施方案中,CRISPR系统包含一个或多个NLS和一个或多个NES。在一些实施方案中,可以通过搜索满足以下任何或所有条件的重复基序,在计算机上鉴定正向重复序列:1.在II型CRISPR基因座侧翼的2Kb基因组序列窗口中;2.跨度为20至50bp;和3.间隔20至50bp。在一些实施方案中,可以使用这些标准中的2个,例如1和2、2和3或1和3。在一些实施方案中,可以使用所有3个标准。
在本发明的实施方案中,术语指导序列和指导RNA,即,能够将Cas导向靶基因组基因座的RNA,如前面引用的文献诸如WO2014/093622(PCT/US2013/074667)中所述互换使用。一般来讲,指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导CRISPR复合物序列特异性地结合至靶序列的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法最佳比对时,指导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Watermanalgorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。在一些实施方案中,指导序列的长度为约或大于约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸。在一些实施方案中,指导序列的长度为小于约75个、50个、45个、40个、35个、30个、25个、20个、15个、12个或更少个核苷酸。优选地,指导序列长度为1030个核苷酸。可以通过任何适合的测定来评定指导序列引导CRISPR复合物序列特异性地结合至靶序列的能力。举例来说,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶序列内的优先切割。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶多核苷酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。
在CRISPR-Cas系统的一些实施方案中,指导序列与其相应靶序列之间的互补程度可以为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;指导物或RNA或sgRNA的长度可以为约或大于约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸;或者指导物或RNA或sgRNA的长度可以小于约75个、50个、45个、40个、35个、30个、25个、20个、15个、12个或更少个核苷酸;并且有利地tracr RNA的长度为30或50个核苷酸。然而,本发明的一个方面是减少脱靶相互作用,例如,减少指导物与具有低互补性的靶序列相互作用。实际上,在实施例中显示,本发明涉及使得CRISPR-Cas系统能够区分靶序列与具有大于80%至约95%互补性,例如83%-84%或88-89%或94-95%互补性的脱靶序列(例如,区分具有18个核苷酸的靶标与具有1个、2个或3个错配的18个核苷酸的脱靶)的突变。因此,在本发明的情形中,指导序列与其相应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序列与指导物之间的互补性,有利的是,脱靶为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与指导物之间的互补性。
指导物修饰
在某些实施方案中,本发明的指导物包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物和/或化学修饰。非天然存在的核酸可以包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸和/或碱基部分被修饰。在本发明的实施方案中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,指导物包含一种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的实施方案中,指导物包含一种或多种非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键联、硼酸磷酸酯键联的核苷酸、包含在核糖环的2’和4’碳原子之间的亚甲基桥的锁定核酸(LNA)或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物、2-硫代尿苷类似物、N6-甲基腺苷类似物或2'-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基-3’-硫代磷酸酯(MS)、硫代磷酸酯(PS)、S-约束乙基(cEt),或2'-O-甲基-3’-硫代PACE(MSP)。此类化学修饰的指导物与未修饰的指导物相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布;Ragdarm等人,0215,PNAS,E7110-E7111;Allerson等人,J.Med.Chem.2005,48:901-904;Bramsen等人,Front.Genet.,2012,3:154;Deng等人,PNAS,2015,112:11870-11875;Sharma等人,MedChemComm.,2014,5:1454-1471;Hendel等人,Nat.Biotechnol.(2015)33(9):985-989;Li等人,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。在一些实施方案中,指导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见Kelly等人,2016,J.Biotech.233:74-83)。在某些实施方案中,指导物在结合至靶DNA的区域中包含核糖核苷酸,并在结合至Cas9、Cpf1或C2c1的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程化的指导结构(诸如但不限于5'端和/或3'端、茎环区和种子区)中。在某些实施方案中,修饰不在茎环区的5'柄(5’-handle)中。指导物的茎环区的5'柄中的化学修饰可能会废除其功能(参见Li等人,Nature Biomedical Engineering,2017,1:0066)。在某些实施方案中,指导物的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸经化学修饰。在一些实施方案中,指导物的3’或5’端的3-5个核苷酸经化学修饰。在一些实施方案中,在种子区中仅引入较小的修饰,诸如2’-F修饰。在一些实施方案中,在指导物的3’端引入2'-F修饰。在某些实施方案中,指导物的5’和/3’端的3至5个核苷酸用2'-O-甲基(M)、2'-O-甲基3’硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3’硫代PACE(MSP)化学修饰。这样的修饰可以提高基因组编辑效率(参见Hendel等人,Nat.Biotechnol.(2015)33(9):985-989)。在某些实施方案中,指导物的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在某些实施方案中,指导物的5’和/3’端的多于5个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)化学修饰。这种化学修饰的指导物可以介导增强的基因破坏水平(参见Ragdarm等人,0215,PNAS,E7110-E7111)。在本发明的一个实施方案中,指导物被修饰成在其3’和/或5’端包含化学部分。这样的部分包括但不限于胺、叠氮化物、炔、硫代基、二苯并环辛炔(DBCO)或若丹明。在某些实施方案中,化学部分通过接头诸如烷基链缀合至指导物。在某些实施方案中,修饰的指导物的化学部分可用于将指导物附接至另一分子,诸如DNA、RNA、蛋白质或纳米粒子。这种化学修饰的指导物可用于识别或富集一般由CRISPR系统编辑的细胞(参见Lee等人,eLife,2017,6:e25312,DOI:10.7554)。
在某些实施方案中,如本文所提供的CRISPR系统可以利用包含指导序列的crRNA或类似多核苷酸,其中多核苷酸是RNA、DNA或RNA与DNA的混合物,并且/或者其中多核苷酸包含一种或多种核苷酸类似物。序列可以包含任何结构,包括但不限于原生crRNA的结构,诸如凸环、发夹或茎环结构。在某些实施方案中,包含指导序列的多核苷酸与可以是RNA或DNA序列的第二多核苷酸序列形成双链体。
在某些实施方案中,利用化学修饰的指导RNA。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP)。此类化学修饰的指导RNA与未修饰的指导RNA相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见Hendel,2015,NatBiotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布)。化学修饰的指导RNA还包括但不限于具有硫代磷酸酯键的RNA和在核糖环的2'与4'碳之间包含亚甲基桥的锁核酸(LNA)核苷酸。
在一些实施方案中,指导序列的长度为约或大于约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸。在一些实施方案中,指导序列的长度为小于约75个、50个、45个、40个、35个、30个、25个、20个、15个、12个或更少个核苷酸。优选地,指导序列长度为10至30个核苷酸。可以通过任何适合的测定来评定指导序列引导CRISPR复合物序列特异性地结合至靶序列的能力。举例来说,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,继而诸如通过Surveyor测定评定靶序列内的优先切割。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶RNA的切割。其他测定可能存在,并且将为本领域技术人员所想到。
在一些实施方案中,对指导物的修饰是化学修饰、插入、缺失或拆分。在一些实施方案中,化学修饰包括但不限于并入2'-O-甲基(M)类似物、2'-脱氧类似物、2-硫代尿苷类似物,N6-甲基腺苷类似物、2'-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2'-O-甲基-3’-硫代磷酸酯(MS)、S-约束乙基(cEt)、硫代磷酸酯(PS)或2'-O-甲基-3’-硫代PACE(MSP)。在一些实施方案中,指导物包含一种或多种硫代磷酸酯修饰。在某些实施方案中,指导物的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或25个核苷酸经化学修饰。在某些实施方案中,种子区中的一个或多个核苷酸经化学修饰。在某些实施方案中,在3’端的一个或多个核苷酸经化学修饰。在某些实施方案中,5’柄中的核苷酸均未经化学修饰。在一些实施方案中,种子区中的化学修饰是次要修饰,诸如并入2’-氟类似物。在具体实施方案中,种子区的一个核苷酸被2’-氟类似物替代。在一些实施方案中,3’端中的5或10个核苷酸经化学修饰。在Cpf1 CrRNA的3’端处的此类化学修饰提高基因切割效率(参见Li等人,Nature Biomedical Engineering,2017,1:0066)。在具体实施方案中,3'端中的5个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的10个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的5个核苷酸被2'-O-甲基(M)类似物替代。
在一些实施方案中,指导物的5'柄的环经修饰。在一些实施方案中,指导物的5'柄的环被修饰为具有缺失、插入、拆分或化学修饰。在某些实施方案中,环包含3、4或5个核苷酸。在某些实施方案中,环包含序列UCUU、UUUU、UAUU或UGUU。
可以选择指导序列并且因此选择核酸靶向指导RNA以靶向任何靶核酸序列。在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。术语“靶RNA”是指是或包含靶序列的RNA多核苷酸。换句话说,靶RNA可以是gRNA的一部分,即,指导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的RNA多核苷酸或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在某些实施方案中,指导RNA的间隔区长度小于28个核苷酸。在某些实施方案中,指导RNA的间隔区长度为至少18个核苷酸并且小于28个核苷酸。在某些实施方案中,指导RNA的间隔区长度在19个与28个核苷酸之间。在某些实施方案中,指导RNA的间隔区长度在19个与25个核苷酸之间。在某些实施方案中,指导RNA的间隔区长度为20个核苷酸。在某些实施方案中,指导RNA的间隔区长度为23个核苷酸。在某些实施方案中,指导RNA的间隔区长度为25个核苷酸。
在某些实施方案中,可以通过在间隔区序列与靶序列之间,包括沿着间隔区/靶标的错配位置引入错配,例如1个或多个错配,诸如1个或2个错配来探索切割效率的调节。举例来说,双重错配越处于中心(即,不是3'或5'),切割效率越受影响。因此,通过选择沿着间隔区的错配位置,可以调节切割效率。作为实例,如果需要小于100%的靶标切割(例如在细胞群体中),那么可以在间隔区序列中引入1个或多个,诸如优选2个在间隔区与靶序列之间的错配。错配位置沿着间隔区越处于中心,切割百分比越低。
在某些示例性实施方案中,可以探索切割效率以设计单指导物,所述单指导物可以区分两种或更多种因单核苷酸,诸如单核苷酸多态性(SNP)、变异或(点)突变而变化的靶标。CRISPR效应子可能对SNP(或其他单核苷酸变异)的灵敏度降低并且继续以某一效率水平切割SNP靶标。因此,对于两种靶标或一组靶标,指导RNA可以被设计成具有与靶标中的一种,即,中靶SNP互补的核苷酸序列。指导RNA被进一步设计成具有合成错配。如本文所用,“合成错配”是指在天然存在的SNP上游或下游,诸如上游或下游至多5个核苷酸,例如上游或下游4个、3个、2个或1个核苷酸,优选地上游或下游至多3个核苷酸,更优选地上游或下游至多2个核苷酸,最优选地上游或下游1个核苷酸(即,邻近SNP)处引入的非天然存在的错配。当CRISPR效应子结合至中靶SNP时,仅单错配将与合成错配一起形成,并且将继续激活CRISPR效应子并产生可检测信号。当指导RNA与脱靶SNP杂交时,将形成两个错配,即来自SNP的错配和合成错配,并且不产生可检测信号。因此,本文所公开的系统可以被设计成区分群体内的SNP。举例来说,所述系统可以用于区分因单个SNP而不同的病原性株系或检测某些疾病特异性SNP,诸如但不限于疾病相关SNP,诸如但不限于癌症相关SNP。
在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8或9上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置2、3、4、5、6或7上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置3、4、5或6上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置3上(以5'端为起点)。
在某些实施方案中,指导RNA被设计成使得错配(例如合成错配,即,除SNP以外的其他突变)位于间隔区序列的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置1、2、3、4、5、6、7、8或9上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置4、5、6或7上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置5上(以5'端为起点)。
在某些实施方案中,指导RNA被设计成使得错配位于SNP上游2个核苷酸(即,一个间插核苷酸)。
在某些实施方案中,指导RNA被设计成使得错配位于SNP下游2个核苷酸(即,一个间插核苷酸)。
在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置5上(以5'端为起点)并且SNP位于间隔区序列的位置3上(以5'端为起点)。
本文所述的实施方案涵盖如本文所论述的在真核细胞中(在体外,即,在分离的真核细胞中)诱导一个或多个核苷酸修饰,包括向细胞递送如本文所论述的载体。一个或多个突变可以包括经由一个或多个指导RNA在细胞的每个靶序列处一个或多个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处1-75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处1个、5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处40个、45个、50个、75个、100个、200个、300个、400个或500个核苷酸的引入、缺失或取代。
通常,在内源CRISPR系统的情形中,CRISPR复合物(包含杂交至靶序列并且与一种或多种Cas蛋白质复合的指导序列)的形成使得靶序列中或附近(例如距其1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个或更多个碱基对以内)切割,但可以取决于例如二级结构,特别是在RNA靶标的情况下。
扩增试剂
在某些示例性实施方案中,本文所公开的系统可以包括扩增试剂。本文描述了可用于核酸扩增的不同组分或试剂。举例来说,如本文所述的扩增试剂可以包括缓冲液,诸如Tris缓冲液。Tris缓冲液可以在适于所需应用或用途的任何浓度下使用,例如包括但不限于1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、25mM、50mM、75mM、1M等浓度。本领域技术人员将能够确定用于本发明的缓冲液(诸如Tris)的适当浓度。
为了改善核酸片段的扩增,可以在扩增反应(诸如PCR)中包括盐,诸如氯化镁(MgCl2)、氯化钾(KCl)或氯化钠(NaCl)。尽管盐浓度将取决于特定反应和应用,但在一些实施方案中,特定大小的核酸片段在特定盐浓度下可能产生最佳结果。较大产物可能需要改变的盐浓度,通常是较低的盐,以产生所需结果,而较小产物的扩增在较高盐浓度下可能产生较佳结果。本领域技术人员将了解,盐的存在和/或浓度以及盐浓度的改变可以改变生物或化学反应的严格度,并且因此可以使用为本发明和如本文所述的反应提供适当条件的任何盐。
生物或化学反应的其他组分可以包括细胞裂解组分以使细胞破开或溶解以供分析其中的物质。细胞裂解组分可以包括但不限于洗涤剂;如上所述的盐,诸如NaCl、KCl、硫酸铵[(NH4)2SO4];或其他。可以适于本发明的洗涤剂可以包括Triton X-100、十二烷基硫酸钠(SDS)、CHAPS(3-[(3-胆酰胺基丙基)二甲铵基]-1-丙磺酸盐)、乙基三甲基溴化铵、壬基苯氧基聚乙氧基乙醇(NP-40)。洗涤剂的浓度可以取决于特定应用,并且在一些情况下可以特定针对反应。如本文所详述,扩增反应可以包括以任何浓度使用的dNTP和核酸引物。
扩增反应可以包括在适于本发明的任何浓度下使用的dNTP和核酸引物,诸如包括但不限于100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mM等浓度。同样地,根据本发明可用的聚合酶可以是本领域中已知并且可用于本发明的任何特定或一般聚合酶,包括Taq聚合酶、Q5聚合酶等。
在一些实施方案中,如本文所述的扩增试剂可以适用于热启动扩增中。热启动扩增在一些实施方案中可以有益于减少或消除衔接分子或寡核苷酸的二聚,或以其他方式防止不合需要的扩增产物或人造物并且获得所需产物的最佳扩增。本文所述的用于扩增中的许多组分也可以用于热启动扩增中。在一些实施方案中,视情况而定,适用于热启动扩增的试剂或组分可以替代组成组分中的一种或多种而使用。举例来说,可以使用在特定温度或其他反应条件下表现出所需活性的聚合酶或其他试剂。在一些实施方案中,可以使用经过设计或优化以用于热启动扩增中的试剂,例如,在转座之后或在达到特定温度之后可以使聚合酶激活。此类聚合酶可以是基于抗体或基于适体的。如本文所述的聚合酶在本领域中是已知的。此类试剂的实例可以包括但不限于热启动聚合酶、热启动dNTP和光笼化dNTP。此类试剂在本领域中是已知且可得的。本领域技术人员将能够确定适于个别试剂的最佳温度。
聚合酶
本文的系统和方法利用聚合酶扩增靶序列。根据本发明可用的聚合酶可以是本领域中已知并且可用于本发明的任何特定或一般聚合酶,包括Taq聚合酶、Q5聚合酶等。在实施方案中,可以利用扩增来使得切刻的DNA片段可以在循环反应中被切刻并延伸,所述循环反应以指数方式扩增切刻位点之间的靶标。在实施方案中,聚合酶可以选自以下:Bst2.0DNA聚合酶、Bst 2.0WarmStart DNA聚合酶、Bst 3.0DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶、Gst聚合酶、Taq聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、KlenTaq、Pol III DNA聚合酶、T5 DNA聚合酶、Gst聚合酶和测序酶DNA聚合酶。
扩增可以是等温的,并针对温度进行选择。在一个实施方案中,扩增以37度快速进行。在其他实施方案中,可以通过选择可在不同温度下操作的聚合酶(例如Bsu、Bst、Phi29、klenow片段等)来选择等温扩增的温度。可以在一定温度范围内或在恒温下执行基于切口酶的扩增。在某些实施方案中,可以在约50℃-59℃、约60℃-72℃或约37℃下执行基于切口酶的扩增。基于Cas的切口酶和聚合酶可以在相同温度或不同温度下执行。
等温反应一般是指没有剧烈温度循环且温度波动不超过约1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,或者温度波动小于约1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃的反应。在某些实施方案中,在聚合酶的可操作温度范围内执行等温反应。
在一些实施方案中,如本文所述的扩增试剂可以适用于热启动扩增中。热启动扩增在一些实施方案中可以有益于减少或消除衔接分子或寡核苷酸的二聚,或以其他方式防止不合需要的扩增产物或人造物并且获得所需产物的最佳扩增。本文所述的用于扩增中的许多组分也可以用于热启动扩增中。在一些实施方案中,视情况而定,适用于热启动扩增的试剂或组分可以替代组成组分中的一种或多种而使用。举例来说,可以使用在特定温度或其他反应条件下表现出所需活性的聚合酶或其他试剂。在一些实施方案中,可以使用经过设计或优化以用于热启动扩增中的试剂,例如,在转座之后或在达到特定温度之后可以使聚合酶激活。此类聚合酶可以是基于抗体或基于适体的。如本文所述的聚合酶在本领域中是已知的。此类试剂的实例可以包括但不限于热启动聚合酶、热启动dNTP和光笼化dNTP。此类试剂在本领域中是已知且可得的。本领域技术人员将能够确定适于个别试剂的最佳温度。
引物对
在本文所提供的系统和方法的实施方案中利用引物对。引物对包含第一引物和第二引物。第一引物包含与靶核酸上的第一位置互补的部分,并且包含含有第一指导分子的结合位点的部分。第二引物包含与靶核酸上的第二位置互补的部分,并且包含含有第二指导分子的结合位点的部分。
在一方面,提供了引物对,所述引物对包含反应混合物的第一引物和第二引物,所述第一引物包含与靶核酸的第一链互补的部分和包含第一指导分子的结合位点的部分,并且所述第二引物包含与靶核酸的第二链互补的部分和包含第二指导分子的结合位点的部分。
在一方面,提供了引物对,所述引物对包含反应混合物的第一引物和第二引物,所述第一引物包含与靶核酸的链的第一位置互补的部分和包含第一指导分子的结合位点的部分,并且所述第二引物包含与靶核酸的链的第二位置互补的部分和包含第二指导分子的结合位点的部分。
在具体实施方案中,扩增反应混合物还可以包含能够与靶核酸链杂交的引物。术语“杂交”是指在引物仅与模板链之一上的其互补序列特异性地结合而不与模板中其他区域结合的条件下,寡核苷酸引物与单链核酸模板的区域结合。杂交的特异性可能受寡核苷酸引物的长度、进行杂交反应的温度、离子强度和pH的影响。术语“引物”是指能够结合至靶核酸上的单链区域以促进靶核酸链的聚合酶依赖性复制的单链核酸。“互补的”核酸或“补体”是指能够根据标准的Watson-Crick、Hoogsteen或反向Hoogsteen结合互补规则进行碱基配对的核酸。
在某些实施方案中,反应中包括引物,所述引物能够与延伸链杂交,然后进一步进行引物的聚合酶延伸以再生两个dsDNA片段:包括第一链CRISPR指导位点或第一链CRISPR指导位点和第二链CRISPR指导位点两者的第一dsDNA,以及包括第二链CRISPR指导位点或第一链CRISPR指导位点和第二链CRISPR指导位点两者的第二dsDNA。这些片段继续在循环反应中被切刻并延伸,所述循环反应以指数方式扩增切刻位点之间靶标的区域。
本发明方法提供了优于先前切刻等温扩增技术的优点,先前切刻等温扩增技术使用具有固定序列偏好的切口酶(例如在切口酶扩增反应或NEAR中),这需要使原始dsDNA靶标变性以允许退火和延伸引物,所述引物将切刻底物添加至靶标末端。本发明方法使用CRISPR切口酶,其中切刻位点可经由指导RNA进行程序化,这意味着不需要变性步骤,从而使整个反应真正地等温。反应得到简化,因为添加切刻底物的这些引物与反应后期所使用的引物不同,这意味着NEAR需要两个引物组(即4个引物),而CRISPR切刻诸如Cpf1切刻扩增仅需要一个引物组(即两个引物)。这使得CRISPR切刻扩增变得更简单,更容易操作,而无需使用复杂的仪器进行变性且随后冷却至等温温度,从而提供了一种更简单、更快速的扩增方法。
引物可以包含启动子序列。在某些实施方案中,启动子序列是可用于任选检测步骤中的序列。在实施方案中,引物包含可与SHERLOCK检测方法一起使用的T7启动子序列。本领域技术人员可以选择其他启动子序列与其他下游系统和方法一起使用。
核酸可以经历聚合步骤。如果要扩增的核酸是DNA,则选择DNA聚合酶。当初始靶标是RNA时,则首先可以使用逆转录酶将RNA靶标复制成cDNA分子,然后进一步扩增cDNA。
扩增反应可以包括在适于本发明的任何浓度下使用的dNTP和核酸引物,诸如包括但不限于100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mM等浓度。
靶核酸
在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含DNA或RNA多核苷酸。术语“靶DNA或RNA”是指是或包含靶序列的DNA或RNA多核苷酸。换句话说,靶DNA或RNA可以是gRNA的一部分,即,指导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的DNA或RNA多核苷酸或DNA或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。
基于切口酶的扩增可以用于扩增具有不同长度的靶核酸序列。举例来说,靶核酸序列的长度可以为约10-20个、约20-30个、约30-40个、约40-50个、约50-100个、约100-200个、约100-200个、约100-1000个、约1000-2000个、约2000-3000个、约3000-4000个或约4000-5000个核苷酸。靶核酸可以是DNA,例如基因组DNA、线粒体DNA、病毒DNA、质粒DNA、无循环细胞DNA、环境DNA或合成双链DNA。靶核酸可以是单链核酸,例如RNA分子。可以在基于切口酶的扩增之前将单链核酸转化为双链核酸。举例来说,可以在扩增之前通过逆转录将RNA分子转化为双链DNA。单链核酸可以选自由以下组成的组:单链病毒DNA、病毒RNA、信使RNA、核糖体RNA、转移RNA、微小RNA、短干扰RNA、小核RNA、合成RNA、长非编码RNA、微小RNA前体、dsRNA和合成单链DNA。
样品
如本文所述,用于本发明的样品可以是生物或环境样品,诸如食物样品(新鲜水果或蔬菜、肉)、饮料样品、纸表面、织物表面、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品、暴露于大气或其他气体样品,或它们的组合。举例来说,可以拭抹由包括但不限于金属、木材、塑料、橡胶等的任何材料制成的家用/商业/工业表面并测试污染物。可以针对病原性细菌或寄生虫或者其他微生物的存在测试土壤样品,用于环境目的和/或用于人类、动物或植物疾病测试。可以评估诸如淡水样品、废水样品或盐水样品的水样品的清洁度和安全性和/或可饮用性,以检测例如微小隐孢子虫(Cryptosporidiumparvum)、兰伯氏贾第虫(Giardia lamblia)或其他微生物污染的存在。在其他实施方案中,生物样品可以获自以下来源:包括但不限于组织样品、唾液、血液、血浆、血清、粪便、尿液、痰液、粘液、淋巴、滑液、脑脊髓液、腹水、胸腔积液、血清肿、脓液,或皮肤或粘膜表面的拭子。在一些具体实施方案中,环境样品或生物样品可以是粗样品和/或在应用方法之前一种或多种靶分子可能未从样品纯化或扩增。微生物的鉴定可用于许多应用和/或为许多应用所需,并且因此可以根据本发明使用本领域技术人员认为适当的来自任何来源的任何类型的样品。
在一些实施方案中,生物样品可以包括但不限于血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液,或获自关节的流体,或皮肤或粘膜表面的拭子。
在特定实施方案中,样品可以是获自人类患者的血液、血浆或血清。
在一些实施方案中,样品可以是植物样品。在一些实施方案中,样品可以是粗样品。在一些实施方案中,样品可以是纯化的样品。
检测
本文所述的系统还可以包括用于检测的系统。可以将基于切口酶的扩增与多种检测方法相结合来检测扩增的核酸产物。举例来说,检测系统和方法可以包括凝胶电泳、嵌入染料检测、PCR、实时PCR、荧光、荧光共振能量转移(FRET)、质谱、侧流测定、比色测定(HRP、ALP、金、基于纳米颗粒的测定)和CRISPR-SHERLOCK。扩增和检测相结合可以实现渺摩尔级灵敏度或飞摩尔级灵敏度。在某些实施方案中,使用本发明的方法或系统的DNA检测需要在检测之前将(扩增的)DNA转录成RNA。
显然,本发明的检测方法可以涉及核酸扩增和检测程序的各种组合。待检测的核酸可以是任何天然存在的或合成的核酸,包括但不限于DNA和RNA,核酸可以通过任何合适的方法来扩增以提供可以检测的中间产物。对中间产物的检测可以通过任何合适的方法来进行,所述方法包括但不限于结合并激活CRISPR蛋白,所述CRISPR蛋白通过直接或附带活性产生可检测信号部分。
在具体实施方案中,可以通过基于CRISPR Cas13的系统来检测扩增的核酸。在具体实施方案中,可以通过基于CRISPR Cas12的系统来检测扩增的核酸(参见Chen等人Science 360:436-439(2018)和Gootenberg等人Science 360:439-444(2018))。在具体实施方案中,可以通过基于CRISPR Cas13的系统和基于CRISPR Cas12的系统的组合来检测扩增的核酸。
核酸(包括单核苷酸变体)的检测,基于rRNA序列的检测,药物抗性筛选,监测微生物暴发,遗传扰动以及环境样品的筛选可以如例如2018年10月22日提交的WO/2019/07105的[0183]-[0327]中所描述,所述文献以引用方式并入本文。参考了WO 2017/219027;WO2018/107129;US20180298445;US 2018-0274017;US2018-0305773;WO 2018/170340;2018年3月15日提交的题为“基于CRISPR效应系统的诊断装置(Devices for CRISPREffector System Based Diagnostics)”的美国申请15/922,837;2018年9月7日提交的题为“基于多效应CRISPR的诊断系统(Multi-Effector CRISPR Based DiagnosticSystems)”的PCT/US18/50091;2018年12月20日提交的题为“基于CRISPR效应系统的多重诊断(CRISPR Effector System Based Multiplex Diagnostics)”的PCT/US18/66940;2018年10月4日提交的题为“基于CRISPR效应系统的诊断(CRISPR Effector System BasedDiagnostic)”的PCT/US18/054472;2018年10月3日提交的题为“用于出血热检测的基于CRISPR效应系统的诊断(CRISPR Effector System Based Diagnostics for HemorrhagicFever Detection)”的美国临时案62/740,728;2018年6月26日提交的美国临时案62/690,278和2018年11月14日提交的美国临时案62/767,059,题均为“基于CRISPR双切口酶的扩增、组合物、系统和方法(CRISPR Double Nickase Based Amplification,Compositions,Systems and Methods)”;2018年6月26日提交的美国临时案62/690,160和2018年11月14日提交的美国临时案62,767,077,题均为“基于CRISPR/CAS和转座酶的扩增组合物、系统和方法(CRISPR/CAS and Transposase Based Amplification Compositions,Systems,AndMethods)”;2018年6月26日提交的美国临时案62/690,257和2018年11月14日提交的美国临时案62/767,052,题均为“基于CRISPR效应系统的扩增方法、系统和诊断(CRISPR EffectorSystem Based Amplification Methods,Systems,And Diagnostics)”;2018年11月14日提交的题为“用SHERLOCK多重化高度进化的病毒变体(Multiplexing Highly EvolvingViral Variants With SHERLOCK)”的美国临时案62/767,076;和2018年11月14日提交的题为“液滴SHERLOCK(Droplet SHERLOCK)”的62/767,070。还参考了WO2017/127807;WO2017/184786;WO 2017/184768;WO2017/189308;WO 2018/035388;WO 2018/170333;WO 2018/191388;WO 2018/213708;WO 2019/005866;2018年12月21日提交的题为“新颖的CRISPR酶和系统(Novel CRISPR Enzymes and Systems)”的PCT/US18/67328;2018年12月21日提交的题为“新颖的CRISPR酶和系统(Novel CRISPR Enzymes and Systems)”的PCT/US18/67225和2018年12月21日提交的题为“新颖的CRISPR酶和系统(Novel CRISPR Enzymes andSystems)”的PCT/US18/67307;2018年7月31日提交的题为“新颖的CRISPR酶和系统(NovelCRISPR Enzymes and Systems)”的US 62/712,809;2018年10月10日提交的题为“新颖的Cas12b酶和系统(Novel Cas12b Enzymes and Systems)”的US62/744,080和2018年10月26日提交的题为“新颖的Cas12b酶和系统(Novel Cas12b Enzymes and Systems)”的U.S.62/751,196;2-18年8月7日提交的题为“新颖的CRISPR酶和系统(Novel CRISPR Enzymes andSystems)”的U.S.715,640;WO 2016/205711;U.S.9,790,490;WO2016/205749;WO 2016/205764;WO 2017/070605;WO 2017/106657和WO 2016/149661;WO2018/035387;WO2018/194963;Cox DBT等人,RNA editing with CRISPR-Cas13,Science.2017年11月24日;358(6366):1019-1027;Gootenberg JS等人,Multiplexed and portable nucleic aciddetection platform with Cas13,Cas12a,and Csm6.,Science.2018年4月27日;360(6387):439-444;Gootenberg JS等人,Nucleic acid detection with CRISPR-Cas13a/C2c2.,Science.2017年4月28日;356(6336):438-442;Abudayyeh OO等人,RNA targetingwith CRISPR-Cas13,Nature.2017年10月12日;550(7675):280-284;Smargon AA等人,Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase DifferentiallyRegulated by Accessory Proteins Csx27 and Csx28.Mol Cell.2017年2月16日;65(4):618-630.e7;Abudayyeh OO等人,C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,Science.2016年8月5日;353(6299):aaf5573;Yang L等人,Engineering and optimising deaminase fusions for genomeediting.Nat Commun.2016年11月2日;7:13330,Myrvhold等人,Field deployable viraldiagnostics using CRISPR-Cas13,Science 2018 360,444-448;Shmakov等人“Diversityand evolution of class 2CRISPR-Cas systems,”Nat Rev Microbiol.201715(3):169-182,所述文献各自以引用方式整体并入本文。
在一些具体实施方案中,可以利用靶向RNA的效应子以提供稳健的基于CRISPR的检测。本文所公开的实施方案可以以相当的灵敏度水平检测DNA和RNA两者,并且可以与所公开的HDA方法和系统结合使用。为了便于参考,本文所公开的检测实施方案也可以称为SHERLOCK(特异性高灵敏度酶促报告子解锁),在一些实施方案中所述检测实施方案在本文所公开的HDA方法之后执行,包括在嗜中温和嗜热等温条件下执行。
在一些实施方案中,核酸靶向检测系统的一个或多个元件来源于包含内源CRISPRRNA靶向系统的特定生物体。在某些示例性实施方案中,效应蛋白CRISPR RNA靶向检测系统包含至少一个HEPN结构域,包括但不限于本文所述的HEPN结构域、本领域中已知的HEPN结构域,和通过与共有序列基序相比而被识别为HEPN结构域的结构域。本文中提供若干此类结构域。在一个非限制性实例中,共有序列可以来源于本文所提供的C2c2或Cas13b直系同源物的序列。在某些示例性实施方案中,效应蛋白包含单个HEPN结构域。在某些其他示例性实施方案中,效应蛋白包含两个HEPN结构域。
在一个示例性实施方案中,效应蛋白包含一个或多个包含RxxxxH基序序列的HEPN结构域。RxxxxH基序序列可以是但不限于来自本文所述的HEPN结构域或本领域中已知的HEPN结构域。RxxxxH基序序列还包括通过组合两个或更多个HEPN结构域的部分而建立的基序序列。如所指出的,共有序列可以来源于以下文献中公开的直系同源物的序列:题为“新颖的VI型CRISPR直系同源物和系统(Novel Type VI CRISPR Orthologs and Systems)”的PCT/US2017/038154的例如第256-264和285-336页、题为“新颖的CRISPR酶和系统(NovelCRISPR Enzymes and Systems)”的美国临时专利申请62/432,240、2017年3月15日提交的题为“新颖的VI型CRISPR直系同源物和系统(Novel Type VI CRISPR Orthologs andSystems)”的美国临时专利申请62/471,710和2017年4月12日提交的题为“新颖的VI型CRISPR直系同源物和系统(Novel Type VI CRISPR Orthologs and Systems)”的美国临时专利申请62/484,786。
在本发明的实施方案中,HEPN结构域包含至少一个包含序列R{N/H/K}X1X2X3H(SEQ ID NO:15)的RxxxxH基序。在本发明的实施方案中,HEPN结构域包括包含序列R{N/H}X1X2X3H(SEQ ID NO:16)的RxxxxH基序。在本发明的实施方案中,HEPN结构域包含序列R{N/K}X1X2X3H(SEQ ID NO:17)。在某些实施方案中,X1是R、S、D、E、Q、N、G、Y或H。在某些实施方案中,X2是I、S、T、V或L。在某些实施方案中,X3是L、F、N、Y、V、I、S、D、E或A。
根据本发明使用的额外效应子可以通过其与cas1基因的接近性来鉴定,例如但不限于在距cas1基因的始端20kb和距cas1基因的末端20kb的区域内。在某些实施方案中,效应蛋白包含至少一个HEPN结构域和至少500个氨基酸,并且其中C2c2效应蛋白天然存在于Cas基因或CRISPR阵列上游或下游20kb内的原核基因组中。Cas蛋白质的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同系物或其修饰型式。在某些示例性实施方案中,C2c2效应蛋白天然存在于Cas 1基因上游或下游20kb内的原核基因组中。术语“直系同源物(orthologue)”(在本文中也称为“直系同源物(ortholog)”)和“同系物(homologue)”(本文中也称为“同系物(homolog)”)在本领域中是众所周知的。作为进一步指导,如本文所用的蛋白质的“同系物”是与作为其同系物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。
在特定实施方案中,靶向RNA的VI型Cas酶是C2c2。在其他示例性实施方案中,靶向RNA的VI型Cas酶是Cas 13b。在特定实施方案中,如本文所提及的VI型蛋白质,诸如C2c2的同系物或直系同源物与VI型蛋白质,诸如C2c2(例如,基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(Listeria newyorkensis)(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同源性或同一性。在其他实施方案中,如本文所提及的VI型蛋白质,诸如C2c2的同系物或直系同源物与野生型C2c2(例如,基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同一性。
在某些其他示例性实施方案中,CRISPR系统效应蛋白是C2c2核酸酶。C2c2的活性可以取决于两个HEPN结构域的存在。这些已经显示为RNA酶结构域,即,切割RNA的核酸酶(特别是内切核酸酶)。C2c2 HEPN还可以靶向DNA,或潜在地DNA和/或RNA。在C2c2的HEPN结构域至少能够结合至RNA并且以其野生型形式切割RNA的基础上,则优选的是C2c2效应蛋白具有RNA酶功能。关于C2c2 CRISPR系统,参考2016年6月17日提交的美国临时案62/351,662和2016年8月17日提交的美国临时案62/376,377。还参考2016年6月17日提交的美国临时案62/351,803。还参考2016年12月8日提交的题为“新颖的Crispr酶和系统(Novel CrisprEnzymes and Systems)”的美国临时案,带有博德研究所(Broad Institute)编号10035.PA4和代理人案号47627.03.2133。进一步参考East-Seletsky等人“Two distinctRNase activities of CRISPR-C2c2 enable guide-RNA processing and RNAdetection”Nature doi:10/1038/nature19802和Abudayyeh等人“C2c2 is a single-component programmable RNA-guided RNA targeting CRISPR effector”bioRxiv doi:10.1101/054742。
CRISPR系统中的RNA酶功能是已知的,举例来说,对于某些III型CRISPR-Cas系统已经报道mRNA靶向(Hale等人,2014,Genes Dev,第28卷,2432-2443;Hale等人,2009,Cell,第139卷,945-956;Peng等人,2015,Nucleic acids research,第43卷,406-417)并且提供显著优点。在表皮葡萄球菌(Staphylococcus epidermis)III-A型系统中,跨靶标的转录切割靶DNA和其转录物,这是由Cas10-Csm核糖核蛋白效应蛋白复合物内的独立活性位点介导(参见Samai等人,2015,Cell,第151卷,1164-1174)。由此提供CRISPR-Cas系统、组合物或经由本发明效应蛋白靶向RNA的方法。
在一个实施方案中,Cas蛋白质可以是以下属的生物体的C2c2直系同源物:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属、弯曲杆菌属和毛螺菌属。这种属的生物体的种类可以如本文其他方面所论述。
在某些示例性实施方案中,本发明的C2c2效应蛋白包括但不限于以下21种直系同源物种类(包括多个CRISPR基因座):沙氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属种马赛-P2398;和纤毛菌属种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属种TSL5-1;假丁酸弧菌属种OR37;丁酸弧菌属种YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
鉴定CRISPR-Cas系统酶的直系同源物的一些方法可以涉及鉴定目标基因组中的tracr序列。tracr序列的鉴定可以涉及以下步骤:在数据库中搜索正向重复序列或tracr配对序列以鉴定包含CRISPR酶的CRISPR区。在正义与反义方向上侧接CRISPR酶的CRISPR区中搜索同源序列。寻找转录终止子和二级结构。鉴定不是正向重复序列或tracr配对序列,但与正向重复序列或tracr配对序列具有大于50%同一性的任何序列作为潜在tracr序列。获取潜在tracr序列并且分析与其相关联的转录终止子序列。
应当理解,本文所述的任何功能性可以工程化至来自其他直系同源物的CRISPR酶中,包括包含来自多种直系同源物的片段的嵌合酶。此类直系同源物的实例在本文别处描述。因此,嵌合酶可以包含以下生物体的CRISPR酶直系同源物的片段:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。嵌合酶可以包含第一片段和第二片段,并且所述片段可以是本文所提及的属类或本文所提及的种类的生物体的CRISPR酶直系同源物的片段;有利地,所述片段来自不同种类的CRISPR酶直系同源物。
在实施方案中,如本文所提及的C2c2蛋白质还涵盖C2c2或其同系物或直系同源物的功能变体。如本文所用的蛋白质的“功能变体”是指这种蛋白质的变体,其至少部分保留所述蛋白质的活性。功能变体可以包括突变体(其可以是插入、缺失或置换突变体),包括多形体等。功能变体还包括这种蛋白质与另一种通常无关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。有利的实施方案可以涉及工程化的或非天然存在的靶向RNA的VI型效应蛋白。
在一个实施方案中,编码C2c2或其直系同源物或同系物的一个或多个核酸分子可以对于在真核细胞中表达进行密码子优化。真核生物可以如本文所论述。一个或多个核酸分子可以是工程化的或非天然存在的。
在一个实施方案中,C2c2或其直系同源物或同系物可以包含一个或多个突变,并且因此编码其的一个或多个核酸分子可以具有一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。关于Cas9酶的催化结构域的实例可以包括但不限于RuvC I、RuvC II、RuvC III和HNH结构域。
在实施方案中,C2c2或其直系同源物或同系物可以包含一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。关于Cas酶的催化结构域的实例可以包括但不限于HEPN结构域。
在一个实施方案中,C2c2或其直系同源物或同系物可以用作与功能结构域融合或可操作地连接至功能结构域的通用核酸结合蛋白。示例性功能结构域可以包括但不限于翻译引发剂、翻译激活剂、翻译阻遏剂、核酸酶(尤其核糖核酸酶)、剪接体、珠粒、光可诱导/可控制结构域或化学可诱导/可控制结构域。
在某些示例性实施方案中,C2c2效应蛋白可以来自选自由以下组成的组的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。
在某些实施方案中,效应蛋白可以是李斯特菌属种C2c2p,优选地是斯氏李斯特菌C2c2p,更优选地是斯氏李斯特菌血清变型1/2b菌株SLCC3954 C2c2p,并且crRNA序列的长度可以是44至47个核苷酸,其具有5'29nt正向重复序列(DR)和15nt至18nt间隔区。
在某些实施方案中,效应蛋白可以是纤毛菌属种C2c2p,优选地是沙氏纤毛菌C2c2p,更优选地是沙氏纤毛菌DSM 19757C2c2p,并且crRNA序列的长度可以是42至58个核苷酸,其具有至少24nt的5'正向重复序列,诸如5'24-28nt正向重复序列(DR),和至少14nt的间隔区,诸如14nt至28nt间隔区,或至少18nt的间隔区,诸如19、20、21、22或更多nt,诸如18-28、19-28、20-28、21-28或22-28nt。
在某些示例性实施方案中,效应蛋白可以是纤毛菌属种,韦德纤毛菌F0279;或李斯特菌属种,优选地是纽约李斯特菌FSL M6-0635。
在某些示例性实施方案中,本发明的C2c2效应蛋白包括但不限于以下21种直系同源物种类(包括多个CRISPR基因座):沙氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属种马赛-P2398;和纤毛菌属种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属种TSL5-1;假丁酸弧菌属种OR37;丁酸弧菌属种YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
在某些实施方案中,根据本发明的C2c2蛋白是或来源于所述直系同源物中的一种,或是如本申请中所描述的直系同源物中的两种或更多种的嵌合蛋白,或是所述直系同源物中的一种的突变体或变体(或嵌合突变体或变体),包括如本文别处所定义的死亡C2c2、脱落C2c2、去稳定C2c2等,其与或不与异源/功能结构域融合。
在某些示例性实施方案中,靶向RNA的效应蛋白是VI-B型效应蛋白,诸如Cas13b和第29组或第30组蛋白质。在某些示例性实施方案中,靶向RNA的效应蛋白包含一个或多个HEPN结构域。在某些示例性实施方案中,靶向RNA的效应蛋白包含C端HEPN结构域、N端HEPN结构域或这两个结构域。关于在本发明的情形中可以使用的示例性VI-B型效应蛋白,参考题为"新颖的CRISPR酶和系统(Novel CRISPR Enzymes and Systems)"并且2016年10月21日提交的美国申请号15/331,792,题为"新颖的CRISPR酶和系统(Novel CRISPR Enzymesand Systems)"并且2016年10月21日提交的国际专利申请号PCT/US2016/058302,和Smargon等人"Cas13b is a Type VI-B CRISPR-associated RNA-Guided RNasedifferentially regulated by accessory proteins Csx27 and Csx28"MolecularCell,65,1-13(2017);dx.doi.org/10.1016/j.molcel.2016.12.023,以及2017年3月15日提交的题为“新颖的Cas13b直系同源物CRISPR酶和系统(Novel Cas13b OrthologuesCRISPR Enzymes and System)”的有待转让的美国临时申请号。在一个优选实施方案中,Cas 13蛋白是LwaCas13。
掩蔽构建体
如本文所用,“掩蔽构建体”是指可以通过本文所述的激活的CRISPR系统效应蛋白切割或以其他方式灭活的分子。术语“掩蔽构建体”替代地也可以称为“检测构建体”。在某些示例性实施方案中,掩蔽构建体是基于RNA的掩蔽构建体。基于RNA的掩蔽构建体包含可被CRISPR效应蛋白切割的RNA元件。RNA元件的切割释放剂或产生构象变化,其允许可检测信号产生。下面描述了证实如何使用RNA元件以阻止或掩蔽可检测信号的产生的示例性构建体,并且本发明的实施方案包括其变体。在切割之前,或当掩蔽构建体处于“活性”状态时,掩蔽构建体阻断阳性可检测信号的生成或检测。应当理解,在某些示例性实施方案中,可以在活性RNA掩蔽构建体存在下产生极小背景信号。阳性可检测信号可以是可使用本领域中已知的光学、荧光、化学发光、电化学或其他检测方法检测到的任何信号。术语“阳性可检测信号”用于与在掩蔽构建体存在下可检测的其他可检测信号区分开。举例来说,在某些实施方案中,当存在掩蔽剂时可以检测到第一信号(即阴性可检测信号),所述第一信号然后在检测到靶分子且掩蔽剂被激活的CRISPR效应蛋白切割或灭活时转化为第二信号(例如阳性可检测信号)。
在某些示例性实施方案中,掩蔽构建体可以阻遏基因产物的生成。基因产物可以由添加到样品中的报告构建体编码。掩蔽构建体可以是参与RNA干扰途径的干扰RNA,诸如短发夹RNA(shRNA)或小干扰RNA(siRNA)。掩蔽构建体还可以包含微小RNA(miRNA)。当存在时,掩蔽构建体阻遏基因产物的表达。基因产物可以是在不存在掩蔽构建体时可被标记的探针、适体或抗体检测的荧光蛋白或其他RNA转录物或蛋白。在激活效应蛋白后,掩蔽构建体被切割或以其他方式沉默而允许基因产物作为阳性可检测信号表达和检测。
在某些示例性实施方案中,掩蔽构建体可以螯合生成可检测阳性信号所需要的一种或多种试剂,使得从掩蔽构建体释放一种或多种试剂导致可检测阳性信号的生成。所述一种或多种试剂可以组合以产生比色信号、化学发光信号、荧光信号或任何其他可检测信号,并且可以包括已知适合于这样的目的的任何试剂。在某些示例性实施方案中,所述一种或多种试剂被结合所述一种或多种试剂的RNA适体鳌合。当检测到靶分子而效应蛋白被激活并且RNA适体被降解时,释放一种或多种试剂。
在本发明的其他实施方案中,所述基于RNA的掩蔽构建体阻遏可检测阳性信号的生成,或者所述基于RNA的掩蔽构建体通过掩蔽所述可检测阳性信号或替代地生成可检测阴性信号来阻遏可检测阳性信号的生成,或者所述基于RNA的掩蔽构建体包含沉默RNA,所述沉默RNA阻遏由报告构建体编码的基因产物的生成,其中所述基因产物在表达时生成所述可检测阳性信号。
在其他实施方案中,所述基于RNA的掩蔽构建体是生成所述阴性可检测信号的核酶,并且其中当所述核酶被灭活时生成所述阳性可检测信号,或者所述核酶将底物转化为第一颜色,并且其中当所述核酶被灭活时,所述底物转化为第二颜色。
在其他实施方案中,所述基于RNA的掩蔽剂是RNA适体,或者所述适体螯合酶,其中所述酶通过作用于底物而在从所述适体释放后生成可检测信号,或者所述适体螯合一对剂,所述剂在从所述适体释放时组合以生成可检测信号。
在另一个实施方案中,所述基于RNA的掩蔽构建体包含RNA寡核苷酸,可检测配体和掩蔽组分附接至所述RNA寡核苷酸。在另一个实施方案中,所述可检测配体是荧光团,并且所述掩蔽组分是猝灭分子,或用以扩增靶RNA分子的试剂,诸如
在某些示例性实施方案中,掩蔽构建体可以固定在个别离散体积(在下文中进一步定义)的固体衬底上,并螯合单一试剂。举例来说,试剂可以是包含染料的珠粒。当被固定的试剂鳌合时,个别珠粒过于扩散而不能生成可检测信号,但是从掩蔽构建体释放后能够生成可检测信号,例如在溶液浓缩中通过聚集或简单增加。在某些示例性实施方案中,固定的掩蔽剂是基于RNA的适体,所述适体可以在检测到靶分子后被激活的效应蛋白切割。
在某些其他示例性实施方案中,掩蔽构建体与溶液中的固定的试剂结合,从而阻断试剂与溶液中游离的单独标记结合配偶体结合的能力。因此,在对样品施加洗涤步骤后,在不存在靶分子的情况下标记的结合配偶体会从样品中洗掉。然而,如果效应蛋白被激活,则掩蔽构建体被切割至足以干扰掩蔽构建体结合试剂的能力的程度,从而允许标记的结合配偶体与固定的试剂结合。因此,标记的结合配偶体在洗涤步骤后保留,表明样品中存在靶分子。在某些方面,结合固定的试剂的掩蔽构建体是RNA适体。固定的试剂可以是蛋白质,并且标记的结合配偶体可以是标记的抗体。或者,固定的试剂可以是链霉亲和素,并且标记的结合配偶体可以是标记的生物素。在上述实施方案中使用的结合配偶体上的标记可以是本领域中已知的任何可检测标记。此外,可以根据本文所述的总体设计使用其他已知的结合配偶体。
在某些示例性实施方案中,掩蔽构建体可以包含核酶。核酶是具有催化特性的RNA分子。天然核酶和工程化的核酶两者包含可以被本文所公开的效应蛋白靶向的RNA或由其组成。可以选择或工程化核酶以催化生成阴性可检测信号或阻止生成阳性对照信号的反应。在激活的效应蛋白灭活核酶后,生成阴性对照信号或阻止生成阳性可检测信号的反应被移除,从而允许阳性可检测信号生成。在一个示例性实施方案中,核酶可以催化比色反应,使溶液显示为第一颜色。当核酶灭活时,溶液然后变成第二颜色,第二颜色是可检测阳性信号。Zhao等人“Signal amplification of glucosamine-6-phosphate based onribozyme glmS,”Biosens Bioelectron.2014;16:337-42描述了核酶如何用于催化比色反应的实例,并提供如何修饰这样的系统以在本文所公开的实施方案的情形中工作的实例。或者,核酶当存在时可以生成例如RNA转录物的切割产物。因此,阳性可检测信号的检测可以包括检测仅在不存在核酶的情况下生成的未切割的RNA转录物。
在某些示例性实施方案中,一种或多种试剂是能够促进生成可检测信号,诸如比色、化学发光或荧光信号的蛋白,诸如酶,所述蛋白被抑制或鳌合使得因一种或多种RNA适体与蛋白的结合,蛋白无法生成可检测信号。在本文所公开的效应蛋白激活时,RNA适体被切割或降解到一个程度即它们不再抑制蛋白产生可检测信号的能力。在某些示例性实施方案中,适体是凝血酶抑制剂适体。在某些示例性实施方案中,凝血酶抑制剂适体具有GGGAACAAAGCUGAAGUACUUACCC(SEQ ID NO:18)的序列。当该适体被切割时,凝血酶将变得具有活性并且将切割肽比色或荧光底物。在某些示例性实施方案中,比色底物是与凝血酶的肽底物共价连接的对硝基苯胺(pNA)。在被凝血酶切割后,pNA被释放并变成黄色并且容易被眼睛看到。在某些示例性实施方案中,荧光底物是可以使用荧光检测器检测的7-氨基-4-甲基香豆素蓝色荧光团。抑制性适体也可以用于辣根过氧化物酶(HRP)、β-半乳糖苷酶或小牛碱性磷酸酶(CAP),并且在上述一般原理内。
在某些实施方案中,用比色法经由酶抑制性适体的切割检测RNA酶。将RNA酶转化为比色信号的一种潜在模式是将RNA适体的切割与能够产生比色输出的酶的再激活结合。在不存在RNA切割的情况下,完整的适体将与酶靶标结合并抑制其活性。该读出系统的优点在于酶提供了另外的扩增步骤:一旦经由附带活性(例如Cas13a附带活性)从适体释放,比色酶将继续产生比色产物,导致信号放大。
在某些实施方案中,使用抑制具有比色读出的酶的现有适体。存在若干具有比色读出的适体/酶对,诸如凝血酶、蛋白C、中性粒细胞弹性蛋白酶和枯草杆菌蛋白酶。这些蛋白酶具有基于pNA的比色底物,并且可以商购获得。在某些实施方案中,使用靶向共同比色酶的新颖适体。常见且稳健的酶,诸如β-半乳糖苷酶、辣根过氧化物酶或小牛肠碱性磷酸酶,可以通过由选择策略(诸如SELEX)设计的工程化的适体靶向。这样的策略允许快速选择具有纳摩尔级结合效率的适体,并且可以用于开发用于比色读出的另外的酶/适体对。
在某些实施方案中,用比色法经由RNA拴系的抑制剂的切割检测RNA酶活性。许多常见的比色酶具有竞争性的可逆抑制剂:例如,β-半乳糖苷酶可以被半乳糖抑制。这些抑制剂中许多都很弱,但是它们的效果可以通过局部浓度的增加来增加。通过将局部浓度的抑制剂与RNA酶活性联系起来,比色酶和抑制剂对可以被工程化至RNA酶传感器中。基于小分子抑制剂的比色RNA酶传感器涉及三个组分:比色酶、抑制剂,和与抑制剂和酶共价连接以将抑制剂拴系在酶上的桥接RNA。在未切割的构型中,酶被增加的局部浓度的小分子所抑制;当RNA被切割时(例如通过Cas13a附带切割),抑制剂将被释放并且比色酶将被激活。
在某些实施方案中,通过比色法经由G四链体的形成和/或激活来检测RNA酶活性。DNA中的G四链体可以与血红素(铁(III)-原卟啉IX)复合以形成具有过氧化物酶活性的DNA酶。当提供过氧化物酶底物(例如ABTS:(2,2’-氮杂双[3-乙基苯并噻唑啉-6-磺酸]-二铵盐))时,在过氧化氢存在下G四链体-血红素复合物使得底物氧化,底物然后在溶液中形成绿色。示例性的形成G四链体的DNA序列是:GGGTAGGGCGGGTTGGGA(SEQ.I.D.No.19)。通过将RNA序列与该DNA适体杂交,G四链体结构的形成将受到限制。RNA酶附带激活(例如C2c2复合物附带激活)后,RNA钉将被切割,从而允许G四链体形成并且与血红素结合。该策略特别有吸引力,因为颜色形成是酶促的,这意味着除了RNA酶激活之外还存在另外的扩增。
在某些示例性实施方案中,掩蔽构建体可以固定在个别离散体积(在下文中进一步定义)的固体衬底上,并螯合单一试剂。举例来说,试剂可以是包含染料的珠粒。当被固定的试剂鳌合时,个别珠粒过于扩散而不能生成可检测信号,但是从掩蔽构建体释放后能够生成可检测信号,例如在溶液浓缩中通过聚集或简单增加。在某些示例性实施方案中,固定的掩蔽剂是基于RNA的适体,所述适体可以在检测到靶分子后被激活的效应蛋白切割。
在一个示例性实施方案中,掩蔽构建体包含检测剂,所述检测剂根据检测剂在溶液中聚集或分散而改变颜色。举例来说,某些纳米颗粒,诸如胶体金,当它们从聚集体移动到分散的颗粒时,经历可见的紫色到红色的色移。因此,在某些示例性实施方案中,这样的检测剂可以通过一种或多种桥分子聚集。桥分子的至少一部分包含RNA。在本文所公开的效应蛋白激活后,桥分子的RNA部分被切割,允许检测剂分散并导致相应的颜色变化。在某些示例性实施方案中,桥分子是RNA分子。在某些示例性实施方案中,检测剂是胶体金属。胶体金属材料可以包括水不溶性金属颗粒或分散在液体、水溶胶或金属溶胶中的金属化合物。胶体金属可以选自周期表中IA、IB、IIB和IIIB族的金属,以及过渡金属,尤其是VIII族的那些金属。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括以下金属的各种氧化态:锂、钠、镁、钾、钪、钛、钒、铬、锰、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂和钆。金属优选以离子形式提供,来源于适当的金属化合物,例如A13+、Ru3+、Zn2+、Fe3+、Ni2+和Ca2+离子。
当RNA桥被激活的CRISPR效应子切割时,观察到前述的色移。在某些示例性实施方案中,颗粒是胶体金属。在某些其他示例性实施方案中,胶体金属是胶体金。在某些示例性实施方案中,胶体纳米颗粒是15nm金纳米颗粒(AuNP)。由于胶体金纳米颗粒的独特表面特性,当在溶液中完全分散时在520nm处观察到最大吸光度,并且肉眼看起来呈红色。在AuNP聚集时,它们表现出最大吸光度的红移并且颜色看起来更暗,最终作为深紫色聚集体从溶液中沉淀出来。在某些示例性实施方案中,纳米颗粒经修饰而包括从纳米颗粒表面延伸的DNA接头。个别颗粒通过在RNA的每个末端与DNA接头的至少一部分杂交的单链RNA(ssRNA)桥连接在一起。因此,纳米颗粒将形成连接的颗粒和聚集体的网状物,呈现为暗沉淀物。在本文所公开的CRISPR效应子激活后,ssRNA桥将被切割,从连接网格释放AU NP并产生可见的红色。下面列出了示例性DNA接头和RNA桥序列。DNA接头末端的硫醇接头可以用于与AuNP的表面缀合。可以使用其他形式的缀合。在某些示例性实施方案中,可以生成两个AuNP群,每个DNA接头一个。这将有助于促进ssRNA桥以正确取向正确结合。在某些示例性实施方案中,第一DNA接头通过3’端缀合,而第二DNA接头通过5’端缀合。
表1.
Figure BDA0002947399140000811
在某些其他示例性实施方案中,掩蔽构建体可以包含可检测标记与其连接的RNA寡核苷酸和该可检测标记的掩蔽剂。这样的可检测标记/掩蔽剂对的实例是荧光团和荧光团的猝灭剂。由于荧光团与另一荧光团或非荧光分子之间形成非荧光复合物,可以发生荧光团的猝灭。这种机制称为基态复合物形成、静态猝灭或接触猝灭。因此,可以设计RNA寡核苷酸,使得荧光团和猝灭剂足够接近以发生接触猝灭。荧光团及其关联猝灭剂在本领域中是已知的,并且可以由本领域普通技术人员为此目的进行选择。特定的荧光团/猝灭剂在本发明的情形中并不重要,只要荧光团/猝灭剂对的选择能确保荧光团的掩蔽。在激活本文所公开的效应蛋白后,RNA寡核苷酸被切割,从而切断维持接触猝灭效应所需的荧光团和猝灭剂之间的接近度。因此,荧光团的检测可以用于确定样品中靶分子的存在。
在某些其他示例性实施方案中,掩蔽构建体可以包含一种或多种金属纳米颗粒诸如金颗粒附接至其的一种或多种RNA寡核苷酸。在一些实施方案中,掩蔽构建体包含由形成闭环的多个RNA寡核苷酸交联的多个金属纳米颗粒。在一个实施方案中,掩蔽构建体包含由形成闭环的三个RNA寡核苷酸交联的三个金纳米颗粒。在一些实施方案中,CRISPR效应蛋白切割RNA寡核苷酸导致由金属纳米颗粒产生可检测信号。
在某些其他示例性实施方案中,掩蔽构建体可以包含一种或多种量子点附接至其的一种或多种RNA寡核苷酸。在一些实施方案中,CRISPR效应蛋白切割RNA寡核苷酸导致由量子点产生的可检测信号。
在一个示例性实施方案中,掩蔽构建体可以包含量子点。量子点可以具有附接至表面的多个接头分子。接头分子的至少一部分包含RNA。接头分子在一端附接至量子点,并沿着接头的长度或在接头的末端附接至一种或多种猝灭剂,使得猝灭剂保持足够接近以发生量子点的猝灭。接头可以是分支的。如上所述,量子点/猝灭剂对并不重要,只要量子点/猝灭剂对的选择能确保荧光团的掩蔽即可。量子点及其关联猝灭剂在本领域中是已知的,并且可以由本领域普通技术人员为此目的进行选择。在本文所公开的效应蛋白激活后,接头分子的RNA部分被切割,从而消除了维持猝灭效应所需的量子点与一种或多种猝灭剂之间的接近度。在某些示例性实施方案中,量子点是链霉亲和素缀合的。RNA经由生物素接头附接并用序列/5Biosg/UCUCGUACGUUC/3IAbRQSp/(SEQ ID NO.23)或/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(SEQ ID NO.24)募集猝灭分子,其中/5Biosg/是生物素标签并且/3lAbRQSp/是Iowa黑猝灭剂。在被本文所公开的激活的效应子切割后,量子点将可见地发荧光。
以类似的方式,荧光能量转移(FRET)可以用于生成可检测阳性信号。FRET是非辐射过程,通过该过程,来自能量激发的荧光团(即“供体荧光团”)的光子将另一分子(即“受体”)中的电子的能态提升到激发单重态的更高振动水平。供体荧光团返回基态而不发出该荧光团的荧光特征。受体可以是另一荧光团或非荧光分子。如果受体是荧光团,则转移的能量作为该荧光团的荧光特征发射。如果受体是非荧光分子,则吸收的能量作为热量而损失。因此,在如本文所公开的实施方案的情形中,荧光团/猝灭剂对被附接至寡核苷酸分子的供体荧光团/受体对替换。当完整时,如通过从受体发射的荧光或热检测到的,掩蔽构建体生成第一信号(阴性可检测信号)。在本文所公开的效应蛋白激活后,RNA寡核苷酸被切割并且FRET被破坏,使得现在检测到供体荧光团的荧光(阳性可检测信号)。
在某些示例性实施方案中,掩蔽构建体包括使用插入染料,所述插入染料响应于长RNA切割为短核苷酸而改变它们的吸光度。存在若干这样的染料。举例来说,焦宁-Y将与RNA复合并形成在572nm处具有吸光度的复合物。RNA的切割导致吸光度损失和颜色变化。亚甲蓝可以以类似的方式使用,RNA切割后亚甲蓝在688nm处的吸光度变化。因此,在某些示例性实施方案中,掩蔽构建体包含RNA和插入染料复合物,所述复合物在本文所公开的效应蛋白切割RNA后改变吸光度。
在某些示例性实施方案中,掩蔽构建体可以包含用于HCR反应的引发剂。参见例如Dirks和Pierce.PNAS 101,15275-15728(2004)。HCR反应利用两种发夹物质中的势能。当具有与发夹之一上的相应区域互补的部分的单链引发剂被释放到先前稳定的混合物中时,它打开一种物质的发夹。该过程进而暴露出打开其他物质的发夹的单链区域。该过程进而暴露出与原始引发剂相同的单链区域。所产生的链反应可以导致形成切刻的双螺旋,所述切刻的双螺旋生长直至发夹供应耗尽。所得产物的检测可以在凝胶上或用比色法进行。示例性比色检测方法包括例如在Lu等人“Ultra-sensitive colorimetric assay systembased on the hybridization chain reaction-triggered enzyme cascadeamplification ACS Appl Mater Interfaces,2017,9(1):167-175;Wang等人“An enzyme-free colorimetric assay using hybridization chain reaction amplification andsplit aptamers”Analyst 2015,150,7657-7662;以及Song等人“Non covalentfluorescent labeling of hairpin DNA probe coupled with hybridization chainreaction for sensitive DNA detection.”Applied Spectroscopy,70(4):686-694(2016)中公开的那些。
在某些示例性实施方案中,掩蔽构建体可以包含HCR引发剂序列和阻止引发剂引发HCR反应的可切割结构元件,诸如环或发夹。在激活的CRISPR效应蛋白切割切割结构元件后,接着释放引发剂以触发HCR反应,检测到HCR反应表明样品中存在一种或多种靶标。在某些示例性实施方案中,掩蔽构建体包含具有RNA环的发夹。当激活的CRISRP效应蛋白切割RNA环时,可以释放引发剂以触发HCR反应。
在具体实施方案中,可以渺摩尔级灵敏度检测靶核酸。在具体实施方案中,可以飞摩尔级灵敏度检测靶核酸。在一些具体实施方案中,在不到约2小时、不到约90分钟、不到约60分钟、不到约30分钟或不到约15分钟内执行所述方法。在一些优选实施方案中,可以在不到约2小时内以2fM的检测以一锅法进行扩增和检测。
用于扩增和检测的试剂盒
本文还提供了用于扩增和/或检测样品中的靶双链核酸的试剂盒。此类试剂盒可以包括但不必限于如本文所述的扩增CRISPR系统。
在一些实施方案中,试剂盒可以包括用于纯化样品中的双链核酸的试剂。
在一些实施方案中,试剂盒可以是用于扩增和/或检测样品中的靶单链核酸的试剂盒,并且可以包括用于纯化样品中的单链核酸的试剂。所述试剂盒还可以包括一套使用说明书。
试剂盒还可以包括检测系统,在优选实施方案中是CRISPR检测系统。所述检测系统可以例如在2016年12月9日提交的美国申请62/432,553;2017年2月8日提交的US 62/456,645;2017年3月15日提交的62/471,930;2017年4月12日提交的62/484,869;2017年10月4日提交的62/568,268中描述,所有这些文献均以引用方式整体并入;且也如2017年12月8日提交的题为“基于CRISPR效应系统的诊断”的PCT/US2017/065477中所述,其以引用方式并入本文,并且特别地在[0142]-[0289]处描述了用于检测的CRISPR系统的部件。
方法
提供了扩增和/或检测方法,并且所述扩增和/或检测方法可以与如本文所公开的系统一起使用。
在本发明的一个实施方案中,可以包括基于切口酶的扩增。切口酶可以是CRISPR蛋白。因此,将切口引入dsDNA可以是可程序化的并且是序列特异性的。图1描绘了本发明的一个实施方案,该实施方案以设计成靶向dsDNA靶标的相反链的两个指导物开始。根据本发明,切口酶可以是Cpf1、C2c1、Cas9或切割或经工程化以切割DNA双链体的单链的任何直系同源物或CRISPR蛋白。然后可以通过聚合酶使切刻的链延伸。在一个实施方案中,选择切口的位置,使得聚合酶使链的延伸朝向切口位点之间的靶双链体DNA的中心部分。在某些实施方案中,反应中包括引物,所述引物能够与延伸链杂交,然后进一步进行引物的聚合酶延伸以再生两个dsDNA片段:包括第一链CRISPR指导位点或第一链CRISPR指导位点和第二链CRISPR指导位点两者的第一dsDNA,以及包括第二链CRISPR指导位点或第一链CRISPR指导位点和第二链CRISPR指导位点两者的第二dsDNA。这些片段继续在循环反应中被切刻并延伸,所述循环反应以指数方式扩增切刻位点之间靶标的区域。
在某些实施方案中,扩增是基于CRISPR-切口酶的扩增,即可程序化的CRISPR切口扩增。扩增可以包括:(a)将包含靶双链核酸的样品与扩增反应混合物组合,所述扩增反应混合物包含:(i)扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向靶核酸的第一链的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向靶核酸的第二链的第二指导分子;和(ii)聚合酶;(b)通过以下方式扩增靶核酸:使用第一CRISPR/Cas复合物和第二CRISPR/Cas复合物切刻靶核酸的第一链和第二链并使用聚合酶置换和延伸切刻的链,从而在第一切口位点与第二切口位点之间产生包含靶核酸序列的双链体;(c)向反应混合物添加包含第一引物和第二引物的引物对,所述第一引物包含与靶核酸的第一链互补的部分和包含第一指导分子的结合位点的部分,并且所述第二引物包含与靶核酸的第二链互补的部分和包含第二指导分子的结合位点的部分;以及(d)通过在等温条件下重复延伸和切刻来进一步扩增靶核酸。第一基于Cas的切口酶和第二基于Cas的切口酶可以是相同的或不同的。
核酸扩增可以使用特定热循环机器或设备进行,并且可以在单个反应中或成批进行,以便可以同时进行任何所需数目的反应。在一些实施方案中,扩增可以使用微流体或机器人装置进行,或可以使用温度的手动改变来进行以达成所需扩增。在一些实施方案中,可以进行优化以获得用于特定应用或材料的最佳反应条件。本领域技术人员将了解并且能够优化反应条件以获得足够的扩增。
在一些实施方案中,在约37℃-65℃下执行靶核酸的扩增。在一些实施方案中,在约50℃-59℃下执行靶核酸的扩增。在一些实施方案中,在约60℃-72℃下执行靶核酸的扩增。在一些实施方案中,在约37℃下执行靶核酸的扩增。在一些实施方案中,在室温下执行靶核酸的扩增。
另外的实施方案在以下编号的段落中公开。
1.一种扩增和/或检测靶双链核酸的方法,所述方法包括:
a.将包含所述靶双链核酸的样品与扩增反应混合物组合,所述扩增反应混合物包含:
i.扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向第一靶核酸位置的第一指导分子,所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向第二靶核酸位置的第二指导分子;和
ii.聚合酶;
b.扩增所述靶核酸;
c.向所述反应混合物添加包含第一引物和第二引物的引物对,所述第一引物包含与所述第一位置互补的部分,并且所述第二引物包含与所述第二位置互补的部分和包含所述第二指导分子的结合位点的部分;以及
d.通过在等温条件下重复延伸和切刻来进一步扩增所述靶核酸。
2.如段落1所述的方法,其中所述第一指导分子将所述第一CRISPR/Cas复合物导向所述靶核酸的第一链,并且所述第二指导分子将所述第二CRISPR/Cas复合物导向所述靶核酸的第二链。
3.如段落1所述的方法,其中所述第一靶核酸位置和所述第二靶核酸位置在所述靶核酸的所述第一链上,从而在所述第一靶核酸位置与所述第二靶核酸位置之间产生包含所述靶核酸的所述第一链的序列的ssDNA。
4.如段落2所述的方法,所述方法包括通过以下方式来扩增所述靶核酸:使用所述第一CRISPR/Cas复合物和所述第二CRISPR/Cas复合物切刻所述靶核酸的所述第一链和所述第二链并使用所述聚合酶置换并延伸所述切刻的链,从而在第一切口位点与第二切口位点之间产生包含靶核酸序列的双链体。
5.如段落1所述的方法,其中所述基于Cas的切口酶选自由以下组成的组:Cas9切口酶、Cpf1切口酶和C2c1切口酶。
6.如段落2所述的方法,其中所述基于Cas的切口酶是Cas9切口酶蛋白,所述Cas9切口酶蛋白在HNH结构域中包含突变。
7.如段落2所述的方法,其中所述基于Cas的切口酶是Cas9切口酶蛋白,所述Cas9切口酶蛋白包含对应于SpCas9中的N863A或者SaCas9中的N580A的突变。
8.如段落3或4所述的方法,其中所述基于Cas的切口酶是来源于选自由以下组成的组的细菌种类的Cas9蛋白:化脓性链球菌、金黄色葡萄球菌、嗜热链球菌、变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌、土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌。
9.如段落2所述的方法,其中所述基于Cas的切口酶是Cpf1切口酶蛋白,所述Cpf1切口酶蛋白在Nuc结构域中包含突变。
10.如段落6所述的方法,其中所述基于Cas的切口酶是Cpf1切口酶蛋白,所述Cpf1切口酶蛋白包含对应于AsCpf1中的R1226A的突变。
11.如段落6或7所述的方法,其中所述基于Cas的切口酶是来源于选自由以下组成的组的细菌种类的Cpf1蛋白:土拉弗朗西斯菌、易北普雷沃氏菌、毛螺菌科细菌、解蛋白丁酸弧菌、异域菌门细菌、俭菌超门细菌、史密斯氏菌属种、氨基酸球菌属种、毛螺菌科细菌、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌、稻田氏钩端螺旋体、狗口腔卟啉单胞菌、解糖胨普雷沃氏菌和猕猴卟啉单胞菌、溶糊精琥珀酸弧菌、解糖胨普雷沃氏菌、嗜鳃黄杆菌、孔兹氏创伤球菌、真杆菌属种、小基因组菌总门(罗伊兹曼菌门)细菌、黄杆菌属种、短普雷沃氏菌、山羊莫拉氏菌、口腔拟杆菌、犬嘴卟啉单胞菌、琼氏互养菌、布氏普雷沃氏菌、厌氧弧菌属种、溶纤维丁酸弧菌、候选甲烷嗜甲基菌、丁酸弧菌属种、口腔无芽孢厌氧菌属种、瘤胃假丁酸弧菌和产丁酸菌。
12.如段落2所述的方法,其中所述基于Cas的切口酶是C2c1切口酶蛋白,所述C2c1切口酶蛋白在Nuc结构域中包含突变。
13.如段落9所述的方法,其中所述基于Cas的切口酶是C2c1切口酶蛋白,所述C2c1切口酶蛋白包含对应于AacC2c1中的D570A、E848A或D977A的突变。
14.如段落9或10所述的方法,其中所述基于Cas的切口酶是来源于选自由以下组成的组的细菌种类的C2c1蛋白:抗酸土脂环酸芽孢杆菌、污染脂环酸芽孢杆菌、大孢束脂环酸芽孢杆菌、外村尚芽孢杆菌、候选林道菌、非常脱硫弧菌、硫歧化酶脱硫盐碱杆菌、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌、嗜热淀粉芽孢杆菌、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌、草脂环酸芽孢杆菌、弗氏柠檬酸杆菌、土壤短芽孢杆菌(例如BAB-2500)和结瘤甲基杆菌。
15.如前述段落中任一项所述的方法,其中所述第一基于Cas的切口酶和所述第二基于Cas的切口酶是相同的。
16.如段落1-11中任一项所述的方法,其中所述第一基于Cas的切口酶和所述第二基于Cas的切口酶是不同的。
17.如前述段落中任一项所述的方法,其中所述聚合酶选自由以下组成的组:Bst2.0DNA聚合酶、Bst 2.0WarmStart DNA聚合酶、Bst 3.0DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶、Gst聚合酶、Taq聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、KlenTaq、Pol III DNA聚合酶、T5 DNA聚合酶、Gst聚合酶和测序酶DNA聚合酶。
18.如前述段落中任一项所述的方法,其中在约50℃-59℃下执行所述靶核酸的扩增。
19.如段落1-14中任一项所述的方法,其中在约60℃-72℃下执行所述靶核酸的扩增。
20.如段落1-14中任一项所述的方法,其中在约37℃或约65℃下执行所述靶核酸的扩增。
21.如段落1-14中任一项所述的方法,其中在恒温下执行所述靶核酸的扩增。
22.如前述段落中任一项所述的方法,其中所述靶核酸序列的长度为约20-30个、约30-40个、约40-50个或约50-100个核苷酸。
23.如段落1-18中任一项所述的方法,其中所述靶核酸序列的长度为约100-200个、约100-500个或约100-1000个核苷酸。
24.如段落1-18中任一项所述的方法,其中所述靶核酸序列的长度为约1000-2000个、约2000-3000个、约3000-4000个或约4000-5000个核苷酸。
25.如前述段落中任一项所述的方法,其中所述第一引物或所述第二引物包含RNA聚合酶启动子。
26.如前述段落中任一项所述的方法,所述方法还包括通过选自由以下组成的组的方法来检测所述扩增的核酸:凝胶电泳、嵌入染料检测、PCR、实时PCR、荧光、荧光共振能量转移(FRET)、质谱和CRISPR-SHERLOCK。
27.如段落23所述的方法,其中通过基于Cas13的CRISPR-SHERLOCK方法来检测所述扩增的核酸。
28.如前述段落中任一项所述的方法,其中以渺摩尔级灵敏度检测所述靶核酸。
29.如段落1-24中任一项所述的方法,其中以飞摩尔级灵敏度检测所述靶核酸。
30.如前述段落中任一项所述的方法,其中所述靶核酸选自由以下组成的组:基因组DNA、线粒体DNA、病毒DNA、质粒DNA和合成双链DNA。
31.如前述段落中任一项所述的方法,其中所述样品是生物样品或环境样品。
32.如段落28所述的方法,其中所述生物样品是血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液,或获自关节的流体,或皮肤或粘膜表面的拭子。
33.如段落29所述的方法,其中所述样品是获自人类患者的血液、血浆或血清。
34.如段落28所述的方法,其中所述样品是植物样品。
35.如前述段落中任一项所述的方法,其中所述样品是粗样品。
36.如段落1-31中任一项所述的方法,其中所述样品是纯化的样品。
37.一种用于扩增和/或检测靶单链核酸的方法,所述方法包括:
(a)将样品中的所述单链核酸转化为靶双链核酸;以及
(b)执行如段落1所述的步骤。
38.如段落34所述的方法,其中所述靶单链核酸是RNA分子。
39.如段落35所述的方法,其中通过逆转录和扩增步骤将所述RNA分子转化为所述双链核酸。
40.如段落34所述的方法,其中所述靶单链核酸选自由以下组成的组:单链病毒DNA、病毒RNA、信使RNA、核糖体RNA、转移RNA、微小RNA、短干扰RNA、小核RNA、合成RNA和合成单链DNA。
41.一种用于扩增和/或检测样品中的靶双链核酸的系统,所述系统包括:
a)扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向所述靶核酸的第一链的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向所述靶核酸的第二链的第二指导分子;
b)聚合酶;
c)引物对,所述引物对包含所述反应混合物的第一引物和第二引物,所述第一引物包含与所述靶核酸的所述第一链互补的部分和包含所述第一指导分子的结合位点的部分,并且所述第二引物包含与所述靶核酸的所述第二链互补的部分和包含所述第二指导分子的结合位点的部分;以及任选地
d)用于检测所述靶核酸的扩增的检测系统。
42.如段落38所述的系统,其中所述基于Cas的切口酶选自由以下组成的组:Cas9切口酶、Cpf1切口酶和C2c1切口酶。
43.如段落38或39所述的系统,其中所述聚合酶选自由以下组成的组:Bst 2.0DNA聚合酶、Bst 2.0WarmStart DNA聚合酶、Bst 3.0DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶和测序酶DNA聚合酶。
44.如段落38-40中任一项所述的系统,其中所述基于Cas的切口酶和所述聚合酶在相同温度下执行。
45.一种用于扩增和/或检测样品中的靶单链核酸的系统,所述系统包括:
a)用于将所述靶单链核酸转化为双链核酸的试剂;
b)如段落38所述的组分。
46.一种用于扩增和/或检测样品中的靶单链核酸的试剂盒,所述试剂盒包括如段落38所述的组分和一套使用说明书。
47.如段落43所述的试剂盒,所述试剂盒还包括用于纯化所述样品中的所述双链核酸的试剂。
48.一种用于扩增和/或检测样品中的靶单链核酸的试剂盒,所述试剂盒包括如段落43所述的组分和一套使用说明书。
49.如段落4所述的试剂盒,所述试剂盒还包括用于纯化所述样品中的所述单链核酸的试剂。
在以下实施例中进一步描述了本发明,这些实施例不限制权利要求中所描述的本发明的范围。
实施例
工作实施例
实施例1-基于CRISPR-切口酶的扩增(CRISPR-NEAR)和NEAR SHERLOCK检测
在该实施例中,使用称为CRISPR-NEAR的CRISPR-Cas酶结合CRISPR SHERLOCK检测方法测试基于切口酶的扩增。图1显示了使用CRISPR-Cas酶的基于切口酶的扩增的示意图。
CRISPR-NEAR可以利用DNA或RNA输入执行。通过在扩增引物中掺入T7启动子序列,CRISPR-NEAR也与下游SHERLOCK检测方法兼容。图9显示了CRISPR-NEAR与SHERLOCK检测相结合的示意图。使用CRISPR-NEAR的主要优势之一是它可以比RPA扩增快得多。所述方法使用非常简单的缓冲液,所述缓冲液使得可以轻松地将SHERLOCK检测的所有步骤组合到一个反应中。在另一方面,RPA扩增使用非常粘稠的缓冲液,很难与其他试剂一起使用。
图2是示出切口酶扩增反应的优化的凝胶电泳图像。结果显示,NEAR扩增取决于切口酶和聚合酶两者。无引物时,仅发生线性扩增。引物和其他PCR添加剂(诸如gp32 SSB或海藻糖)可能会增加扩增并调节非特异性产物形成。
图3A-图3F显示了一系列实验,表明基于切口酶的线性扩增取决于最佳切口酶浓度。在这些实验中,反应中不包括其他引物,因此仅发生基于切刻的线性扩增。在这些实验中使用的切口酶是Nt.A1w1(用作阳性对照)、T7错配的nAsCpf1或匹配的nAsCpf1。指导物浓度在5μM输入下保持一致,同时滴定切口酶浓度。nAsCpf1能够切刻双链DNA,所述双链DNA由置换链聚合酶扩增。这些数据显示,nAsCpf1扩增的最佳浓度为500nM,而不是最高测试浓度(1μM)。
使用扩增的NEAR反应作为输入,进行了连续实验,其中使用SYTO嵌入染料(图4A-图4C)、基于凝胶的读数(图4D-图4F)或基于Cas13的SHERLOCK检测(图4G-图4I)扩增并检测核酸靶标。这些结果表明,利用NEAR的扩增会产生许多非特异性产物,因此与SYTO或基于凝胶的读出不相容。然而,基于CRISPR SHERLOCK的检测可以避免该问题,并允许对目标产物进行特异性检测。将使用SYTO或基于CRISPR SHERLOCK的检测(使用Cas13或Cpf1检测)获得的数据进一步绘制为靶标/无靶标比(图5)。该图显示,程序化到靶位点的LwCas13a和Cpf1指导复合物能够区分特异性扩增和非特异性扩增,而SYTO嵌入染料检测在标准条件下无法实现。
图6A和图6B是显示单独NEAR与结合SHERLOCK检测的NEAR的数据的两个图。从这些图可以得出几个结论。第一,LwCas13s SHERLOCK可通过T7扩增和强附带RNA酶活性实现较低的检测限。第二,使用Nt.A1w1 NEAR与Cas13检测可以达到2aM的检测限,而使用nAsCpf1-NEAR与Cas 13检测可以达到2fM的检测限。最后,AsCpf1检测与任何NEAR反应结合都不够灵敏,无法提供<20fM的可靠信号。
取决于所使用的聚合酶,可以在不同的温度下执行NEAR SHERLOCK。图7A-图7C表明可以使用Bst 2.0热启动聚合酶在60℃下执行NEAR;图8A-图8B表明也可以使用测序酶2.0聚合酶在37℃下执行NEAR。
***
在不脱离本发明的范围和精神的情况下,本发明所述的方法、药物组合物和药盒的各种修改和变型对于本领域技术人员而言是显而易见的。尽管已结合具体实施方案描述了本发明,但是应当理解,本发明能够进行进一步修改,并且所要求保护的本发明不应该不当地受到这些具体实施方案的限制。实际上,对于本领域技术人员而言显而易见的用于实施本发明的所述模式的各种变型旨在落入本发明的范围内。本申请旨在覆盖本发明的任何变型、用途或改型,这些变型、用途或改型总体遵循本发明的原理且包括在本发明所属领域内已知习惯性实践内的与本公开内容有所偏离的内容,并且可以在陈述之前应用于本文的基本特征。

Claims (49)

1.一种扩增和/或检测靶双链核酸的方法,所述方法包括:
a.将包含所述靶双链核酸的样品与扩增反应混合物组合,所述扩增反应混合物包含:
i.扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向第一靶核酸位置的第一指导分子,所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向第二靶核酸位置的第二指导分子;和
ii.聚合酶;
b.扩增所述靶核酸;
c.向所述反应混合物添加包含第一引物和第二引物的引物对,所述第一引物包含与所述第一位置互补的部分,并且所述第二引物包含与所述第二位置互补的部分和包含所述第二指导分子的结合位点的部分;以及
d.通过在等温条件下重复延伸和切刻来进一步扩增所述靶核酸。
2.如权利要求1所述的方法,其中所述第一指导分子将所述第一CRISPR/Cas复合物导向所述靶核酸的第一链,并且所述第二指导分子将所述第二CRISPR/Cas复合物导向所述靶核酸的第二链。
3.如权利要求1所述的方法,其中所述第一靶核酸位置和所述第二靶核酸位置在所述靶核酸的所述第一链上,从而在所述第一靶核酸位置与所述第二靶核酸位置之间产生包含所述靶核酸的所述第一链的序列的ssDNA。
4.如权利要求2所述的方法,所述方法包括通过以下方式来扩增所述靶核酸:使用所述第一CRISPR/Cas复合物和所述第二CRISPR/Cas复合物切刻所述靶核酸的所述第一链和所述第二链并使用所述聚合酶置换并延伸所述切刻的链,从而在第一切口位点与第二切口位点之间产生包含靶核酸序列的双链体。
5.如权利要求1所述的方法,其中所述基于Cas的切口酶选自由以下组成的组:Cas9切口酶、Cpf1切口酶和C2c1切口酶。
6.如权利要求2所述的方法,其中所述基于Cas的切口酶是Cas9切口酶蛋白,所述Cas9切口酶蛋白在HNH结构域中包含突变。
7.如权利要求2所述的方法,其中所述基于Cas的切口酶是Cas9切口酶蛋白,所述Cas9切口酶蛋白包含对应于SpCas9中的N863A或者SaCas9中的N580A的突变。
8.如权利要求3或4所述的方法,其中所述基于Cas的切口酶是来源于选自由以下组成的组的细菌种类的Cas9蛋白:化脓性链球菌、金黄色葡萄球菌、嗜热链球菌、变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌、土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌。
9.如权利要求2所述的方法,其中所述基于Cas的切口酶是Cpf1切口酶蛋白,所述Cpf1切口酶蛋白在Nuc结构域中包含突变。
10.如权利要求6所述的方法,其中所述基于Cas的切口酶是Cpf1切口酶蛋白,所述Cpf1切口酶蛋白包含对应于AsCpf1中的R1226A的突变。
11.如权利要求6或7所述的方法,其中所述基于Cas的切口酶是来源于选自由以下组成的组的细菌种类的Cpf1蛋白:土拉弗朗西斯菌、易北普雷沃氏菌、毛螺菌科细菌、解蛋白丁酸弧菌、异域菌门细菌、俭菌超门细菌、史密斯氏菌属种、氨基酸球菌属种、毛螺菌科细菌、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌、稻田氏钩端螺旋体、狗口腔卟啉单胞菌、解糖胨普雷沃氏菌和猕猴卟啉单胞菌、溶糊精琥珀酸弧菌、解糖胨普雷沃氏菌、嗜鳃黄杆菌、孔兹氏创伤球菌、真杆菌属种、小基因组菌总门(罗伊兹曼菌门)细菌、黄杆菌属种、短普雷沃氏菌、山羊莫拉氏菌、口腔拟杆菌、犬嘴卟啉单胞菌、琼氏互养菌、布氏普雷沃氏菌、厌氧弧菌属种、溶纤维丁酸弧菌、候选甲烷嗜甲基菌、丁酸弧菌属种、口腔无芽孢厌氧菌属种、瘤胃假丁酸弧菌和产丁酸菌。
12.如权利要求2所述的方法,其中所述基于Cas的切口酶是C2c1切口酶蛋白,所述C2c1切口酶蛋白在所述Nuc结构域中包含突变。
13.如权利要求9所述的方法,其中所述基于Cas的切口酶是C2c1切口酶蛋白,所述C2c1切口酶蛋白包含对应于AacC2c1中的D570A、E848A或D977A的突变。
14.如权利要求9或10所述的方法,其中所述基于Cas的切口酶是来源于选自由以下组成的组的细菌种类的C2c1蛋白:抗酸土脂环酸芽孢杆菌、污染脂环酸芽孢杆菌、大孢束脂环酸芽孢杆菌、外村尚芽孢杆菌、候选林道菌、非常脱硫弧菌、硫歧化酶脱硫盐碱杆菌、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌、嗜热淀粉芽孢杆菌、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌、草脂环酸芽孢杆菌、弗氏柠檬酸杆菌、土壤短芽孢杆菌(例如BAB-2500)和结瘤甲基杆菌。
15.如前述权利要求中任一项所述的方法,其中所述第一基于Cas的切口酶和所述第二基于Cas的切口酶是相同的。
16.如权利要求1-11中任一项所述的方法,其中所述第一基于Cas的切口酶和所述第二基于Cas的切口酶是不同的。
17.如前述权利要求中任一项所述的方法,其中所述聚合酶选自由以下组成的组:Bst2.0 DNA聚合酶、Bst 2.0 WarmStart DNA聚合酶、Bst 3.0 DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶、Gst聚合酶、Taq聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、KlenTaq、Pol III DNA聚合酶、T5DNA聚合酶、Gst聚合酶和测序酶DNA聚合酶。
18.如前述权利要求中任一项所述的方法,其中在约50℃-59℃下执行所述靶核酸的扩增。
19.如权利要求1-14中任一项所述的方法,其中在约60℃-72℃下执行所述靶核酸的扩增。
20.如权利要求1-14中任一项所述的方法,其中在约37℃或约65℃下执行所述靶核酸的扩增。
21.如权利要求1-14中任一项所述的方法,其中在恒温下执行所述靶核酸的扩增。
22.如前述权利要求中任一项所述的方法,其中所述靶核酸序列的长度为约20-30个、约30-40个、约40-50个或约50-100个核苷酸。
23.如权利要求1-18中任一项所述的方法,其中所述靶核酸序列的长度为约100-200个、约100-500个或约100-1000个核苷酸。
24.如权利要求1-18中任一项所述的方法,其中所述靶核酸序列的长度为约1000-2000个、约2000-3000个、约3000-4000个或约4000-5000个核苷酸。
25.如前述权利要求中任一项所述的方法,其中所述第一引物或所述第二引物包含RNA聚合酶启动子。
26.如前述权利要求中任一项所述的方法,所述方法还包括通过选自由以下组成的组的方法来检测所述扩增的核酸:凝胶电泳、嵌入染料检测、PCR、实时PCR、荧光、荧光共振能量转移(FRET)、质谱和CRISPR-SHERLOCK。
27.如权利要求23所述的方法,其中通过基于Cas13的CRISPR-SHERLOCK方法来检测所述扩增的核酸。
28.如前述权利要求中任一项所述的方法,其中以渺摩尔级灵敏度检测所述靶核酸。
29.如权利要求1-24中任一项所述的方法,其中以飞摩尔级灵敏度检测所述靶核酸。
30.如前述权利要求中任一项所述的方法,其中所述靶核酸选自由以下组成的组:基因组DNA、线粒体DNA、病毒DNA、质粒DNA和合成双链DNA。
31.如前述权利要求中任一项所述的方法,其中所述样品是生物样品或环境样品。
32.如权利要求28所述的方法,其中所述生物样品是血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液,或获自关节的流体,或皮肤或粘膜表面的拭子。
33.如权利要求29所述的方法,其中所述样品是获自人类患者的血液、血浆或血清。
34.如权利要求28所述的方法,其中所述样品是植物样品。
35.如前述权利要求中任一项所述的方法,其中所述样品是粗样品。
36.如权利要求1-31中任一项所述的方法,其中所述样品是纯化的样品。
37.一种用于扩增和/或检测靶单链核酸的方法,所述方法包括:
(a)将样品中的所述单链核酸转化为靶双链核酸;以及
(b)执行如权利要求1所述的步骤。
38.如权利要求34所述的方法,其中所述靶单链核酸是RNA分子。
39.如权利要求35所述的方法,其中通过逆转录和扩增步骤将所述RNA分子转化为所述双链核酸。
40.如权利要求34所述的方法,其中所述靶单链核酸选自由以下组成的组:单链病毒DNA、病毒RNA、信使RNA、核糖体RNA、转移RNA、微小RNA、短干扰RNA、小核RNA、合成RNA和合成单链DNA。
41.一种用于扩增和/或检测样品中的靶双链核酸的系统,所述系统包括:
e)扩增CRISPR系统,所述扩增CRISPR系统包含第一CRISPR/Cas复合物和第二CRISPR/Cas复合物,所述第一CRISPR/Cas复合物包含第一基于Cas的切口酶和将所述第一CRISPR/Cas复合物导向所述靶核酸的第一链的第一指导分子,并且所述第二CRISPR/Cas复合物包含第二基于Cas的切口酶和将所述第二CRISPR/Cas复合物导向所述靶核酸的第二链的第二指导分子;
f)聚合酶;
g)引物对,所述引物对包含所述反应混合物的第一引物和第二引物,所述第一引物包含与所述靶核酸的所述第一链互补的部分和包含所述第一指导分子的结合位点的部分,并且所述第二引物包含与所述靶核酸的所述第二链互补的部分和包含所述第二指导分子的结合位点的部分;以及任选地
h)用于检测所述靶核酸的扩增的检测系统。
42.如权利要求38所述的系统,其中所述基于Cas的切口酶选自由以下组成的组:Cas9切口酶、Cpf1切口酶和C2c1切口酶。
43.如权利要求38或39所述的系统,其中所述聚合酶选自由以下组成的组:Bst 2.0DNA聚合酶、Bst 2.0 WarmStart DNA聚合酶、Bst 3.0 DNA聚合酶、全长Bst DNA聚合酶、大片段Bst DNA聚合酶、大片段Bsu DNA聚合酶、phi29 DNA聚合酶、T7 DNA聚合酶和测序酶DNA聚合酶。
44.如权利要求38-40中任一项所述的系统,其中所述基于Cas的切口酶和所述聚合酶在相同温度下执行。
45.一种用于扩增和/或检测样品中的靶单链核酸的系统,所述系统包括:
c)用于将所述靶单链核酸转化为双链核酸的试剂;
d)如权利要求38所述的组分。
46.一种用于扩增和/或检测样品中的靶双链核酸的试剂盒,所述试剂盒包括如权利要求38所述的组分和一套使用说明书。
47.如权利要求43所述的试剂盒,所述试剂盒还包括用于纯化所述样品中的所述双链核酸的试剂。
48.一种用于扩增和/或检测样品中的靶单链核酸的试剂盒,所述试剂盒包括如权利要求43所述的组分和一套使用说明书。
49.如权利要求4所述的试剂盒,所述试剂盒还包括用于纯化所述样品中的所述单链核酸的试剂。
CN201980055278.XA 2018-06-26 2019-06-26 基于crispr双切口酶的扩增组合物、系统和方法 Pending CN112639121A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862690278P 2018-06-26 2018-06-26
US62/690,278 2018-06-26
US201862767059P 2018-11-14 2018-11-14
US62/767,059 2018-11-14
PCT/US2019/039221 WO2020006067A1 (en) 2018-06-26 2019-06-26 Crispr double nickase based amplification compositions, systems, and methods

Publications (1)

Publication Number Publication Date
CN112639121A true CN112639121A (zh) 2021-04-09

Family

ID=67297327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980055278.XA Pending CN112639121A (zh) 2018-06-26 2019-06-26 基于crispr双切口酶的扩增组合物、系统和方法

Country Status (12)

Country Link
US (1) US20210207203A1 (zh)
EP (1) EP3814520A1 (zh)
JP (1) JP2021528091A (zh)
KR (1) KR20210024010A (zh)
CN (1) CN112639121A (zh)
AU (1) AU2019291827A1 (zh)
BR (1) BR112020026246A2 (zh)
CA (1) CA3102211A1 (zh)
IL (1) IL278963A (zh)
MX (1) MX2020013461A (zh)
SG (1) SG11202012785VA (zh)
WO (1) WO2020006067A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021247870A1 (en) * 2020-06-03 2021-12-09 Siphox, Inc. Cascading amplification for chemical and biosensing
CN111733216B (zh) * 2020-06-22 2023-03-28 山东舜丰生物科技有限公司 一种提高目标核酸检测效率的方法
CN112831544A (zh) * 2020-12-31 2021-05-25 华南农业大学 一种基于CRISPR/Cas12a系统的生物检测方法和生物检测装置
CN113186253B (zh) * 2021-04-27 2022-06-21 福州大学 一种用于检测路易体病标志物的Cas12a-DNAzyme传感器及其制备方法
EP4373963A2 (en) 2021-07-21 2024-05-29 Montana State University Nucleic acid detection using type iii crispr complex

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090017453A1 (en) * 2007-07-14 2009-01-15 Maples Brian K Nicking and extension amplification reaction for the exponential amplification of nucleic acids
WO2016205749A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
CN107075546A (zh) * 2014-08-19 2017-08-18 哈佛学院董事及会员团体 用于对核酸探测并作图的rna‑引导的系统
WO2017189308A1 (en) * 2016-04-19 2017-11-02 The Broad Institute Inc. Novel crispr enzymes and systems
US20170332610A1 (en) * 2016-05-20 2017-11-23 Regeneron Pharmaceuticals, Inc. Methods for breaking immunological tolerance using multiple guide rnas
CN107488710A (zh) * 2017-07-14 2017-12-19 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US715640A (en) 1902-09-10 1902-12-09 Whitney Mfg Company Clutch mechanism.
US5541099A (en) 1989-08-10 1996-07-30 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'-to-5' exonuclease activity
US6555349B1 (en) 1993-01-22 2003-04-29 Cornell Research Foundation, Inc. Methods for amplifying and sequencing nucleic acid molecules using a three component polymerase
NZ520579A (en) 1997-10-24 2004-08-27 Invitrogen Corp Recombinational cloning using nucleic acids having recombination sites and methods for synthesizing double stranded nucleic acids
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
SG185367A1 (en) 2010-04-26 2012-12-28 Sangamo Biosciences Inc Genome editing of a rosa locus using zinc-finger nucleases
NZ701145A (en) * 2012-04-09 2016-09-30 Envirologix Inc Compositions and methods for quantifying a nucleic acid sequence in a sample
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
WO2014164479A1 (en) * 2013-03-11 2014-10-09 Elitech Holding B.V. Methods for true isothermal strand displacement amplification
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
US10981167B2 (en) 2015-03-18 2021-04-20 The Broad Institute, Inc. Massively parallel on-chip coalescence of microemulsions
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
FI3430134T3 (fi) 2015-06-18 2023-01-13 Uusia CRISPR-entsyymejä ja järjestelmiä
CN109153980B (zh) 2015-10-22 2023-04-14 布罗德研究所有限公司 Vi-b型crispr酶和系统
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
US20190264186A1 (en) 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
SG10202010311SA (en) 2016-04-19 2020-11-27 Broad Inst Inc Novel Crispr Enzymes and Systems
CA3026112A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
US11788083B2 (en) 2016-06-17 2023-10-17 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
US20200283743A1 (en) 2016-08-17 2020-09-10 The Broad Institute, Inc. Novel crispr enzymes and systems
US11352647B2 (en) 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
PL3551753T3 (pl) 2016-12-09 2022-10-31 The Broad Institute, Inc. Diagnostyka oparta na uk‎‎‎ładzie efektorowym crispr
EP3596218B1 (en) 2017-03-15 2023-08-23 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
US11104937B2 (en) 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11739308B2 (en) 2017-03-15 2023-08-29 The Broad Institute, Inc. Cas13b orthologues CRISPR enzymes and systems
US11174515B2 (en) 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11618928B2 (en) 2017-04-12 2023-04-04 The Broad Institute, Inc. CRISPR effector system based diagnostics for malaria detection
KR20200006054A (ko) 2017-04-12 2020-01-17 더 브로드 인스티튜트, 인코퍼레이티드 신규 타입 vi crispr 오르소로그 및 시스템
WO2018194963A1 (en) 2017-04-16 2018-10-25 Sanford Health Filter for stent retriever and methods for use thereof
WO2018213708A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
WO2019005866A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. NEW TYPE VI CRISPR ORTHOLOGISTS AND ASSOCIATED SYSTEMS
CN109209763B (zh) 2017-07-06 2019-11-29 北京金风科创风电设备有限公司 风力发电机组叶片变桨装置、变桨方法及风力发电机组

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090017453A1 (en) * 2007-07-14 2009-01-15 Maples Brian K Nicking and extension amplification reaction for the exponential amplification of nucleic acids
CN107075546A (zh) * 2014-08-19 2017-08-18 哈佛学院董事及会员团体 用于对核酸探测并作图的rna‑引导的系统
WO2016205749A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US20180320163A1 (en) * 2015-06-18 2018-11-08 The Broad Institute Inc. Novel crispr enzymes and systems
WO2017189308A1 (en) * 2016-04-19 2017-11-02 The Broad Institute Inc. Novel crispr enzymes and systems
US20170332610A1 (en) * 2016-05-20 2017-11-23 Regeneron Pharmaceuticals, Inc. Methods for breaking immunological tolerance using multiple guide rnas
CN107488710A (zh) * 2017-07-14 2017-12-19 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUI YANG等: "PAM-dependent target DNA recognition and Cleavage by C2c1 CRISPR-CAS endonuclease", 《CELL》, vol. 167, no. 7, pages 7 *
JONATHAN S GOOTENBERG等: "Nucleic acid detection with CRISPR-Cas13a/C2c2", 《SCIENCE》, vol. 356, no. 6336, XP055781069, DOI: 10.1126/science.aam9321 *

Also Published As

Publication number Publication date
WO2020006067A1 (en) 2020-01-02
MX2020013461A (es) 2021-04-28
SG11202012785VA (en) 2021-01-28
KR20210024010A (ko) 2021-03-04
US20210207203A1 (en) 2021-07-08
CA3102211A1 (en) 2020-01-02
AU2019291827A1 (en) 2020-12-24
IL278963A (en) 2021-01-31
BR112020026246A2 (pt) 2021-04-20
EP3814520A1 (en) 2021-05-05
JP2021528091A (ja) 2021-10-21

Similar Documents

Publication Publication Date Title
CN112543812A (zh) 基于crispr效应系统的扩增方法、系统和诊断
CN112639121A (zh) 基于crispr双切口酶的扩增组合物、系统和方法
EP3765616B1 (en) Novel crispr dna and rna targeting enzymes and systems
JP2022106710A (ja) 短縮ガイドRNA(tru-gRNA)を用いたRNA誘導型ゲノム編集の特異性の増大
CA3106035A1 (en) Cas12b enzymes and systems
CN112041444A (zh) 新型crispr dna靶向酶及系统
US20220154258A1 (en) Crispr effector system based multiplex diagnostics
EA038500B1 (ru) Термостабильные нуклеазы cas9
CN109844113B (zh) 序列和长度确定的dna单链分子的可扩展性的生物技术生产
US20220333208A1 (en) Crispr effector system based multiplex cancer diagnostics
US20210147915A1 (en) Crispr/cas and transposase based amplification compositions, systems and methods
JP2020517299A (ja) 縦列反復配列を有するドナーdna修復鋳型を使用する部位特異的なdna改変
CN114207145A (zh) 基于III型CRISPR/Cas的诊断
Daou‐Chabo et al. Ribosomes initiating translation of the hbs mRNA protect it from 5′‐to‐3′ exoribonucleolytic degradation by RNase J1
CA3093580A1 (en) Novel crispr dna and rna targeting enzymes and systems
CN113302312A (zh) 使用sherlock检测方法对高度进化的病毒变体进行多重化
Yang et al. Antisense RNA elements for downregulating expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination