CN111630162A - 基于crispr效应系统的诊断 - Google Patents

基于crispr效应系统的诊断 Download PDF

Info

Publication number
CN111630162A
CN111630162A CN201880078358.2A CN201880078358A CN111630162A CN 111630162 A CN111630162 A CN 111630162A CN 201880078358 A CN201880078358 A CN 201880078358A CN 111630162 A CN111630162 A CN 111630162A
Authority
CN
China
Prior art keywords
species
lateral flow
flow device
virus
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880078358.2A
Other languages
English (en)
Inventor
F·张
J·戈滕贝格
O·阿布达耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Publication of CN111630162A publication Critical patent/CN111630162A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54366Apparatus specially adapted for solid-phase testing
    • G01N33/54386Analytical elements
    • G01N33/54387Immunochromatographic test strips
    • G01N33/54388Immunochromatographic test strips based on lateral flow
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L3/00Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
    • B01L3/50Containers for the purpose of retaining a material to be analysed, e.g. test tubes
    • B01L3/502Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures
    • B01L3/5023Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures with a sample being transported to, and subsequently stored in an absorbent for analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/08Geometry, shape and general structure
    • B01L2300/0809Geometry, shape and general structure rectangular shaped
    • B01L2300/0819Microarrays; Biochips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/08Geometry, shape and general structure
    • B01L2300/0809Geometry, shape and general structure rectangular shaped
    • B01L2300/0825Test strips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/12Specific details about materials
    • B01L2300/123Flexible; Elastomeric
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/12Specific details about materials
    • B01L2300/126Paper
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • C12Q2565/1015Interaction between at least two labels labels being on the same oligonucleotide
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases

Abstract

本文提供了一种侧流诊断装置和使用所述侧流诊断装置的方法。所述装置包括衬底和第一端,其中所述第一端包括样品加载部分。所述第一端可还包括加载有可检测配体的第一区域、CRISPR效应系统、检测构建体、包含生物素配体的第一测试带和包含用于所述可检测配体的捕获分子的第二测试带。所述检测构建体可包含RNA寡核苷酸,所述RNA寡核苷酸在第一端上具有第一分子,如FITC,并且在第二端上具有第二分子,如FAM。使所述样品加载部分与样品接触导致所述样品从所述衬底的所述样品加载部分流向第一捕获区域和第二捕获区域,从而产生可检测信号,所述可检测信号可指示疾病状态。

Description

基于CRISPR效应系统的诊断
相关申请的交叉引用
本申请要求2017年10月4日提交的美国临时申请号62/568,309、2017年12月22日提交的美国临时申请号62/610,144、2018年1月29日提交的美国临时申请号62/623,529和2018年2月14日提交的美国临时申请号62/630,787的权益。以上确认的申请的全部内容特此以引用的方式完全并入本文中。
关于联邦资助研究的声明
本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的授权号MH110049和HL141201在政府支持下完成的。政府对本发明具有某些权利。
技术领域
本文所公开的主题大体上关于与CRISPR效应系统的使用相关的快速诊断。
背景技术
核酸是生物信息的通用标识。在便携平台上以高灵敏度和单碱基特异性快速检测核酸的能力具有以下潜力:为许多疾病的诊断和监测带来革新,提供有价值的流行病学信息,并且用作可泛化的科学工具。尽管已经开发许多方法用于检测核酸(Du等,2017;Green等,2014;Kumar等,2014;Pardee等,2014;Pardee等,2016;Urdea等,2006),但其不可避免地在灵敏度、特异性、简易性和速度当中有所权衡。举例来说,qPCR方法是灵敏但昂贵的并且依赖复杂的仪器,这限制了在实验室设置中训练有素的操作者的可用性。其他方法,例如组合等温核酸扩增与便携平台的新方法(Du等,2017;Pardee等,2016),在定点护理(POC)设置中提供高检测特异性,但归因于低灵敏度而具有稍受限制的应用。因为核酸诊断对于多种保健应用变得日益相关,所以在低成本下提供高特异性和灵敏度的检测技术将在临床与基础研究设置中具有很大效用。
发明内容
在一方面,本发明提供了一种包括基底的侧流装置。所述衬底可包括第一端,其中所述第一端包括样品加载部分。所述第一端可还包括加载有可检测配体的第一区域、CRISPR效应系统、检测构建体、包含生物素配体的第一测试带和包含用于所述可检测配体的捕获分子的第二测试带。所述检测构建体可包含RNA寡核苷酸,所述RNA寡核苷酸在第一端上具有第一分子并且在第二端上具有第二分子。在某些实施方案中,所述第一分子可为FITC并且所述第二个分子可为FAM。
所述侧流装置可还包括可裂解的报告构建体,所述报告构建体包含通过RNA或DNA接头连接的第一分子和第二分子。在一些实施方案中,所述第一分子可为FITC并且所述第二个分子可为生物素,反之亦然。所述侧流装置可还包括第一捕获区域,其为在一些实施方案中,所述第一捕获区域可为横越所述装置的第一水平线。在特定实施方案中,所述第一捕获区域与所述样品加载部分相邻并且处于所述侧流衬底的同一端上,并且可包括特异性地结合所述报告构建体的所述第一分子的第一结合剂。在一些实施方案中,所述第一结合剂可为固定的或以其他方式固定化至所述第一捕获区域的抗体,如抗FITC抗体。所述侧流装置可还包括第二捕获区域,在一些实施方案中,所述第二捕获区域朝向所述侧流衬底的与所述第一结合区域相反的一端定位。在特定实施方案中,所述第二捕获区域可包括特异性地结合所述报告构建体的所述第二分子的第二结合剂。在一些实施方案中,所述第二结合剂可为固定的或以其他方式固定化至所述第二捕获区域的抗体,如抗生物素抗体。
在一些实施方案中,所述可检测配体可为金纳米颗粒,所述金纳米颗粒可被第一抗体修饰。在特定实施方案中,所述第一抗体可为抗FITC抗体。在一些实施方案中,所述CRISPR效应系统可包括CRISPR效应蛋白和一个或多个被配置成结合至一种或多种靶序列的向导序列。
在一些实施方案中,所述衬底可为柔性材料衬底,例如像纸衬底或基于柔性聚合物的衬底。
在某些示例性实施方案中,CRISPR效应蛋白可为靶向RNA的效应蛋白。在某些实施方案中,靶向RNA的效应蛋白可为Cas13。在特定实施方案中,所述Cas13可在Cas 1基因的20kb之内。所述Cas13效应蛋白可以是选自由以下组成的组的属的生物体:纤毛菌属(Leptotrichia)、李斯特菌属(Listeria)、棒状杆菌属(Corynebacter)、萨特氏菌属(Sutterella)、军团菌属(Legionella)、密螺旋体属(Treponema)、产线菌属(Filifactor)、真杆菌属(Eubacterium)、链球菌属(Streptococcus)、乳杆菌属(Lactobacillus)、支原体属(Mycoplasma)、拟杆菌属(Bacteroides)、弗维菌属(Flaviivola)、黄杆菌属(Flavobacterium)、单丝壳属(Sphaerochaeta)、固氮螺菌属(Azospirillum)、葡糖醋杆菌属(Gluconacetobacter)、奈瑟氏菌属(Neisseria)、罗氏菌属(Roseburia)、细小棒菌属(Parvibaculum)、葡萄球菌属(Staphylococcus)、硝酸盐裂解菌属(Nitratifractor)、支原体属(Mycoplasma)、弯曲杆菌属(Campylobacter)和毛螺菌属(Lachnospira)。在特定实施方案中,所述C2c2或Cas13b效应蛋白可以来自选自由以下组成的组的生物体:沙氏纤毛菌(Leptotrichia shahii);韦德纤毛菌(Leptotrichia wadei)(Lw2);斯氏李斯特菌(Listeria seeligeri);毛螺菌科细菌(Lachnospiraceae bacterium)MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]([Clostridium]aminophilum)DSM 10710;鸡肉杆菌(Carnobacterium gallinarum)DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌(Paludibacter propionicigenes)WB4;韦氏李斯特菌(Listeriaweihenstephanensis)FSL R9-0317;李斯特菌科菌(Listeriaceae bacterium)FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌(Rhodobacter capsulatus)SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌(Leptotrichia buccalis)C-1013-b;解半纤维素赫氏菌(Herbinix hemicellulosilytica);直肠[真杆菌]([Eubacterium]rectale);真杆菌科细菌(Eubacteriaceae bacterium)
CHKCI004;布劳特氏菌属种(Blautia sp.)马赛-P2398;和纤毛菌属口腔分类群(Leptotrichia sp.oral taxon)879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌(Chloroflexus aggregans);桔红色去甲基醌菌(Demequinaaurantiaca);海旋菌属种(Thalassospira sp.)TSL5-1;假丁酸弧菌属种(Pseudobutyrivibrio sp.)OR37;丁酸弧菌属种(Butyrivibrio sp.)YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌(Bacteroides ihuae);紫单孢菌科细菌(Porphyromonadaceae bacterium)KH3CP3RA;崖李斯特菌(Listeria riparia);和陌生非适应螺菌(Insolitispirillum peregrinum)。在示例性实施方案中,所述C2c2效应蛋白是韦德纤毛菌F0279或韦德纤毛菌F0279(Lw2)C2c2效应蛋白。
在某些示例性实施方案中,所述CRISPR-Cas效应蛋白可为Cas12蛋白,如Cpf1或C2c1。
在某些示例性实施方案中,所述测定或装置可包括多个Cas 13直系同源物、多个Cas12直系同源物或Cas13和Cas12直系同源物的组合。
所述一个或多个向导序列可包括一个或多个向导RNA,所述一个或多个向导RNA可被设计成结合至一种或多种对疾病状态具诊断性的靶分子。此类疾病状态可包括但不必要限于癌症、自身免疫疾病、感染、器官疾病、血液疾病、免疫系统疾病、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病或环境获得性疾病。
在一些实施方案中,所述疾病状态的特征在于抗生素或药物抗性或易感基因或转录物或多肽,优选地在病原体或细胞中的存在或不存在。
在一些实施方案中,所述感染可由病毒、细菌、真菌、原生动物或寄生虫引起。在所述感染是病毒的实施方案中,所述感染可由DNA病毒引起。在特定实施方案中,所述DNA病毒可包括但不必要限于短尾病毒科、长尾病毒科、异疱疹病毒科、疱疹病毒科(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科、脂毛病毒科、小杆状病毒科、腺病毒科、瓶状病毒科、囊泡病毒科、非洲猪瘟病毒科(包括非洲猪瘟病毒)、杆状病毒科、西坎达病毒科、棒状病毒科、覆盖噬菌体科、小纺锤形噬菌体科、球状病毒科、滴状病毒科、唾液腺肥大病毒科、虹彩病毒科、马赛病毒科、拟菌病毒科、裸病毒科、线头病毒科、潘多拉病毒科、乳头瘤病毒科、藻类DNA病毒科、芽生噬菌体科、多DNA病毒、多瘤病毒科(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(包括牛痘和天花)、球脂状病毒科、复层噬菌体科、图里病毒科、甲藻DNA病毒、盐末端蛋白病毒、或瑞兹病毒。
病毒感染也可由双链RNA病毒、正义RNA病毒、反义RNA病毒、逆转录病毒或它们的组合引起。病毒感染可进一步由冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或丁型病毒引起。在某些示例性实施方案中,病毒可进一步由冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒引起。
在其他实施方案中,所述感染本质上可能是细菌。引起所述细菌感染的细菌可包括但不必要限于:不动杆菌属种、放线杆菌属种、放线菌目种、放线菌属种、气球菌属种、气单胞菌属种、红孢子虫属种、产碱杆菌属种、芽孢杆菌属种、拟杆菌属种、巴尔通体属种、双歧杆菌属种、博德特氏菌属种、包柔氏螺旋体属种、布鲁氏菌属种、伯克氏菌属种、弯曲杆菌属种、嗜二氧化碳噬细胞菌属种、衣原体属种、柠檬酸杆菌属种、柯克斯体属种、棒状杆菌属种、梭菌属种、艾肯菌属种、肠杆菌属种、埃希氏菌属种、肠球菌属种、埃立克体属种、表皮癣菌属种、丹毒丝菌属种、真杆菌属种、弗朗西斯菌属种、梭杆菌属种、加德纳菌属种、孪生球菌属种、嗜血杆菌属种、螺杆菌属种、金氏菌属种、克雷伯菌属种、乳杆菌属种、乳球菌属种、李斯特菌属种、钩端螺旋体属种、军团菌属种、钩端螺旋体属种、明串珠菌属种、曼氏杆菌属种、小孢子菌属种、微球菌属种、莫拉菌属种、摩根氏菌属种、动弯杆菌属种、微球菌属种、分枝杆菌属种、支原体属种、诺卡氏菌属种、奈瑟氏菌属种、巴斯德菌属种、片球菌属种、消化链球菌属种、糠疹癣菌属种、邻单胞菌属种、普雷沃菌属种、卟啉单胞菌属种、变形杆菌属种、普罗威登斯菌属种、假单胞菌属种、丙酸杆菌属种、红球菌属种、立克次体属种、红球菌属种、沙雷氏菌属种、寡养单胞菌属种、沙门氏菌属种、沙雷氏菌属种、志贺氏菌属种、葡萄球菌属种、链球菌属种、螺菌属种、链杆菌属种、密螺旋体属种、养障体属种、毛癣菌属种、脲原体属种、韦荣氏球菌属种、弧菌属种、耶尔森菌属种、黄单胞菌属种,或它们的组合。
在其他实施方案中,所述感染可为真菌并且可由真菌引起,所述真菌包括但不必要限于曲霉属、芽生菌属、念珠菌属、球孢子菌属、新型隐球菌、格特隐球菌、组织胞浆菌属种(如荚膜组织胞浆菌)、肺孢子菌属种(如耶氏肺孢子菌)、葡萄穗霉属(如纸葡萄穗霉)、毛霉菌属、孢子丝菌属、真菌性眼睛感染癣、突脐蠕孢属、枝孢属、地霉属、酵母属、汉逊酵母属种、假丝酵母属种、克鲁维酵母属种、德巴利酵母属种、毕赤酵母属种、青霉菌属种、枝孢属种、丝衣霉属种,或它们的组合。
在其他实施方案中,所述感染可由原生动物引起,所述原生动物如眼虫动物界、异叶足纲、双滴虫目、变形虫界、芽囊原虫属、顶复亚门,或它们的组合。
在其他实施方案中,所述感染可由寄生虫引起,所述寄生虫如但不必要限于克氏锥虫(恰加斯病)、布氏冈比亚锥虫、布氏罗得西亚锥虫、巴西利什曼原虫、婴儿利什曼原虫、墨西哥利什曼原虫、硕大利什曼原虫、热带利什曼原虫、杜氏利什曼原虫、福氏耐格里变形虫、肠贾第虫(蓝氏贾第鞭毛虫、十二指肠贾第虫)、卡氏棘阿米巴虫、巴氏阿米巴原虫、痢疾阿米巴、人芽囊原虫、田鼠巴贝虫、微小隐孢子虫、卡晏环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫,或它们的组合。
在一些实施方案中,所述样品可为生物样品或环境样品。生物样品可包括但不必要限于血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液(例如获自脓肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节或受如类风湿性关节炎、骨关节炎、痛风或化脓性关节炎等疾病影响的关节)的流体,或皮肤或粘膜表面的拭子。
在某些实施方案中,环境样品可包括但不必要限于获自食物样品、纸表面、织物、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品,或它们的组合的样品。
在另一方面,本发明提供了一种侧流装置,所述侧流装置包括衬底,所述衬底包括第一端,其中所述第一端包括样品加载部分,以及加载有可检测配体的第一区域、两个或更多个CRISPR效应系统、两种或更多种检测构建体、一个或多个第一捕获区域、两个或更多个第二捕获区域,所述一个或多个第一捕获区域各自包括第一结合剂,所述两个或更多个第二捕获区域各自包括第二结合剂,其中所述两个或更多个CRISPR效应系统各自包含CRISPR效应蛋白和一个或多个向导序列,每一向导序列被配置成结合一种或多种靶分子。
在一些实施方案中,所述两种或更多种检测构建体各自包含RNA或DNA寡核苷酸,所述RNA或DNA寡核苷酸在第一端上包含第一分子并且在第二端上包含第二分子。在特定实施方案中,所述侧流装置可包括两个CRISPR效应系统和两种检测构建体。在甚至更具体的实施方案中,所述侧流装置可包括四个CRISPR效应系统和四种检测构建体。
所述样品加载部分可还包括一种或多种扩增试剂以扩增所述一种或多种靶分子。
在一些实施方案中,所述第一检测构建体包含FAM作为第一分子并且包含生物素作为第二第二分子,反之亦然,并且第二检测构建体包含FAM作为第一分子并且包含地高辛(DIG)作为第二分子,反之亦然。在一些实施方案中,所述CRISPR效应蛋白是靶向RNA的CRISPR效应蛋白。在一些实施方案中,所述靶向RNA的效应蛋白是C2c2。在一些实施方案中,所述靶向RNA的效应蛋白是Cas13b。
在一些实施方案中,第一检测构建体可包含Tye665作为第一分子并且包含Alexa-fluor-488作为第二分子,反之亦然;第二检测构建体可包含Tye665作为第一分子并且包含FAM作为第二分子,反之亦然;第三检测构建体可包含Tye665作为第一分子并且包含生物素作为第二分子,反之亦然;第四检测构建体可包含Tye665作为第一分子并且包含DIG作为第二分子,反之亦然。
在一些实施方案中,所述CRISPR效应蛋白可为靶向RNA的效应蛋白或靶向DNA的效应蛋白。所述靶向RNA的效应蛋白可为C2c2或Cas13b。在一些实施方案中,所述靶向DNA的效应蛋白是Cas12a。
在另一方面,本发明提供了一种用于检测样品中的靶核酸的方法,所述方法包括使样品与本文所述的侧流装置的第一端接触。优选地,使所述样品与所述装置的所述样品加载部分接触,并且所述样品从所述衬底的所述样品加载部分流向所述第一捕获区域和所述第二捕获区域,从而产生可检测信号。
所述样品可为液体样品,或者可溶解于水性溶剂中。在所述样品不含有靶核酸的实施方案中,所述可检测信号出现在所述第一捕获区域处。在所述样品含有靶核酸的实施方案中,所述可检测信号出现在所述第二捕获区域处。靶核酸的存在通常指示疾病状态。
示例性实施方案的这些和其他方面、目标、特征和优点在考虑所说明的示例性实施方案的以下详细描述后对于本领域普通技术人员将变得显而易见。
附图说明
图1-是示例性基于C2c2的CRISPR效应系统的示意图。
图2-提供了(A)来自韦德纤毛菌的CRISPR/C2c2基因座的示意图。示出了来自LwC2c2和LshC2c2系统的代表性crRNA结构。(SEQ.I.D.No.220和221)(B)C2c2活性的体内细菌测定的示意图。在氨苄西林(ampicillin)抗性质粒中的β-内酰胺酶基因上游克隆原间隔区,并且使这种构建体转化至表达与靶向或非靶向间隔区联合的C2c2的大肠杆菌(E.coli)中。对成功的转化体进行计数以定量活性。(C)LwC2c2和LshC2c2体内活性的定量。(n=2个生物性重复;条形表示平均值±s.e.m.)(D)LwC2c2的最终尺寸排阻凝胶过滤。(E)LwC2c2逐步纯化的考马斯蓝(Coomassie blue)染色的丙烯酰胺凝胶。(F)针对不同PFS标靶的LwC2c2的活性。LwC2c2靶向具有侧接间隔区的可变3'PFS的荧光RNA,并且反应产物在变性凝胶上显现。LwC2c2显示略微偏向于GPFS。
图3-示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中,经过3小时以5分钟时间间隔测量。
图4-示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中,经过3小时以5分钟时间间隔测量。
图5-示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中,经过3小时以5分钟时间间隔测量。
图6-示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中,经过3小时以5分钟时间间隔测量。
图7-提供了根据某些示例性实施方案,使用掩蔽构建体和CRISPR效应蛋白的示例性检测方案的示意图。
图8-提供了示出当使用向导RNA的不同库检测标靶时荧光随时间的变化的一组图。
图9-提供了示出在不同浓度的CRISPR效应蛋白下跨越不同稀释度的靶RNA检测的标准化荧光的图。
图10-是示出NASBA扩增反应的一般步骤的示意图。
图11-提供了示出通过NASBA用三种不同引物组扩增并且然后经受使用淬灭的荧光探针的C2c2附带检测的核酸靶ssRNA 1的检测的图(n=2个技术性重复;条形表示平均值±s.e.m.)。
图12-提供了示出附带效应可以用于检测慢病毒靶RNA的存在的图。
图13-提供了展示附带效应和NASBA可以检测aM浓度下的物质的图。
图14-提供了展示附带效应和NASBA快速辨别低浓度样品的图。
图15-示出了在特定时间点的标准化荧光预测样品输入浓度。在无扩增的情况下来自Cas13a检测的荧光测量值与输入RNA浓度相关(n=2个生物性重复;条形表示平均值±s.e.m.)。
图16-提供了RPA反应的示意图,其示出参与反应的组分。
图17-SHERLOCK的示意图;提供了示出经由相应地并入RPA或RT-RPA步骤对DNA或RNA标靶的检测的示意图。在靶RNA识别后,附带效应促使C2c2切割裂解报告子,产生荧光。可以经由重组酶聚合酶扩增(RPA)使单分子量的RNA或DNA扩增成DNA并且转录产生RNA,然后由C2c2检测。
图18-提供了经由C2c2附带检测所检测的ssRNA标靶的示意图(SEQ.I.D.No.222和223)。
图19-提供了展示使用RPA的单分子DNA检测的一组图(即,在C2c2添加的15分钟内)。
图20-提供了展示将T7聚合酶混合至RPA反应中会不利地影响DNA检测的一组图。
图21-提供了展示将聚合酶混合至RPA反应中不会不利地影响DNA检测的一组图。
图22-提供了展示当同时孵育时RPA、T7转录和C2c2检测反应是相容的并且达成单分子检测的图(n=2个技术性重复;条形表示平均值±s.e.m.)。
图23-提供了展示快速RPA-RNA时间孵育的功效的一组图。
图24-提供了展示增加T7聚合酶量增强RPA-RNA的灵敏度的一组图。
图25-提供了示出来自使用1.5x酶的一锅式反应的RPA-DNA检测测定的结果的一组图。单分子(2aM)检测早在30分钟即达成。
图26-提供了展示RPA-DNA一锅式反应证实相对于输入浓度的荧光定量减少的一组图。拟合曲线揭示标靶输入浓度与输出荧光之间的关系。
图27-提供了一组图,其展示(A)在无扩增的情况下RNA的C2c2检测可以检测浓度低至50fM的ssRNA标靶(n=2个技术性重复;条形表示平均值±s.e.m.),以及(B)RPA-C2c2反应能够进行单分子DNA检测(n=4个技术性重复;条形表示平均值±s.e.m.)。
图28-提供了展示根据某些示例性实施方案产生的C2c2信号可以检测纸衬底上的20pM标靶的一组图。
图29-提供了示出特异性RNA酶抑制剂能够去除纸上的背景信号的图。
图30是示出在玻璃纤维衬底上使用根据某些示例性实施方案的系统的检测的一组图。
图31-提供了一组图,其提供(A)根据某些示例性实施方案的寨卡RNA检测的示意图。用通过C2c2附带检测靶向的寨卡RNA或同源登革RNA片段包封慢病毒。48小时后收集培养基并且经受热裂解、RT-RPA和C2c2检测。(B)RT-RAP-C2c2检测能够进行寨卡慢病毒颗粒的高度灵敏检测(n=4个技术性重复,双尾司徒登t检验(Student t-test);*****,p<0.0001;条形表示平均值±s.e.m.)(C)根据某些示例性实施方案,使用纸上冷冻干燥的C2c2的寨卡RNA检测的示意图。(D)基于纸的测定能够进行寨卡慢病毒颗粒的高度灵敏检测(n-4个技术性重复,双尾司徒登t检验;****,p<0.0001;**,p<0.01,条形表示平均值±s.e.m.)。
图32-提供了一组图,其展示(A)从人血清分离的寨卡RNA的C2c2检测的示意图。血清中的寨卡RNA经受逆转录、RNA的RNA酶H降解、cDNA的RPA以及C2c2检测。(B)C2c2能够进行人寨卡血清样品的高度灵敏检测。通过qPCR验证所示出的寨卡RNA的浓度(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.)。
图33-提供了一组图,其展示(A)冷冻干燥的C2c2能够进行低飞摩尔范围内的ssRNA 1的灵敏检测。C2c2能够进行纸上呈液体形式(B)或冷冻干燥(C)的200pM ssRNA 1标靶的快速检测。反应能够进行在溶液中(D)(n=3)及呈冷冻干燥形式(E)(n=3)的经过合成的寨卡RNA片段的灵敏检测。(F)示出输入浓度与所检测的荧光之间的显著相关的人寨卡cDNA检测的定量曲线。(G)在不同量的人血清存在下进行的ssRNA 1的C2c2检测(除非另有注释,否则n=2个技术性重复;条形表示平均值±s.e.m.)。
图34-提供了(A)使用通用V3 RPA引物组对来自细菌基因组的16S rRNA基因的C2c2检测的示意图,以及(B)使用根据某些示例性实施方案进行的测定达成大肠杆菌或绿脓假单胞菌(P.aeruginosa)gDNA的灵敏和特异性检测的能力(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.)。Ec,大肠杆菌(Escherichiacoli);Kp,肺炎克雷伯菌(Klebsiella pneumoniae);Pa,绿脓假单胞菌(Pseudomonasaeruginosa);Mt,结核分枝杆菌(Mycobacterium tuberculosis);Sa,金黄色葡萄球菌(Staphylococcus aureus)。
图35-提供了一组图,其展示(A)来自肺炎克雷伯菌的四种不同临床分离株的两种不同碳青霉烯(carbapenem)抗性基因(KPC和NDM-1)的检测,以及(B)碳青霉烯抗性基因的检测(部分A)标准化为KPC与NDM-1crRNA测定之间的信号比(n=2个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.)。
图36-提供了一组图,其展示(A)C2c2对于单错配不灵敏,但可以区分当加载有具有额外错配的crRNA时标靶中的单核苷酸差异。用11个crRNA检测ssRNA标靶1-3,其中10个间隔区含有在crRNA中的各个位置处的合成错配。错配的间隔区并不显示标靶1的降低的裂解,但显示错配标靶2和3的受抑制的裂解(SEQ.I.D.No.224至237)。(B)示出具有合成错配的单碱基特异性间隔区的合理设计的过程的示意图。合成错配接近于所关注的SNP或碱基放置。(SEQ.I.D.No.238至242)(C)株系SNP的高度特异性检测允许使用具有截短(23个核苷酸)crRNA的C2c2检测来区别仅相差一个核苷酸的寨卡非洲对美洲RNA标靶(n=2个技术性重复,单尾司徒登t检验;*,p<0.05;****,p<0.0001;条形表示平均值±s.e.m.)。
图37-提供了一组图,其展示:(A)用于检测的寨卡株系标靶区和crRNA序列的示意图。(SEQ.I.D.No.243至248)。标靶中的SNP用红色或蓝色突出显示并且向导序列中的合成错配涂红色。(B)株系SNP的高度特异性检测允许使用SHERLOCK来区别寨卡非洲对美洲RNA标靶(n=2个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.)(SEQ.I.D.No.249至254)。(C)用于检测的登革株系标靶区和crRNA序列的示意图。标靶中的SNP用红色或蓝色突出显示并且向导序列中的合成错配涂红色。(D)株系SNP的高度特异性检测允许使用SHERLOCK来区别登革株系1对株系3RNA标靶(n=2个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.)。
图38-提供了一组图,其示出(A)示出用C2c2检测的人SNP的位置的圆环图。(B)根据某些示例性实施方案进行的测定可以区分人SNP。SHERLOCK可以在人基因组中的四个不同SNP位点处对四个不同个体进行正确基因分型。在每个图的下方标注每个个体的基因型和等位基因传感crRNA的身份(n=4个技术性重复;双尾司徒登t检验;*,p<0.05;**,p<0.01;***,p<0.001;****,p<0.0001;条形表示平均值±s.e.m.)。(C)根据某些示例性实施方案对cfDNA的检测(例如癌症突变的无细胞DNA检测)的过程的示意图。(D)用于检测EGFRL858R和BRAF V600E的示例性crRNA序列。(SEQ.I.D.No.255至260)。对于无细胞DNA中的癌症突变所测定的两个基因组基因座的序列。示出了具有用蓝色突出显示的SNP的靶基因组序列和具有涂红色的合成错配的突变体/野生型传感crRNA序列。
图39-提供了一组图,其展示C2c2可以检测来自EGFR L858R(C)或BRAF V600E(B)次要等位基因的仿制无细胞DNA样品中的突变体次要等位基因(n=4个技术性重复,双尾司徒登t检验;*,p<0.05;**,p<0.01,****,P<0.0001;条形表示±s.e.m.)。
图40-提供了一组图,其展示(A)测定可以区分rs5082处的基因型(n=4个技术性重复;*,p<0.05;**,p<0.01;***,p<0.001;****,p<0.0001;条形表示平均值±s.e.m.)。(B)测定可以区分直接来自离心、变性和煮沸的唾液的gDNA中的rs601338处的基因型(n=3个技术性重复;*,p<0.05;条形表示平均值±s.e.m.)。
图41-提供了(A)在与ssDNA 1仅相差单错配的标靶的背景中对ssDNA1进行的示例性实施方案的示意图。(B)测定达成在错配的背景(与ssDNA仅相差单错配的标靶)存在下ssDNA 1的单核苷酸特异性检测。各种浓度的靶DNA与背景过量的具有一个错配的DNA组合并且通过测定来检测。
图42是示出具有不同染料Cy5的掩蔽构建体也允许有效检测的图。
图43是基于比色的金纳米颗粒测定的示意图。使用DNA接头与RNA桥的组合使AuNP聚集。添加RNA酶活性后,ssRNA桥裂解并且释放AuNP,促使特征性颜色朝向红色偏移。
图44是示出检测在520nm下分散的纳米颗粒的红色偏移的能力的图。纳米颗粒是基于图43中所示的示例性实施方案并且使用不同浓度的RNA酶A的添加而分散。
图45是示出RNA酶比色测试是定量的图。
图46是示出分散的纳米颗粒的颜色偏移在视觉上可检测的微孔板的照片。
图47是展示比色偏移在纸衬底上可见的照片。测试在37℃下在玻璃纤维934-AH上进行10分钟。
图48是用于蛋白质或小分子检测的根据某些示例性实施方案的构象转换适体的示意图。(A)SEQ ID NO:261。接合产物(B)用作RNA靶向效应物的完整标靶,所述效应物无法检测未接合的输入产物。(SEQ ID NO:262)。
图49是示出基于适体的接合可以建立RPA可检测底物的凝胶的图像。将适体与各种水平的凝血酶一起孵育,然后与探针接合。接合的构建体用作3分钟RPA反应的模板。500nM凝血酶具有比背景显著更高水平的扩增标靶。
图50示出了所选C2c2直系同源物的HEPN结构域的氨基酸序列(SEQ ID NO:263-292)。
图51使用RPA扩增(SHERLOCK)对RNA的Cas13a检测可以检测浓度降至约2aM的ssRNA标靶,比单独的Cas13a更灵敏(n=4个技术性重复;条形表示平均值±s.e.m.)。
图52-Cas13a检测可以用于传感病毒和细菌病原体。(A)从人临床样品分离的ZIKVRNA的SHERLOCK检测的示意图。(B)SHERLOCK能够进行人ZIKV阳性血清(S)或尿液(U)样品的高度灵敏检测。所示出的ZIKV RNA的近似浓度通过qPCR确定(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.;n.d.,未检出)。
图53-通过使用引物组2的NASBA(图11)和SHERLOCK对ssRNA 1的检测的比较(n=2个技术性重复;条形表示平均值±s.e.m.)。
图54使用RPA和单反应SHERLOCK的核酸扩增。(A)用于图1C中所用的稀释液的ssRNA 1的数字微滴PCR定量。基于ddPCR结果的稀释液的调整浓度示于条形图上方。(B)用于图1D中所用的稀释液的ssDNA 1的数字微滴PCR定量。基于ddPCR结果的稀释液的调整浓度示于条形图上方。(C)当同时孵育时RPA、T7转录和Cas13a检测反应是相容的并且达成DNA2的单分子检测(n=3个技术性重复,双尾司徒登t检验;n.s.,不显著;**,p<0.01;****,p<0.0001;条形表示平均值±s.e.m.)。
图55-SHERLOCK与其他灵敏核酸检测工具的比较。(A)使用数字微滴PCR对ssDNA 1稀释系列的检测分析(n=4个技术性重复,双尾司徒登t检验;n.s.,不显著;*,p<0.05;**,p<0.01;****,p<0.0001;红线表示平均值,条形表示平均值±s.e.m。所测量的拷贝/微升低于10-1的样品未示出。)。(B)使用定量PCR对ssDNA 1稀释系列的检测分析(n=16个技术性重复,双尾司徒登t检验;n.s.,不显著;**,p<0.01;****,p<0.0001;红线表示平均值,条形表示平均值±s.e.m。相对信号低于10-10的样品未示出。)。(C)使用具有SYBR Green II的RPA对ssDNA 1稀释系列的检测分析(n=4个技术性重复,双尾司徒登t检验;*,p<0.05;**,p<0.01;红线表示平均值,条形表示平均值±s.e.m。相对信号低于100的样品未示出。)。(D)使用SHERLOCK对ssDNA 1稀释系列的检测分析(n=4个技术性重复,双尾司徒登t检验;**,p<0.01;****,p<0.0001;红线表示平均值,条形表示平均值±s.e.m。相对信号低于100的样品未示出。)。(E)一系列ssDNA 1稀释液对于四种类型的检测方法的百分比变异系数。(F)6e2、6e1、6e0和6e-1ssDNA1稀释液对于四种类型的检测方法的平均百分比变异系数。(条形表示平均值±s.e.m.)。
图56-临床细菌分离株的碳青霉烯抗性的检测。来自肺炎克雷伯菌的五种临床分离株和大肠杆菌对照的两种不同碳青霉烯抗性基因(KPC和NDM-1)的检测(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.;n.d.,未检出)。
图57-对靶序列中的截短间隔区和单错配的LwCas13a灵敏度的表征。(A)用于(B)-(G)中的截短间隔区crRNA的序列。还示出了ssRNA 1和2的序列,其具有用红色突出显示的单碱基对差异。含有合成错配的crRNA用涂红色的错配位置来展示(SEQ ID NO:293-304)。(B)在位置1-7处具有合成错配的28nt间隔区crRNA对ssRNA 1和2的附带裂解活性(n=4个技术性重复;条形表示平均值±s.e.m.)。(C)在(B)中测试的crRNA的特异性比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA 2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。(D)在位置1-7处具有合成错配的23nt间隔区crRNA对ssRNA 1和2的附带裂解活性(n=4个技术性重复;条形表示平均值±s.e.m.)。(E)在(D)中测试的crRNA的特异性比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。(F)在位置1-7处具有合成错配的20nt间隔区crRNA对ssRNA 1和2的附带裂解活性(n=4个技术性重复;条形表示平均值±s.e.m.)。(G)在(F)中测试的crRNA的特异性比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA 2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。
图58.-靶序列中相对于突变的理想合成错配位置的鉴别。(A)用于评估理想合成错配位置以检测ssRNA 1与ssRNA 2之间的突变的序列。在每个标靶上,测试在涂色(红色)位置处具有合成错配的crRNA。设计每一组合成错配crRNA以使得突变位置相对于间隔区的序列发生位置偏移。设计间隔区以使得在间隔区内的位置3、4、5和6处评估突变。所示为SEQID NO:305-336。(B)在不同位置处具有合成错配的crRNA对ssRNA 1和2的附带裂解活性。存在四组crRNA,其在间隔区:标靶双链体区内的任一位置3、4、5或6处具有突变(n=4个技术性重复;条形表示平均值±s.e.m.)。(C)在(B)中测试的crRNA的特异性比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA 2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。
图59-使用SHERLOCK在额外基因座处的基因分型和从煮沸的唾液的直接基因分型。SHERLOCK可以区分直接来自离心、变性和煮沸的唾液的基因组DNA中的rs601338SNP位点处的基因型(n=4个技术性重复,双尾司徒登t检验;**,p<0.01;****,p<0.001;条形表示平均值±s.e.m.)。
图60-用以对人SNP进行准确基因分型的合成基因分型标准的开发。(A)与PCR扩增的基因型标准相比,使用SHERLOCK在rs601338SNP位点处对四个个体中的每一个进行的基因分型(n=4个技术性重复;条形表示平均值±s.e.m.)。(B)与PCR扩增的基因型标准相比,使用SHERLOCK在rs4363657SNP位点处对四个个体中的每一个进行的基因分型(n=4个技术性重复;条形表示平均值±s.e.m.)。(C)每个个体的SHERLOCK结果与rs601338SNP位点处的合成标准之间的计算p值的热图。示出了等位基因传感crRNA中的每一个的热图。将热图色表加标度以使得非显著性(p>0.05)呈红色并且显著性(p<0.05)呈蓝色(n=4个技术性重复,单因素ANOVA)。(D)每个个体的SHERLOCK结果与rs4363657SNP位点处的合成标准之间的计算p值的热图。示出了等位基因传感crRNA中的每一个的热图。将热图色表加标度以使得非显著性(p>0.05)呈红色并且显著性(p<0.05)呈蓝色(n=4个技术性重复,单因素ANOVA)。(E)用于理解SHERLOCK基因分型的p值热图结果的指南。通过选择对应于在个体与等位基因合成标准之间的p值>0.05的等位基因可以容易地调用基因分型。红色区块对应于合成标准与个体的SHERLOCK结果之间的非显著差异并且因此是基因型阳性结果。蓝色区块对应于合成标准与个体的SHERLOCK结果之间的显著差异并且因此是基因型阴性结果。
图61-作为小部分的错配背景标靶的ssDNA 1的检测。在人基因组DNA的背景下ssDNA 1的稀释系列的SHERLOCK检测。应注意,在所检测的ssDNA 1标靶与背景基因组DNA之间不应存在序列相似性(n=2个技术性重复;条形表示平均值±s.e.m.)。
图62-来自具有寨卡病毒的患者的尿液(A)或血清(B)样品在95℃(尿液)或65℃(血清)下热灭活5分钟。根据示例性实施方案,1微升灭活的尿液或血清用作2小时RPA反应继之以3小时C2c2/Cas13a检测反应的输入。误差条指示基于检测反应的n=4个技术性重复的1SD。
图63-来自具有寨卡病毒的患者的尿液样品在95℃下热灭活5分钟。根据示例性实施方案,1微升灭活的尿液用作30分钟RPA反应继之以3小时(A)或1小时(B)C2c2/Cas13检测反应的输入。误差条指示基于检测反应的n=4个技术性重复的1SD。
图64-来自具有寨卡病毒的患者的尿液样品在95℃下热灭活5分钟。1微升灭活的尿液用作20分钟RPA反应继之以1小时C2c2/Cas13a检测反应的输入。健康人尿液用作阴性对照。误差条指示基于n=4个技术性重复或检测反应的1SD。
图65-来自具有寨卡病毒的患者的尿液样品在95℃下热灭活5分钟。1微升灭活的尿液用作20分钟RPA反应继之以在存在或不存在向导RNA的情况下1小时C2c2/Cas13a检测反应的输入。通过从含有向导的检测反应中扣除无向导检测反应的平均荧光值而使数据标准化。健康人尿液用作阴性对照。误差条指示基于检测反应的n=4个技术性重复的1SD。
图66-示出了根据示例性实施方案,使用四种不同向导RNA设计对两种疟疾特异性标靶的检测。所示为SEQ ID NO:337-348。
图67-提供显示不同Cas13b直系同源物的编辑偏好的图。密钥见表3。
图68-提供A)使用具有不同编辑偏好的不同Cas13b直系同源物的多重测定的示意图,和B)证实使用Cas13b10和Cas13b5的这样的测定的可行性的数据。
图69-提供显示采用Cas13b5(普雷沃菌属种MA2106)和Cas13b9(中间普雷沃菌)直系同源物的双多重化的图。效应蛋白和向导序列两者包含在同一反应中,允许在同一反应中使用不同荧光读出(poly U 530nm和poly A 485nm)进行双多重化。
图70-提供与图69相同,但在这种情况下使用Cas13a(韦德纤毛菌LwaCas13a)直系同源物和Cas13b直系同源物(普雷沃菌属种MA2016,Cas13b5)。
图71-提供根据某些示例性实施方案,用多个向导序列铺设靶序列以确定靶向的稳健性的方法。所示为SEQ ID NO:349和350。
图72-提供杂交链式反应(HCR)凝胶,其显示Cas13效应蛋白可用于解锁引发剂,例如,引入如本文所述的掩蔽构建体中的引发剂,以活化杂交链式反应。
图73-提供显示在复杂溶解产物中检测铜绿假单胞菌的能力的数据。
图74-提供显示根据某些示例性实施方案的某些Cas13直系同源物的离子偏好的数据。所有标靶浓度均为20nM输入,离子浓度为(1mM和10mM)。
图75-提供显示Cas13b12具有1mM硫酸锌切割偏好的数据。
图76-提供显示缓冲液优化可以增强Cas13b5对polyA报告子的信号比的数据。旧缓冲液包含40mM Tris-HCL,60mM NaCl,6mM MgCl2,pH 7.3。新缓冲液包含20mM HEPES pH6.8,6mM MgCl2和60mM NaCl。
图77-提供VI-A/C型Crispr系统和VI-B1和B2型系统的示意图以及代表性Cas13b直系同源物的系统发生树。
图78-提供各种Cas13b直系同源物在不同核苷酸处和相对于LwCas13a的相对切割活性。
图79-提供显示各种实例Cas13直系同源物的相对灵敏度的图。
图80-提供显示使用示例性实施方案实现仄普托(zepto)摩尔(zM)检测水平的能力的图。
图81-提供使用具有不同编辑偏好的Cas13直系同源物和基于polyN的掩蔽构建体的多重测定的示意图。
图82-提供显示在一系列条件下的引物优化实验和假单胞菌检测的结果的数据。
图83-提供根据某些示例性实施方案的侧流测定的示意图以及使用侧流装置获得的结果。
图84-提供根据某些示例性实施方案的使用侧流装置检测特定大豆株系的能力。
图85-使SHERLOCK适应侧流检测。(A)使用SHERLOCK进行侧流检测的示意图。(B)使用侧流SHERLOCK和1小时的LwaCas13a反应来检测合成的寨卡RNA。(C)对来自(B)中的检测的带强度的定量。
图86-侧流SHERLOCK的农业和即时医疗应用。(A)使用LwaCas13a在CP4-EPSPS修饰的(除草剂抗性)或WT大豆种子中检测CP4-EPSPS除草剂抗性基因或凝集素对照物。(B)除草剂抗性或WT大豆中的CP4-EPSPS检测的时程。(C)除草剂抗性或WT大豆中的凝集素检测的时程。(D)使用LwaCas13a,对CP4-EPSPS和WT种子混合物的CP4-EPSPS DNA含量的定量。(E)使用LwaCas13a,对CP4-EPSPS修饰的大豆或WT大豆种子中的CP4-EPSPS除草剂抗性基因或凝集素对照物的侧流检测。(F)对来自(E)中的检测的带强度的定量。(G)对具有L858R或WT癌症突变的患者来源的无细胞DNA样品中的EGFR L858R突变的检测。(H)对具有L858R或WT癌症突变的患者来源的无细胞DNA样品中的EGFR L858R突变的侧流检测。(I)对来自(H)中的检测的带强度的定量。(J)对具有外显子19缺失或WT癌症突变的患者来源的无细胞DNA样品中的EGFR外显子19缺失突变的检测。(K)对具有外显子19缺失或WT癌症突变的患者来源的无细胞DNA样品中的EGFR外显子19缺失突变的侧流检测。(L)对来自(K)中的检测的带强度的定量。
图87-基于磁珠的侧流SHERLOCK。(A)基于磁珠的侧流SHERLOCK读出的示意图。附带活性从珠子中切割侧流报告子,从而允许进行检测。(B)使用基于磁珠的侧流SHERLOCK和1小时的LwaCas13a反应检测合成的登革热RNA。(C)对来自(B)中的检测的带强度的定量。
图88-对ssRNA1的SHERLOCK侧流检测。(A)使用侧流SHERLOCK在各种浓度的ssRNA1下检测ssRNA 1。(B)对来自(A)中的检测的带强度的定量。
图89-对来自粗植物提取物中的CP4和凝集素基因的SHERLOCK侧流检测。(A)使用侧流SHERLOCK,以10分钟RPA和20分钟附带检测对来自直接大豆粗提物中的RR(CP4 EPSPS基因)或凝集素的检测。(B)使用侧流SHERLOCK,以10分钟RPA和35分钟附带检测对来自直接大豆粗提物中的RR(CP4 EPSPS基因)或凝集素的检测。(C)对来自(A)中的检测的带强度的定量。(D)对来自(B)中的检测的带强度的定量。
图90-对合成外显子19缺失样品的SHERLOCK侧流检测。(A)使用LwaCas13a,对具有外显子19缺失或WT基因型的合成DNA样品中的EGFR外显子19缺失突变的检测。(B)使用LwaCas13a,对具有外显子19缺失或WT基因型的合成DNA样品中的EGFR外显子19缺失突变的侧流检测。(C)对来自(B)中的检测的带强度的定量。
图91-示出了使用SHERLOCK对大豆除草剂抗性基因的检测。(A)SHERLOCK与快速基因组DNA提取方法结合使用的示意图,所述方法允许经由侧流条带以定量、多重和便携式方式检测大豆转基因。(B)使用LwaCas13a和荧光报告子,对Roundup Ready(RR)转基因CP4EPSPS和阳性对照基因凝集素的SHERLOCK检测。(C)对复杂大豆混合物中Roundup Ready(RR)转基因CP4 EPSPS的百分比的定量SHERLOCK检测。(D)使用双色SHERLOCK利用LwaCas13a和PsmCas13b对CP4 EPSPS转基因和凝集素进行样品内多重检测的示意图。(E)使用双色SHERLOCK利用LwaCas13a和PsmCas13b对CP4 EPSPS转基因和凝集素的样品内多重检测。将大豆的凝集素检测与无输入水对照样品进行比较。(F)使用SHERLOCK侧流条带快速检测大豆转基因的示意图。(G)使用SHERLOCK和LwaCas13a在侧流条带上在30分钟内对CP4EPSPS转基因的快速检测。(H)对来自G中的侧流条带的样品带强度的定量。
图92-示出了使用SHERLOCK进行植物基因检测的动力学。(A)在一段时间内,使用SHERLOCK和LwaCas13a对RR大豆和野生型(WT)大豆中的Roundup Ready(RR)转基因CP4EPSPS的检测。(B)在一段时间内,使用SHERLOCK和LwaCas13a对Roundup Ready(RR)大豆和野生型(WT)大豆中的凝集素基因的检测。
图93-示出了大豆种群中CP4 EPSPS转基因的定量SHERLOCK。(A)在SHERLOCK检测反应的不同时间点,SHERLOCK信号与Roundup Ready(RR)大豆百分比的相关性。(B)在30分钟的时间点(具有最大相关性的时间点,如a所示),含有变化量的Roundup Ready(RR)大豆的大豆混合物中的CP4EPSPS转基因的SHERLOCK信号检测。(C)在30分钟的时间点(具有最大相关性的时间点,如A所示),含有变化量的Roundup Ready(RR)大豆的大豆混合物中的凝集素基因的SHERLOCK信号检测。
图94-示出了在Csm6信号扩增下CP4 EPSPS转基因的SHERLOCK检测。(A)使用LwaCas13a并且EiCsm6或LsCsm6进行信号扩增,对Roundup Ready(RR)转基因CP4 EPSPS的SHERLOCK检测。(B)使用LwaCas13a,对CP4 EPSPS转基因的SHERLOCK检测的EiCsm6扩增的动力学。
图95.-提供利用金纳米颗粒聚集RNA酶活性的比色检测结果。A)基于金纳米颗粒的RNA酶活性比色读出的示意图。在不存在RNA酶活性的情况下,RNA接头会聚集金纳米颗粒,导致红色损失。RNA接头的切割释放纳米颗粒并导致红色改变。
图96.-A)提供根据某些示例性实施方案的侧流检测的示意图。B)使用侧流实施方案和1小时的LwaCas13反应对合成寨卡ssRNA的检测。C)对来自(B)中的检测的带强度的定量。C)对来自(B)中的检测的带强度的定量。对来自患者液体活检样品的治疗性相关EGFR突变进行侧流检测的示意图。(E)对具有L858R或WT癌症突变的患者来源的无细胞DNA样品中的EGFR L858R突变的检测。值表示平均值+/-S.E.M.。F).对具有L858R或WT等位基因的患者来源的无细胞DNA样品中的EGFR L858R突变的侧流检测。G)对来自(E)的带强度的定量。(H)对具有外显子19缺失或WT等位基因的患者来源的无细胞DNA样品中的EGFR外显子19缺失突变的检测。值表示平均值+/-S.E.M.。(I)对具有外显子19缺失或WT等位基因的患者来源的无细胞DNA样品中的EGFR外显子19缺失突变的侧流检测。(J)对来自(H)中的检测的带强度的定量。K)对DENV ssRNA进行EiCsm6增强的LwaCas13a检测的侧流读出的示意图。L)不通过RPA预扩增,结合LwaCas13a对合成DENV RNA进行的EiCsm6增强的侧流检测。带强度定量结果显示在右侧。
图97-A)使用侧流实施方案对各种浓度的ssRNA 1的检测。B)对来自(A)中的检测的带强度的定量。
图98.对来自唾液的基因组DNA的一锅式侧流基因分型。A)从患者唾液中快速提取和一锅式检测基因组DNA的示意图。B).与水输入相比,对粗基因组DNA提取物中的rs601338基因型的检测。C).对粗基因组DNA提取物中的rs601338基因型的侧流检测。D).对来自(C)中的检测的带强度的定量。E)25分钟内对粗唾液中的患者DNA的检测。
图99-对合成cfDNA样品的SHERLOCK侧流检测。A)使用LwaCas13a,对具有WT基因型的外显子19缺失的合成DNA样品中的EGFT外显子19缺失突变的检测。B)使用LwaCas13a,对具有外显子19缺失或WT基因型的合成DNA样品中的EGFR外显子19缺失突变的侧流检测。C)对来自(B)中的检测的带强度的定量。D)使用LwaCas13a,对具有外显子19缺失或WT基因型的4患者cfDNA样品中的EGFR外显子19缺失突变的检测。E)使用LwaCas13,对具有T790M或WT基因型的合成DNA样品中的EGFR T790M缺失突变的检测。K)使用LwaCas13a,对具有T790M或WT基因型的患者cfDNA样品中的EGFR T790M缺失突变的检测(*,p<0.05;n.s,不显著;条形表示±s.e.m.)。在这种情况下,经靶向测序验证,患者4的T790M等位基因分数为0.6%。由于灵敏度和测定特异性,申请人仍然能够看到该低等位基因分数的显著检测结果,这与先前的结果一致,表明检测到大于0.1%的等位基因分数样品(3)。此外,由于RPA中的Bsu聚合酶每循环每掺入的碱基的最小错误率为10-5个错误(25),因此预期约0.02%的扩增子在要感测的突变处含有错误。因为伪信号只会在野生型扩增子上形成正确突变的时候被检测到,因此只有0.0067%的扩增子会具有突变,导致对该突变的伪检测结果。由于大多数患者不具有低于0.01%的cfDNA突变等位基因分数,因此该错误率是可接受的。
图100-使用不同报告子组合的Csm6增强的侧流SHERLOCK。A)使用各种报告子设计的Csm6增强的SHERLOCK侧流检测。sA:短polyA感测子;lA:长polyA感测子;sC:短Poly-C感测子;lC:长poly-C感测子;sA/C:短poly-A/C感测子;lA/C:长poly-A/C感测子;M:混合的RNA酶alert样感测子。B)对来自(A)中的检测的带强度的定量。C)用单独的RPA和IVT步骤对酰基转移酶ssDNA进行EiCsm6增强的LwaCas13a SHERLOCK检测的侧流读出的示意图。D)结合LwasCas13a对铜绿假单胞菌酰基转移酶基因进行的EiCsm6增强的侧流SHERLOCK。带强度定量显示在右侧。
图101-crRNA间隔区长度对Casd13直系同源物切割的影响。A)具有不同间隔区长度的靶向ssRNA1的crRNA对PsmCas13b的切割活性。B)具有不同间隔区长度的靶向ssRNA1的crRNA对CcaCas13b的切割活性。
图102-Cas13家族与二核苷酸切割偏好的关系。A)基于几个Cas13a和Cas13b直系同源物成员的多重蛋白质序列比对的蛋白质序列相似性矩阵。基于欧几里德距离显示聚类。B)基于几个Cas13a和Cas13b正向重复序列的多重序列比对的正向重复序列相似性矩阵。基于欧几里德距离显示聚类。C)对二核苷酸基序报告子的Cas13切割活性碱基偏好的聚类。
图103A和图103B-示出使用针对登革热的Cas13b10探针和针对ssRNA1的LwaCas13a探针进行登革热RNA和ssRNA1的侧流测定的结果。
具体实施方式
一般定义
除非另有规定,否则本文所用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。在分子生物学中常用的术语和技术的定义可以在以下文献中找到:Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook、Fritsch和Maniatis);Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等编辑);the seriesMethods in Enzymology
(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson、B.D.Hames和G.R.Taylor编辑):Antibodies,A Laboratory Manual(1988)(Harlow和Lane编辑):Antibodies A Laboratory Manual,第2版2013(E.A.Greenfield编辑);Animal Cell Culture(1987)(R.I.Freshney编辑);BenjaminLewin,Genes IX,Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等(编辑),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994(ISBN0632021829);Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,VCH Publishers,Inc.出版,1995(ISBN9780471185710);Singleton等,Dictionary of Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),三月,Advanced Organic ChemistryReactions,Mechanisms and Structure第4版,John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker和Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
除非上下文另有明确指示,否则如本文所用的单数形式“一个”、“一种”和“所述”包括单数和复数指示物。
术语“任选的”或“任选地”意指后续描述的事件、情形或替代物可能发生或可能不发生,并且描述包括事件或情形发生的情况和不发生的情况。
由端点对数值范围的叙述包括归入相应范围内的所有数值和分数,以及所叙述的端点。
如本文所用的术语“约”或“近似”当涉及例如参数、量、时距等可测量的值时,有意涵盖指定值的变化和从指定值的变化,例如指定值和从指定值+/-10%或更小、+/-5%或更小、+/-1%或更小和+/-0.1%或更小的变化,只要此类变化适于在所公开的发明中执行即可。应了解,修饰语“约”或“近似”所涉及的值本身也特定地并优选地公开。
在本说明书通篇提及“一个实施方案”、“实施方案”、“示例性实施方案”意指结合实施方案描述的特定特征、结构或特性包括于本发明的至少一个实施方案中。因此,在本说明书通篇各处出现短语“在一个实施方案中”、“在实施方案中”或“示例性实施方案”不一定全部涉及同一实施方案,但可能如此。此外,如本领域技术人员从本公开将显而易见,在一个或多个实施方案中,特定特征、结构或特性可以按任何适合的方式组合。此外,虽然本文所描述的一些实施方案包括其他实施方案中所包括的一些特征而非其他特征,但不同实施方案的特征的组合有意处于本发明的范围内。举例来说,在随附权利要求书中,所要求的实施方案中的任一个可以按任何组合形式使用。
现在将“C2c2”称为“Cas13a”,除非另有说明,否则这些术语在本文中可互换使用。
本文所引用的所有公布、公布的专利文献、和专利申请特此以引用的方式并入,引用程度如同每个个别公布、公布的专利文献、或专利申请特定地并个别地指示以引用的方式并入一样。
综述
本文所公开的实施方案利用RNA或DNA靶向效应物以提供具有渺摩尔灵敏度的稳固的基于CRISPR的诊断。本文所公开的实施方案可以在可比水平的灵敏度下检测肉汤DNA和RNA并且可以基于单碱基对差异区别标靶与非标靶。此外,本文所公开的实施方案可以按冷冻干燥格式制备用于便利的分配和定点护理(POC)应用。此类实施方案适用于人健康的多种情形,包括例如病毒检测、菌株分型、灵敏基因分型和疾病相关的无细胞DNA的检测。在某些实施方案中,本发明用于使用对病原体(例如空肠弯曲杆菌(Campylobacter jejuni)、产气荚膜梭菌(Clostridium perfringens)、沙门氏菌属种(Salmonella spp.)、大肠杆菌、蜡样芽孢杆菌(Bacillus cereus)、单核细胞增多性李斯特菌(Listeria monocytogenes)、志贺氏菌属种(Shigella spp.)、金黄色葡萄球菌、葡萄球菌性肠炎(Staphylococcalenteritis)、链球菌属、霍乱弧菌(Vibrio cholerae)、副溶血弧菌(Vibrioparahaemolyticus)、创伤弧菌(Vibrio vulnificus)、小肠结肠炎耶尔森菌(Yersiniaenterocolitica)和假结核耶尔森菌(Yersinia pseudotuberculosis)、布鲁氏菌属种(Brucella spp.)、溃疡棒杆菌(Corynebacterium ulcerans)、贝氏柯克斯体(Coxiellaburnetii)或类志贺邻单胞菌(Plesiomonas shigelloides))具有特异性的向导RNA进行食源性病原体的快速检测。
在一个方面,本文所公开的实施方案涉及一种核酸检测系统,所述核酸检测系统包括CRISPR系统、一种或多种被设计成结合至相应靶分子的向导RNA、报告构建体,以及任选的用以扩增样品中的靶核酸分子的扩增试剂。报告构建体是包含可被活化的CRISPR效应蛋白切割的寡核苷酸组分(DNA或RNA)的分子。寡核苷酸组分的组成可以是通用的,即与靶分子不同。报告构建体被配置成使得当处于未切割配置时阻止或掩蔽可检测阳性信号的产生,但当处于切割配置时允许或促进阳性可检测信号的产生。在本发明的情形中,报告了包含通过RNA或DNA核酸接头连接的第一分子和第二分子的构建体。RNA或DNA接头的使用将取决于所使用的一种或多种CRISPR效应蛋白是否具有RNA或DNA附带活性。第一分子和第二分子通常是结合对的一部分,其中另一结合伴侣被附连至侧流衬底,如下面进一步详细描述的。所述系统还包含特异性地结合第二分子的检测剂,并且还包含可检测标记。
为了便于参考,在本文中可将这些系统称为SHERLOCK系统,并且将它们促进的反应称为SHERLOCK反应。如果样品中存在靶分子,则相应的向导分子将通过与靶分子杂交将CRSIPR Cas/向导复合物导向靶分子,从而触发CRISPR效应蛋白的核酸酶活性。此活化的CRISPR效应蛋白将切割靶分子,然后非特异性地切割RNA构建体的接头部分。
本文所公开的实施方案针对包括SHERLOCK系统的侧流检测装置。所述装置可包括用于检测SHERLOCK反应的侧流衬底。适用于侧流测定的衬底在本领域中是已知的。这些衬底可包括但不限于由纤维素制成的膜或垫,和/或玻璃纤维、聚酯、硝酸纤维素或吸收垫(JSaudi Chem Soc 19(6):689-705;2015)。将SHERLOCK系统,即一种或多种CRISPR系统和相应的报告构建体在侧流衬底的限定试剂部分处,通常在侧流衬底的一端处添加至侧流衬底。在本发明的情形中使用的报告构建体包含通过RNA或DNA接头连接的第一分子和第二分子。侧流衬底还包括样品部分。样品部分可与试剂部分等效、连续或邻接。侧流条带还包括第一捕获线,通常是横穿所述装置的水平线,但是其他配置也是可能的。第一捕获区域与样品加载部分相邻并且处于侧流衬底的同一端上。特异性地结合报告构建体的第一分子的第一结合剂是固定的或以其他方式固定化至第一捕获区域。第二捕获区域位于侧流衬底的与第一结合区域相反的一端。第二结合剂是固定的或以其他方式固定化在第二捕获区域。第二结合剂特异性地结合报告构建体的第二分子,或者第二结合剂可结合可检测配体。举例来说,可检测配体可以是当聚集时可通过目视检测到的颗粒,如胶体颗粒。可用特异性地结合报告构建体上的第二分子的抗体修饰所述颗粒。如果报告构建体未被切割,它将促进可检测配体在第一结合区域的积累。如果报告构建体被切割,则可检测配体被释放以流向第二结合区域。在这种实施方案中,第二结合剂是能够特异性或非特异性地结合可检测配体上的抗体上的可检测配体的剂。用于这种实施方案的合适的结合剂的实例包括但不限于蛋白A和蛋白G。
侧支撑衬底可位于壳体内(参见例如“Rapid Lateral Flow Test Strips”MerckMillipore 2013)。所述壳体可包括至少一个用于加载样品的开口和允许读取在第一捕获区域和第二捕获区域产生的可检测信号的第二单一开口或单独开口。
SHERLOCK系统可被冷冻干燥至侧流衬底并包装为即用型装置,或者也可在使用该装置时将SHERLOCK系统添加至侧流衬底的试剂部分。将要筛选的样品加载到侧流衬底的样品加载部分。样品必须是液体样品或溶于适当溶剂(通常是水溶液)中的样品。液体样品会重构SHERLOCK试剂,从而可以发生SHERLOCK反应。液体样品开始从衬底的样品部分流向第一捕获区域和第二捕获区域。完整的报告构建体通过第一结合剂和第一分子之间的结合而在第一捕获区域被结合。同样,检测剂将通过与完整报告构建体上的第二分子结合而开始收集在第一结合区域。如果样品中存在一种或多种靶分子,则活化CRISPR效应蛋白附带效应。当活化的CRISPR效应蛋白与结合的报告构建体接触时,报告构建体被切割,释放第二分子,以进一步沿侧流衬底向下流向第二结合区域。然后,释放的第二分子通过与第二结合剂结合而被捕获在第二捕获区域,其中另外的检测剂也可通过与第二分子结合而积累。因此,如果样品中不存在一种或多种靶分子,则可检测信号将在第一捕获区域出现;而如果样品中存在一种或多种靶分子,则可检测信号将在第二捕获区域的位置中出现。
特异性结合整合分子包括可在本发明中使用的结合对的任何成员。此类结合对是本领域技术人员已知的,并且包括但不限于抗体-抗原对、酶-底物对、受体-配体对和链霉亲和素-生物素。除此类已知的结合对之外,还可特别设计新颖的结合对。结合对的特征是结合对的两个成员之间的结合。
如果CRISPR效应蛋白具有DNA附带活性(Cpf1和C2c1),则在任一末端具有分子的寡核苷酸接头可包含DNA,或者如果CRISPR效应蛋白具有RNA附带活性,则在任一末端具有分子的寡核苷酸接头可包含RNA。寡核苷酸接头可以是单链或双链,而在某些实施方案中,它们可能包含RNA和DNA区域两者。寡核苷酸接头可具有不同的长度,如5-10个核苷酸、10-20个核苷酸、20-50个核苷酸或更多。
在一些实施方案中,多肽标识符元件包括亲和标签,如血球凝素(HA)标签、Myc标签、FLAG标签、V5标签、甲壳质结合蛋白(CBP)标签、麦芽糖结合蛋白(MBP)标签、GST标签、poly-His标签和荧光蛋白(例如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、dsRed、mCherry、Kaede、Kindling以及它们的衍生物、FLAG标签、Myc标签、AU1标签、T7标签、OLLAS标签、Glu-Glu标签、VSV标签或它们的组合。其他亲和标签在本领域中是众所周知的。可使用本领域已知的方法(例如,通过使用识别特定亲和标签的特异性结合剂,如抗体)来检测和/或分离此类标记。此类特异性结合剂(例如抗体)可还含有例如可检测标记,如同位素标记和/或核酸条形码,例如本文所描述的那些。
举例来说,侧流条带允许由颜色进行RNA酶(例如Cas13a)检测。修饰RNA报告子以具有附接至5'端的第一分子(例如FITC)和附接至3'端的第二分子(例如生物素)(或反之亦然)。侧流条带被设计成具有两个捕获线路,其中抗第一分子(例如抗FITC)抗体在第一线路杂交并且抗第二分子(例如抗生物素)抗体在第二下游线路。随着SHERLOCK反应物从条带流下,未裂解的报告子将在第一捕获线路结合至抗第一分子抗体,而裂解的报告子将在第二捕获线路释放第二分子并允许第二分子结合。第二分子夹心抗体,例如缀合至纳米颗粒,例如金纳米颗粒,将在第一线路或第二线路结合任何第二分子并且产生强读出/信号(例如颜色)。随着更多报告子裂解,更多信号将在第二捕获线路积累并且更少信号将在第一线路出现。在某些方面,本发明涉及使用如本文所描述的跟踪条带用于检测核酸或多肽。在某些方面,本发明涉及一种使用如本文所定义的流动条带检测核酸或多肽的方法,例如(侧)流测试或(侧)流免疫色谱测定。
在某些示例性实施方案中,侧流装置包括侧流衬底,所述侧流衬底包括用于施加样品的第一端。第一区域加载有可检测配体,如本文所公开的那些,例如金纳米颗粒。金纳米颗粒可用第一抗体如抗FITC抗体修饰。第一区域还包括检测构建体。在一个示例性实施方案中,本文公开了一种RNA检测构建体和一种CRISPR效应系统(CRISPR效应蛋白和一个或多个被配置成结合至一种或多种靶序列的向导序列)。在一个示例性实施方案中,并且出于进一步说明的目的,所述RNA构建体可在检测构建体的第一端上包含FAM分子,并且在检测构建体的第二端上包含生物素。从侧流衬底的第一端开始的溶液流的上游是第一测试带。测试带可包含生物素配体。因此,当RNA检测构建体以其初始状态存在时,即在没有标靶的情况下,第一端上的FAM分子将结合金纳米颗粒上的抗FITC抗体,而RNA检测构建体的第二端上的生物素将结合生物素配体,允许可检测配体在第一次测试时积累,由此产生可检测信号。在第一带处产生可检测信号表明靶配体不存在。在存在标靶的情况下,CRISPR效应复合物形成,并且CRISPR效应蛋白被活化,导致RND检测构建体的裂解。在没有完整的RNA检测构建体的情况下,胶体金将流过第二条带。侧流装置可包括在第一带的上游的第二带。第二条带可包含能够结合抗体标记的胶体金分子的分子,例如能够结合胶体金上的兔抗FTIC抗体的抗兔抗体。因此,在存在一种或多种标靶的情况下,可检测配体将在第二带上积累,表明样品中存在一种或多种标靶。
微生物成簇的规律间隔的短回文重复(Microbial Clustered RegularlyInterspaced Short Palindromic Repeats,CRISPR)和CRISPR相关(CRISPR-Cas)适应性免疫系统含有可编程的核酸内切酶,例如Cas9和Cpf1(Shmakov等,2017;Zetsche等,2015)。尽管Cas9与Cpf1均靶向DNA,但单效应物RNA导向的RNA酶最近已经被发现(Shmakov等,2015)和表征(Abudayyeh等,2016;Smargon等,2017),包括C2c2,这提供了用于特异性RNA传感的平台。可以使用CRISPR RNA(crRNA)容易地并且便利地对RNA导向的RNA酶进行重新编程以使靶RNA裂解。不同于仅使DNA标靶裂解的DNA核酸内切酶Cas9和Cpf1,RNA导向的RNA酶,如C2c2,在使其RNA标靶裂解后保持活性,引起附近的非靶向RNA的“附带”裂解(Abudayyeh等,2016)。这种crRNA编程的附带RNA裂解活性使得有机会使用RNA导向的RNA酶通过触发可以充当读出的体内程序性细胞死亡或体外非特异性RNA降解来检测特异性RNA的存在(Abudayyeh等,2016;East-Seletsky等,2016)。另外已经在其他CRISPR Cas酶中识别到附带活性[为我提供Cpf1和C2c1附带活性的引用的线索标志]。
CRISPR效应蛋白
一般来说,如本文中和例如WO 2014/093622(PCT/US2013/074667)的文献中所用的CRISPR-Cas或CRISPR系统共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源CRISPR系统的情形中涵盖“正向重复”和tracrRNA加工的部分正向重复)、向导序列(在内源CRISPR系统的情形中也称作“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas,例如Cas9的一种或多种RNA,例如CRISPR RNA和反式活化(tracr)RNA或单向导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来说,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源CRISPR系统的情形中也称作原间隔区)。当CRISPR蛋白质是C2c2蛋白质时,不需要tracrRNA。C2c2已描述于Abudayyeh等(2016)“C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector”;Science;DOI:10.1126/science.aaf5573;和Shmakov等(2015)“Discovery andFunctional Characterization of Diverse Class 2CRISPR-Cas Systems”,MolecularCell,DOI:dx.doi.org/10.1016/j.molcel.2015.10.008;所述文献以引用方式整体并入本文。Cas13b已描述于Smargon等(2017)“Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNases Differentially Regulated by Accessory Proteins Csx27 andCsx28,”Molecular Cell.65,1-13;dx.doi.org/10.1016/j.molcel.2016.12.023.,所述文献以全文引用的方式并入本文中。
在某些实施方案中,原间隔区邻近基序(PAM)或PAM样基序引导如本文所公开的效应蛋白复合物结合至所关注的靶基因座。在一些实施方案中,PAM可以是5'PAM(即,位于原间隔区的5'端上游)。在其他实施方案中,PAM可以是3'PAM(即,位于原间隔区的5'端下游)。术语“PAM”可以与术语“PFS”或“原间隔区侧接位点”或“原间隔区侧接序列”互换使用。
在优选实施方案中,CRISPR效应蛋白可以识别3'PAM。在某些实施方案中,CRISPR效应蛋白可识别作为5'H的3'PAM,其中H是A、C或U。在某些实施方案中,效应蛋白可以是沙氏纤毛菌C2c2p,更优选地是沙氏纤毛菌DSM 19757C2c2,并且3’PAM为5’H。
在形成CRISPR复合物的情形中,“靶序列”是指向导序列被设计成与其具有互补性的序列,其中靶序列与向导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。术语“靶RNA”是指作为靶序列或包含靶序列的RNA多核苷酸。换句话说,靶RNA可以是gRNA的一部分,即,向导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的RNA多核苷酸或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。
编码CRISPR效应蛋白,尤其C2c2的核酸分子有利地是密码子优化的CRISPR效应蛋白。在这种情况下,密码子优化的序列的一个实例是对于在真核生物中表达而优化的序列,例如人(即,对于在人中表达而优化),或对于如本文所论述的另一种真核生物、动物或哺乳动物;参见例如WO2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化的序列。虽然这是优选的,但将了解,其他实例可能存在,并且对于除人以外的宿主物种的密码子优化或对于特定器官的密码子优化是已知的。在一些实施方案中,编码CRISPR效应蛋白的酶编码序列对于在特定细胞,例如真核细胞中表达进行密码子优化。真核细胞可以是特定生物体的那些或来源于特定生物体,例如植物或哺乳动物,包括但不限于人,或如本文所论述的非人真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、犬、家畜或非人哺乳动物或灵长类动物。在一些实施方案中,可以排除有可能不会对人或动物带来任何实质性医学效益的修改人的种系遗传身份的过程和/或修改动物的遗传身份的过程,以及由此类过程产生的动物。一般来说,密码子优化是指修饰核酸序列用于增强在所关注的宿主细胞中的表达的过程,这个过程是通过用在宿主细胞的基因中较频繁或最频繁使用的密码子置换原生序列的至少一个密码子(例如约或大于约1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时维持原生氨基酸序列。各个物种对特定氨基酸的某些密码子展现特定偏性。密码子偏性(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关,据信所述效率继而尤其取决于所翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。细胞中所选tRNA的主导性一般反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来调整基因用于给定的生物体中最佳基因表达。密码子使用表可容易得到,例如,在kazusa.orjp/codon/上可得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按许多方式进行改编。参见Nakamura,Y.,等“Codon usage tabulated from theinternational DNA sequence databases:status for the year 2000”Nucl.AcidsRes.28:292(2000)。对于在特定宿主细胞中表达对特定序列进行密码子优化的计算机算法也可得到,例如Gene Forge(Aptagen;Jacobus,PA)也可得到。在一些实施方案中,编码Cas的序列中的一个或多个密码子(例如1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在某些实施方案中,如本文所描述的方法可以包括提供Cas转基因细胞,尤其C2c2转基因细胞,其中提供或引入编码一种或多种向导RNA的一种或多种核酸,其在细胞中与包含所关注的一种或多种基因的启动子的调控元件可操作地连接。如本文所用的术语“Cas转基因细胞”是指细胞,例如真核细胞,其中Cas基因已经在基因组上整合。细胞的性质、类型或来源根据本发明并无特别限制。而且,Cas转基因引入细胞中的方式可以有变化并且可以是如本领域中已知的任何方法。在某些实施方案中,通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。在某些其他实施方案中,通过从Cas转基因生物体中分离细胞来获得Cas转基因细胞。通过实例并且不受限制,如本文所提及的Cas转基因细胞可以来源于Cas转基因真核生物,例如Cas敲入真核生物。参考WO 2014/093622(PCT/US13/74667),以引用的方式并入本文中。可以修改针对靶向Rosa基因座的转让给Sangamo BioSciences,Inc.的美国专利公布号20120017290和20110265198的方法以利用本发明的CRISPR Cas系统。还可以修改针对靶向Rosa基因座的转让给Cellectis的美国专利公布号20130236946的方法以利用本发明的CRISPR Cas系统。通过另一个实例,参考Platt等(Cell;159(2):440-455(2014)),其描述了Cas9敲入小鼠,以引用的方式并入本文中。Cas转基因还可以包含Lox-Stop-polyA-Lox(LSL)盒,从而促成由Cre重组酶可诱导的Cas表达。或者,可以通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。用于转基因的递送系统在本领域中是众所周知的。通过实例,可以借助于如本文别处也描述的载体(例如AAV、腺病毒、慢病毒)和/或颗粒和/或纳米颗粒递送将Cas转基因递送于例如真核细胞中。
技术人员将了解,如本文所提及的细胞,例如Cas转基因细胞除了具有整合的Cas基因或当与能够将Cas导向靶基因座的RNA复合时由Cas的序列特异性作用产生的突变以外还可以包含基因组改变。
在某些方面,本发明涉及例如用于将Cas和/或能够将Cas导向靶基因座的RNA(即,向导RNA)递送至或引入细胞中以及用于繁殖这些组分(例如在原核细胞中)的载体。如本文所用的“载体”是允许或有助于实体从一种环境转移至另一种环境的工具。载体是复制子,例如质粒、噬菌体或粘粒,其中可以插入另一个DNA区段以达成所插入的区段的复制。一般来说,载体当与适当控制元件相关联时能够复制。一般来说,术语“载体”是指核酸分子,其能够转运已经与其连接的另一个核酸。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域中已知的多核苷酸的其他种类。一种类型的载体是“质粒”,其是指环状双链DNA环,其中可以插入额外DNA区段,例如通过标准分子克隆技术。另一种类型的载体是病毒载体,其中载体中存在源自病毒的DNA或RNA序列用于包封至病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))中。病毒载体还包括由病毒携带的多核苷酸用于转染至宿主细胞中。某些载体能够在其所引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体,和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入宿主细胞中之后整合至宿主细胞的基因组中,并且从而连同宿主基因组一起复制。此外,某些载体能够引导其操作性连接的基因的表达。此类载体在本文中称作“表达载体”。在重组DNA技术中有效用的常用表达载体常常呈质粒的形式。
重组表达载体可以包含本发明的核酸,其呈适合于在宿主细胞中表达核酸的形式,这意指重组表达载体包括一个或多个调控元件,其可以在有待用于表达的宿主细胞的基础上选择,操作性地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”意图指所关注的核苷酸序列以允许核苷酸序列表达(例如在体外转录/翻译系统中或当将载体引入宿主细胞中时在宿主细胞中)的方式连接至一个或多个调控元件。关于重组和克隆方法,提及2004年9月2日以US 2004-0171156 A1公布的美国专利申请10/815,730,其内容以全文引用的方式并入本文中。因此,本文所公开的实施方案还可以包括包含CRISPR效应系统的转基因细胞。在某些示例性实施方案中,转基因细胞可以充当个别离散容积。换句话说,可以将包含掩蔽构建体的样品递送至细胞中,例如在适合的递送囊泡中,并且如果递送囊泡中存在标靶,那么活化CRISPR效应物并且产生可检测信号。
一个或多个载体可以包括一个或多个调控元件,例如一个或多个启动子。一个或多个载体可以包含Cas编码序列和/或单个,但可能还可以包含至少3个或8个或16个或32个或48个或50个向导RNA(例如sgRNA)编码序列,例如1-2个、1-3个、1-4个、1-5个、3-6个、3-7个、3-8个、3-9个、3-10个、3-8个、3-16个、3-30个、3-32个、3-48个、3-50个RNA(例如sgRNA)。在单个载体中,可以存在每个RNA(例如sgRNA)的启动子,有利地当存在至多约16个RNA时;并且当单个载体提供多于16个RNA时,一个或多个启动子可以驱动多于一个RNA的表达,例如当存在32个RNA时,每个启动子可以驱动两个RNA的表达,并且当存在48个RNA时,每个启动子可以驱动三个RNA的表达。通过简单的算术和完善的克隆方案和本公开中的教义,本领域技术人员可以关于适合的例示性载体(例如AAV)的一个或多个RNA和例如U6启动子的适合启动子来容易地实施本发明。举例来说,AAV的包封限度为约4.7kb。单个U6-gRNA(加上用于克隆的限制性位点)的长度为361bp。因此,技术人员可以容易地将约12-16个,例如13个U6-gRNA盒装配至单个载体中。这可以通过任何适合的方式组装,例如用于TALE组装的金门策略(genome-engineering.org/taleffectors/)。技术人员还可以使用串联向导策略以使U6-gRNA的数目增加约1.5倍,例如,从12-16个,例如13个增加至约18-24个,例如约19个U6-gRNA。因此,本领域技术人员可以在单个载体,例如AAV载体中容易地达到约18-24个,例如约19个启动子-RNA,例如U6-gRNA。用于增加载体中启动子和RNA的数目的进一步方式是使用单个启动子(例如U6)以表达由可裂解序列分离的RNA阵列。并且,用于增加载体中启动子-RNA的数目的更进一步方式是在编码序列或基因的内含子中表达由可裂解序列分离的启动子-RNA阵列;并且在这种情况下,有利的是使用聚合酶II启动子,其可以具有增加的表达并且能够以组织特异性方式转录长RNA(参见例如nar.oxfordjournals.org/content/34/7/e53.short and nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在有利的实施方案中,AAV可以包封靶向至多约50个基因的U6串联gRNA。因此,从本领域中的知识和本公开中的教义,技术人员可以容易地制造和使用一个或多个载体,例如单个载体,其在控制下表达多个RNA或向导或者操作性地或功能性地连接至一个或多个启动子-尤其关于本文所论述的RNA或向导的数目,而不存在任何不当实验。
向导RNA编码序列和/或Cas编码序列可以功能性地或操作性地连接至一个或多个调控元件,并且因此一个或多个调控元件驱动表达。一个或多个启动子可以是一个或多个组成性启动子和/或一个或多个条件性启动子和/或一个或多个诱导性启动子和/或一个或多个组织特异性启动子。启动子可以选自由以下组成的组:RNA聚合酶、pol I、pol II、polIII、T7、U6、H1、逆转录病毒劳斯肉瘤病毒(Rous sarcoma virus)(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子U6。
在一些实施方案中,核酸靶向系统的一个或多个元件来源于包含内源CRISPR RNA靶向系统的特定生物体。在某些示例性实施方案中,效应蛋白CRISPR RNA靶向系统包含至少一个HEPN结构域,包括但不限于本文所描述的HEPN结构域、本领域中已知的HEPN结构域,和通过与共有序列基序相比而被识别为HEPN结构域的结构域。本文中提供若干此类结构域。在一个非限制性实例中,共有序列可以来源于本文所提供的C2c2或Cas13b直系同源物的序列。在某些示例性实施方案中,效应蛋白包含单个HEPN结构域。在某些其他示例性实施方案中,效应蛋白包含两个HEPN结构域。
在一个示例性实施方案中,效应蛋白包含一个或多个包含RxxxxH基序序列的HEPN结构域。RxxxxH基序序列可以但不限于来自本文所描述的HEPN结构域或本领域中已知的HEPN结构域。RxxxxH基序序列还包括通过组合两个或更多个HEPN结构域的部分而建立的基序序列。正如所指出,共有序列可以来源于以下文献中所公开的直系同源物的序列:题为"Novel CRISPR Enzymes and Systems"的美国临时专利申请62/432,240,2017年3月15日提交的题为"Novel Type VI CRISPR Orthologs and Systems"的美国临时专利申请62/471,710,和以代理人案号47627-05-2133标注并且2017年4月12日提交的题为"Novel Type VICRISPR Orthologs and Systems"的美国临时专利申请。
在本发明的实施方案中,HEPN结构域包含至少一个包含序列R{N/H/K}X1X2X3H(SEQ ID NO:351)的RxxxxH基序。在本发明的实施方案中,HEPN结构域包括包含序列R{N/H}X1X2X3H(SEQ ID NO:352)的RxxxxH基序。在本发明的实施方案中,HEPN结构域包含序列R{N/K}X1X2X3H(SEQ ID NO:353)。在某些实施方案中,X1是R、S、D、E、Q、N、G、Y或H。在某些实施方案中,X2是I、S、T、V或L,在某些实施方案中,X3是L、F、N、Y、V、I、S、D、E或A。
根据本发明使用的额外效应物可以通过其与cas1基因的接近性来鉴别,例如但不限于在距cas1基因的始端20kb和距cas1基因的末端20kb的区域内。在某些实施方案中,效应蛋白包含至少一个HEPN结构域和至少500个氨基酸,并且其中C2c2效应蛋白天然存在于Cas基因或CRISPR阵列上游或下游20kb内的原核基因组中。Cas蛋白质的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰型式。在某些示例性实施方案中,C2c2效应蛋白天然存在于Cas 1基因上游或下游20kb内的原核基因组中。术语“直系同源物(orthologue)”(本文中也称作“直系同源物(ortholog)”)和“同源物(homologue)”(本文中也称作“同源物(homolog)”)在本领域中是众所周知的。通过进一步指导,如本文所用的蛋白质的“同源物”是与作为其同源物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以但不需要结构上相关,或仅部分结构上相关。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。
在特定实施方案中,VI型RNA靶向Cas酶是C2c2。在其他示例性实施方案中,VI型RNA靶向Cas酶是Cas 13b。在特定实施方案中,如本文所提及的VI型蛋白质,例如C2c2的同源物或直系同源物与VI型蛋白质,例如C2c2(例如基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(Listeria newyorkensis)(FSLM6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同源性或同一性。在其他实施方案中,如本文所提及的VI型蛋白质,例如C2c2的同源物或直系同源物与野生型C2c2(例如基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020C2c2、毛螺菌科细菌NK4A179C2c2、嗜氨梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(FSLM6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同一性。
在某些其他示例性实施方案中,CRISPR系统效应蛋白是C2c2核酸酶。C2c2的活性可以取决于两个HEPN结构域的存在。这些已经显示为RNA酶结构域,即,切割RNA的核酸酶(尤其核酸内切酶)。C2c2 HEPN还可以靶向DNA,或潜在地DNA和/或RNA。在C2c2的HEPN结构域至少能够结合至RNA并且以其野生型形式切割RNA的基础上,则优选的是C2c2效应蛋白具有RNA酶功能。关于C2c2 CRISPR系统,参考2016年6月17日提交的美国临时案62/351,662和2016年8月17日提交的美国临时案62/376,377。还参考2016年6约17日提交的美国临时案62/351,803。还参考2016年12月8日提交的题为"Novel Crispr Enzymes and Systems"的美国临时案,带有博德研究所(Broad Institute)编号10035.PA4和代理人案号47627.03.2133。进一步参考East-Seletsky等“Two distinct RNase activities ofCRISPR-C2c2 enable guide-RNA processing and RNA detection”Nature doi:10/1038/nature19802和Abudayyeh等“C2c2 is a single-component programmable RNA-guidedRNA targeting CRISPR effector”bioRxiv doi:10.1101/054742。
CRISPR系统中的RNA酶功能是已知的,例如,对于某些III型CRISPR-Cas系统已经报道mRNA靶向(Hale等,2014,Genes Dev,第28卷,2432-2443;Hale等,2009,Cell,第139卷,945-956;Peng等,2015,Nucleic acids research,第43卷,406-417)并且提供显著优点。在表皮葡萄球菌(Staphylococcus epidermis)III-A型系统中,跨标靶的转录使得靶DNA和其转录物裂解,这是由Cas10-Csm核糖核蛋白效应蛋白复合物内的独立活性位点介导(参见Samai等,2015,Cell,第151卷,1164-1174)。由此提供CRISPR-Cas系统、组合物或经由本发明效应蛋白靶向RNA的方法。
在实施方案中,Cas蛋白质可以是以下属类的生物体的C2c2直系同源物:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。此种属类的生物体的种类可以如本文其他方面所论述。
鉴别CRISPR-Cas系统酶的直系同源物的一些方法可以涉及鉴别所关注的基因组中的tracr序列。tracr序列的鉴别可以涉及以下步骤:tracr序列的鉴别可以涉及以下步骤:在数据库中搜索正向重复或tracr配对序列以鉴别包含CRISPR酶的CRISPR区。在正义与反义方向上侧接CRISPR酶的CRISPR区中搜索同源序列。寻找转录终止子和二级结构。鉴别不是正向重复或tracr配对序列,但与正向重复或tracr配对序列具有大于50%同一性的任何序列作为潜在tracr序列。获取潜在tracr序列并且分析与其相关联的转录终止子序列。
将了解,本文所描述的任何功能性可以工程改造至来自其他直系同源物的CRISPR酶中,包括包含来自多种直系同源物的片段的嵌合酶。此类直系同源物的实例在本文别处描述。因此,嵌合酶可以包含以下生物体的CRISPR酶直系同源物的片段:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。嵌合酶可以包含第一片段和第二片段,并且片段可以是本文所提及的属类或本文所提及的种类的生物体的CRISPR酶直系同源物的片段;有利地,片段来自不同种类的CRISPR酶直系同源物。
在实施方案中,如本文所提及的C2c2蛋白质还涵盖C2c2或其同源物或直系同源物的功能变体。如本文所用的蛋白质的“功能变体”是指此种蛋白质的变体,其至少部分保留所述蛋白质的活性。功能变体可以包括突变体(其可以是插入、缺失或置换突变体),包括多形体等。功能变体还包括此种蛋白质与另一种通常无关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然产生的或可以是人造的。有利的实施方案可以涉及工程改造或非天然产生的VI型靶向RNA的效应蛋白。
在实施方案中,编码C2c2或其直系同源物或同源物的一个或多个核酸分子可以对于在真核细胞中表达进行密码子优化。真核生物可以如本文所论述。一个或多个核酸分子可以是工程改造或非天然产生的。
在实施方案中,C2c2或其直系同源物或同源物可以包含一个或多个突变,并且因此编码其的一个或多个核酸分子可以具有一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。关于Cas9酶的催化结构域的实例可以包括但不限于RuvC I、RuvC II、RuvC III和HNH结构域。
在实施方案中,C2c2或其直系同源物或同源物可以包含一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。关于Cas酶的催化结构域的实例可以包括但不限于HEPN结构域。
在实施方案中,C2c2或其直系同源物或同源物可以用作与功能结构域融合或可操作地连接至功能结构域的通用核酸结合蛋白。例示性功能结构域可以包括但不限于翻译引发剂、翻译活化剂、翻译阻遏剂、核酸酶(尤其核糖核酸酶)、剪接体、珠粒、光可诱导/可控制结构域或化学可诱导/可控制结构域。
在某些示例性实施方案中,C2c2效应蛋白可以来自选自由以下组成的组的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。
在某些实施方案中,效应蛋白可以是李斯特菌属种(Listeria sp.)C2c2p,优选斯氏李斯特菌C2c2p,更优选斯氏李斯特菌血清变型1/2b菌株SLCC3954 C2c2p,并且crRNA序列的长度可以是44至47个核苷酸,其具有5'29-nt正向重复(DR)和15-nt至18-nt间隔区。
在某些实施方案中,效应蛋白可以是纤毛菌属种(Leptotrichia sp.)C2c2p,优选沙氏纤毛菌C2c2p,更优选沙氏纤毛菌DSM 19757C2c2p,并且crRNA序列的长度可以是42至58个核苷酸,其具有至少24nt的5'正向重复,例如5'24-28-nt正向重复(DR),和至少14nt的间隔区,例如14-nt至28-nt间隔区,或至少18nt的间隔区,例如19、20、21、22或更多nt,例如18-28、19-28、20-28、21-28或22-28nt。
在某些示例性实施方案中,效应蛋白可以是纤毛菌属,韦德纤毛菌F0279,或李斯特菌属,优选纽约李斯特菌FSL M6-0635。
在某些示例性实施方案中,本发明的C2c2效应蛋白包括但不限于以下21种直系同源物种类(包括多个CRISPR基因座):沙氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属种马赛-P2398;和纤毛菌属种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属种TSL5-1;假丁酸弧菌属种OR37;丁酸弧菌属种YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
在某些实施方案中,根据本发明的C2c2蛋白质是或来源于如下表中所描述的直系同源物中的一种,或是如下表中所描述的直系同源物中的两种或更多种的嵌合蛋白,或是如下表中所描述的直系同源物中的一种的突变体或变体(或嵌合突变体或变体),包括如本文别处所定义的死C2c2、脱落C2c2、去稳定C2c2等,其与或不与异源/功能结构域融合。
在某些示例性实施方案中,C2c2效应蛋白选自下表1。
表1
Figure BDA0002523004990000411
Figure BDA0002523004990000421
Figure BDA0002523004990000431
上述种类的野生型蛋白质序列在下表2中列出。在某些实施方案中,提供了编码C2c2蛋白质的核酸序列。
表2
Figure BDA0002523004990000432
Figure BDA0002523004990000441
Figure BDA0002523004990000451
Figure BDA0002523004990000461
在本发明的实施方案中,提供了效应蛋白,所述效应蛋白包含与以下细菌中的任一种的野生型序列具有至少80%序列同源性的氨基酸序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2。
在本发明的实施方案中,效应蛋白包含与VI型效应蛋白共有序列具有至少80%序列同源性的氨基酸序列,所述共有序列包括但不限于本文所描述的共有序列。
根据本发明,共有序列可以从多种C2c2直系同源物产生,其可以帮助定位保守氨基酸残基和基序,包括但不限于C2c2直系同源物中介导C2c2功能的催化残基和HEPN基序。使用Geneious比对从上文所提及的33种直系同源物产生的一种此类共有序列是:
MKISKVXXXVXKKXXXGKLXKXVNERNRXAKRLSNXLBKYIXXIDKIXKKEXXKKFXAXEEITLKLNQXXXBXLXKAXXDLRKDNXYSXJKKILHNEDINXEEXELLINDXLEKLXKIESXKYSYQKXXXNYXMSVQEHSKKSIXRIXESAKRNKEALDKFLKEYAXLDPRMEXLAKLRKLLELYFYFKNDXIXXEEEXNVXXHKXLKENHPDFVEXXXNKENAELNXYAIEXKKJLKYYFPXKXAKNSNDKIFEKQELKKXWIHQJENAVERILLXXGKVXYKLQXGYLAELWKIRINEIFIKYIXVGKAVAXFALRNXXKBENDILGGKIXKKLNGITSFXYEKIKAEEILQREXAVEVAFAANXLYAXDLXXIRXSILQFFGGASNWDXFLFFHFATSXISDKKWNAELIXXKKJGLVIREKLYSNNVAMFYSKDDLEKLLNXLXXFXLRASQVPSFKKVYVRXBFPQNLLKKFNDEKDDEAYSAXYYLLKEIYYNXFLPYFSANNXFFFXVKNLVLKANKDKFXXAFXDIREMNXGSPIEYLXXTQXNXXNEGRKKEEKEXDFIKFLLQIFXKGFDDYLKNNXXFILKFIPEPTEXIEIXXELQAWYIVGKFLNARKXNLLGXFXSYLKLLDDIELRALRNENIKYQSSNXEKEVLEXCLELIGLLSLDLNDYFBDEXDFAXYJGKXLDFEKKXMKDLAELXPYDQNDGENPIVNRNIXLAKKYGTLNLLEKJXDKVSEKEIKEYYELKKEIEEYXXKGEELHEEWXQXKNRVEXRDILEYXEELXGQIINYNXLXNKVLLYFQLGLHYLLLDILGRLVGYTGIWERDAXLYQIAAMYXNGLPEYIXXKKNDKYKDGQIVGXKINXFKXDKKXLYNAGLELFENXNEHKNIXIRNYIAHFNYLSKAESSLLXYSENLRXLFSYDRKLKNAVXKSLINILLRHGMVLKFKFGTDKKSVXIRSXKKIXHLKSIAKKLYYPEVXVSKEYCKLVKXLLKYK(SEQ ID NO:369)。
在另一个非限制性实例中,用以帮助共有序列产生和保守残基鉴别的序列比对工具是MUSCLE比对工具(www.ebi.ac.uk/Tools/msa/muscle/)。举例来说,使用MUSCLE,可以在韦德纤毛菌C2c2中鉴别在C2c2直系同源物当中保守的以下氨基酸位置:K2;K5;V6;E301;L331;I335;N341;G351;K352;E375;L392;L396;D403;F446;I466;I470;R474(HEPN);H475;H479(HEPN);E508;P556;L561;I595;Y596;F600;Y669;I673;F681;L685;Y761;L676;L779;Y782;L836;D847;Y863;L869;I872;K879;I933;L954;I958;R961;Y965;E970;R971;D972;R1046(HEPN);H1051(HEPN);Y1075;D1076;K1078;K1080;I1083;I1090。
显示高度保守残基的HEPN结构域的例示性序列比对在图50中示出。
在某些示例性实施方案中,靶向RNA的效应蛋白是VI-B型效应蛋白,例如Cas13b和第29组或第30组蛋白质。在某些示例性实施方案中,靶向RNA的效应蛋白包含一个或多个HEPN结构域。在某些示例性实施方案中,靶向RNA的效应蛋白包含C端HEPN结构域、N端HEPN结构域或这两个结构域。关于在本发明的情形中可以使用的示例性VI-B型效应蛋白,参考题为"Novel CRISPR Enzymes and Systems"并且2016年10月21日提交的美国申请号15/331,792,题为"Novel CRISPR Enzymes and Systems"并且2016年10月21日提交的国际专利申请号PCT/US2016/058302,和Smargon等"Cas13b is a Type VI-B CRISPR-associatedRNA-Guided RNase differentially regulated by accessory proteins Csx27 andCsx28"Molecular Cell,65,1-13(2017);dx.doi.org/10.1016/j.molcel.2016.12.023,以及2017年3月15日提交的题为"Novel Cas13b Orthologues CRISPR Enzymes and System"的有待转让的美国临时申请号。在特定实施方案中,Cas13b酶来源于动物溃疡伯格菌(Bergeyella zoohelcum)。在某些其他示例性实施方案中,效应蛋白是或包含与表3中所列序列中的任一个具有至少80%序列同源性的氨基酸序列。
表3
Figure BDA0002523004990000481
Figure BDA0002523004990000491
在某些示例性实施方案中,Cas13b直系同源物的野生型序列可见于以下表4a或表4b。
表4a
Figure BDA0002523004990000492
Figure BDA0002523004990000501
Figure BDA0002523004990000511
Figure BDA0002523004990000521
Figure BDA0002523004990000531
Figure BDA0002523004990000541
表4b
Figure BDA0002523004990000542
Figure BDA0002523004990000551
Figure BDA0002523004990000561
Figure BDA0002523004990000571
在某些示例性实施方案中,靶向RNA的效应蛋白是如2017年6月26日提交的美国临时专利申请号62/525,165和2017年8月16日提交的PCT申请号US 2017/047193中所公开的Cas13c效应蛋白。Cas13c的示例性野生型直系同源物序列在下表5中提供。
表5
Figure BDA0002523004990000572
Figure BDA0002523004990000581
CAS12蛋白
在某些示例性实施方案中,所述测定可包含多个Cas12直系同源物或与一个或多个Cas13直系同源物组合的一个或多个直系同源物。在某些示例性实施方案中,Cas12直系同源物是Cpf1直系同源物。在某些其他示例性实施方案中,Cas12直系同源物是C2c1直系同源物。
Cpf1直系同源物
本发明涵盖来源于被指代为亚型V-A的Cpf1基因座的Cpf1效应蛋白的用途。在本文中,此类效应蛋白也称为“Cpf1p”,例如Cpf1蛋白(并且这种效应蛋白或Cpf1蛋白或来源于Cpf1基因座的蛋白也称为“CRISPR酶”)。目前,亚型V-A基因座包括cas1、cas2(表示为cpf1的独特基因)和CRISPR阵列。Cpf1(CRISPR相关蛋白Cpf1,亚型PREFRAN)是一种大蛋白(约1300个氨基酸),它含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,Cpf1缺少所有Cas9蛋白中都存在的HNH核酸酶结构域,而RuvC样结构域在Cpf1序列中是连续的,相比之下Cas9含有长插入片段,包括HNH结构域。因此,在特定实施方案中,CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
RNA向导的Cpf1的可编程性、特异性和附带活性也使其成为用于核酸非特异性切割的理想可切换核酸酶。在一个实施方案中,将Cpf1系统工程改造以提供并利用RNA的附带非特异性切割。在另一个实施方案中,将Cpf1系统工程改造以提供并利用ssDNA的附带非特异性切割。因此,工程改造的Cpf1系统提供了用于核酸检测和转录组操纵的平台。Cpf1被开发用作哺乳动物转录敲除和结合的工具。当被序列特异性的靶向DNA结合活化时,Cpf1能够对RNA和ssDNA进行稳健的附带切割。
术语“直系同源物(orthologue)”(本文中也称作“直系同源物(ortholog)”)和“同源物(homologue)”(本文中也称作“同源物(homolog)”)在本领域中是众所周知的。通过进一步指导,如本文所用的蛋白质的“同源物”是与作为其同源物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以但不需要结构上相关,或仅部分结构上相关。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。同源物和直系同源物可以通过同源建模(参见例如Greer,Science第228卷(1985)1055和Blundell等Eur J Biochem vol 172(1988),513)或“结构BLAST”(Dey F,CliffZhang Q,Petrey D,Honig B.Toward a"structural BLAST":using structuralrelationships to infer function.Protein Sci.2013Apr;22(4):359-66.doi:10.1002/pro.2225.)来鉴定。另参见Shmakov等(2015)了解在CRISPR-Cas基因座领域中的申请。同源蛋白质可以但不需要结构上相关,或仅部分结构上相关。
Cpf1基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4基因以及CRISPR盒(例如新凶手弗朗西斯菌(Francisella cf.novicida)Fx1的FNFX1_1431-FNFX1_1428)在同一基因座中。因此,此推定的新颖CRISPR-Cas系统的布局似乎与II-B型的布局类似。此外,与Cas9类似,Cpf1蛋白含有与转座子ORF-B同源的易于鉴定的C端区,并且包含活性的RuvC样核酸酶、富含精氨酸的区和Zn指(不存在于Cas9中)。然而,与Cas9不同,Cpf1还存在于没有CRISPR-Cas环境的若干种基因组中,并且其与ORF-B的相对较高相似性表明其可能是转座子组分。表明如果此是真正的CRISPR-Cas系统并且Cpf1是Cas9的功能类似物,则其将是新颖CRISPR-Cas类型,即V型(参见Annotation and Classification ofCRISPR-Cas Systems.Makarova KS,Koonin EV.Methods Mol Biol.2015;1311:47-75)。然而,如本文所述,将Cpf1指代为亚型V-A以将其与C2c1p区分,该C2c1p不具有相同的结构域结构并且因此被指代为亚型V-B。
在特定实施方案中,效应蛋白是来自包括以下的属的生物体的Cpf1效应蛋白:链球菌属(Streptococcus)、弯曲杆菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、细小棒菌属(Parvibaculum)、罗氏菌属(Roseburia)、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、棒状杆菌属(Corynebacter)、肉杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Listeria)、帕鲁迪菌属(Paludibacter)、梭菌属(Clostridium)、毛螺旋菌科(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯菌属、军团菌属(Legionella)、脂环酸芽孢杆菌属(Alicyclobacillus)、甲烷嗜甲基菌属(Methanomethyophilus)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属、拟杆菌门(Bacteroidetes)、创伤球菌属(Helcococcus)、钩端螺旋体属(Letospira)、脱硫弧菌属(Desulfovibrio)、脱硫盐碱杆菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、肿块芽孢杆菌属(Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacilus)、甲基杆菌属(Methylobacterium)或氨基酸球菌属。
在另外的特定实施方案中,Cpf1效应蛋白来自选自以下的生物体:变异链球菌(S.mutans)、无乳链球菌(S.agalactiae)、似马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌;空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌(C.coli);N.salsuginis、N.tergarcus;耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae);单核增生李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii)。
效应蛋白可包含嵌合效应蛋白,所述嵌合效应蛋白包含来自第一效应蛋白(例如Cpf1)直系同源物的第一片段和来自第二效应蛋白(例如Cpf1)直系同源物的第二片段,并且其中第一和第二效应蛋白直系同源物是不同的。第一效应蛋白和第二效应蛋白(例如Cpf1)直系同源物中的至少一者可以包含来自包括以下的生物体的效应蛋白(例如Cpf1):链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、帕鲁迪菌属、梭菌属、毛螺旋菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cpf1:链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、帕鲁迪菌属、梭菌属、毛螺旋菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属,其中第一片段和第二片段并非来自相同细菌;例如,包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cpf1:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌;土拉弗朗西斯菌1、易北普雷沃菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门菌GW2011_GWA2_33_10、帕库氏菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺菌科细菌MA2020、候选白蚁甲烷枝原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌和猕猴卟啉单胞菌,其中第一片段和第二片段并非来自相同细菌。
在更优选的实施方案中,Cpf1p来源于选自以下的细菌种类:土拉弗朗西斯菌1、易北普雷沃菌、毛螺科菌MC2017 1、解蛋白丁酸弧菌、异域菌门菌GW2011_GWA2_33_10、帕库氏菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺科菌MA2020、候选白蚁甲烷枝原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田钩端螺旋体、毛螺科菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌和猕猴卟啉单胞菌。在某些实施方案中,Cpf1p来源于选自氨基酸球菌属种BV3L6、毛螺旋菌科细菌MA2020的细菌种类。在某些实施方案中,效应蛋白来源于土拉弗朗西斯菌(Francisella tularensis)1的亚种,包括但不限于土拉弗朗西斯菌新凶手亚种。
在一些实施方案中,Cpf1p来源于来自真杆菌属的生物体。在一些实施方案中,CRISPR效应蛋白是来源于来自细菌种类直肠真杆菌的生物体的Cpf1蛋白。在一些实施方案中,Cpf1效应蛋白的氨基酸序列对应于NCBI参考序列WP_055225123.1、NCBI参考序列WP_055237260.1、NCBI参考序列WP_055272206.1或GenBank ID OLA16049.1。在一些实施方案中,Cpf1效应蛋白与NCBI参考序列WP_055225123.1、NCBI参考序列WP_055237260.1、NCBI参考序列WP_055272206.1或GenBank ID OLA16049.1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或序列同一性。技术人员将理解,这包括Cpf1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。在一些实施方案中,Cpf1效应蛋白识别TTTN或CTTN的PAM序列。
在特定实施方案中,如本文所提及的Cpf1的同源物或直系同源物与Cpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf1的同源物或直系同源物与野生型Cpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在Cpf1具有一个或多个突变(是突变的)的情况下,如本文所提及的所述Cpf1的同源物或直系同源物与突变的Cpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,Cpf1蛋白可以是包括但不限于以下的属的生物体的直系同源物:氨基酸球菌属种、毛螺菌科细菌或牛眼莫拉氏菌;在特定实施方案中,V型Cas蛋白可以是包括但不限于以下的属的生物体的直系同源物:氨基酸球菌属种BV3L6、毛螺菌科细菌ND2006(LbCpf1)或牛眼莫拉氏菌237。在特定实施方案中,如本文所提及的Cpf1的同源物或直系同源物与本文所公开的Cpf1序列中的一者或多者具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf的同源物或直系同源物与野生型FnCpf1、AsCpf1或LbCpf1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的Cpf1蛋白与FnCpf1、AsCpf1或LbCpf1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf1蛋白与野生型AsCpf1或LbCpf1具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在特定实施方案中,本发明的Cpf1蛋白与FnCpf1具有少于60%的序列同一性。技术人员将理解,这包括Cpf1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。
C2c1直系同源物
本发明涵盖来源于被指代为亚型V-B的C2c1基因座的C2c1效应蛋白的用途。在本文中,此类效应蛋白也称为“C2c1p”,例如C2c1蛋白(并且这种效应蛋白或C2c1蛋白或来源于C2c1基因座的蛋白也称为“CRISPR酶”)。目前,亚型V-B基因座包括cas1-Cas4融合物、cas2(表示为C2c1的独特基因)和CRISPR阵列。C2c1(CRISPR相关蛋白C2c1)是一种大蛋白(约1100-1300个氨基酸),它含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,C2c1缺少所有Cas9蛋白中都存在的HNH核酸酶结构域,而RuvC样结构域在C2c1序列中是连续的,相比之下Cas9含有长插入片段,包括HNH结构域。因此,在特定实施方案中,CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
C2c1(也称为Cas12b)蛋白是RNA导向的核酸酶。其切割依赖于tracr RNA以募集包含向导序列和正向重复的向导RNA,其中所述向导序列与靶核苷酸序列杂交以形成DNA/RNA异源双链体。基于目前的研究,C2c1核酸酶活性还需要依赖于PAM序列的识别。C2c1 PAM序列是富含T的序列。在一些实施方案中,PAM序列是5’TTN 3'或5’ATTN 3',其中N是任何核苷酸。在特定实施方案中,PAM序列是5’TTC 3'。在特定实施方案中,PAM处于恶性疟原虫的序列之中。
C2c1在靶基因座处产生交错切口,在靶序列的PAM远端侧具有5’突出端或“粘性末端”。在一些实施方案中,5'突出端为7nt。参见Lewis和Ke,Mol Cell.2017年2月2日;65(3):377-379。
本发明提供了C2c1(V-B型;Cas12b)效应蛋白和直系同源物。术语“直系同源物(orthologue)”(本文中也称作“直系同源物(ortholog)”)和“同源物(homologue)”(本文中也称作“同源物(homolog)”)在本领域中是众所周知的。通过进一步指导,如本文所用的蛋白质的“同源物”是与作为其同源物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以但不需要结构上相关,或仅部分结构上相关。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。同源物和直系同源物可以通过同源建模(参见例如Greer,Science第228卷(1985)1055和Blundell等Eur JBiochem vol 172(1988),513)或“结构BLAST”(Dey F,Cliff Zhang Q,Petrey D,HonigB.Toward a"structural BLAST":using structural relationships to inferfunction.Protein Sci.2013Apr;22(4):359-66.doi:10.1002/pro.2225.)来鉴定。另参见Shmakov等(2015)了解在CRISPR-Cas基因座领域中的申请。同源蛋白质可以但不需要结构上相关,或仅部分结构上相关。
C2c1基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4基因以及CRISPR盒在同一基因座中。因此,此推定的新颖CRISPR-Cas系统的布局似乎与II-B型的布局类似。此外,与Cas9类似,C2c1蛋白含有活性的RuvC样核酸酶、富含精氨酸的区和Zn指(不存在于Cas9中)。
在特定实施方案中,效应蛋白是来自包括以下的属的生物体的C2c1效应蛋白:脂环酸芽孢杆菌属(Alicyclobacillus)、脱硫弧菌属(Desulfovibrio)、脱硫盐碱杆菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、肿块芽孢杆菌属(Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacillus)、候选种(Candidatus)、脱硫杆菌属、柠檬酸杆菌属(Citrobacter)、迷踪菌门(Elusimicrobia)、甲基杆菌属、Omnitrophica、浮霉菌纲(Phycisphaerae)、浮霉菌门(Planctomycetes)、螺旋体属(Spirochaetes)和疣微菌科(Verrucomicrobiaceae)。
在另外的特定实施方案中,C2c1效应蛋白来自选自以下的种类:嗜酸脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)(例如ATCC 49025)、污染脂环酸芽孢杆菌(Alicyclobacillus contaminans)(例如DSM 17975)、大孢束脂环酸芽孢杆菌(Alicyclobacillus macrosporangiidus)(例如DSM 17980)、外村尚芽孢杆菌(Bacillushisashii)菌株C4、Candidatus Lindowbacteria菌RIFCSPLOWO2、非常脱硫弧菌(Desulfovibrio inopinatus)(例如DSM 10711)、硫歧化酶脱硫碱菌(Desulfonatronumthiodismutans)(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、Omnitrophica WOR_2细菌RIFCSPHIGHO2、丰祐菌科细菌TAV5细菌,浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(Tuberibacillus calidus)(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(Desulfatirhabdiumbutyrativorans)(例如DSM 18734)、草脂环酸芽孢杆菌(Alicyclobacillus herbarius)(例如DSM 13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(Brevibacillusagri)(例如BAB-2500)、结瘤甲基杆菌(Methylobacterium nodulans)(例如ORS 2060)。
效应蛋白可包含嵌合效应蛋白,所述嵌合效应蛋白包含来自第一效应蛋白(例如C2c1)直系同源物的第一片段和来自第二效应蛋白(例如C2c1)直系同源物的第二片段,并且其中第一和第二效应蛋白直系同源物是不同的。第一效应蛋白和第二效应蛋白(例如,C2c1)直系同源物中的至少一者可包含来自包括以下的生物体的效应蛋白(例如,C2c1):脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、柠檬酸杆菌属、迷踪菌门、甲基杆菌属、Omnitrophica、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科;例如,包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包含以下的生物体的C2c1:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、迷踪菌门、柠檬酸杆菌属、甲基杆菌属、Omnitrophica、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科,其中第一片段和第二片段不是来自同一细菌;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自以下的C2c1:嗜酸脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、Candidatus Lindowbacteria菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫碱菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、Omnitrophica WOR_2细菌RIFCSPHIGHO2、丰祐菌科细菌TAV5细菌,浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM 13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS2060),其中第一片段和第二片段不是来自同一细菌。
在更优选的实施方案中,C2c1p来源于选自以下的细菌种类:嗜酸脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、Candidatus Lindowbacteria菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫碱菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、Omnitrophica WOR_2细菌RIFCSPHIGHO2、丰祐菌科细菌TAV5细菌,浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060)。在某些实施方案中,C2c1p来源于选自嗜酸脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)的细菌种类。
在特定实施方案中,如本文所提及的C2c1的同源物或直系同源物与C2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1的同源物或直系同源物与野生型C2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在C2c1具有一个或多个突变(是突变的)的情况下,如本文所提及的所述C2c1的同源物或直系同源物与突变的C2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,C2c1蛋白可为包括但不限于以下属的生物体的直系同源物:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、候选种、脱硫杆菌属、柠檬酸杆菌属、迷踪菌门、甲基杆菌属、Omnitrophica、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科;在特定实施方案中,V型Cas蛋白可为包括但不限于以下的种类的生物体的直系同源物:嗜酸脂环酸芽孢杆菌(例如ATCC49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM17980)、外村尚芽孢杆菌菌株C4、Candidatus Lindowbacteria菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫碱菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、OmnitrophicaWOR_2细菌RIFCSPHIGHO2、丰祐菌科细菌TAV5细菌,浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属种CF112、芽孢杆菌属种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060)。在特定实施方案中,如本文所提及的C2c1的同源物或直系同源物与本文所公开的一个或多个C2c1序列具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1的同源物或直系同源物与野生型AacC2c1或BthC2c1具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的C2c1蛋白与AacC2c1或BthC2c1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1蛋白与野生型AacC2c1具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在特定实施方案中,本发明的C2c1蛋白与AacC2c1具有少于60%的序列同一性。技术人员将理解,这包括C2c1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。
RNA向导的C2c1的可编程性、特异性和附带活性也使其成为用于核酸非特异性切割的理想可切换核酸酶。在一个实施方案中,将C2c1系统工程改造以提供并利用RNA的附带非特异性切割。在另一个实施方案中,将C2c1系统工程改造以提供并利用ssDNA的附带非特异性切割。因此,工程改造的C2c1系统提供了用于核酸检测和转录组操纵以及诱导细胞死亡的平台。C2c1被开发用作哺乳动物转录敲除和结合的工具。当被序列特异性的靶向DNA结合活化时,C2c1能够对RNA和ssDNA进行稳健的附带切割。
在一个实施方案中,将C2c1系统工程改造以非特异性地切割细胞的亚群中的RNA,所述细胞的亚群可通过异常DNA序列的存在来区分,举例来说,其中异常DNA的切割可能是不完全的或无效的。在一个非限制性实例中,靶向存在于癌细胞中并驱动细胞转化的DNA易位。经历染色体DNA和修复的细胞亚群可存活,而非特异性的附带核糖核酸酶活性则有利地导致潜在存活者的细胞死亡。
最近,附带活性被用于称为SHERLOCK的高度灵敏且具特异性的核酸检测平台,所述平台可用于许多临床诊断(Gootenberg,J.S.等Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017))。
根据本发明,工程改造的C2c1系统被优化用于DNA或RNA核酸内切酶活性,并且可在哺乳动物细胞中表达并且被靶向以有效地敲低细胞中的报告分子或转录物。
向导序列
如本文所用的术语“向导序列”、“crRNA”、“向导RNA”或“单向导RNA”或“gRNA”是指包含与靶核酸序列具有足够互补性的任何多核苷酸序列的多核苷酸以与靶核酸序列杂交并且引导包含向导序列和CRISPR效应蛋白的RNA靶向复合物序列特异性地结合至靶核酸序列。在一些示例性实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Watermanalgorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。可以通过任何合适的测定来评定向导序列(在核酸靶向向导RNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的能力。举例来说,足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分,包括有待测试的向导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶核酸序列内的优先靶向(例如切割)。类似地,可以在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的向导序列)和不同于测试向导序列的对照向导序列,以及在测试向导序列与对照向导序列反应之间比较靶序列处的结合或切割速率来评估靶核酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择向导序列并且因此选择核酸靶向向导以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在一些实施方案中,选择核酸靶向向导以降低核酸靶向向导内的二级结构程度。在一些实施方案中,当最佳折叠时,核酸靶向向导的约或小于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸参与自身互补碱基配对。最佳折叠可以通过任何适合的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能(Gibbsfree energy)。一种此类算法的实例是如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所描述的mFold。另一个示例性折叠算法是维也纳大学(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)开发的使用质心结构预测算法的在线网络服务器RNAfold(参见例如A.R.Gruber等,2008,Cell 106(1):23-24;和PACarr和GM Church,2009,Nature Biotechnology 27(12):1151-62)。
在某些实施方案中,向导RNA或crRNA可以包含正向重复(DR)序列和向导序列或间隔区序列,基本上由其组成,或由其组成。在某些实施方案中,向导RNA或crRNA可以包含融合或连接至向导序列或间隔区序列的正向重复序列,基本上由其组成,或由其组成。在某些实施方案中,正向重复序列可以位于向导序列或间隔区序列上游(即,5')。在其他实施方案中,正向重复序列可以位于向导序列或间隔区序列下游(即,3')。
在某些实施方案中,crRNA包含茎环,优选单个茎环。在某些实施方案中,正向重复序列形成茎环,优选单个茎环。
在某些实施方案中,向导RNA的间隔区长度为15至35nt。在某些实施方案中,向导RNA的间隔区长度为至少15个核苷酸。在某些实施方案中,间隔区长度为15至17nt,例如15、16或17nt;17至20nt,例如17、18、19或20nt;20至24nt,例如20、21、22、23或24nt;23至25nt,例如23、24或25nt;24至27nt,例如24、25、26或27nt;27-30nt,例如27、28、29或30nt;30-35nt,例如30、31、32、33、34或35nt;或35nt或更长。
一般来讲,CRISPR-Cas、CRISPR-Cas9或CRISPR系统可以如在诸如WO 2014/093622(PCT/US2013/074667)的前述文献中那样使用并且共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因(特别地,在CRISPR-Cas9的情况下为Cas9基因)的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”和tracrRNA加工的部分正向重复序列)、向导序列(在内源性CRISPR系统的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas9的一种或多种RNA,例如CRISPR RNA和反式活化(tracr)RNA或单向导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来说,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源CRISPR系统的情形中也称作原间隔区)。在形成CRISPR复合物的情形中,“靶序列”是指向导序列被设计成与其具有互补性的序列,其中靶序列与向导序列之间的杂交促进CRISPR复合物的形成。与靶序列的互补对于切割活性很重要的向导序列的部分在本文中称为种子序列。靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中,并且可以包括处于存在于细胞内的线粒体、细胞器、囊泡、脂质体或粒子中或来自其的核酸。在一些实施方案中,特别是对于非核用途,NLS不是优选的。在一些实施方案中,CRISPR系统包含一个或多个核输出信号(NES)。在一些实施方案中,CRISPR系统包含一个或多个NLS和一个或多个NES。在一些实施方案中,可以通过搜索满足以下任何或所有条件的重复基序,在计算机上鉴定正向重复序列:1.在II型CRISPR基因座侧翼的2Kb基因组序列窗口中;2.跨度为20至50bp;和3.间隔20至50bp。在一些实施方案中,可以使用这些标准中的2个,例如1和2、2和3或1和3。在一些实施方案中,可以使用所有3个标准。
在本发明的实施方案中,术语向导序列和向导RNA,即,能够将Cas导向靶基因组基因座的RNA,如前面引用的文献诸如WO 2014/093622
(PCT/US2013/074667)中所述互换使用。一般来说,向导序列是与靶多核苷酸序列具有足够互补性的任何多核苷酸序列以与靶序列杂交并且引导CRISPR复合物序列特异性结合至靶序列。在一些实施方案中,当使用适合的比对算法最佳比对时,向导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何适合算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。在一些实施方案中,向导序列的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多核苷酸。在一些实施方案中,向导序列的长度小于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。优选地,向导序列长度为10-30个核苷酸。向导序列引导CRISPR复合物序列特异性结合至靶序列的能力可以通过任何适合的测定来评价。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的向导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶序列内的优先切割。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的向导序列)和不同于测试向导序列的对照向导序列,以及在测试向导序列与对照向导序列反应之间比较靶序列处的结合或切割速率来评估靶多核苷酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。
在CRISPR-Cas系统的一些实施方案中,向导序列与其相应靶序列之间的互补程度可以为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;向导或RNA或sgRNA的长度可以为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸;或者向导或RNA或sgRNA的长度可以小于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸;并且有利地tracr RNA的长度为30或50个核苷酸。然而,本发明的一个方面是减少脱靶相互作用,例如,减少向导与具有低互补性的靶序列相互作用。确实,在实例中显示,本发明涉及使得CRISPR-Cas系统能够区分靶序列与具有大于80%至约95%互补性,例如83%-84%或88-89%或94-95%互补性的脱靶序列(例如,区分具有18个核苷酸的标靶与具有1个、2个或3个错配的18个核苷酸的脱靶)的突变。因此,在本发明的情形中,向导序列与其相应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序列与向导之间的互补性,有利的是,脱靶为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与向导之间的互补性。
向导修饰
在某些实施方案中,本发明的向导包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物和/或化学修饰。非天然存在的核酸可以包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸和/或碱基部分被修饰。在本发明的实施方案中,向导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,向导包含一种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的实施方案中,向导包含一种或多种非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键联、硼酸磷酸酯键联的核苷酸、包含在核糖环的2’和4’碳原子之间的亚甲基桥的锁定核酸(LNA)或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物、2-硫代尿苷类似物、N6-甲基腺苷类似物或2'-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。向导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基-3’-硫代磷酸酯(MS)、硫代磷酸酯(PS)、S-约束乙基(cEt),或2'-O-甲基-3’-硫代PACE(MSP)。此类化学修饰的向导与未修饰的向导相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见Hendel,2015,NatBiotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布;Ragdarm等,0215,PNAS,E7110-E7111;Allerson等,J.Med.Chem.2005,48:901-904;Bramsen等,Front.Genet.,2012,3:154;Deng等,PNAS,2015,112:11870-11875;Sharma等,MedChemComm.,2014,5:1454-1471;Hendel等,Nat.Biotechnol.(2015)33(9):985-989;Li等,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。在一些实施方案中,向导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见Kelly等,2016,J.Biotech.233:74-83)。在某些实施方案中,向导在结合至靶DNA的区域中包含核糖核苷酸,并在结合至Cas9、Cpf1或C2c1的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程改造的向导结构(诸如但不限于5'端和/或3'端、茎环区和种子区)中。在某些实施方案中,修饰不在茎环区的5'柄(5’-handle)中。向导的茎环区的5'柄中的化学修饰可能会废除其功能(参见Li等,Nature BiomedicalEngineering,2017,1:0066)。在某些实施方案中,向导的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸经化学修饰。在一些实施方案中,向导的3’或5’端的3-5个核苷酸经化学修饰。在一些实施方案中,在种子区中仅引入较小的修饰,诸如2’-F修饰。在某些实施方案中,在向导的3’端引入2'-F修饰。在某些实施方案中,向导的5’端和/或3’端的3至5个核苷酸用2'-O-甲基(M)、2'-O-甲基-3’-硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3’-硫代PACE(MSP)化学修饰。这样的修饰可以提高基因组编辑效率(参见Hendel等,Nat.Biotechnol.(2015)33(9):985-989)。在某些实施方案中,向导的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在某些实施方案中,向导的5’端和/或3’端的多于5个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)化学修饰。这种化学修饰的向导可以介导增强的基因破坏水平(参见Ragdarm等,0215,PNAS,E7110-E7111)。在本发明的一个实施方案中,向导被修饰成在其3’和/或5’端包含化学部分。这样的部分包括但不限于胺、叠氮化物、炔、硫代基、二苯并环辛炔(DBCO)或若丹明。在某些实施方案中,化学部分通过接头诸如烷基链缀合至向导。在某些实施方案中,修饰的向导的化学部分可用于将向导附接至另一分子,诸如DNA、RNA、蛋白质或纳米粒子。这种化学修饰的向导可用于识别或富集一般由CRISPR系统编辑的细胞(参见Lee等,eLife,2017,6:e25312,DOI:10.7554)。
在某些实施方案中,如本文所提供的CRISPR系统可以利用包含向导序列的crRNA或类似多核苷酸,其中多核苷酸是RNA、DNA或RNA与DNA的混合物,和/或其中多核苷酸包含一种或多种核苷酸类似物。序列可以包含任何结构,包括但不限于原生crRNA的结构,例如凸环、发夹或茎环结构。在某些实施方案中,包含向导序列的多核苷酸与可以是RNA或DNA序列的第二多核苷酸序列形成双链体。
在某些实施方案中,利用化学修饰的向导RNA。向导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS),或2'-O-甲基3'硫代PACE(MSP)。此类化学修饰的向导RNA与未修饰的向导RNA相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见Hendel,2015,NatBiotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布)。化学修饰的向导RNA还包括但不限于具有硫代磷酸酯键的RNA和在核糖环的2'与4'碳之间包含亚甲基桥的锁核酸(LNA)核苷酸。
在一些实施方案中,向导序列的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多核苷酸。在一些实施方案中,向导序列的长度小于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。优选地,向导序列长度为10至30个核苷酸。向导序列引导CRISPR复合物序列特异性结合至靶序列的能力可以通过任何适合的测定来评价。举例来说,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的向导序列,可以提供给具有相应靶序列的宿主细胞,例如通过用编码CRISPR序列的组分的载体转染,继而评价靶序列内的优先裂解,例如通过Surveyor测定。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的向导序列)和不同于测试向导序列的对照向导序列,以及在测试与对照向导序列反应之间对靶序列比较结合或裂解速率来评估靶RNA的裂解。其他测定可能存在,并且将为本领域技术人员所想到。
在一些实施方案中,对向导的修饰是化学修饰、插入、缺失或拆分。在一些实施方案中,化学修饰包括但不限于并入2'-O-甲基(M)类似物、2'-脱氧类似物、2-硫代尿苷类似物,N6-甲基腺苷类似物、2'-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2'-O-甲基-3’-硫代磷酸酯(MS)、S-约束乙基(cEt)、硫代磷酸酯(PS)或2'-O-甲基-3’-硫代PACE(MSP)。在一些实施方案中,向导包含一种或多种硫代磷酸酯修饰。在某些实施方案中,向导的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或25个核苷酸经化学修饰。在某些实施方案中,种子区中的一个或多个核苷酸经化学修饰。在某些实施方案中,在3’端的一个或多个核苷酸经化学修饰。在某些实施方案中,5’柄中的核苷酸均未经化学修饰。在一些实施方案中,种子区中的化学修饰是次要修饰,诸如并入2’-氟类似物。在具体实施方案中,种子区的一个核苷酸被2’-氟类似物替代。在一些实施方案中,3’端中的5或10个核苷酸经化学修饰。在Cpf1CrRNA的3’端处的此类化学修饰提高基因切割效率(参见Li等,Nature Biomedical Engineering,2017,1:0066)。在具体实施方案中,3'端中的5个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的10个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的5个核苷酸被2'-O-甲基(M)类似物替代。
在一些实施方案中,向导的5'柄的环经修饰。在一些实施方案中,向导的5'柄的环被修饰为具有缺失、插入、裂解或化学修饰。在某些实施方案中,环包含3个、4个或5个核苷酸。在某些实施方案中,环包含序列UCUU、UUUU、UAUU或UGUU。
可以选择向导序列并且因此选择核酸靶向向导RNA以靶向任何靶核酸序列。在形成CRISPR复合物的情形中,“靶序列”是指向导序列被设计成与其具有互补性的序列,其中靶序列与向导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。术语“靶RNA”是指作为靶序列或包含靶序列的RNA多核苷酸。换句话说,靶RNA可以是gRNA的一部分,即,向导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的RNA多核苷酸或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在某些实施方案中,向导RNA的间隔区长度小于28个核苷酸。在某些实施方案中,向导RNA的间隔区长度为至少18个核苷酸并且小于28个核苷酸。在某些实施方案中,向导RNA的间隔区长度在19个与28个核苷酸之间。在某些实施方案中,向导RNA的间隔区长度在19个与25个核苷酸之间。在某些实施方案中,向导RNA的间隔区长度为20个核苷酸。在某些实施方案中,向导RNA的间隔区长度为23个核苷酸。在某些实施方案中,向导RNA的间隔区长度为25个核苷酸。
在某些实施方案中,可以通过在间隔区序列与靶序列之间,包括沿着间隔区/标靶的错配位置引入错配,例如1个或多个错配,例如1个或2个错配来探索裂解效率的调节。举例来说,双重错配越处于中心(即,不是3'或5'),裂解效率越受影响。因此,通过选择沿着间隔区的错配位置,可以调节裂解效率。通过实例,如果需要小于100%的标靶裂解(例如在细胞群体中),那么可以在间隔区序列中引入1个或多个,例如优选2个在间隔区与靶序列之间的错配。错配位置沿着间隔区越处于中心,裂解百分比越低。
在某些示例性实施方案中,可以探索裂解效率以设计单向导,所述单向导可以区分两种或更多种因单核苷酸,例如单核苷酸多态性(SNP)、变异或(点)突变而变化的标靶。CRISPR效应物可能对SNP(或其他单核苷酸变异)具有降低的灵敏度并且继续以某一效率水平使SNP标靶裂解。因此,对于两种标靶或一组标靶,向导RNA可以被设计成具有与标靶中的一种,即,中靶SNP互补的核苷酸序列。向导RNA被进一步设计成具有合成错配。如本文所用的“合成错配”是指非天然产生的错配,其在天然产生的SNP上游或下游,例如上游或下游至多5个核苷酸,例如上游或下游4个、3个、2个或1个核苷酸,优选地上游或下游至多3个核苷酸,更优选地上游或下游至多2个核苷酸,最优选地上游或下游1个核苷酸(即,邻近SNP)处引入。当CRISPR效应物结合至中靶SNP时,仅单错配将与合成错配一起形成,并且将继续活化CRISPR效应物并产生可检测信号。当向导RNA杂交至脱靶SNP时,将形成两个错配,来自SNP的错配和合成错配,并且不产生可检测信号。因此,本文所公开的系统可以被设计成区分群体内的SNP。举例来说,系统可以用于区分因单个SNP而不同的病原性株系或检测某些疾病特异性SNP,例如但不限于疾病相关SNP,例如但不限于癌症相关SNP。
在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8或9(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置2、3、4、5、6或7(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置3、4、5或6(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置3(以5'端为起点)上。
在某些实施方案中,向导RNA被设计成使得错配(例如合成错配,即,除SNP以外的额外突变)位于间隔区序列的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得错配位于间隔区序列的位置1、2、3、4、5、6、7、8或9(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得错配位于间隔区序列的位置4、5、6或7(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得错配位于间隔区序列的位置5(以5'端为起点)上。
在某些实施方案中,向导RNA被设计成使得错配位于SNP上游2个核苷酸(即,一个间插核苷酸)。
在某些实施方案中,向导RNA被设计成使得错配位于SNP下游2个核苷酸(即,一个间插核苷酸)。
在某些实施方案中,向导RNA被设计成使得错配位于间隔区序列的位置5(以5'端为起点)上并且SNP位于间隔区序列的位置3(以5'端为起点)上。
本文所描述的实施方案涵盖在如本文所论述的真核细胞中(体外,即,在分离的真核细胞中)诱导一个或多个核苷酸修饰,其包括向细胞递送如本文所论述的载体。一个或多个突变可以包括经由一个或多个向导RNA在细胞的每个靶序列处一个或多个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处1-75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处40、45、50、75、100、200、300、400或500个核苷酸的引入、缺失或取代。
通常,在内源CRISPR系统的情形中,CRISPR复合物(包含杂交至靶序列并且与一种或多种Cas蛋白质复合的向导序列)的形成使得靶序列中或附近(例如距其1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对以内)裂解,但可以取决于例如二级结构,尤其在RNA标靶的情况下。
信号扩增CRISPR效应蛋白
在某些示例性实施方案中,信号扩增CRISPR效应蛋白是III-A型CRISPR-Cas系统效应蛋白。在某些示例性实施方案中,III-A型CRISPR-Cas效应蛋白是Csm6。Csm6与多蛋白Csm效应复合物一起起作用,但不是所述复合物的一部分(参见,例如,US20170198286A1;WO2016035044A1;M.Kazlauskiene等,Science 10.1126/science.aao0100(2017);以及Niewoehner等2017,bioRxiv预印本在线发布于2017年6月23日;doi:dx.doi.org/10.1101/153262)。
在表皮葡萄球菌(Staphylococcus epidermidis)中,Csm复合物(SeCsm)由Cas10、Csm2、Csm3、Csm4和Csm5蛋白组成。使用用于嗜热链球菌(Streptococcus thermophilus)(St)的Csm复合物,证明III-A型CRISPR-Cas系统在体外和细胞中均具有RNA切割活性(参见,例如,US20170198286A1)。
III-A型CRISPR-Cas系统包括嗜热链球菌(GenBank KM222358)、DGCC7710(GenBank AWVZ01000003)、LMD-9(GenBank NC008532)、表皮葡萄球菌RP62a(GenBankNC002976)、意大利肠球菌(Enterococcus italicus)DSM15952(GenBank AEPV01000074)、乳酸乳球菌DGCC7167(GenBank JX524189)和硫磺矿硫化叶菌(Sulfolobus solfataricus)P2(GenBank AE006641)。DGCC8004的III-A型系统含有侧接CRISPR2阵列的10个cas基因,并且包括cast、cas2、cas6、cas10、csm2、csm3、csm4、csm5、csm6和csm6'基因。DGCC8004CRISPR2基因座与DGCC7710(GenBank AWVZ00000000,(Horvath和Barrangou,2010))和LMD-9(GenBank NC_008532,(Makarova等,2006))具有相似的基因排列。主要区别在于DGCC8004中的另一个csm6'基因。DGCC8004中的Csm6'蛋白由386个氨基酸组成,与428个氨基酸的Csm6蛋白具有34%的氨基酸同一性,这表明可能是古老的基因复制事件,随后是序列趋异。相比之下,DGCC7710在csm6前面仅含有一个短的117-nt ORF。DGCC8004中与CRISPR2相关的Cas/Csm蛋白与DGCC7710和LMD-9中的相应蛋白同源(氨基酸同一性超过90%,Csm2蛋白除外,其具有约70%的同一性)。其他经实验表征的III-A型系统包括表皮葡萄球菌RP62a(GenBank NC002976,(Marraffini和Sontheimer,2008))、意大利肠球菌DSM15952(GenBankAEPV01000074,(Millen等,2012))和乳酸乳球菌DGCC7167(GenBank JX524189,(Millen等,2012))与DGCC8004共享cas10-csm2-csm3-csm4-csm5-csm6基因簇的保守排列,而cas6和cast/cas2基因的位置在某些菌株中有所不同。硫磺矿硫化叶菌P2(GenBank AE006641)中的III-A型CRISPR-Cas基因座具有不同的基因组织,并且与DGCC8004中的Cas/Csm直系同源物显示出低的蛋白质序列相似性。值得注意的是,Csm3蛋白在不同株系的Cas/Csm蛋白中最保守,并且在硫磺矿硫化叶菌中存在5个拷贝的Csm3旁系同源物。表皮葡萄球菌、意大利大肠杆菌和乳酸乳球菌中的重复序列具有相同的长度(36nt),但是核苷酸保守性仅限于重复序列的回文部分和3'末端。该重复序列的8-nt 3'末端序列可能有助于crRNA 5’柄,显示嗜热链球菌、表皮葡萄球菌、意大利大肠杆菌和乳酸乳球菌之间具有ACGRRAAC共有性,但与硫磺矿硫化叶菌(AUUGAAG(Rouillon等,2013))不同。
已经证明Csm6是一种ssRNA特异性内切核糖核酸酶,并确定了该活性的结构基础(Niewoehner和Jinek,2016,Structural basis for the endoribonuclease activity ofthe type III-A CRISPR-associated protein Csm6.RNA 22:318–329)。
在一些实施方案中,本发明的核酸靶向系统的一个或多个元件来源于包含内源CRISPR RNA靶向系统的特定生物体。在某些实施方案中,CRISPR RNA靶向系统包含Csm6蛋白、Csm6直系同源物或Csm6样蛋白。如本文所使用,对Csm6的讨论也涉及Csm6蛋白、Csm6直系同源物或Csm6样蛋白。Csm6直系同源物可见于如本文所述和本领域已知的生物体(参见例如WO2016035044A1以及Niewoehner和Jinek,2016)。示例性Csm6直系同源物包括但不限于嗜热栖热菌(T.thermophilus)(TtCsm6,GI:55978335)、表皮葡萄球菌(SeCsm6,GI:488416649)、变异链球菌(SmCsm6,GI:24379650)、嗜热链球菌(StCsm6,GI:585230687)和焦酚火球菌(P.furiosus)Csx1(PfCsx1,GI:33359545)。在某些实施方案中,可用于本发明的Csm6蛋白包含至少一个N端CARF(CRISPR相关罗斯曼折叠(Rossman fold))结构域和至少一个C端HEPN结构域(高级真核生物和原核生物核苷酸结合结构域)。在某些实施方案中,Csm6蛋白形成二聚体。在某些实施方案中,HEPN结构域的二聚化导致形成核糖核酸酶活性位点。在某些实施方案中,CARF结构域的二聚体界面包含正电袋。不受理论的束缚,所述口袋可用作核糖核酸酶活性的别构控制的配体结合位点。
在某些示例性实施方案中,本文所述的基于CRISPR的检测系统包含Csm6蛋白,所述Csm6蛋白包含至少一个HEPN结构域,包括但不限于本文所述的HEPN结构域、本领域已知的HEPN结构域(Niewoehner和Jinek,2016),和通过与共有序列基序相比而被识别为HEPN结构域的结构域。本文中提供若干此类结构域。在一个非限制性实例中,共有序列可以来源于本文所提供的C2c2或Cas13b直系同源物的序列。在某些示例性实施方案中,Csm6蛋白包含单个HEPN结构域。在某些其他示例性实施方案中,Csm6蛋白包含两个HEPN结构域。
在一个示例性实施方案中,Csm6蛋白包含一个或多个包含RxxxxH基序序列的HEPN结构域。RxxxxH基序序列可以但不限于来自本文所描述的HEPN结构域或本领域中已知的HEPN结构域。RxxxxH基序序列还包括通过组合两个或更多个HEPN结构域的部分而建立的基序序列。如所指出的,共有序列可来源于本文所公开的直系同源物的序列。在某些实施方案中,HEPN结构域包含保守的R-X4-6-H基序(Anantharaman等,Biol Direct.2013年6月15日;8:15;和Kim等,Proteins.2013年2月;81(2):261-70)。
在本发明的实施方案中,HEPN结构域包含至少一个包含序列R{N/H/K}X1X2X3H的RxxxxH基序。在本发明的实施方案中,HEPN结构域包括包含序列R{N/H}X1X2X3H的RxxxxH基序。在本发明的实施方案中,HEPN结构域包含序列R{N/K}X1X2X3H。在某些实施方案中,X1是R、S、D、E、Q、N、G、Y或H。在某些实施方案中,X2是I、S、T、V或L,在某些实施方案中,X3是L、F、N、Y、V、I、S、D、E或A。
已经描述了CARF结构域和CARF结构域的共有序列(参见例如Makarova等,FrontGenet.2014;5:102)。在某些实施方案中,Csm6包含至少一个CARF结构域,所述至少一个CARF结构域包含核心结构域,所述核心结构域包含六链罗斯曼样折叠,且核心链5和链6形成β发夹。序列保守的主要区域与核心结构域的链1和链4相缔合。在某些实施方案中,链1末端的特征是极性残基,通常带有醇性侧链(S/T)。在某些实施方案中,紧邻链4下游的是高度保守的碱性残基(K/R),优选地是与[DN]X[ST]XXX[RK]标记(SEQ ID NO:430)相缔合。在某些实施方案中,Csm6被截短以去除N端CARF结构域(例如TtCsm6的1-190位氨基酸或直系同源Csm6蛋白中的等效残基)。
在某些实施方案中,Csm6包含至少一个6H结构域(Niewoehner和Jinek,2016)。TtCsm6多肽链的6H结构域(残基191-292)由五个α螺旋组成,并且形成右手螺线管结构域。不受理论的束缚,因为某些直系同源物可能不具有6H结构域,所以该结构域对于本发明的Csm6蛋白的活性不是必需的。
Csm6已显示通过充当降解入侵者RNA转录物的独立核糖核酸酶而有助于干扰。Csm6蛋白通过III型干扰复合物产生的第二信使被活化。在靶RNA被III型干扰复合物结合后,Cas10亚单位将ATP转化为环状寡腺苷酸产物,所述产物通过与其CARF结构域结合而别构活化Csm6。消除别构活化的CARF结构域突变在体内抑制Csm6活性,而Cas10手掌结构域中的突变导致Csm6表型丧失(M.Kazlauskiene等,2017;和Niewoehner等2017)。
在某些示例性实施方案中,当活化的CRISPR检测蛋白切割活化序列时,信号扩增CRISPR效应蛋白被活化。活化序列在下面进一步详细描述。活化序列的切割产物活化信号扩增CRISPR效应蛋白的单独活性,如RNA核酸酶活性。举例来说,Csm6一旦被活化,就会像Cas13酶的附带效应一样,无差别地切割RNA。因此,除检测到报告构建体的效应物修饰之外,活化的信号扩增CRISPR效应蛋白还修饰了报告构建体以进一步增强信号产生。在某些实施方案中,当与另一种CRISPR酶(例如Cas13)结合提供时,Csm6被活化。在某些实施方案中,当与Cas13结合使用时,Csm6可产生协同效应,从而大大提高了Cas13的附带活性。不受理论的束缚,当在测定中还包括Csm6时(例如,即时测定),可大大降低Cas13的浓度。因此,可在Cas13诊断测定中加入Csm6以增加该测定的灵敏度并降低成本。
在某些示例性实施方案中,所述一种或多种信号扩增效应蛋白选自表6。
表6
Figure BDA0002523004990000831
Figure BDA0002523004990000841
Figure BDA0002523004990000851
Figure BDA0002523004990000861
Figure BDA0002523004990000871
Figure BDA0002523004990000881
CRISPR效应物通常与其他组分相互作用以调节活性,VI-B型CRISPR系统通常包含干扰调节蛋白Csx27和Csx28,而Csx28共表达经证实可提高体内Cas13b蛋白的干扰活性。在某些实施方案中,所述一种或多种信号扩增CRISPR效应蛋白包括Csx28或Csx27。
标靶扩增
在某些示例性实施方案中,在活化CRISPR效应蛋白之前可以扩增靶RNA和/或DNA。可以使用任何适合的RNA或DNA扩增技术。在某些示例性实施方案中,RNA或DNA扩增是等温扩增。在某些示例性实施方案中,等温扩增可以是基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)或切口酶扩增反应(NEAR)。在某些示例性实施方案中,可以使用非等温扩增方法,包括但不限于PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分枝扩增方法(RAM)。
在某些示例性实施方案中,RNA或DNA扩增是基于核酸序列的扩增NASBA,其通过序列特异性反向引物对靶RNA的逆转录起始以建立RNA/DNA双链体。RNA酶H然后用于使RNA模板降解,从而允许含有启动子,例如T7启动子的正向引物结合互补链并起始互补链的延长,产生双链DNA产物。RNA聚合酶启动子介导的DNA模板转录然后建立靶RNA序列的拷贝。重要的是,新靶RNA中的每一个可以由向导RNA检测,由此进一步增强测定的灵敏度。靶RNA由向导RNA结合然后使得CRISPR效应蛋白活化并且方法如上文所概述继续进行。NASBA反应具有能够在适度等温条件下,例如在约41℃下继续进行的额外优点,使其适合于用于在实地和远离临床实验室的早期和直接检测而部署的系统和装置。
在某些其他示例性实施方案中,重组酶聚合酶扩增(RPA)反应可以用于扩增靶核酸。RPA反应采用能够使序列特异性引物与双链体DNA中的同源序列配对的重组酶。如果存在靶DNA,那么起始DNA扩增并且不需要其他样品操作,例如热循环或化学熔融。整个RPA扩增系统呈干燥的配方而稳定并且无需冷冻即可以安全地运输。RPA反应还可以在等温温度下进行,其中最佳反应温度为37-42℃。序列特异性引物被设计成扩增包含有待检测的靶核酸序列的序列。在某些示例性实施方案中,将RNA聚合酶启动子,例如T7启动子添加至引物中的一个。这得到包含靶序列和RNA聚合酶启动子的扩增的双链DNA产物。在RPA反应之后或期间,添加RNA聚合酶,这将从双链DNA模板产生RNA。然后继而可以由CRISPR效应系统检测扩增的靶RNA。以这种方式,可以使用本文所公开的实施方案检测靶DNA。RPA反应还可以用于扩增靶RNA。首先使用逆转录酶使靶RNA转变成cDNA,继之以第二链DNA合成,届时RPA反应如上文所概述继续进行。
因此,在某些示例性实施方案中,本文所公开的系统可以包括扩增试剂。本文描述了适用于核酸扩增的不同组分或试剂。举例来说,如本文所描述的扩增试剂可以包括缓冲剂,例如Tris缓冲剂。Tris缓冲剂可以在适于所需应用或用途的任何浓度下使用,例如包括但不限于1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、25mM、50mM、75mM、1M等浓度。本领域技术人员将能够确定用于本发明的缓冲剂(例如Tris)的适当浓度。
扩增反应,例如PCR中可以包括盐,例如氯化镁(MgCl2)、氯化钾(KCl)或氯化钠(NaCl),以改善核酸片段的扩增。尽管盐浓度将取决于特定反应和应用,但在一些实施方案中,特定大小的核酸片段在特定盐浓度下可能产生最佳结果。较大产物可能需要改变的盐浓度,通常是较低盐,以产生所需结果,而较小产物的扩增在较高盐浓度下可能产生较佳结果。本领域技术人员将了解,盐的存在和/或浓度以及盐浓度的改变可以改变生物或化学反应的严格度,并且因此可以使用为本发明和如本文所描述的反应提供适当条件的任何盐。
生物或化学反应的其他组分可以包括细胞裂解组分以使细胞破开或溶解以供分析其中的物质。细胞裂解组分可以包括但不限于洗涤剂;如上文所描述的盐,例如NaCl、KCl、硫酸铵[(NH4)2SO4];或其他。可以适于本发明的洗涤剂可以包括Triton X-100、十二烷基硫酸钠(SDS)、CHAPS(3-[(3-胆酰胺基丙基)二甲铵基]-1-丙磺酸盐)、乙基三甲基溴化铵、壬基苯氧基聚乙氧基乙醇(NP-40)。洗涤剂的浓度可以取决于特定应用,并且在一些情况下可以特定针对反应。扩增反应可以包括在适于本发明的任何浓度下使用的dNTP和核酸引物,例如包括但不限于100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mM等浓度。同样地,根据本发明适用的聚合酶可以是本领域中已知并且适用于本发明的任何特异性或一般聚合酶,包括Taq聚合酶、Q5聚合酶等。
在一些实施方案中,如本文所描述的扩增试剂可以适用于热启动扩增中。热启动扩增在一些实施方案中可以有益于减少或消除衔接分子或寡核苷酸的二聚,或以其他方式防止不合需要的扩增产物或人造物并且获得所需产物的最佳扩增。用于扩增中的本文所描述的许多组分也可以用于热启动扩增中。在一些实施方案中,视情况而定,适用于热启动扩增的试剂或组分可以替代组成组分中的一种或多种而使用。举例来说,可以使用在特定温度或其他反应条件下展现所需活性的聚合酶或其他试剂。在一些实施方案中,可以使用经过设计或优化以用于热启动扩增中的试剂,例如,在转座之后或在达到特定温度之后可以使聚合酶活化。此类聚合酶可以基于抗体或基于适体。如本文所描述的聚合酶在本领域中是已知的。此类试剂的实例可以包括但不限于热启动聚合酶、热启动dNTP和光笼化dNTP。此类试剂在本领域中是已知和可得的。本领域技术人员将能够确定适于个别试剂的最佳温度。
核酸扩增可以使用特定热循环机器或设备进行,并且可以在单个反应中或成批进行,以便可以同时进行任何所需数目的反应。在一些实施方案中,扩增可以使用微流体或机器人装置进行,或可以使用温度的手动改变来进行以达成所需扩增。在一些实施方案中,可以进行优化以获得用于特定应用或材料的最佳反应条件。本领域技术人员将了解并且能够优化反应条件以获得足够的扩增。
在某些实施方案中,使用本发明的方法或系统的DNA检测需要在检测之前(扩增的)DNA转录成RNA。
可检测阳性信号增强
在某些示例性实施方案中,可引入进一步扩增可检测阳性信号的进一步修改。举例来说,活化的CRISPR效应蛋白附带活化可用于产生二级标靶或另外的向导序列,或两者。在一个示例性实施方案中,反应溶液将包含以高浓度加标的二级标靶。二级标靶可不同于一级标靶(即,测定被设计用于检测的标靶),并且在某些情况下,在所有反应体积中可为共同的。举例来说,用于二级标靶的二级向导序列可通过二级结构特征如带有RNA环的发夹加以保护,并且无法结合第二标靶或CRISPR效应蛋白。活化的CRISPR效应蛋白切割保护基(即,在与溶液中的一种或多种一级标靶形成复合物后活化),并在溶液中与游离CRISPR效应蛋白形成复合物,并从加标的第二标靶中活化。在某些其他示例性实施方案中,类似的概念用于二级标靶和受保护的二级标靶的游离向导序列。从二级标靶上切割保护基将允许额外的CRISPR效应蛋白、向导序列、二级靶序列形成。在又一个示例性实施方案中,所述一种或多种一级标靶对CRISPR效应蛋白的活化可用于切割受保护的或环化的引物,然后将所述引物释放以在模板上针对二级向导序列、二级标靶或两者进行等温扩增反应,如本文所公开的那些。对此扩增模板的后续转录将产生更多的二级向导序列和/或二级靶序列,随后进行额外的CRISPR效应蛋白附带活化。
示例性方法和测定
测定平台的低成本和适应性适用于许多应用,包括(i)一般RNA/DNA定量,(ii)快速、多元化RNA/DNA表达检测,以及(iii)临床样品与环境样品中靶核酸、肽的灵敏检测。另外,本文所公开的系统可以适应于生物设置,例如细胞内转录物的检测。给出本文所描述的CRISPR效应物的高度特异性质,有可能追踪活细胞中转录物或疾病相关突变的等位基因特异性表达。
在某些示例性实施方案中,将对单个标靶具有特异性的单向导序列放置于单独的容积中。每个容积然后可以接受不同样品或相同样品的等分试样。在某些示例性实施方案中,可以将各自针对单独标靶的多个向导序列放置于单个孔中以使得在不同孔中可以筛选多个标靶。为了在单个容积中检测多个向导RNA,在某些示例性实施方案中,可以使用具有不同特异性的多个效应蛋白。举例来说,可以使用具有不同序列特异性的不同直系同源物。举例来说,一种直系同源物可以优先切割A,而其他优先切割C、G、U/T。因此,可产生全部是单核苷酸或包含单核苷酸的实质部分的掩蔽构建体,每个掩蔽构建体具有可在不同波长下检测到的不同荧光团。以这种方式,在单个个别离散容积中可以筛选至多四种不同标靶。在某些示例性实施方案中,可使用来自相同类别的CRISPR效应蛋白的不同直系同源物,如两个Cas13a直系同源物、两个Cas13b直系同源物或两个Cas13直系同源物。图67示出了各种Cas13蛋白的核苷酸偏好。在某些其他示例性实施方案中,可使用具有不同核苷酸编辑偏好的不同直系同源物,如Cas13a和Cas13b直系同源物,或Cas13a和Cas13c直系同源物,或Cas13b直系同源物和Cas13c直系同源物等。在某些实施例实施方案中,使用具有polyU偏好的Cas13蛋白和具有polyA偏好的Cas13b蛋白。在某些实施例实施方案中,具有polyU偏好的Cas13b蛋白是中间普雷沃菌(Prevotella intermedia)Cas13b,而具有polyA偏好的Cas13b蛋白是普雷沃菌属种MA2106 Cas13b蛋白。在某些实施例实施方案中,具有polyU偏好的Cas13蛋白是韦德纤毛菌Cas13a蛋白,而具有poly A偏好的Cas13蛋白是普雷沃菌属种MA2106 Cas13b蛋白。
如本文所展示,CRISPR效应系统能够检测低至渺摩尔浓度的靶分子。参见例如图13、14、19、22和下文所描述的实施例。归因于所述系统的灵敏度,需要快速和灵敏检测的许多应用可以得益于本文所公开的实施方案,并且预期处于本发明的范围内。示例性测定和应用在下文进一步详细描述。
微生物应用
在某些示例性实施方案中,本文所公开的系统、装置和方法涉及检测样品,例如获自受试者的生物样品中一种或多种微生物剂的存在。在某些示例性实施方案中,微生物可以是细菌、真菌、酵母、原生动物、寄生虫或病毒。因此,本文所公开的方法可以适应于在其他方法中与其他方法一起(或组合)使用,所述其他方法需要微生物种类的快速鉴别,监测微生物蛋白质(抗原)、抗体、抗体基因的存在,检测某些表型(例如细菌抗性),监测疾病进展和/或爆发,以及抗生素筛选。因为此处所公开的实施方案的快速和灵敏诊断能力、低至单核苷酸差异的微生物种类类型的检测和作为POC装置部署的能力,所以本文所公开的实施方案可以用于指导治疗方案,例如适当抗生素或抗病毒剂的选择。本文所公开的实施方案还可以用于针对微生物污染的存在筛选环境样品(空气、水、表面、食物等)。
公开了一种用以鉴别微生物种类,例如细菌、病毒、真菌、酵母或寄生虫种类等的方法。本文所公开的特定实施方案描述了将鉴别和区分单个样品内或跨越多个样品的微生物种类的方法和系统,从而允许识别许多不同微生物。本发明方法通过检测样品中靶核酸序列的存在而允许检测病原体和区分生物或环境样品中一种或多种生物体的两个或更多个种类,例如细菌、病毒、酵母、原生动物和真菌或它们的组合。获自样品的阳性信号指示微生物的存在。可以使用本发明的方法和系统,通过采取使用多于一种效应蛋白,其中每种效应蛋白靶向特异性微生物靶序列来同时鉴别多种微生物。以这种方式,对特定受试者可以进行多水平分析,其中可以一次检测许多微生物。在一些实施方案中,使用可以鉴别一种或多种微生物种类的一组探针可以进行多种微生物的同时检测。
样品的多元分析能够进行样品的大规模检测,从而减少分析的时间和成本。然而,多元分析常常受生物样品的可用性限制。根据本发明,然而,可以进行多元分析的替代方案以使得可以将多个效应蛋白添加至单个样品中并且每个掩蔽构建体可以与单独的淬灭剂染料组合。在这种情况下,对于单个样品中的多个检测可以单独地从每个淬灭剂染料获得阳性信号。
本文公开了区分样品中一种或多种生物体的两个或更多个种类的方法。所述方法还适用于检测样品中一种或多种生物体的一个或多个种类。
微生物检测
在一些实施方案中,提供了一种用于检测样品中的微生物的方法,所述方法包括将样品或样品组分配至一个或多个个别离散容积中,所述个别离散容积包含如本文所描述的CRISPR系统;在足以允许一种或多种向导RNA结合至一种或多种微生物特异性标靶的条件下孵育样品或样品组;经由一种或多种向导RNA结合至一种或多种靶分子来活化CRISPR效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便产生可检测的阳性信号;以及检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中一种或多种靶分子的存在。一种或多种靶分子可以是包含靶核苷酸序列的mRNA、gDNA(编码或非编码)、trRNA或RNA,其可以用于相互区分两种或更多种微生物种类/株系。向导RNA可以被设计成检测靶序列。本文所公开的实施方案还可以利用某些步骤以改善向导RNA与靶RNA序列之间的杂交。增强核糖核酸杂交的方法在题为"Enhanced Methods of Ribonucleic AcidHybridization"的WO 2015/085194中公开,其以引用的方式并入本文中。微生物特异性标靶可以是RNA或DNA或蛋白质。DNA方法还可以包括使用引入如本文所描述的RNA聚合酶启动子的DNA引物。如果标靶是蛋白质,那么方法将利用特定针对本文所描述的蛋白质检测的适体和步骤。
单核苷酸变体的检测
在一些实施方案中,可以使用对如本文所描述的靶序列具有特异性并且结合至所述靶序列的向导RNA检测一种或多种鉴别的靶序列。本发明的系统和方法甚至可以区分在不同微生物种类当中存在的单核苷酸多态性,并且因此根据本发明的多种向导RNA的使用可以进一步扩展或改善可以用于区分种类的靶序列的数目。举例来说,在一些实施方案中,一种或多种向导RNA可以在种、属、族、目、类、门、界或表型或它们的组合上区分微生物。
基于rRNA序列的检测
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于区分样品中的多个微生物种类。在某些示例性实施方案中,鉴别可以基于核糖体RNA序列,包括16S、23S和5S亚单位。鉴别相关rRNA序列的方法在美国专利申请公布号2017/0029872中公开。在某些示例性实施方案中,一组向导RNA可以被设计成由对于每个种类或株系独特的可变区来区分每个种类。向导RNA还可以被设计成靶向在属、族、目、类、门或界的水平或它们的组合上区分微生物的RNA基因。在使用扩增的某些示例性实施方案中,一组扩增引物可以被设计成侧接核糖体RNA序列的恒定区并且向导RNA被设计成由可变内区来区分每个种类。在某些示例性实施方案中,引物和向导RNA可以分别被设计成16S亚单位中的保守区和可变区。同样可以使用跨越种类或种类的子组,例如RecA基因家族RNA聚合酶β亚单位独特可变的其他基因或基因组区域。其他适合的系统发生标志和其鉴别方法在例如Wu等arXiv:1307.8690[q-bio.GN]中论述。
在某些示例性实施方案中,方法或诊断被设计成同时跨越多个系统发生和/或表型水平筛选微生物。举例来说,方法或诊断可以包括使用多个具有不同向导RNA的CRISPR系统。第一组向导RNA可以区分例如分枝杆菌、革兰氏阳性细菌和革兰氏阴性细菌。这些一般类别甚至可以进一步细分。举例来说,可以设计向导RNA并且用于区分革兰氏阴性细菌内的肠道菌和非肠道菌的方法或诊断中。第二组向导RNA可以被设计成在属或种的水平上区分微生物。因此,可以产生鉴别所有分枝杆菌、革兰氏阳性、革兰氏阴性(进一步分成肠道菌和非肠道菌)的矩阵,其中在给定样品中鉴别的细菌种类的每个属属于那些类别之一。前述内容仅用于示例性目的。还涵盖用于归类其他微生物类型的其他方式并且将遵循上文所描述的一般结构。
抗药性筛选
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于筛选所关注的微生物基因,例如抗生素和/或抗病毒抗性基因。向导RNA可以被设计成区分所关注的已知基因。然后可以使用本文所公开的用于检测此类基因的实施方案筛选样品,包括临床样品。在POC下筛选抗药性的能力将在选择适当治疗方案中具有巨大的效益。在某些示例性实施方案中,抗生素抗性基因是碳青霉烯酶(carbapenemase),包括KPC、NDM1、CTX-M15、OXA-48。其他抗生素抗性基因是已知的并且可以在例如综合抗生素抗性数据库(ComprehensiveAntibiotic Resistance Database)(Jia等“CARD 2017:expansion and model-centriccuration of the Comprehensive Antibiotic Resistance Database.”Nucleic AcidsResearch,45,D566-573)中找到。
病毒唑(ribavirin)是针对许多RNA病毒的有效抗病毒剂。若干临床上重要的病毒已经演变出病毒唑抗性,包括口蹄疫病毒doi:10.1128/JVI.03594-13;脊髓灰质炎病毒(Pfeifer和Kirkegaard.PNAS,100(12):7289-7294,2003);以及丙型肝炎病毒(Pfeiffer和Kirkegaard,J.Virol.79(4):2346-2355,2005)。许多其他持久性RNA病毒,例如肝炎和HIV,已经演变出对现有抗病毒药物的抗性:乙型肝炎病毒(拉米夫定(lamivudine)、替诺福韦(tenofovir)、恩替卡韦(entecavir))doi:10/1002/hep22900;丙型肝炎病毒(特拉匹韦(telaprevir)、BILN2061、ITMN-191、SCh6、波普瑞韦(boceprevir)、AG-021541、ACH-806)doi:10.1002/hep.22549;以及HIV(许多抗药性突变)hivb.standford.edu。本文所公开的实施方案尤其可以用于检测此类变体。
除抗药性以外,存在许多可以用本文所公开的实施方案检测的临床上相关的突变,例如LCMV中的持久性对急性感染(doi:10.1073/pnas.1019304108),和增加的埃博拉感染力(Diehl等Cell.2016,167(4):1088-1098。
如本文别处所描述,可以通过在gRNA中引入合成错配来区分密切相关的微生物种类(例如在给定的靶序列中仅具有单核苷酸差异)。
组覆盖方法(Set Cover Approach)
在特定实施方案中,设计一组向导RNA,其可以鉴别例如一组规定微生物内的所有微生物种类。此类方法描述于某些示例性实施方案中;可以将如本文所描述的产生向导RNA的方法与以引用的方式并入本文中的WO2017/040316中公开的方法相比较。如WO2017040316中所描述,组覆盖解决方案可以鉴别覆盖整个靶序列或一组靶序列,例如一组基因组序列所需的最小数目的靶序列探针或向导RNA。组覆盖方法先前已经用于鉴别引物和/或微阵列探针,通常在20个至50个碱基对的范围内。参见例如Pearson等,cs.virginia.edu/~robins/papers/primers_dam11_final.pdf.;Jabado等NucleicAcids Res.2006 34(22):6605-11;Jabado等Nucleic Acids Res.2008,36(1):e3doi10.1093/nar/gkm1106;Duitama等Nucleic Acids Res.2009,37(8):2483-2492;Phillippy等BMC Bioinformatics.2009,10:293doi:10.1186/1471-2105-10-293。然而,此类方法一般涉及将每个引物/探针处理成k-mer以及搜索精确匹配或允许使用后缀阵列搜索不精确匹配。另外,方法一般采用二元方法以通过选择引物或探针以使得每个输入序列仅需要由一个引物或探针结合并且这个结合沿着序列的位置是无关的来检测杂交。替代性方法可以将靶基因组分成预定义窗口并且在二元方法下将每个窗口有效处理成单独的输入序列-即,其确定给定的探针或向导RNA是否在每个窗口内结合并且是否需要所有窗口都由某个探针或向导RNA结合。有效地,这些方法将组覆盖问题中“通用”的每个元件处理成整个输入序列或输入序列的预定义窗口,并且如果探针或向导RNA的起点在元件内结合,那么每个元件被视为“覆盖的”。这些方法限制了允许不同探针或向导RNA设计覆盖给定的靶序列的流动性。
相比之下,本文所公开的实施方案涉及检测更长的探针或向导RNA长度,例如在70bp至200bp的范围内,其适合于杂交体选择测序。另外,可以应用本文所公开的方法以采用能够定义探针或向导RNA组的泛靶序列方法,所述探针或向导RNA组可以鉴别和促进大型和/或可变靶序列组中所有种类和/或株系序列的检测测序。举例来说,本文所公开的方法可以用于在单个测定中鉴别给定病毒或多个不同病毒的所有变体。此外,本文所公开的方法将组覆盖问题中“通用”的每个元件处理成靶序列的核苷酸,并且每个元件被视为“覆盖的”,只要探针或向导RNA结合至包括元件的靶基因组的某个区段即可。这些类型的组覆盖方法可以替代先前方法的二元方法使用,本文所公开的方法将探针或向导RNA可以如何杂交至靶序列较好地建模。胜过仅询问给定的向导RNA序列是否结合至给定的窗口,此类方法可以用于检测杂交模式-即,在给定的探针或向导RNA结合至一个或多个靶序列的情况下-然后从那些杂交模式确定覆盖靶序列组至足以能够从样品富集并且对任何和所有靶序列进行测序的程度所需的最小数目的探针或向导RNA。这些杂交模式可以通过定义某些参数来确定,所述参数使损失功能降至最低,从而能够以允许参数对于每个种类有变化,例如以反映每个种类的多样性的方式,以及以使用组覆盖解决方案的简单应用,例如在探针或向导RNA设计情形中先前应用的那些无法达成的计算有效方式鉴别最小探针或向导RNA组。
检测多个转录物丰度的能力可以允许产生指示特定表型的独特微生物标识。各种机器学习技术可以用于导出基因标识。因此,CRISPR系统的向导RNA可以用于鉴别和/或定量由基因标识定义的生物标志的相对水平以检测某些表型。在某些示例性实施方案中,基因标识指示对抗生素的易感性、对抗生素的抗性,或它们的组合。
在本发明的一个方面,方法包括检测一种或多种病原体。以这种方式,可以获得个别微生物对受试者的感染之间的区别。在一些实施方案中,此种区别能够由临床医师检测或诊断特定疾病,例如疾病的不同变体。优选地,病原体序列是病原体的基因组或其片段。方法还可以包括确定病原体的演变。确定病原体的演变可以包括鉴别病原体突变,例如核苷酸缺失、核苷酸插入、核苷酸取代。在后者当中,存在非同义、同义和非编码取代。突变在爆发期间更频繁地是非同义的。方法还可以包括确定如上文所描述而分析的两个病原体序列之间的取代率。突变是有害的还是甚至适应性的将需要功能性分析,然而,非同义突变率表明这种流行病的持续进展可能为病原体适应提供机会,强调了快速遏制的需要。因此,方法还可以包括评价病毒适应的风险,其中确定非同义突变的数目(Gire等,Science 345,1369,2014)。
监测微生物爆发
在一些实施方案中,如本文所描述的CRISPR系统或其使用方法可以用于确定病原体爆发的演变。方法可以包括检测来自一个或多个受试者的多个样品的一个或多个靶序列,其中靶序列是来自引起爆发的微生物的序列。此种方法还可以包括确定病原体传播的模式,或由病原体引起的疾病爆发中所涉及的机制。
病原体传播的模式可以包括从病原体的天然储库的持续新传播或在从天然储库的单个传播之后受试者与受试者之间的传播(例如人与人之间的传播),或两种的混合情况。在一个实施方案中,病原体传播可以是细菌或病毒传播,在此种情况下,靶序列优选地是微生物基因组或其片段。在一个实施方案中,病原体传播的模式是病原体传播的早期模式,即,在病原体爆发开始时。在爆发开始时确定病原体传播的模式增加了在最早可能的时间阻止爆发的可能性,从而降低本地和国际蔓延的可能性。
确定病原体传播的模式可以包括根据本文所描述的方法检测病原体序列。确定病原体传播的模式还可以包括检测受试者之间的病原体序列的共享宿主内变异以及确定共享宿主内变异是否显示时序模式。所观测的宿主内和宿主间变异中的模式提供了关于传播和流行病学的重要见解(Gire等,2014)。
显示时序模式的在受试者之间的共享宿主内变异的检测是受试者之间(特别是人之间)的传播链路的指示,这是因为其可以由来自多个来源的受试者感染(超感染)、样品污染重现性突变(在存在或不存在平衡选择以加强突变的情况下)或在传播链中较早由突变产生的略有分歧病毒的共传播来解释(Park等,Cell 161(7):1516-1526,2015)。受试者之间的共享宿主内变异的检测可以包括位于共同单核苷酸多态性(SNP)位置处的宿主内变体的检测。位于共同(SNP)位置处的宿主内变体的阳性检测指示超感染和污染作为关于宿主内变体的主要解释。超感染和污染可以在作为宿主间变体出现的SNP频率的基础上分开(Park等,2015)。其他方式的超感染和污染可以排除在外。在这种后者的情况下,受试者之间的共享宿主内变异的检测还可以包括评价同义和非同义变体的频率以及相互比较同义和非同义变体的频率。非同义突变是改变蛋白质的氨基酸的突变,这可能引起经受自然选择的微生物中的生物变化。同义取代不改变氨基酸序列。同义和非同义变体的同等频率指示中性演变的宿主内变体。如果同义和非同义变体的频率有分歧,那么宿主内变体可能通过平衡选择来维持。如果同义和非同义变体的频率很低,那么这指示重现性突变。如果同义和非同义变体的频率很高,那么这指示共传播(Park等,2015)。
如同埃博拉病毒一样,拉沙病毒(LASV)可以导致具有高病例致死率的出血热。Andersen等生成了来自临床和啮齿动物储库样品的将近200个LASV序列的基因组目录(Andersen等,Cell第162卷,第4期,第738-750页,2015年8月13日)。Andersen等显示,尽管2013-2015年EVD流行病由人与人之间的传播推动,但LASV感染主要由储库与人之间的感染引起。Andersen等阐明LASV跨越西非的扩散并且显示这种迁移伴有LASV基因组丰度、致死率、密码子适应和翻译效率的变化。方法还可以包括在系统发生上比较第一病原体序列与第二病原体序列,以及确定第一病原体序列与第二病原体序列之间是否存在系统发生关联。第二病原体序列可以是较早参考序列。如果存在系统发生关联,那么方法还可以包括针对第二病原体序列追溯第一病原体序列的系统发生的根源。因此,有可能构建第一病原体序列的谱系(Park等,2015)。
方法还可以包括确定突变是有害的还是适应性的。有害突变指示传播受损病毒和终端感染,因此通常仅在个别受试者中存在。一个个别受试者独有的突变是系统发生树的外枝上出现的那些,而内枝突变是多个样品中(即,多个受试者中)存在的那些。较高非同义取代率是系统发生树的外枝的特征(Park等,2015)。
在系统发生树的内枝中,选择已经有更多机会来滤除有害突变体。根据定义,内枝已经产生多个派生谱系并且因此不太可能包括具有适合度代价的突变。因此,较低非同义取代率指示内枝(Park等,2015)。
可能对适合度具有较少影响的同义突变在内枝和外枝上以更可比的频率出现(Park等,2015)。
通过分析测序的靶序列,例如病毒基因组,有可能发现造成例如在2014年埃博拉爆发期间流行病发作的严重性的机制。举例来说,Gire等作出2014年爆发的基因组与来自较早爆发的全部20种基因组的系统发生比较,表明2014年西非病毒可能在过去十年内从中非扩散。使用与其他埃博拉病毒基因组的分歧追溯系统发生的根源是成问题的(6、13)。然而,追溯树的最早爆发的根源揭示样品日期与根部至尖端距离之间的强相关性,其中每年每个地点的取代率为8×10-4(13)。这表明三次最新爆发的谱系全部在大致相同的时间,即,2004年左右从共同祖先分出,这提出了以下假设:每次爆发表示来自天然储库中的相同遗传多样性病毒群体的独立人畜共患事件。还发现,2014年EBOV爆发可能由从天然储库的单个传播引起,继而在爆发期间在人与人之间传播。其结果还表明,塞拉利昂的流行病发作可能起源于大约在相同时间从几内亚引入两种遗传上截然不同的病毒(Gire等,2014)。
还已经有可能确定拉沙病毒如何从其起源点扩散开,尤其归功于人与人之间的传播并且甚至有可能回溯到400年前这种扩散的历史(Andersen等,Cell 162(4):738-50,2015)。
与在2013-2015年EBOV爆发期间所需的工作和在爆发地点医疗人员所遭遇的困难相关,并且更一般来说,本发明的方法使得有可能使用较少选择的探针进行测序以便可以加速测序,由此缩短从获取样品至取得结果所需的时间。此外,试剂盒和系统可以被设计成实地可用以便可以容易地进行患者的诊断而无需将样品发送或运送至国家或世界的另一个地区。
在上文所描述的任何方法中,对靶序列或其片段进行测序可以使用上文所描述的测序过程中的任一种。此外,对靶序列或其片段进行测序可以是近实时测序。对靶序列或其片段进行测序可以根据先前所描述的方法进行(Experimental Procedures:Matranga等,2014;以及Gire等,2014)。对靶序列或其片段进行测序可以包括多个靶序列的平行测序。对靶序列或其片段进行测序可以包括Illumina测序。
分析杂交至所选探针中的一个或多个的靶序列或其片段可以是鉴别分析,其中所选探针杂交至靶序列或其片段指示样品内靶序列的存在。
当前,主要诊断是基于患者所具有的症状。然而,各种疾病可能共享相同的症状,使得诊断太依赖于统计。举例来说,疟疾触发类流感症状:头痛、发热、寒颤、关节疼痛、呕吐、溶血性贫血、黄疸、尿液中的血红蛋白、视网膜损伤和惊厥。这些症状对于败血病、胃肠炎和病毒性疾病也是常见的。在后者当中,埃博拉出血热具有以下症状:发热、咽喉痛、肌肉疼痛、头痛、呕吐、腹泻、皮疹、肝和肾功能下降、内出血和外出血。
当将患者递交给医疗单位时,例如在热带非洲,基础诊断将推断为疟疾,这是因为在统计上,疟疾是在非洲的那个地区内最可能的疾病。因此针对疟疾治疗患者,不过患者可能实际上并未染上这种疾病并且患者未得到正确治疗而死亡。正确治疗的这种缺乏可能是威胁生命的,尤其当患者所染上的疾病呈现出快速演变时。在医疗人员认识到给予患者的治疗是无效的并且获得正确诊断并向患者施用足够的治疗之前可能为时已晚。
本发明的方法提供了这种情况的解决方案。确实,因为向导RNA的数目可以显著减少,所以这使得有可能在单个芯片上提供分成组的所选探针,每组对一种疾病具有特异性,以便可以同时诊断多种疾病,例如病毒感染。归功于本发明,在单个芯片上可以同时诊断多于3种疾病,优选地多于4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种疾病,优选地在给定的地理区域的群体内最常出现的疾病。因为每组所选探针对诊断的疾病中的一种具有特异性,所以可以进行更准确诊断,由此减少向患者施用错误治疗的风险。
在其他情况下,例如病毒感染的疾病可能在无任何症状下发生,或已经引起症状,但在将患者递交给医疗人员之前症状消散。在此类情况下,患者不寻求任何医疗救助或在递交当天归因于症状的缺乏而使诊断变得复杂。
本发明还可以与诊断疾病、鉴别病原体以及基于核酸,例如未纯化粗样品中的mRNA的检测优化治疗的其他方法相配合使用。
本发明的方法还提供了一种用以处理这种情况的强有力工具。确实,因为在单个诊断内包括多组所选向导RNA,每组对在给定区域的群体内出现的最常见疾病具有特异性,所以医疗人员仅需要使获自患者的生物样品与芯片接触。读取芯片揭示患者已染上的疾病。
在一些情况下,将患者递交给医疗人员用于特定症状的诊断。本发明的方法使得有可能不仅鉴别哪种疾病引起这些症状,而且同时确定患者是否罹患其未察觉的另一种疾病。
当探索爆发的机制时,这种信息可能至关重要。确实,具有相同病毒的患者组还显示时序模式,表明受试者与受试者之间的传播链路。
筛选微生物遗传扰动
在某些示例性实施方案中,本文所公开的CRISPR系统可以用于筛选微生物遗传扰动。此类方法可以适用于例如制定出微生物途径和功能网络。可以对微生物细胞进行遗传修饰,然后在不同实验条件下筛选。如上文所描述,本文所公开的实施方案可以按多元方式筛选单个样品中的多个靶分子或单个个别离散容积中的单个标靶。可以对遗传修饰的微生物进行修饰以包括鉴别由特定微生物细胞或微生物细胞群体携带的特定遗传修饰的核酸条形码序列。条形码是用作标识符的核苷酸(例如DNA、RNA或它们的组合)的短序列。核酸条形码可以具有4-100个核苷酸的长度并且是单链或双链的。用条形码鉴别细胞的方法在本领域中是已知的。因此,本文所描述的CRISPR效应系统的向导RNA可以用于检测条形码。检测到阳性可检测信号指示样品中特定遗传修饰的存在。本文所公开的方法可以与检测互补基因型或表型读出的其他方法组合,指示在所测试的实验条件下遗传修饰的作用。有待筛选的遗传修饰可以包括但不限于基因敲入、基因敲除、倒位、易位、转座,或一个或多个核苷酸插入、缺失、取代、突变,或具有功能结果的编码表位的核酸的添加,所述功能结果例如改变蛋白质稳定性或检测。以类似方式,本文所描述的方法可以用于合成生物学应用中以筛选基因调控元件和基因表达模块的特定排列的功能性。
在某些示例性实施方案中,方法可以用于筛选亚等位基因。亚等位基因的产生和其鉴别关键细菌功能性基因的用途以及新抗生素治疗剂的鉴别如2016年11月4日提交的题为"Multiplex High-Resolution Detection of Micro-organism Strains,RelatedKits,Diagnostic Methods and Screening Assays"的PCT/US2016/060730中公开,其以引用的方式并入本文中。
不同实验条件可以包括微生物细胞暴露于不同化学剂、化学剂组合、不同浓度的化学剂或化学剂组合、暴露于化学剂或化学剂组合的不同持续时间、不同物理参数,或两者。在某些示例性实施方案中,化学剂是抗生素或抗病毒剂。有待筛选的不同物理参数可以包括不同温度、大气压、不同大气气体和非大气气体浓度、不同pH水平、不同培养基组成,或它们的组合。
筛选环境样品
本文所公开的方法还可以用于通过检测靶核酸或多肽的存在针对污染物筛选环境样品。举例来说,在一些实施方案中,本发明提供了一种用于检测微生物的方法,所述方法包括:使如本文所描述的CRISPR系统暴露于样品;经由一种或多种向导RNA结合至一种或多种微生物特异性靶RNA或一种或多种触发RNA来活化RNA效应蛋白以便产生可检测的阳性信号。可以检测阳性信号并且指示样品中一种或多种微生物的存在。在一些实施方案中,CRISPR系统可以在如本文所描述的衬底上,并且衬底可以暴露于样品。在其他实施方案中,可以将相同CRISPR系统和/或不同CRISPR系统施加至衬底上的多个离散位置。在其他实施方案中,不同CRISPR系统可以检测每个位置处的不同微生物。如上文进一步详细描述,衬底可以是柔性材料衬底,例如包括但不限于纸衬底、织物衬底或基于柔性聚合物的衬底。
根据本发明,通过将衬底短暂浸入有待取样的流体中,通过将有待测试的流体施加至衬底,或通过使有待测试的表面与衬底接触,可以使衬底被动暴露于样品。视情况而定,可以使用将样品引入衬底的任何方式。
如本文所描述,用于本发明的样品可以是生物或环境样品,例如食物样品(新鲜水果或蔬菜、肉)、饮料样品、纸表面、织物表面、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品、暴露于大气或其他气体样品,或它们的组合。举例来说,可以拭抹由包括但不限于金属、木材、塑料、橡胶等的任何材料制成的家用/商业/工业表面并测试污染物。可以针对病原性细菌或寄生虫或者其他微生物的存在测试土壤样品,用于环境目的和/或用于人、动物或植物疾病测试。可以评估例如淡水样品、废水样品或盐水样品的水样品的清洁度和安全性和/或可饮用性,以检测例如微小隐孢子虫(Cryptosporidiumparvum)、蓝氏贾第鞭毛虫(Giardia lamblia)或其他微生物污染的存在。在其他实施方案中,生物样品可以获自以下来源:包括但不限于组织样品、唾液、血液、血浆、血清、粪便、尿液、痰液、粘液、淋巴、滑液、脑脊髓液、腹水、胸腔积液、血清肿、脓液,或皮肤或粘膜表面的拭子。在一些特定实施方案中,环境样品或生物样品可以是粗样品和/或在应用方法之前一种或多种靶分子可能未从样品纯化或扩增。微生物的鉴别可以适用于许多应用和/或为许多应用所需,并且因此可以根据本发明使用本领域技术人员认为适当的来自任何来源的任何类型的样品。
在一些实施方案中,在餐馆或其他食物提供方、食物表面检查细菌,例如大肠杆菌对食物的污染;测试水的病原体,如沙门氏菌属、弯曲杆菌属或大肠杆菌;以及为制造商和监管方检查食物质量以确定肉源的纯净度;鉴别受病原体,例如军团菌属的空气污染;检查啤酒是否受病原体,如片球菌属(Pediococcus)和乳杆菌属污染或腐败;在制造期间细菌或真菌对巴式灭菌或未巴式灭菌的奶酪的污染。
根据本发明的微生物可以是病原性微生物或者引起食物或可消耗产品腐败的微生物。病原性微生物可能对于人、动物或植物是病原性的或以其他方式不合乎需要。对于人或动物来说,微生物可以引起疾病或导致疾患。本发明的动物或兽医应用可以鉴别受微生物感染的动物。举例来说,本发明的方法和系统可以鉴别具有病原体,包括但不限于犬窝咳、狂犬病病毒和犬恶丝虫的伴侣动物。在其他实施方案中,本发明的方法和系统可以出于育种目的用于亲缘测试。植物微生物可以导致对植物的伤害或疾病、产量减少,或改变性状,例如颜色、口味、稠度、气味。对于食物或可消耗的污染来说,微生物可以不利地影响食物或可消耗产品的口味、气味、颜色、稠度或其他商业特性。在某些示例性实施方案中,微生物是细菌种类。细菌可以是兼性嗜冷菌(psychrotroph)、大肠菌、乳酸菌或形成芽孢的细菌。在某些示例性实施方案中,细菌可以是引起疾病或疾患,或以其他方式导致不合需要的产物或性状的任何细菌种类。根据本发明的细菌可能对于人、动物或植物是病原性。
样品类型
用于本文所公开的方法中的适当样品包括获自生物体或其一部分,例如植物、动物、细菌等的任何常规生物样品。在特定实施方案中,生物样品获自动物受试者,例如人受试者。生物样品是获自以下任何活生物体、由其排泄或分泌的任何固体或流体样品:包括但不限于单细胞生物体,尤其例如细菌、酵母、原生动物和阿米巴虫;多细胞生物体(例如植物或动物,包括来自健康或表观健康人受试者或受有待诊断或研究的状况或疾病影响的人患者的样品,所述状况或疾病例如受病原性微生物,例如病原性细菌或病毒感染)。举例来说,生物样品可以是获自以下的生物流体:例如血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、流出物(例如获自脓肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节或受例如类风湿性关节炎、骨关节炎、痛风或化脓性关节炎的疾病影响的关节)的流体,或皮肤或粘膜表面的拭子。
样品还可以是获自任何器官或组织的样品(包括活检或尸检样本,例如肿瘤活检体),或可以包括细胞(无论是初级细胞还是培养的细胞)或由任何细胞、组织或器官调节的培养基。示例性样品包括但不限于细胞、细胞裂解产物、血液涂片、细胞离心制剂、细胞学涂片、体液(例如血液、血浆、血清、唾液、痰液、尿液、支气管肺泡灌洗液、精液等)、组织活检体(例如肿瘤活检体)、细针抽吸液,和/或组织切片(例如冷冻组织切片和/或石蜡包埋组织切片)。在其他实例中,样品包括循环肿瘤细胞(其可以由细胞表面标志鉴别)。在特定实例中,样品直接使用(例如新鲜或冷冻的),或可以在使用前例如通过固定(例如使用福尔马林)和/或包埋于蜡中(例如福尔马林固定石蜡包埋(FFPE)组织样品)来操作。将了解,可以利用从受试者获得组织的任何方法,并且所用方法的选择将取决于各种因素,例如组织类型、受试者年龄或从业者可用的程序。用于获得此类样品的标准技术在本领域中是可用的。参见例如Schluger等,J.Exp.Med.176:1327-33(1992);Bigby等,Am.Rev.Respir.Dis.133:515-18(1986);Kovacs等,NEJM 318:589-93(1988);以及Ognibene等,Am.Rev.Respir.Dis.129:929-32(1984)。
在其他实施方案中,样品可以是环境样品,例如水、土壤或表面,例如工业或医学表面。在一些实施方案中,例如美国专利公布号2013/0190196中所公开的那些的方法可以应用于在高度灵敏度和特异性下检测直接来自粗细胞样品的核酸标识,特别是RNA水平。对所关注的每个病原体具有特异性的序列可以通过由BLAST软件比较来自所关注的病原体的编码序列与其他生物体中的所有编码序列来鉴别或选择。
本公开的若干实施方案涉及使用本领域中已知的程序和方法以将临床血液样品成功分级。参见例如以下文献中所描述的程序:Han Wei Hou等,Microfluidic Devicesfor Blood Fractionation,Micromachines 2011,2,319-343;Ali Asgar S.Bhagat等,Dean Flow Fractionation(DFF)Isolation of Circulating Tumor Cells(CTCs)fromBlood,15th International Conference on Miniaturized Systems for Chemistry andLife Sciences,2011年10月2日-6日,Seattle,WA;以及国际专利公布号WO2011109762,其公开内容以全文引用的方式并入本文中。血液样品通常在培养物中扩充以增加用于测试目的的样品大小。在本发明的一些实施方案中,血液或其他生物样品可以用于如本文所描述的方法中而无需在培养物中扩充。
此外,本公开的若干实施方案涉及使用本领域中已知的程序和方法以使用螺旋形微通道从全血中成功分离病原体,如Han Wei Hou等,Pathogen Isolation from WholeBlood Using Spiral Microchannel,案号15995JR,Massachusetts Institute ofTechnology(原稿在准备中)所描述,其公开内容以全文引用的方式并入本文中。
归因于本文所公开的实施方案的灵敏度增加,在某些示例性实施方案中,测定和方法可以在粗样品或有待检测的靶分子未从样品进一步分级或纯化的样品上运作。
示例性微生物
本文所公开的实施方案可以用于检测许多不同微生物。如本文所用的术语微生物包括细菌、真菌、原生动物、寄生虫和病毒。
细菌
以下提供了可能使用本文所公开的实施方案检测的微生物类型的示例性清单。在某些示例性实施方案中,微生物是细菌。可以根据所公开的方法检测的细菌的实例包括但不限于以下任何一种或多种(或其任何组合):鲍曼不动杆菌(Acinetobacter baumanii)、放线杆菌属种(Actinobacillus sp.)、放线菌(Actinomycetes)、放线菌属种(Actinomycessp.)(例如伊氏放线菌(Actinomyces israelii)和内氏放线菌(Actinomycesnaeslundii))、气单胞菌属种(Aeromonas sp.)(例如嗜水气单胞菌(Aeromonashydrophila)、凡隆气单胞菌温和生物型(Aeromonas veronii biovar sobria)(温和气单胞菌(Aeromonas sobria))和豚鼠气单胞菌(Aeromonas caviae))、嗜吞噬细胞无浆体(Anaplasma phagocytophilum)、边缘无浆体(Anaplasma marginale)、木糖氧化产碱菌(Alcaligenes xylosoxidans)、鲍曼不动杆菌、伴放线菌放线杆菌(Actinobacillusactinomycetemcomitans)、芽孢杆菌属种(Bacillus sp.)(例如炭疽芽孢杆菌(Bacillusanthracis)、蜡样芽孢杆菌、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)和嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))、拟杆菌属种(Bacteroides sp.)(例如脆弱拟杆菌(Bacteroides fragilis))、巴尔通体属种(Bartonella sp.)(例如杆菌状巴尔通体(Bartonella bacilliformis)和汉氏巴尔通体(Bartonella henselae))、双歧杆菌属种(Bifidobacterium sp.)、博德特氏菌属种(Bordetella sp.)(例如百日咳博德特氏菌(Bordetella pertussis)、副百日咳博德特氏菌(Bordetella parapertussis)和支气管炎博德特氏菌(Bordetella bronchiseptica))、疏螺旋体属种(Borrelia sp.)(例如回归热疏螺旋体(Borrelia recurrentis)和伯氏疏螺旋体(Borrelia burgdorferi))、布鲁氏菌属种(Brucella sp.)(例如流产布鲁氏菌(Brucella abortus)、犬布鲁氏菌(Brucella canis)、羊布鲁氏菌(Brucellamelintensis)和猪布鲁氏菌(Brucella suis))、伯克氏菌属种(Burkholderia sp.)(例如类鼻疽伯克氏菌(Burkholderia pseudomallei)和洋葱伯克氏菌(Burkholderiacepacia))、弯曲杆菌属种(Campylobacter sp.)(例如空肠弯曲杆菌、结肠弯曲杆菌(Campylobacter coli)、红嘴鸥弯曲杆菌(Campylobacter lari)和胎儿弯曲杆菌(Campylobacter fetus))、二氧化碳嗜纤维菌属种(Capnocytophaga sp.)、人心杆菌(Cardiobacterium hominis)、沙眼衣原体(Chlamydia trachomatis)、肺炎嗜衣原体(Chlamydophila pneumoniae)、鹦鹉热嗜衣原体(Chlamydophila psittaci)、柠檬酸杆菌属种(Citrobacter sp.)、贝氏柯克斯体、棒状杆菌属种(Corynebacterium sp.)(例如白喉棒杆菌(Corynebacterium diphtheriae)、杰氏棒杆菌(Corynebacterium jeikeum)和棒杆菌(Corynebacterium))、梭菌属种(Clostridium sp.)(例如产气荚膜梭菌、艰难梭菌(Clostridium difficile)、肉毒梭菌(Clostridium botulinum)和破伤风梭菌(Clostridium tetani))、啮蚀艾肯菌(Eikenella corrodens)、肠杆菌属种(Enterobactersp.)(例如产气肠杆菌(Enterobacter aerogenes)、聚团肠杆菌(Enterobacteragglomerans)、阴沟肠杆菌(Enterobacter cloacae)和大肠杆菌,包括机会大肠杆菌,例如肠产毒性大肠杆菌、肠侵袭性大肠杆菌、肠致病性大肠杆菌、肠出血性大肠杆菌、肠聚集性大肠杆菌和尿道致病性大肠杆菌)、肠球菌属种(Enterococcus sp.)(例如粪肠球菌(Enterococcus faecalis)和屎肠球菌(Enterococcus faecium))、埃立克体属种(Ehrlichia sp.)(例如恰菲埃立克体(Ehrlichia chafeensia)和犬埃立克体(Ehrlichiacanis))、絮状表皮癣菌(Epidermophyton floccosum)、红斑丹毒丝菌(Erysipelothrixrhusiopathiae)、真杆菌属种(Eubacterium sp.)、土拉弗朗西斯菌(Francisellatularensis)、具核梭杆菌(Fusobacterium nucleatum)、阴道加德纳菌(Gardnerellavaginalis)、麻疹双球菌(Gemella morbillorum)、嗜血杆菌属种(Haemophilus sp.)(例如流感嗜血杆菌(Haemophilus influenzae)、杜克雷嗜血杆菌(Haemophilus ducreyi)、埃及嗜血杆菌(Haemophilus aegyptius)、副流感嗜血杆菌(Haemophilus parainfluenzae)、溶血嗜血杆菌(Haemophilus haemolyticus)和副溶血嗜血杆菌(Haemophilusparahaemolyticus))、螺杆菌属种(Helicobacter sp.)(例如幽门螺杆菌(Helicobacterpylori)、同性恋螺杆菌(Helicobacter cinaedi)和芬纳尔螺杆菌(Helicobacterfennelliae))、金氏金氏菌(Kingella kingii)、克雷伯菌属种(Klebsiella sp.)(例如肺炎克雷伯菌、肉芽肿克雷伯菌(Klebsiella granulomatis)和产酸克雷伯菌(Klebsiellaoxytoca))、乳杆菌属种(Lactobacillus sp.)、单核细胞增多性李斯特菌、问号钩端螺旋体(Leptospira interrogans)、嗜肺军团菌(Legionella pneumophila)、问号钩端螺旋体、消化链球菌属种(Peptostreptococcus sp.)、溶血性曼氏杆菌(Mannheimia hemolytica)、犬小孢子菌(Microsporum canis)、卡他莫拉菌(Moraxella catarrhalis)、摩根氏菌属种(Morganella sp.)、动弯杆菌属种(Mobiluncus sp.)、微球菌属种(Micrococcus sp.)、分枝杆菌属种(Mycobacterium sp.)(例如麻风分枝杆菌(Mycobacterium leprae)、结核分枝杆菌、副结核分枝杆菌(Mycobacterium paratuberculosis)、胞内分枝杆菌(Mycobacterium intracellulare)、鸟分枝杆菌(Mycobacterium avium)、牛分枝杆菌(Mycobacterium bovis)和海洋分枝杆菌(Mycobacterium marinum))、支原体属种(Mycoplasm sp.)(例如肺炎支原体(Mycoplasma pneumoniae)、人支原体(Mycoplasmahominis)和生殖支原体(Mycoplasma genitalium))、诺卡氏菌属种(Nocardia sp.)(例如星形诺卡氏菌(Nocardia asteroides)、奶牛乳房炎性诺卡氏菌(Nocardiacyriacigeorgica)和巴西诺卡氏菌(Nocardia brasiliensis))、奈瑟氏菌属种(Neisseriasp.)(例如淋病奈瑟氏菌(Neisseria gonorrhoeae)和脑膜炎奈瑟氏菌(Neisseriameningitidis))、多杀巴斯德菌(Pasteurella multocida)、糠秕孢子菌(Pityrosporumorbiculare)(糠秕马拉色菌(Malassezia furfur))、类志贺邻单胞菌、普雷沃菌属、卟啉单胞菌属、产黑普雷沃菌(Prevotella melaninogenica)、变形杆菌属种(Proteus sp.)(例如普通变形杆菌(Proteus vulgaris)和奇异变形杆菌(Proteus mirabilis))、普罗威登斯菌属种(Providencia sp.)((例如产碱普罗威登斯菌(Providencia alcalifaciens)、雷氏普罗威登斯菌(Providencia rettgeri)和斯氏普罗威登斯菌(Providencia stuartii))、绿脓假单胞菌、痤疮丙酸杆菌(Propionibacterium acnes)、马红球菌(Rhodococcus equi)、立克次体属种(Rickettsia sp.)(例如立氏立克次体(Rickettsia rickettsii)、小蛛立克次体(Rickettsia akari)和普氏立克次体(Rickettsia prowazekii)、恙虫病东方体(Orientia tsutsugamushi)(原名:恙虫病立克次体(Rickettsia tsutsugamushi))和伤寒立克次体(Rickettsia typhi))、红球菌属种(Rhodococcus sp.)、粘质沙雷氏菌(Serratiamarcescens)、嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)、沙门氏菌属种(Salmonella sp.)(例如肠沙门氏菌(Salmonella enterica)、伤寒沙门氏菌(Salmonellatyphi)、副伤寒沙门氏菌(Salmonella paratyphi)、肠炎沙门氏菌(Salmonellaenteritidis)、猪霍乱沙门氏菌(Salmonella cholerasuis)和鼠伤寒沙门氏菌(Salmonella typhimurium))、沙雷氏菌属种(Serratia sp.)(例如粘质沙雷氏菌(Serratia marcesans)和液化沙雷氏菌(Serratia liquifaciens))、志贺氏菌属种(Shigella sp.)(例如痢疾志贺氏菌(Shigella dysenteriae)、福氏志贺氏菌(Shigellaflexneri)、鲍氏志贺氏菌(Shigella boydii)和宋内志贺氏菌(Shigella sonnei))、葡萄球菌属种(Staphylococcus sp.)(例如金黄色葡萄球菌、表皮葡萄球菌(Staphylococcusepidermidis)、溶血葡萄球菌(Staphylococcus hemolyticus)、腐生葡萄球菌(Staphylococcus saprophyticus))、链球菌属种(Streptococcus sp.)(例如肺炎链球菌(Streptococcus pneumoniae)(例如氯霉素(chloramphenicol)抗性血清型4肺炎链球菌、壮观霉素(spectinomycin)抗性血清型6B肺炎链球菌、链霉素(streptomycin)抗性血清型9V肺炎链球菌、红霉素(erythromycin)抗性血清型14肺炎链球菌、奥普托欣(optochin)抗性血清型14肺炎链球菌、利福平(rifampicin)抗性血清型18C肺炎链球菌、四环素(tetracycline)抗性血清型19F肺炎链球菌、青霉素(penicillin)抗性血清型19F肺炎链球菌和甲氧苄啶(trimethoprim)抗性血清型23F肺炎链球菌、氯霉素抗性血清型4肺炎链球菌、壮观霉素抗性血清型6B肺炎链球菌、链霉素抗性血清型9V肺炎链球菌、奥普托欣抗性血清型14肺炎链球菌、利福平抗性血清型18C肺炎链球菌、青霉素抗性血清型19F肺炎链球菌或甲氧苄啶抗性血清型23F肺炎链球菌))、无乳链球菌(Streptococcus agalactiae)、变异链球菌(Streptococcus mutans)、化脓链球菌(Streptococcus pyogenes)、A群链球菌(Group A streptococci)、化脓链球菌、B群链球菌(Group B streptococci)、无乳链球菌、C群链球菌(Group C streptococci)、咽峡炎链球菌(Streptococcus anginosus)、类马链球菌(Streptococcus equismilis)、D群链球菌(Group D streptococci)、牛链球菌(Streptococcus bovis)、F群链球菌(Group F streptococci)和咽峡炎链球菌G群链球菌(Group G streptococci))、小螺菌(Spirillum minus)、念珠状链杆菌(Streptobacillusmoniliformi)、密螺旋体属种(Treponema sp.)(例如斑点密螺旋体(Treponemacarateum)、细弱密螺旋体(Treponema petenue)、苍白密螺旋体(Treponema pallidum)和地方性密螺旋体(Treponema endemicum))、红色毛癣菌(Trichophyton rubrum)、须癣毛癣菌(T.mentagrophytes)、惠普尔养障体(Tropheryma whippelii)、解脲脲原体(Ureaplasmaurealyticum)、韦荣氏球菌属种(Veillonella sp.)、弧菌属种(Vibrio sp.)(例如霍乱弧菌、副溶血弧菌(Vibrio parahaemolyticus)、创伤弧菌、副溶血弧菌、创伤弧菌、溶藻弧菌(Vibrio alginolyticus)、拟态弧菌(Vibrio mimicus)、霍利斯弧菌(Vibrio hollisae)、河流孤菌(Vibrio fluvialis)、麦奇尼科夫氏弧菌(Vibrio metchnikovii)、海鱼弧菌(Vibrio damsela)和弗氏弧菌(Vibrio furnisii))、耶尔森菌属种(Yersinia sp.)(例如小肠结肠炎耶尔森菌、鼠疫耶尔森菌(Yersinia pestis)和假结核耶尔森菌)以及嗜麦芽黄单胞菌(Xanthomonas maltophilia)。
真菌
在某些示例性实施方案中,微生物是真菌或真菌种类。可以根据所公开的方法检测的真菌的实例包括但不限于以下任何一种或多种(或其任何组合):曲霉(Aspergillus)、芽生菌(Blastomyces)、念珠菌(Candidiasis)、球孢子菌(Coccidiodomycosis)、新型隐球菌(Cryptococcus neoformans)、格特隐球菌(Cryptococcus gatti)、组织胞浆菌属种(sp.Histoplasma sp.)(例如荚膜组织胞浆菌(Histoplasma capsulatum))、肺孢子菌属种(Pneumocystis sp.)(例如耶氏肺孢子菌(Pneumocystis jirovecii))、葡萄穗霉(Stachybotrys)(例如黑葡萄穗霉(Stachybotrys chartarum))、毛霉菌(Mucroymcosis)、孢子丝菌(Sporothrix)、眼真菌感染环癣、突脐蠕孢(Exserohilum)、枝孢霉(Cladosporium)。
在某些示例性实施方案中,真菌是酵母。可以根据所公开的方法检测的酵母的实例包括但不限于以下一种或多种(或其任何组合):曲霉属(例如烟曲霉(Aspergillusfumigatus)、黄曲霉(Aspergillus flavus)和棒曲霉(Aspergillus clavatus))、隐球菌属种(Cryptococcus sp.)(例如新型隐球菌、格特隐球菌(Cryptococcus gattii)、罗伦隐球菌(Cryptococcus laurentii)和浅白隐球菌(Cryptococcus albidus))、地霉(Geotrichum)属、酵母(Saccharomyces)属、汉逊酵母(Hansenula)属、念珠菌(Candida)属(例如白色念珠菌(Candida albicans))、克鲁维酵母(Kluyveromyces)属、德巴利酵母(Debaryomyces)属、毕赤酵母(Pichia)属或它们的组合。在某些示例性实施方案中,真菌是霉菌。示例性霉菌包括但不限于青霉(Penicillium)属、枝孢霉属、丝衣霉(Byssochlamys)属或它们的组合。
原生动物
在某些示例性实施方案中,微生物是原生动物。可以根据所公开的方法和装置检测的原生动物的实例包括但不限于以下任何一种或多种(或其任何组合):眼虫动物界(Euglenozoa)、异叶足纲(Heterolobosea)、双滴虫目(Diplomonadida)、变形虫界(Amoebozoa)、芽囊原虫属(Blastocystic)和顶复亚门(Apicomplexa)。示例性眼虫动物界包括但不限于克氏锥虫(Trypanosoma cruzi)(查加斯病(Chagas disease))、布氏冈比亚锥虫(T.brucei gambiense)、布氏罗得西亚锥虫(T.brucei rhodesiense)、巴西利什曼原虫(Leishmania braziliensis)、婴儿利什曼原虫(L.infantum)、墨西哥利什曼原虫(L.mexicana)、大型利什曼原虫(L.major)、热带利什曼原虫(L.tropica)和杜氏利什曼原虫(L.donovani)。示例性异叶足纲包括但不限于福氏耐格里变形虫(Naegleria fowleri)。示例性双滴虫目包括但不限于肠贾第虫(Giardia intestinalis)(兰伯氏贾第虫(G.lamblia)、十二指肠贾第虫(G.duodenalis))。示例性变形虫界包括但不限于卡氏棘阿米巴(Acanthamoeba castellanii)、狒狒巴拉姆希阿米巴(Balamuthia madrillaris)、溶组织内阿米巴(Entamoeba histolytica)。示例性芽囊原虫属包括但不限于人芽囊原虫(Blastocystic hominis)。示例性顶复亚门包括但不限于微小巴贝虫(Babesia microti)、微小隐孢子虫、卡耶他环孢子虫(Cyclospora cayetanensis)、恶性疟原虫(Plasmodiumfalciparum)、间日疟原虫(P.vivax)、卵形疟原虫(P.ovale)、三日疟原虫(P.malariae)和刚地弓形虫(Toxoplasma gondii)、微小巴贝虫、微小隐孢子虫、卡耶他环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫。
寄生虫
在某些示例性实施方案中,微生物是寄生虫。可以根据所公开的方法检测的寄生虫的实例包括但不限于以下一种或多种(或其任何组合):盘尾丝虫(Onchocerca)属和疟原虫(Plasmodium)属。
病毒
在某些示例性实施方案中,本文所公开的系统、装置和方法涉及检测样品中的病毒。本文所公开的实施方案可以用于检测病毒感染(例如受试者或植物的病毒感染),或确定病毒株,包括因单核苷酸多态性而不同的病毒株。病毒可以是DNA病毒、RNA病毒或逆转录病毒。适用于本发明的病毒的非限制性实例包括但不限于埃博拉、麻疹、SARS、基孔肯雅、肝炎、马尔堡、黄热病、MERS、登革、拉沙、流感、棒状病毒或HIV。肝炎病毒可以包括甲型肝炎、乙型肝炎或丙型肝炎。流感病毒可以包括例如甲型流感或乙型流感。HIV可以包括HIV 1或HIV 2。在某些示例性实施方案中,病毒序列可以是人呼吸道合胞病毒、苏丹埃博拉病毒(Sudan ebola virus)、本迪布焦病毒(Bundibugyo virus)、大森林埃博拉病毒(TaiForest ebola virus)、雷斯顿埃博拉病毒(Reston ebola virus)、阿基莫塔(Achimota)、伊蚊黄病毒、艾顾凯特病毒(Aguacate virus)、阿卡班病毒(Akabane virus)、阿德非德瑞塔沙粒病毒(Alethinophid reptarenavirus)、阿帕华约哺乳类沙粒病毒(Allpahuayomammarenavirus)、阿马帕里沙粒病毒(Amapari mmarenavirus)、安第斯病毒(Andesvirus)、阿波依病毒(Apoi virus)、阿拉万病毒(Aravan virus)、阿罗阿病毒(Aroavirus)、阿莫瓦病毒(Arumwot virus)、大西洋鲑鱼副粘病毒(Atlantic salmonparamyoxivirus)、澳洲蝙蝠狂犬病病毒(Australian bat lyssavirus)、禽波纳病毒(Avian bornavirus)、禽偏肺病毒(Avian metapneumovirus)、禽副粘病毒(Avianparamyoxvirus)、企鹅或福克兰群岛病毒(penguin or Falkland Islandsvirus)、BK多瘤病毒、巴加扎病毒(Bagaza virus)、版纳病毒(Banna virus)、蝙蝠戊型肝炎病毒(Bathepevirus)、蝙蝠札幌病毒(Bat sapovirus)、熊佳农哺乳类沙粒病毒(Bear Canonmammarenavirus)、北龙病毒(Beilong virus)、贝塔康诺病毒(Betacoronoavirus)、贝塔乳头瘤病毒1-6(Betapapillomavirus 1-6)、班杰病毒(Bhanja virus)、博克洛蝙蝠狂犬病病毒(Bokeloh bat lyssavirus)、博尔纳病病毒、波本病毒(Bourbon virus)、牛丙型肝炎病毒(Bovine hepacivirus)、牛副流感病毒3、牛呼吸道合胞病毒、巴宗病毒(Brazoranvirus)、本雅威病毒(Bunyamwere virus)、杯状病毒科病毒、加利福尼亚脑炎病毒(California encephalitis virus)、坎迪鲁病毒(Candiru virus)、犬瘟热病毒(Caninedistemper virus)、犬肺病毒(Canaine pneumovirus)、松湾病毒(Cedar virus)、细胞融合因子病毒(Cell fusing agent virus)、鲸麻疹病毒(Cetacean morbillivirus)、金迪普拉病毒(Chandipura virus)、朝阳病毒(Chaoyang virus)、查帕雷哺乳类沙粒病毒(Chaparemammarenavirus)、基孔肯雅病毒、疣猴乳头瘤病毒(Colobus monkey papillomavirus)、科罗拉多蜱传热病毒(Colorado tick fever virus)、牛痘病毒、克里米亚-刚果出血热病毒、库蚊黄病毒、库皮科斯哺乳类沙粒病毒(Cupixi mammarenavirus)、登革病毒、多布拉瓦-贝尔格莱德病毒(Dobrava-Belgrade virus)、东港病毒(Donggang virus)、杜贝病毒(Dugbevirus)、杜文海格病毒(Duvenhage virus)、东方马脑炎病毒(Eastern equineencephalitis virus)、恩德培蝙蝠病毒(Entebbe bat virus)、肠病毒A-D、欧洲蝙蝠狂犬病病毒1-2、依埃契病毒(Eyach virus)、猫麻疹病毒(Feline morbillivirus)、矛头蛇副粘病毒(Fer-de-Lance paramyxovirus)、费茨罗伊河病毒(Fitzroy River virus)、黄病毒科病毒、弗萊克索哺乳类沙粒病毒(Flexal mammarenavirus)、GB病毒C、加伊若病毒(Gairovirus)、戈麦环状病毒(Gemycircularvirus)、鹅副粘病毒SF02、大岛病毒(Great Islandvirus)、瓜纳瑞托哺乳类沙粒病毒(Guanarito mammarenavirus)、汉坦病毒(Hantaanvirus)、汉坦病毒Z10、哈特兰德病毒(Heartland virus)、亨德拉病毒、甲型/乙型/丙型/戊型肝炎、丁型肝炎病毒(Hepatitis delta virus)、人博卡病毒(Human bocavirus)、人冠状病毒、人内源逆转录病毒K、人肠道冠状病毒、人生殖器相关环状DNA病毒-1、人疱疹病毒1-8、人免疫缺陷病毒1/2、人哺乳动物腺病毒A-G(Huan mastadenovirus A-G)、人乳头瘤病毒、人副流感病毒1-4、人副肠孤病毒(Human paraechovirus)、人小双节RNA病毒(Humanpicobirnavirus)、人斯马可病毒(Human smacovirus)、艾克马狂犬病病毒(Ikomalyssavirus)、伊列乌斯病毒(Ilheus virus)、甲型-丙型流感、伊皮哺乳类沙粒病毒(Ippymammarenavirus)、伊尔库特病毒(Irkut virus)、J-病毒、JC多瘤病毒、日本脑炎病毒、胡宁哺乳类沙粒病毒(Junin mammarenavirus)、KI多瘤病毒、卡迪皮罗病毒(Kadipiro virus)、卡密河病毒(Kamiti River virus)、凯杜古病毒(Kedougou virus)、库贾德病毒(Khujandvirus)、科科贝拉病毒(Kokobera virus)、科萨努尔森林病病毒(Kyasanur forestdisease virus)、拉各斯蝙蝠病毒(Lagos bat virus)、兰加特病毒(Langat virus)、拉沙哺乳类沙粒病毒(Lassa mammarenavirus)、拉丁哺乳类沙粒病毒(Latinomammarenavirus)、罗帕德山病毒(Leopards Hill virus)、辽宁病毒(Liao ning virus)、永安河病毒(Ljungan virus)、拉洛维病毒(Lloviu virus)、跳跃病病毒(Louping illvirus)、卢约哺乳类沙粒病毒(Lujo mammarenavirus)、卢纳哺乳类沙粒病毒(Lunamammarenavirus)、伦卡病毒(Lunk virus)、淋巴细胞性脉络丛脑膜炎哺乳类沙粒病毒(Lymphocytic choriomeningitis mammarenavirus)、欧泽诺尔狂犬病病毒(LyssavirusOzernoe)、MSSI2\.225病毒、马丘波哺乳类沙粒病毒(Machupo mammarenavirus)、哺乳动物星状病毒1(Mamastrovirus 1)、曼萨尼亚病毒(Manzanilla virus)、马普埃拉病毒(Mapuera virus)、马尔堡病毒、马雅罗病毒(Mayaro virus)、麻疹病毒、梅南高病毒(Menangle virus)、摩西卡迪病毒(Mercadeo virus)、梅克尔细胞多瘤病毒(Merkel cellpolyomavirus)、中东呼吸综合征冠状病毒、莫巴拉哺乳类沙粒病毒(Mobalamammarenavirus)、摩多克病毒(Modoc virus)、莫江病毒(Moijang virus)、莫科洛病毒(Mokolo virus)、猴痘病毒、蒙大拿鼠耳蝙蝠脑白质炎病毒(Montana myotisleukoenchalitis virus)、莫佩亚拉沙病毒重排体29(Mopeia lassa virusreassortant29)、莫佩亚哺乳类沙粒病毒(Mopeia mammarenavirus)、莫罗戈罗病毒(Morogoro virus)、莫斯曼病毒(Mossman virus)、腮腺炎病毒、鼠类肺炎病毒、墨累山谷脑炎病毒(Murray Valley encephalitis virus)、纳里瓦病毒(Nariva virus)、新城疫病毒、尼帕病毒、诺瓦克病毒、挪威鼠丙型肝炎病毒(Norway rat hepacivirus)、恩塔亚病毒(Ntaya virus)、奥尼昂-尼昂病毒(O'nyong-nyong virus)、奥利韦罗斯哺乳类沙粒病毒(Oliveros mammarenavirus)、鄂木斯克出血热病毒(Omsk hemorrhagic fever virus)、奥罗普切病毒(Oropouche virus)、副流感病毒5、巴拉那哺乳类沙粒病毒(Paranamammarenavirus)、帕拉马塔河病毒(Parramatta River virus)、小型反刍动物瘟疫病毒(Peste-des-petits-ruminants virus)、毕赤德哺乳类沙粒病毒(Pichandemammarenavirus)、小RNA病毒科病毒、皮里陶哺乳类沙粒病毒(Pirital mammarenavirus)、鱼戊型肝炎病毒A(Piscihepevirus A)、猪副流感病毒1、猪腮腺炎病毒(porcinerubulavirus)、波瓦桑病毒(Powassan virus)、灵长类动物T-嗜淋巴细胞病毒1-2、灵长类动物红系细小病毒1(Primate erythroparvovirus 1)、庞塔托鲁病毒(Punta Torovirus)、普马拉病毒(Puumala virus)、广平病毒(Quang Binh virus)、狂犬病病毒、拉兹丹病毒(Razdan virus)、爬行动物博尔纳病毒(Reptile bornavirus 1)、鼻病毒A-B、里夫特山谷热病毒(Rift Valley fever virus)、牛瘟病毒、热伯维病毒(Rio Bravo virus)、啮齿动物细环病毒(Rodent Torque Teno virus)、啮齿动物丙型肝炎病毒(Rodenthepacivirus)、罗斯河病毒、轮状病毒A-I、皇家农场病毒(Royal Farm virus)、风疹病毒、萨比亚哺乳类沙粒病毒(Sabia mammarenavirus)、塞勒姆病毒(Salem virus)、那不勒斯白蛉热病毒(Sandfly fever Naples virus)、西西里白蛉热病毒(Sandfly fever Sicilianvirus)、札幌病毒(Sapporo virus)、萨苏伯里病毒(Sathuperi virus)、海豹指环病毒(Seal anellovirus)、塞姆利基森林病毒(Semliki Forest virus)、仙台病毒(Sendaivirus)、汉城病毒(Seoul virus)、塞皮克病毒(Sepik virus)、严重急性呼吸综合征相关冠状病毒、严重发热伴血小板减少综合征病毒、沙门达病毒(Shamonda virus)、希莫尼蝙蝠病毒(Shimoni bat virus)、舒尼病毒(Shuni virus)、西姆布病毒(Simbu virus)、猿猴细环病毒(Simian torque teno virus)、猿猴病毒40-41、辛诺柏病毒(Sin Nombre virus)、辛德毕斯病毒、小指环病毒(Small anellovirus)、索素佳病毒(Sosuga virus)、西班牙山羊脑炎病毒(Spanish goat encephalitis virus)、斯庞德温尼病毒(Spondweni virus)、圣路易斯脑炎病毒(St.Louis encephalitis virus)、森夏恩病毒(Sunshine virus)、TTV样微小病毒(TTV-like mini virus)、塔卡里伯哺乳类沙粒病毒(Tacaribemammarenavirus)、台依病毒(Taila virus)、塔玛纳蝙蝠病毒(Tamana bat virus)、塔米埃米哺乳类沙粒病毒(Tamiami mammarenavirus)、坦布苏病毒(Tembusu virus)、托高土病毒(Thogoto virus)、索托帕拉雅病毒(Thottapalayam virus)、蜱传脑炎病毒(Tick-borneencephalitis virus)、刁曼病毒(Tioman virus)、披膜病毒科病毒、犬细环病毒(Torqueteno canis virus)、夜猴细环病毒(Torque teno douroucouli virus)、猫细环病毒(Torque teno felis virus)、中细环病毒(Torque teno midi virus)、猪细环病毒(Torque teno sus virus)、狨猴细环病毒(Torque teno tamarin virus)、细环病毒(Torque teno virus)、海狮细环病毒(Torque teno zalophus virus)、吐霍克病毒(Tuhoko virus)、图拉病毒(Tula virus)、树鼩副粘病毒、乌苏图病毒(Usutu virus)、尤库尼米病毒(Uukuniemi virus)、痘苗病毒、天花病毒、委内瑞拉马脑炎病毒(Venezuelanequine encephalitis virus)、印第安纳水泡性口炎病毒(Vesicular stomatitisIndiana virus)、WU多瘤病毒、韦塞尔斯布朗病毒(Wesselsbron virus)、西高加索蝙蝠病毒(West Caucasian bat virus)、西尼罗河病毒、西方马脑炎病毒(Western equineencephalitis virus)、怀特沃特阿罗约哺乳类沙粒病毒(Whitewater Arroyomammarenavirus)、黄热病病毒、横须贺病毒(Yokose virus)、尤格波格丹诺夫奇病毒(YugBogdanovac virus)、扎伊尔埃博拉病毒(Zaire ebolavirus)、寨卡病毒或拜氏接合酵母病毒Z病毒序列(Zygosaccharomyces bailii virus Z viral sequence)。可以检测的RNA病毒的实例包括以下一种或多种(或其任何组合):冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或丁型病毒。在某些示例性实施方案中,病毒是冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒。
在某些示例性实施方案中,病毒可以是选自包括以下的组的植物病毒:烟草花叶病毒(TMV)、番茄斑萎病毒(TSWV)、黄瓜花叶病毒(CMV)、马铃薯Y病毒(PVY)、RT病毒花椰菜花叶病毒(CaMV)、李痘病毒(PPV)、雀麦草花叶病毒(BMV)、马铃薯病毒X(PVX)、柑橘衰退病毒(CTV)、大麦黄矮病毒(BYDV)、马铃薯卷叶病毒(PLRV)、番茄丛矮病毒(TBSV)、水稻东格鲁球状病毒(rice tungro spherical virus)(RTSV)、水稻黄斑驳病毒(RYMV)、水稻白叶病毒(RHBV)、玉米雷亚朵非纳病毒(maize rayado fino virus)(MRFV)、玉米矮花叶病毒(MDMV)、甘蔗花叶病毒(SCMV)、甘薯羽状斑驳病毒(SPFMV)、甘薯凹脉黄化丝状病毒(sweetpotato sunken vein closterovirus)(SPSVV)、葡萄扇叶病毒(GFLV)、葡萄病毒A(GVA)、葡萄病毒B(GVB)、葡萄斑点病毒(GFkV)、葡萄卷叶相关病毒-1、葡萄卷叶相关病毒-2和葡萄卷叶相关病毒-3(GLRaV-1、GLRaV-2和GLRaV-3)、南芥菜花叶病毒(ArMV)或沙地葡萄茎痘相关病毒(RSPaV)。在优选实施方案中,靶RNA分子是所述病原体的一部分或从所述病原体的DNA分子转录。举例来说,靶序列可以包含在RNA病毒的基因组中。进一步优选的是,如果所述病原体感染或已经感染所述植物,那么CRISPR效应蛋白水解所述植物中所述病原体的所述靶RNA分子。因此优选的是,当治疗性地,即,在感染已经发生之后,或预防性地,即,在感染已经发生之前应用CRISPR系统(或其完成所需的部分)时,CRISPR系统能够使靶RNA分子从植物病原体裂解。
在某些示例性实施方案中,病毒可以是逆转录病毒。可以使用本文所公开的实施方案检测的示例性逆转录病毒包括以下病毒中的一种或多种或任何组合:α逆转录病毒属、β逆转录病毒属、γ逆转录病毒属、δ逆转录病毒属、ε逆转录病毒属、慢病毒属、泡沫病毒属(Spumavirus),或转座病毒科(Metaviridae)、假病毒科(Pseudoviridae)和逆转录病毒科(Retroviridae)(包括HIV)、嗜肝DNA病毒科(Hepadnaviridae)(包括乙型肝炎病毒)和花椰菜花叶病毒科(Caulimoviridae)(包括花椰菜花叶病毒)。
在某些示例性实施方案中,病毒是DNA病毒。可以使用本文所公开的实施方案检测的示例性DNA病毒尤其包括来自以下科的病毒中的一种或多种(或其任何组合):肌病毒科(Myoviridae)、短尾病毒科(Podoviridae)、长尾病毒科(Siphoviridae)、异疱疹病毒科(Alloherpesviridae)、疱疹病毒科(Herpesviridae)(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科(Malocoherpesviridae)、脂毛病毒科(Lipothrixviridae)、小杆状病毒科(Rudiviridae)、腺病毒科(Adenoviridae)、瓶状病毒科(Ampullaviridae)、囊泡病毒科(Ascoviridae)、非洲猪瘟病毒科(Asfarviridae)(包括非洲猪瘟病毒)、杆状病毒科(Baculoviridae)、西坎达病毒科(Cicaudaviridae)、棒状病毒科(Clavaviridae)、覆盖噬菌体科(Corticoviridae)、微小纺锤形病毒科(Fuselloviridae)、球状病毒科(Globuloviridae)、滴状病毒科(Guttaviridae)、肥大唾腺炎病毒科(Hytrosaviridae)、虹彩病毒科(Iridoviridae)、马赛病毒科(Maseilleviridae)、拟菌病毒科(Mimiviridae)、裸病毒科(Nudiviridae)、线形病毒科(Nimaviridae)、潘多拉病毒科(Pandoraviridae)、乳头瘤病毒科(Papillomaviridae)、藻类DNA病毒科(Phycodnaviridae)、原质病毒科(Plasmaviridae)、多DNA病毒(Polydnavirus)、多瘤病毒科(Polyomaviridae)(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(Poxviridae)(包括牛痘和天花)、球脂状病毒科(Sphaerolipoviridae)、复层病毒科(Tectiviridae)、图里病毒科(Turriviridae)、地诺DNA病毒(Dinodnavirus)、盐末端蛋白病毒(Salterprovirus)、瑞兹病毒(Rhizidovirus)。在一些实施方案中,一种诊断疑似具有细菌感染的受试者中的种类特异性细菌感染的方法被描述为从受试者获得包含细菌核糖体核糖核酸的样品;使样品与所描述的探针中的一个或多个接触;以及检测样品中存在的细菌核糖体核糖核酸序列与探针之间的杂交,其中杂交的检测指示受试者受以下细菌感染:大肠杆菌、肺炎克雷伯菌、绿脓假单胞菌、金黄色葡萄球菌、鲍曼不动杆菌(Acinetobacter baumannii)、白色念珠菌、阴沟肠杆菌、粪肠球菌、屎肠球菌、奇异变形杆菌、无乳葡萄球菌(Staphylococcus agalactiae)或嗜麦芽葡萄球菌(Staphylococcus maltophilia)或它们的组合。
疟疾检测和监测
疟疾是由疟原虫寄生虫引起的蚊传病状。寄生虫经由受感染的雌性疟蚊(Anopheles)的叮咬传播给人。五种疟原虫种类引起人的疟疾:恶性疟原虫、间日疟原虫(Plasmodium vivax)、卵形疟原虫(Plasmodium ovale)、三日疟原虫(Plasmodiummalariae)和诺氏疟原虫(Plasmodium knowlesi)。在这些当中,根据世界卫生组织(WorldHealth Organization)(WHO),恶性疟原虫和间日疟原虫造成最大威胁。恶性疟原虫(P.falciparum)是非洲大陆最普遍存在的疟疾寄生虫并且造成全球大多数疟疾相关死亡。间日疟原虫是在撒哈拉以南非洲外的大多数国家的主要疟疾寄生虫。
在2015年,91个国家和地区具有持续的疟疾传播。根据最近的WHO估计,在2015年存在2.12亿疟疾病例和429000例死亡。在疟疾高度传播的地区,5岁以下儿童尤其易受感染、疾患和死亡;所有疟疾死亡中超过三分之二(70%)在这个年龄组中发生。在2010年与2015年之间,全球5岁以下疟疾死亡率下降29%。然而,疟疾仍然是五岁以下儿童的主要杀手,每两分钟夺走一名儿童的生命。
如WHO所描述,疟疾是急性发热疾患。在非免疫个体中,症状在感染性蚊叮咬后7天或更长时间出现。首发症状-发热、头痛、寒冷和呕吐-可能是轻微的并且难以识别为疟疾,然而,如果在24小时内未治疗,那么恶性疟原虫疟疾可以进展至严重疾患,常常导致死亡。
患有严重疟疾的儿童频繁发展出以下症状中的一种或多种:严重贫血、与代谢性酸中毒相关的呼吸窘迫,或脑型疟疾。在成人中,多器官受累也频繁出现。在疟疾流行区,人可能发展出部分免疫,从而允许无症状感染发生。
快速和有效诊断测试的发展与公共卫生高度相关。确实,疟疾的早期诊断和治疗不仅减轻疾病并防止死亡,而且有助于减少疟疾传播。根据WHO推荐,疑似疟疾的所有病例在施用治疗之前应使用基于寄生虫的诊断测试(特别是使用快速诊断测试)来确认(参见"WHO Guidelines for the treatment of malaria",第三版,2015年4月公布)。
对抗疟疾疗法的抗性表现出关键的健康问题,这大大减少了治疗策略。确实,如WHO网站所报道,恶性疟原虫对前代药物,例如氯喹(chloroquine)和磺胺多辛/乙胺嘧啶(sulfadoxine/pyrimethamine)(SP)的抗性在1950年代和1960年代变得普遍存在,削弱了疟疾控制的努力并且逆转了儿童存活率的增加。因此,WHO推荐抗疟疾药抗性的常规监测。确实,准确诊断可以避免非适当治疗并且限制对抗疟疾药物的抗性的扩展。
在这种情形中,2016-2030年WHO全球疟疾技术策略-在2015年5月由世界卫生大会(World Health Assembly)正式通过-提供了对于所有疟疾流行国家的技术框架。其意图指导和支持致力于疟疾控制和消除的地区和国家规划。策略设定了宏大的但可达成的全球目标,包括:
·截至2030年使疟疾病例发病率降低至少90%。
·截至2030年使疟疾死亡率降低至少90%。
·截至2030年消除至少35个国家的疟疾。
·防止无疟疾的所有国家的疟疾再起。
这种策略是跨越2年并且涉及来自70个成员国的超过400名技术专家的参与的广泛协商过程的结果。这是基于3个关键轴:
·确保全面普及疟疾预防、诊断和治疗;
·加速对消除和达到无疟疾状态的努力;以及
·将疟疾监视转变成核心干预。
对疟原虫的治疗包括芳基-氨基醇,例如奎宁(quinine)或奎宁衍生物,例如氯喹、阿莫地喹(amodiaquine)、甲氟喹(mefloquine)、哌喹(piperaquine)、苯芴醇(lumefantrine)、伯氨喹(primaquine);亲脂性羟基萘醌类似物,例如阿托伐醌(atovaquone);抗叶酸药物,例如磺胺类药物磺胺多辛、氨苯砜(dapsone)和乙胺嘧啶;氯胍(proguanil);阿托伐醌/氯胍的组合;青蒿素(atemisins)药物;以及它们的组合。
作为蚊传病原体存在的诊断的靶序列包括作为疟原虫,特别是影响人的疟原虫(Plasmodia)种类,例如恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和诺氏疟原虫存在的诊断的序列,包括来自其基因组的序列。
作为监测对疟原虫,特别是影响人的疟原虫种类,例如恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和诺氏疟原虫的治疗的抗药性的诊断的靶序列。
其他靶序列包括序列,所述序列包括编码以下蛋白质的靶分子/核酸分子:疟原虫寄生虫的基本生物过程中所涉及的蛋白质并且特别是转运蛋白,例如来自药物/代谢物转运子家族的蛋白质;底物易位中所涉及的ATP结合盒(ABC)蛋白质,例如ABC转运子C亚家族或Na+/H+交换子、膜谷胱甘肽S-转移酶;叶酸途径中所涉及的蛋白质,例如二氢蝶酸合成酶、二氢叶酸还原酶活性或二氢叶酸还原酶-胸苷酸合成酶;以及跨越线粒体内膜的质子易位中所涉及的蛋白质并且特别是细胞色素b复合物。额外标靶还可以包括编码亚铁血红素聚合酶的一个或多个基因。
其他靶序列包括编码基本生物过程中所涉及的蛋白质的靶分子/核酸分子,其可以选自恶性疟原虫氯喹抗性转运基因(pfcrt)、恶性疟原虫多抗药性转运子1(pfmdr1)、恶性疟原虫多抗药性相关蛋白基因(Pfmrp)、恶性疟原虫Na+/H+交换基因(pfnhe)、编码恶性疟原虫输出蛋白1的基因、恶性疟原虫Ca2+转运ATPase 6(pfatp6);恶性疟原虫二氢蝶酸合成酶(pfdhps)、二氢叶酸还原酶活性(pfdhpr)和二氢叶酸还原酶-胸苷酸合成酶(pfdhfr)基因、细胞色素b基因、GTP环化水解酶和Kelch13(K13)基因,以及其在其他疟原虫种类中的功能性异源基因。
许多突变,特别是单点突变,已经在作为当前治疗的标靶并且与特异性抗性表型相关联的蛋白质中鉴别到。因此,本发明允许检测蚊传寄生虫,例如疟原虫的各种抗性表型。
本发明允许检测靶核酸/分子中的一个或多个突变并且特别是一个或多个单核苷酸多态性。因此,以下任一个突变或它们的组合可以用作抗药性标志并且可以根据本发明检测。
恶性疟原虫K13中的单点突变包括以下位置处的单点突变:252、441、446、449、458、493、539、543、553、561、568、574、578、580、675、476、469、481、522、537、538、579、584和719,并且特别是突变E252Q、P441L、F446I、G449A、N458Y、Y493H、R539T、I543T、P553L、R561H、V568G、P574L、A578S、C580Y、A675V、M476I、C469Y、A481V、S522C、N537I、N537D、G538V、M579I、D584V和H719N。这些突变一般与青蒿素药物抗性表型相关联(Artemisininand artemisinin-based combination therapy resistance,2016年4月WHO/HTM/GMP/2016.5)。
在恶性疟原虫二氢叶酸还原酶(DHFR)(PfDHFR-TS,PFD0830w)中,重要的多态性包括位置108、51、59和164处的突变,特别是调节对乙胺嘧啶的抗性的108D、164L、51I和59R。其他多态性还包括与对磺胺多辛的抗性相关联的437G、581G、540E、436A和613S。额外观测的突变包括Ser108Asn、Asn51Ile、Cys59Arg、Ile164Leu、Cys50Arg、Ile164Leu、Asn188Lys、Ser189Arg和Val213Ala、Ser108Thr和Ala16Val。突变Ser108Asn、Asn51Ile、Cys59Arg、Ile164Leu、Cys50Arg、Ile164Leu与基于乙胺嘧啶的疗法和/或氯鸟嘌呤-氨苯砜组合疗法抗性显著相关联。环氯胍(Cycloguanil)抗性似乎与双重突变Ser108Thr和Ala16Val相关联。dhfr的扩增也可能与疗法抗性,特别是乙胺嘧啶抗性高度相关。
在恶性疟原虫二氢蝶酸合成酶(DHPS)(PfDHPS,PF08_0095)中,重要的多态性包括位置436、437、581和613处的突变Ser436Ala/Phe、Ala437Gly、Lys540Glu、Ala581Gly和Ala613Thr/Ser。位置581和/或613处的多态性还已经与对磺胺多辛-乙胺嘧啶基础疗法的抗性相关联。
在恶性疟原虫氯喹抗性转运子(PfCRT)中,位置76处的多态性,特别是突变Lys76Thr,与对氯喹的抗性相关联。其他多态性包括可能与氯喹抗性相关联的Cys72Ser、Met74Ile、Asn75Glu、Ala220Ser、Gln271Glu、Asn326Ser、Ile356Thr和Arg371Ile。PfCRT也在残基S33、S411和T416处磷酸化,这可以调控蛋白质的转运活性或特异性。
在恶性疟原虫多抗药性转运子1(PfMDR1)(PFE1150w)中,位置86、184、1034、1042处的多态性,特别是Asn86Tyr、Tyr184-Phe、Ser1034Cys、Asn1042Asp和Asp1246Tyr已经被鉴别和报道为影响对苯芴醇、青蒿素、奎宁、甲氟喹(mefloquine)、卤泛群(halofantrine)和氯喹的易感性。另外,PfMDR1的扩增与对苯芴醇、青蒿素、奎宁、甲氟喹和卤泛群的易感性降低相关联,并且PfMDR1的解除扩增(deamplification)导致氯喹抗性的增加。还可以检测到pfmdr1的扩增。PfMDR1的磷酸化状态也高度相关。
在恶性疟原虫多抗药性相关蛋白(PfMRP)(基因参照PFA0590w)中,已经鉴别到位置191和/或437处的多态性,例如Y191H和A437S并且与氯喹抗性表型相关联。
在恶性疟原虫NA+/H+交换子(PfNHE)(参照PF13_0019)中,微卫星ms4670中DNNND的重复增加可以是奎宁抗性的标志。
改变由细胞色素be基因(cytb,mal_mito_3)编码的细胞色素b蛋白的泛醇结合位点的突变与阿托伐醌抗性相关联。位置26、268、276、133和280处的突变并且特别是Tyr26Asn、Tyr268Ser、M1331和G280D可能与阿托伐醌抗性相关联。
举例来说,在间日疟原虫中,Pf MDR1的同源物PvMDR1中的突变已经与氯喹抗性相关联,特别是位置976处的多态性,诸如突变Y976F。
上述突变是依据蛋白质序列来定义。然而,技术人员能够确定有待鉴别为核酸靶序列的相应突变,包括SNP。
其他所鉴别的抗药性标志在本领域中是已知的,例如以下文献中所描述:"Susceptibility of Plasmodium falciparum to antimalarial drugs(1996-2004)";WHO;Artemisinin and artemisinin-based combination therapy resistance(2016年4月WHO/HTM/GMP/2016.5);"Drug-resistant malaria:molecular mechanisms andimplications for public health"FEBS Lett.2011年6月6日;585(11):1551-62.doi:10.1016/j.febslet.2011.04.042.Epub 2011年4月23日.Review.PubMed PMID:21530510;其内容以引用的方式并入于此。
关于可以根据本发明检测的多肽,本文所提及的所有基因的基因产物都可以用作标靶。相应地,预期此类多肽可以用于抗药性的种类鉴别、分型和/或检测。
在某些示例性实施方案中,本文所公开的系统、装置和方法涉及检测样品,例如获自受试者的生物样品中一种或多种蚊传寄生虫的存在。在某些示例性实施方案中,寄生虫可以选自以下种类:恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫或诺氏疟原虫。因此,本文所公开的方法可以适应于在其他方法中与其他方法一起(或组合)使用,所述其他方法需要寄生虫种类的快速鉴别,监测寄生虫和寄生虫形式的存在(例如对应于感染和寄生虫生命周期的各个阶段,例如红细胞外期、红细胞内期、孢子生殖期;寄生虫形式包括裂殖子、子孢子、分裂体、配子体);某些表型(例如病原体抗药性)的检测,疾病进展和/或爆发的监测,以及治疗(药物)筛选。此外,在疟疾的情况下,在感染性叮咬之后可能流逝很长时间,即,长孵育时段,在此期间患者不显示出症状。类似地,预防性治疗可以延迟症状的出现,并且在复发之前还可以观测到很长的无症状时段。此类延迟可以容易引起误诊或延迟诊断,并且因此削弱治疗的有效性。
因为此处所公开的实施方案的快速和灵敏诊断能力、低至单核苷酸差异的寄生虫类型的检测和作为POC装置部署的能力,所以本文所公开的实施方案可以用于指导治疗方案,例如适当疗程的选择。本文所公开的实施方案还可以用于针对寄生虫的存在和分型筛选环境样品(蚊群等)。还可以修改实施方案以同时检测蚊传寄生虫和其他蚊传病原体。在一些情况下,疟疾和其他蚊传病原体可能最初呈现出类似的症状。因此,快速区分感染类型的能力可以指导重要的治疗决策。可以与疟疾共同检测的其他蚊传病原体包括登革、西尼罗河病毒、基孔肯雅、黄热病、丝虫病、日本脑炎、圣路易斯脑炎、西方马脑炎、东方马脑炎、委内瑞拉马脑炎、拉克罗斯脑炎(La Crosse encephalitis)和寨卡。
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于区分样品中的多个蚊传寄生虫种类。在某些示例性实施方案中,鉴别可以基于核糖体RNA序列,包括18S、16S、23S和5S亚单位。在某些示例性实施方案中,鉴别可以基于基因组中的多个拷贝中所存在的基因的序列,例如线粒体基因,如CYTB。在某些示例性实施方案中,鉴别可以基于高度表达和/或高度保守的基因的序列,例如GAPDH、组蛋白H2B、烯醇酶或LDH。鉴别相关rRNA序列的方法在美国专利申请公布号2017/0029872中公开。在某些示例性实施方案中,一组向导RNA可以被设计成由对于每个种类或株系独特的可变区来区分每个种类。向导RNA还可以被设计成靶向在属、族、目、类、门、界的水平或它们的组合上区分微生物的RNA基因。在使用扩增的某些示例性实施方案中,一组扩增引物可以被设计成侧接核糖体RNA序列的恒定区并且向导RNA被设计成由可变内区来区分每个种类。在某些示例性实施方案中,引物和向导RNA可以分别被设计成16S亚单位中的保守区和可变区。同样可以使用跨越种类或种类的子组,例如RecA基因家族RNA聚合酶β亚单位独特可变的其他基因或基因组区域。其他适合的系统发生标志和其鉴别方法在例如Wu等arXiv:1307.8690[q-bio.GN]中论述。
在某些示例性实施方案中,种类鉴别可以基于基因组中的多个拷贝中所存在的基因,例如线粒体基因,如CYTB来进行。在某些示例性实施方案中,种类鉴别可以基于高度表达和/或高度保守基因,例如GAPDH、组蛋白H2B、烯醇酶或LDH来进行。
在某些示例性实施方案中,方法或诊断被设计成同时跨越多个系统发生和/或表型水平筛选蚊传寄生虫。举例来说,方法或诊断可以包括使用多个具有不同向导RNA的CRISPR系统。第一组向导RNA可以区分例如恶性疟原虫或间日疟原虫。这些一般类别甚至可以进一步细分。举例来说,可以设计向导RNA并且用于一般性地或关于特定药物或药物组合来区分抗药性株系的方法或诊断中。第二组向导RNA可以被设计成在种类的水平上区分微生物。因此,可以产生鉴别所有蚊传寄生虫种类或亚种的矩阵,根据抗药性进一步划分。前述内容仅用于示例性目的。还涵盖用于归类其他蚊传寄生虫类型的其他方式并且将遵循上文所描述的一般结构。
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于筛选所关注的蚊传寄生虫基因,例如抗药性基因。向导RNA可以被设计成区分所关注的已知基因。然后可以使用本文所公开的用于检测一个或多个此类基因的实施方案筛选样品,包括临床样品。在POC下筛选抗药性的能力将在选择适当治疗方案中具有巨大的效益。在某些示例性实施方案中,抗药性基因是编码以下蛋白质的基因:例如转运蛋白,例如来自药物/代谢物转运子家族的蛋白质;底物易位中所涉及的ATP结合盒(ABC)蛋白质,例如ABC转运子C亚家族或Na+/H+交换子;叶酸途径中所涉及的蛋白质,例如二氢蝶酸合成酶、二氢叶酸还原酶活性或二氢叶酸还原酶-胸苷酸合成酶;以及跨越线粒体内膜的质子易位中所涉及的蛋白质并且特别是细胞色素b复合物。额外标靶还可以包括编码亚铁血红素聚合酶的一个或多个基因。在某些示例性实施方案中,抗药性基因选自恶性疟原虫氯喹抗性转运基因(pfcrt)、恶性疟原虫多抗药性转运子1(pfmdr1)、恶性疟原虫多抗药性相关蛋白基因(Pfmrp)、恶性疟原虫Na+/H+交换基因(pfnhe)、恶性疟原虫Ca2+转运ATPase 6(pfatp6)、恶性疟原虫二氢蝶酸合成酶(pfdhps)、二氢叶酸还原酶活性(pfdhpr)和二氢叶酸还原酶-胸苷酸合成酶(pfdhfr)基因、细胞色素b基因、GTP环化水解酶和Kelch13(K13)基因,以及其在其他疟原虫种类中的功能性异源基因。其他所鉴别的抗药性标志在本领域中是已知的,例如以下文献中所描述:"Susceptibility of Plasmodium falciparum to antimalarial drugs(1996-2004)";WHO;Artemisinin and artemisinin-based combination therapy resistance(2016年4月WHO/HTM/GMP/2016.5);"Drug-resistant malaria:molecular mechanismsand implications for public health"FEBS Lett.2011年6月6日;585(11):1551-62.doi:10.1016/j.febslet.2011.04.042.Epub 2011年4月23日.Review.PubMed PMID:21530510;其内容以引用的方式并入于此。
在一些实施方案中,如本文所描述的CRISPR系统、检测系统或其使用方法可以用于确定蚊传寄生虫爆发的演变。方法可以包括检测来自一个或多个受试者的多个样品的一个或多个靶序列,其中靶序列是来自蚊传寄生虫扩散或引起爆发的序列。此种方法还可以包括确定蚊传寄生虫传播的模式,或由蚊传寄生虫引起的疾病爆发中所涉及的机制。样品可以来源于一个或多个人,和/或来源于一个或多个蚊。
病原体传播的模式可以包括从蚊传寄生虫的天然储库的持续新传播或在从天然储库的单个传播之后的其他传播(例如在蚊之间),或两种的混合情况。在一个实施方案中,靶序列优选地是蚊传寄生虫基因组内的序列或其片段。在一个实施方案中,蚊传寄生虫传播的模式是蚊传寄生虫传播的早期模式,即,在蚊传寄生虫爆发开始时。在爆发开始时确定蚊传寄生虫传播的模式增加了在最早可能的时间阻止爆发的可能性,从而降低本地和国际蔓延的可能性。
确定蚊传寄生虫传播的模式可以包括根据本文所描述的方法检测蚊传寄生虫序列。确定病原体传播的模式还可以包括检测受试者之间的蚊传寄生虫序列的共享宿主内变异以及确定共享宿主内变异是否显示时序模式。所观测的宿主内和宿主间变异中的模式提供了关于传播和流行病学的重要见解(Gire等,2014)。
除了本文所公开的其他样品类型以外,样品可以来源于一个或多个蚊,例如,样品可以包括蚊唾液。
生物标志检测
在某些示例性实施方案中,本文所公开的系统、装置和方法可以用于生物标志检测。举例来说,本文所公开的系统、装置和方法可以用于SNP检测和/或基因分型。本文所公开的系统、装置和方法还可以用于由异常基因表达表征的任何疾病病况或病症的检测。异常基因表达包括所表达的基因、表达的位置和表达的水平中的异常。可以检测与心血管、免疫病症和癌症以及其他疾病相关的多个转录物或蛋白质标志。在某些示例性实施方案中,本文所公开的实施方案可以用于涉及溶解的疾病,例如肝纤维化和限制性/阻塞性肺病的无细胞DNA检测。在某些示例性实施方案中,实施方案可以用于无细胞DNA的产前测试的更快速和更便携检测。本文所公开的实施方案可以用于筛选尤其与心血管健康、脂质/代谢标识、种族鉴别、父权匹配、人ID(例如匹配嫌疑犯与SNP标识的罪犯数据库)相关联的不同SNP的板块。本文所公开的实施方案还可以用于与癌症肿瘤相关并且从癌症肿瘤释放的突变的无细胞DNA检测。本文所公开的实施方案还可以用于肉质量的检测,例如,通过提供给定的肉产品中不同动物来源的快速检测。本文所公开的实施方案还可以用于与DNA相关的GMO或基因编辑的检测。如本文别处所描述,可以通过在gRNA中引入合成错配来区分密切相关的基因型/等位基因或生物标志(例如在给定的靶序列中仅具有单核苷酸差异)。
在一个方面,本发明涉及一种用于检测样品中的靶核酸的方法,所述方法包括:
将样品或样品组分配至一个或多个个别离散容积中,所述个别离散容积包含如本文所描述的根据本发明的CRISPR系统;
在足以允许一种或多种向导RNA结合至一种或多种靶分子的条件下孵育样品或样品组;
经由一种或多种向导RNA结合至一种或多种靶分子来活化CRISPR效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便产生可检测的阳性信号;以及
检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中一种或多种靶分子的存在。
生物标志样品类型
本文所描述的测定的灵敏度非常适合于多种生物样品类型,包括靶核酸是稀释的或样品材料受限制的样品类型中靶核酸的检测。生物标志筛选可以对许多样品类型进行,包括但不限于唾液、尿液、血液、粪便、痰液和脑脊髓液。本文所公开的实施方案还可以用于检测基因的上调和/或下调。举例来说,可以连续稀释样品以使得仅过度表达的基因保持高于测定的检测限临界值。
在某些实施方案中,本发明提供了获得生物流体(例如尿液、血液血浆或血清、痰液、脑脊髓液)的样品以及提取DNA的步骤。有待检测的突变体核苷酸序列可以是较大分子的一部分或可以最初作为离散分子存在。
在某些实施方案中,从癌症患者的血浆/血清中分离DNA。为作比较,从赘生组织中分离DNA样品,并且可以从来自同一患者的非赘生组织中分离第二样品,例如淋巴细胞。非赘生组织可以与赘生组织类型相同或来自不同器官来源。在某些实施方案中,收集血液样品并且立即通过离心从血液细胞中分离血浆。可以将血清过滤并冷冻储存直至DNA提取。
在某些示例性实施方案中,检测直接来自粗的或未加工的样品,例如血液、血清、唾液、脑脊髓液、痰液或尿液的靶核酸。在某些示例性实施方案中,靶核酸是无细胞DNA。
循环肿瘤细胞
在一个实施方案中,可以用本发明测定循环细胞(例如循环肿瘤细胞(CTC))。可以进行用于本文所描述的任何方法中的循环肿瘤细胞(CTC)的分离。可以用于本发明中的达成循环细胞的特异性和灵敏检测和捕获的例示性技术已有描述(Mostert B等,Circulating tumor cells(CTCs):detection methods and their clinical relevancein breast cancer.Cancer Treat Rev.2009;35:463-474;以及Talasaz AH等,Isolatinghighly enriched populations of circulating epithelial cells and other rarecells from blood using a magnetic sweeper device.Proc Natl Acad Sci U SA.2009;106:3970-3975)。在105-106个外周血单核细胞的背景下可以发现少至一个CTC(Ross A A等,Detection and viability of tumor cells in peripheral blood stemcell collections from breast cancer patients using immunocytochemical andclonogenic assay techniques.Blood.1993,82:2605-2610)。
Figure BDA0002523004990001301
平台使用免疫磁性珠粒,所述珠粒涂布有针对上皮细胞粘附分子(EpCAM)的抗体以富集表达EPCAM的上皮细胞,继之以免疫染色以确认细胞角蛋白染色的存在和白细胞标志CD45的不存在来确认所捕获的细胞是上皮肿瘤细胞(Momburg F等,Immunohistochemical study of theexpression of a Mr 34,000human epithelium-specific surface glycoprotein innormal and malignant tissues.Cancer Res.1987;47:2883-2891;以及Allard WJ等,Tumor cells circulate in the peripheral blood of all major carcinomas but notin healthy subjects or patients with nonmalignant diseases.Clin CancerRes.2004;10:6897-6904)。所捕获的细胞数目已经预期地展示对患有晚期疾病的乳癌、结肠直肠癌和前列腺癌患者的预后意义(Cohen SJ等,J Clin Oncol.2008;26:3213-3221;Cristofanilli M等,N Engl J Med.2004;351:781-791;Cristofanilli M等,J ClinOncol.2005;23:1420-1430;以及de Bono JS等,Clin Cancer Res.2008;14:6302-6309)。
本发明还提供了用CTC-芯片技术分离CTC。CTC-芯片是基于微流体的CTC捕获装置,其中血液流过腔室,所述腔室含有数千个涂布有CTC所结合的抗EpCAM抗体的微柱(Nagrath S等,Isolation of rare circulating tumour cells in cancer patients bymicrochip technology.Nature.2007;450:1235-1239)。CTC-芯片与
Figure BDA0002523004990001302
系统相比提供CTC计数和纯度的显著增加(Maheswaran S等,Detection of mutations in EGFRin circulating lung-cancer cells,N Engl J Med.2008;359:366-377),这两个平台均可以用于下游分子分析。
无细胞染色质
在某些实施方案中,根据本发明分离和分析无细胞染色质片段。可以在健康个体(Stroun等,Annals of the New York Academy of Sciences 906:161-168(2000))以及患有疾病病况的个体的血清中检测核小体。此外,核小体的血清浓度在罹患良性和恶性疾病,例如癌症和自身免疫疾病的患者中明显较高(Holdenrieder等(2001)Int J Cancer 95,114-120;Trejo-Becerril等(2003)Int J Cancer 104,663-668;Kuroi等1999BreastCancer 6,361-364;Kuroi等(2001)Int j Oncology 19,143-148;Amoura等(1997)ArthRheum 40,2217-2225;Williams等(2001)J Rheumatol 28,81-94)。不受理论束缚,带有肿瘤的患者中核小体的高浓度来源于在增生性肿瘤中自发发生的凋亡。在血液中循环的核小体含有独特修饰的组蛋白。举例来说,美国专利公布号2005/0069931(2005年3月31日)涉及使用针对特异性组蛋白N端修饰的抗体作为疾病的诊断指示剂,采用此类组蛋白特异性抗体从患者的血液或血清样品中分离核小体以促进伴随DNA的纯化和分析用于诊断/筛选目的。因此,本发明可以使用染色质结合的DNA以检测和监测例如肿瘤突变。与修饰的组蛋白相关联的DNA的鉴别可以充当疾病和先天性缺陷的诊断标志。
因此,在另一个实施方案中,分离的染色质片段来源于循环染色质,优选循环单核小体和寡核小体。分离的染色质片段可以来源于生物样品。生物样品可以来自有需要的受试者或患者。生物样品可以是血清、血浆、淋巴、血液、血液部分、尿液、滑液、脊髓液、唾液、循环肿瘤细胞或粘液。
无细胞DNA(cfDNA)
在某些实施方案中,本发明可以用于检测无细胞DNA(cfDNA)。血浆或血清中的无细胞DNA可以用作非侵入性诊断工具。举例来说,已经研究和优化无细胞胎儿DNA用于对相容RhD因子的测试、X连锁遗传病症的性别确定、单基因病症的测试、子痫前期的鉴别。举例来说,对母体血浆中cfDNA的胎儿细胞部分进行测序是检测与胎儿染色体非整倍性相关联的拷贝数的可靠方法。另举一例,从癌症患者中分离的cfDNA已经用于检测与治疗决策相关的关键基因中的突变。
在某些示例性实施方案中,本公开提供了检测直接来自患者样品的cfDNA。在某一其他示例性实施方案中,本公开提供了使用上文所公开的富集实施方案并且在检测靶cfDNA之前富集cfDNA。
核外体
在一个实施方案中,可以用本发明测定核外体。核外体是已经显示含有RNA的小细胞外囊泡。通过超离心、过滤、化学沉淀、尺寸排阻色谱法和微流体分离核外体在本领域中是已知的。在一个实施方案中,使用核外体生物标志纯化核外体。核外体从生物样品中的分离和纯化可以通过任何已知方法进行(参见例如WO2016172598A1)。
SNP检测和基因分型
在某些实施方案中,本发明可以用于检测生物样品中单核苷酸多态性(SNP)的存在。SNP可以与产科测试相关(例如性别确定、胎儿缺陷)。SNP可以与刑事侦查相关。在一个实施方案中,可以由本发明鉴别刑事侦查中的嫌疑犯。不受理论束缚,基于核酸的法庭证据可能需要可用于检测嫌疑犯或受害者的遗传物质的最灵敏测定,这是因为所测试的样品可能有限。
在其他实施方案中,本发明涵盖与疾病相关联的SNP。与疾病相关联的SNP在本领域中是众所周知的,并且本领域技术人员可以应用本发明方法来设计适合的向导RNA(参见例如www.ncbi.nlm.nih.gov/clinvar?term=human%5Borgn%5D)。
在一个方面,本发明涉及一种用于基因分型,例如SNP基因分型的方法,所述方法包括:
将样品或样品组分配至一个或多个个别离散容积中,所述个别离散容积包含如本文所描述的根据本发明的CRISPR系统;
在足以允许一种或多种向导RNA结合至一种或多种靶分子的条件下孵育样品或样品组;
经由一种或多种向导RNA结合至一种或多种靶分子来活化CRISPR效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便产生可检测的阳性信号;以及
检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中对于特定基因型所特有的一种或多种靶分子的存在。
在某些实施方案中,将可检测信号与一种或多种标准信号,优选合成标准信号相比较(例如通过比较信号强度),例如,图60的实施方案中所说明。在某些实施方案中,标准是特定基因型或对应于特定基因型。在某些实施方案中,标准包含特定SNP或其他(单)核苷酸变异。在某些实施方案中,标准是(PCR扩增的)基因型标准。在某些实施方案中,标准是DNA或包含DNA。在某些实施方案中,标准是RNA或包含RNA。在某些实施方案中,标准是从DNA转录的RNA或包含从DNA转录的RNA。在某些实施方案中,标准是从RNA逆转录的DNA或包含从RNA逆转录的DNA。在某些实施方案中,将可检测信号与一种或多种标准相比较,所述标准中的每一种对应于已知的基因型,例如SNP或其他(单)核苷酸变异。在某些实施方案中,将可检测信号与一种或多种标准信号相比较并且比较包括统计分析,例如通过参数和非参数统计分析,例如通过单因素或两因素ANOVA等。在某些实施方案中,将可检测信号与一种或多种标准信号相比较,并且当可检测信号并不(统计上)显著偏离标准时,将基因型确定为对应于所述标准的基因型。
在其他实施方案中,本发明允许用于急诊药物基因组学的快速基因分型。在一个实施方案中,单点护理测定可以用于对进入急诊室的患者进行基因分型。患者可能疑似具有血液凝块并且急诊医师需要决定血液稀释剂施用的剂量。在例示性实施方案中,本发明可以在心肌梗塞或中风治疗期间基于例如VKORC1、CYP2C9和CYP2C19的标志的基因分型来提供关于施用血液稀释剂的指导。在一个实施方案中,血液稀释剂是抗凝血剂华法林(warfarin)(Holford,NH(1986年12月)."Clinical Pharmacokinetics andPharmacodynamics of Warfarin Understanding the Dose-Effect Relationship".Clinical Pharmacokinetics.Springer International Publishing.11(6):483-504)。与血液凝结相关联的基因在本领域中是已知的(参见例如US20060166239A1;Litin SC,Gastineau DA(1995)"Current concepts in anticoagulant therapy".MayoClin.Proc.70(3):266-72;以及Rusdiana等,Responsiveness to low-dose warfarinassociated with genetic variants of VKORC1,CYP2C9,CYP2C19,and CYP4F2in anIndonesian population.Eur J Clin Pharmacol.2013年3月;69(3):395-405)。具体地说,在VKORC1 1639(或3673)单核苷酸多态性中,常见(“野生型”)G等位基因由A等位基因置换。具有A等位基因(或“A单体型”)的人相比具有G等位基因(或“非A单体型”)的那些人产生较少VKORC1。这些变体的流行率也因种族而异,其中37%的高加索人和14%的非洲人携带A等位基因。最终结果是凝结因子的数目减少并且因此凝结的能力降低。
在某些示例性实施方案中,用于检测患者中的SNP的遗传物质的可用性允许在DNA或RNA样品无扩增的情况下检测SNP。在基因分型的情况下,容易获得所测试的生物样品。在某些示例性实施方案中,可以缩短本发明的孵育时间。可以在酶促反应发生所需的时间段内进行测定。本领域技术人员可以在5分钟内进行生物化学反应(例如5分钟接合)。本发明可以使用自动化DNA提取装置以从血液获得DNA。然后可以将DNA添加至产生效应蛋白的靶分子的反应中。在产生靶分子后立即可以切断掩蔽剂并且检测信号。在例示性实施方案中,本发明允许POC快速诊断用于在施用药物(例如血液稀释剂)之前确定基因型。在使用扩增步骤的情况下,所有反应都在一步过程中在同一反应中发生。在优选实施方案中,可以在小于一小时,优选10分钟、20分钟、30分钟、40分钟或50分钟内进行POC测定。
在某些实施方案中,本文所公开的系统、装置和方法可以用于检测长非编码RNA(lncRNA)的存在或表达水平。某些lncRNA的表达与疾病病况和/或抗药性相关联。特别地,某些lncRNA(例如TCONS_00011252、NR_034078、TCONS_00010506、TCONS_00026344、TCONS_00015940、TCONS_00028298、TCONS_00026380、TCONS_0009861、TCONS_00026521、TCONS_00016127、NR_125939、NR_033834、TCONS_00021026、TCONS_00006579、NR_109890和NR_026873)与以下相关联:对癌症治疗的抗性,例如,对用于治疗黑素瘤(例如结节性黑素瘤、恶性雀斑样痣、恶性雀斑样痣黑素瘤、肢端雀斑样痣性黑素瘤、浅表扩散性黑素瘤、粘膜黑素瘤、息肉状黑素瘤、促结缔组织增生性黑素瘤、无黑色素性黑素瘤和软组织黑素瘤)的一种或多种BRAF抑制剂(例如威罗菲尼、达拉菲尼(Dabrafenib)、索拉非尼(Sorafenib)、GDC-0879、PLX-4720和LGX818)的抗性。使用本文所描述的各种实施方案检测lncRNA可以有助于疾病诊断和/或治疗选项的选择。
在一个实施方案中,本发明可以向导DNA或RNA靶向的疗法(例如CRISPR、TALE、锌指蛋白、RNAi),特别是在疗法的快速施用对治疗结果很重要的设置中。
LOH检测
癌细胞当与正常细胞相比时经历遗传物质(DNA)的损失。几乎所有(如果并非全部)癌症所经历的这种遗传物质缺失被称作“杂合性损失”(LOH)。杂合性损失(LOH)是引起整个基因和周围染色体区的损失的总染色体事件。杂合性损失在癌症中常发生,在此其可以指示损失的区域中不存在功能性肿瘤抑制基因。然而,损失可能是沉默的,这是因为仍然有一个功能性基因保留在染色体对的另一个染色体上。肿瘤抑制基因的剩余拷贝可以通过点突变而灭活,导致肿瘤抑制基因的损失。遗传物质从癌细胞损失可以引起在染色体上特定基因座处对于细胞存活力或细胞生长至关重要的基因的两个或更多个等位基因中的一个的选择性损失。
“LOH标志”是来自微卫星基因座的DNA,当与正常细胞相比时,其中的缺失、改变或扩增与癌症或其他疾病相关联。LOH标志常常与肿瘤抑制基因或另一个通常是肿瘤相关基因的损失相关联。
术语“微卫星”是指广泛分布于人基因组中的DNA的短重复序列。微卫星是少量串联重复(即,邻近)的DNA基序,其长度在两个至五个核苷酸的范围内,并且通常重复5-50次。举例来说,序列TATATATATA(SEQ ID NO:431)是二核苷酸微卫星,并且GTCGTCGTCGTCGTC(SEQ ID NO:432)是三核苷酸微卫星(其中A是腺嘌呤,G是鸟嘌呤,C是胞嘧啶,并且T是胸腺嘧啶)。此类微卫星的重复长度的体细胞改变已经显示出代表肿瘤的特有特征。向导RNA可以被设计成检测此类微卫星。此外,本发明可以用于检测重复长度的改变,以及基于可检测信号的定量的扩增和缺失。某些微卫星位于基因的调控性侧接或内含子区中,或直接在基因的密码子中。微卫星突变在此类情况下可以导致表型变化和疾病,特别是三联体扩张疾病,例如脆性X综合征和亨廷顿氏病。
特定染色体区上的频繁杂合性损失(LOH)已经在许多种类的恶性病中有报道。特定染色体区上的等位基因损失是在多种恶性病中观测到的最常见的遗传改变,因此,微卫星分析已经应用于检测来自体液,例如肺癌的痰液和膀胱癌的尿液的样本中的癌细胞的DNA。(Rouleau等Nature 363,515-521(1993);和Latif等Science 260,1317-1320(1993))。此外,已经确立了在患有癌症和一些其他疾病的个体的血浆中存在浓度明显增加的可溶性DNA,指示无细胞血清或血浆可以用于检测具有微卫星异常的癌症DNA。(Kamp等Science264,436-440(1994);以及Steck等Nat Genet.15(4),356-362(1997))。两个小组已经报道了患有小细胞肺癌或头颈癌的有限数目的患者的血浆或血清中的微卫星改变。(Hahn等Science 271,350-353(1996);以及Miozzo等Cancer Res.56,2285-2288(1996))。先前也已经显示了黑素瘤患者的肿瘤和血清中杂合性损失的检测(参见例如美国专利号US6465177B1)。
因此,有利的是检测罹患癌症或处于癌症风险下的受试者中的LOH标志。本发明可以用于检测肿瘤细胞中的LOH。在一个实施方案中,循环肿瘤细胞可以用作生物样品。在优选实施方案中,获自血清或血浆的无细胞DNA用于非侵入性地检测和/或监测LOH。在其他实施方案中,生物样品可以是本文所描述的任何样品(例如膀胱癌的尿液样品)。不受理论束缚,本发明可以用于在与任何先前方法相比改善的灵敏度下检测LOH标志,由此提供了突变事件的早期检测。在一个实施方案中,在生物流体中检测LOH,其中LOH的存在与癌症的发生相关联。本文所描述的方法和系统通过提供用于检测与癌症相关联的特异性等位基因的LOH的非侵入性、快速和准确方法而表现出优于先前技术,例如PCR或组织活检的重大进步。因此,本发明提供了可以用于筛选高风险群体和监测经历化学预防、化学疗法、免疫疗法或其他治疗的高风险患者的方法和系统。
因为本发明的方法仅需要从例如血液的体液中提取DNA,所以其可以在任何时间和对单个患者重复进行。可以在手术之前或之后;在治疗,例如化学疗法、放射疗法、基因疗法或免疫疗法之前、期间和之后;或在治疗之后对疾病进展、稳定性或复发进行跟踪检查期间获取血液并监测LOH。不受理论束缚,本发明的方法还可以用于使用对那个患者具有特异性的LOH标志检测亚临床疾病的存在或复发,这是因为LOH标志对个别患者的肿瘤具有特异性。方法还可以使用肿瘤特异性LOH标志检测多发性转移是否可能存在。
表观遗传修饰的检测
指示癌症或癌症进展的组蛋白变体、DNA修饰和组蛋白修饰可以用于本发明中。举例来说,美国专利公布20140206014描述了癌症样品与健康受试者相比具有提高的核小体H2AZ、macroH2A1.1、5-甲基胞嘧啶、P-H2AX(Ser139)水平。个体中癌细胞的存在由于癌细胞的凋亡增加可以产生血液中较高水平的无细胞核小体。在一个实施方案中,针对与凋亡相关联的标志,例如H2B Ser 14(P)的抗体可以用于鉴别已经从凋亡性赘生细胞中释放的单个核小体。因此,可以根据本发明在高灵敏度和准确度下有利地分析由肿瘤细胞产生的DNA。
产前筛选
在某些实施方案中,本发明的方法和系统可以用于产前筛选中。在某些实施方案中,无细胞DNA用于产前筛选的方法中。在某些实施方案中,可以用本发明检测与单个核小体或寡核小体相关联的DNA。在优选实施方案中,与单个核小体或寡核小体相关联的DNA的检测用于产前筛选。在某些实施方案中,无细胞染色质片段用于产前筛选的方法中。
产前诊断或产前筛选是指测试在出生之前胎儿或胚胎的疾病或状况。目的是检测出生缺陷,例如神经管缺陷、唐氏综合征、染色体异常、遗传病症和其他状况,例如脊柱裂、颚裂、泰萨氏病(Tay Sachs disease)、镰状细胞性贫血、地中海贫血、囊性纤维化、肌营养不良和脆性X综合征。筛选还可以用于产前性别甄别。常用测试程序包括羊膜穿刺、超声波检查(包括颈半透明度超声波)、血清标志测试或遗传筛选。在一些情况下,施用测试以确定胎儿是否将被流产,不过医师和患者还发现其适用于早期诊断高风险妊娠以便可以在三级护理医院安排分娩,在此婴儿可以接受适当护理。
已经认识到母亲的血液中存在胎儿细胞,并且这些细胞提供用于产前基于DNA的诊断的胎儿染色体的潜在来源。另外,胎儿DNA在母体血液中的总DNA的约2-10%的范围内。当前可用的产前遗传测试通常涉及侵入性程序。举例来说,对妊娠约10-12周的孕妇进行的绒毛膜绒毛取样(CVS)和约14-16周进行的羊膜穿刺全部含有侵入性程序以获得样品用于测试胎儿中的染色体异常。经由这些取样程序获得的胎儿细胞通常使用细胞遗传学或荧光原位杂交(FISH)分析来测试染色体异常。无细胞胎儿DNA已经显示早在孕六周就存在于孕妇的血浆和血清中,在妊娠期间浓度升高并且在分娩之前达到峰值。因为这些细胞在妊娠很早期出现,所以其可以构成准确、非侵入性、孕早期测试的基础。不受理论束缚,本发明在检测少量的胎儿DNA中提供前所未有的灵敏度。不受理论束缚,大量的母体DNA一般与所关注的胎儿DNA一起伴随地发现,由此降低胎儿DNA定量和突变检测的灵敏度。本发明由出乎意料的高测定灵敏度克服了此类问题。
组蛋白的H3类别由四种不同蛋白质类型组成:主要类型H3.1和H3.2;替换类型H3.3;以及睾丸特异性变体H3t。尽管H3.1和H3.2密切相关,仅在Ser96处不同,但H3.1在至少5个氨基酸位置处不同于H3.3。此外,H3.1与其在包括肝、肾和心的成人组织中的存在相比在胎儿的肝中高度富集。在成人组织中,H3.3变体比H3.1变体更丰富,而对于胎儿的肝正相反。本发明可以使用这些差异以检测包含胎儿与母体细胞和/或胎儿核酸的母体生物样品中的胎儿核小体和胎儿核酸。
在一个实施方案中,胎儿核小体可以获自血液。在其他实施方案中,胎儿核小体获自宫颈粘液样品。在某些实施方案中,在妊娠的孕中期早期或孕早期后期通过对孕妇拭抹或灌洗来获得宫颈粘液样品。可以将样品放置在孵育箱中以释放截留于粘液中的DNA。孵育箱可以设定为37℃。可以将样品摇晃约15至30分钟。可以用粘蛋白酶进一步溶解粘液用于达成释放DNA的目的。样品还可以经受如本领域中众所周知的条件,例如化学处理等,以诱导凋亡来释放胎儿核小体。因此,可以用诱导凋亡剂处理宫颈粘液样品,借此释放胎儿核小体。关于循环胎儿DNA的富集,参考美国专利公布号20070243549和20100240054。当将方法和系统应用于仅小部分的核小体或DNA可能源于胎儿的产前筛选时,本发明尤其有利。
根据本发明的产前筛选可以用于以下疾病:包括但不限于三体型13、三体型16、三体型18、克氏综合征(47,XXY)、(47,XYY)和(47,XXX)、特纳综合征、唐氏综合征(三体型21)、囊性纤维化、亨廷顿氏病、β型地中海贫血、肌强直性营养不良、镰状细胞性贫血、卟啉症、脆性X综合征、罗伯逊易位、安格尔曼综合征、迪乔治综合征和沃尔夫-赫斯霍恩综合征。
本发明的若干其他方面涉及诊断、预后和/或治疗与大范围的遗传疾病相关联的缺陷,所述遗传疾病在国家卫生研究院的网站上在主题分部遗传病症(GeneticDisorders)下进一步描述(网站health.nih.gov/topic/Genetic Disorders)。
癌症和癌症抗药性检测
在某些实施方案中,本发明可以用于检测与癌症相关联的基因和突变。在某些实施方案中,检测与抗性相关联的突变。在肿瘤细胞的克隆群体中抗性肿瘤细胞的扩增或抗性突变的出现在治疗期间可能会发生(参见例如Burger JA等,Clonal evolution inpatients with chronic lymphocytic leukaemia developing resistance to BTKinhibition.Nat Commun.2016年5月20日;7:11589;Landau DA等,Mutations driving CLLand their evolution in progression and relapse.Nature.2015年10月22日;526(7574):525-30;Landau DA等,Clonal evolution in hematological malignancies andtherapeutic implications.Leukemia.2014年1月;28(1):34-43;以及Landau DA等,Evolution and impact of subclonal mutations in chronic lymphocyticleukemia.Cell.2013年2月14日;152(4):714-26)。因此,检测此类突变需要高度灵敏测定并且监测需要重复活检。重复活检是不便利的、侵入性的和高成本的。使用本领域中已知的先前方法可能难以在血液样品或其他非侵入性收集的生物样品(例如血液、唾液、尿液)中检测抗性突变。抗性突变可以指与对化学疗法、靶向疗法或免疫疗法的抗性相关联的突变。
在某些实施方案中,突变在个别癌症中出现,其可以用于检测癌症进展。在一个实施方案中,与针对肿瘤的T细胞细胞裂解活性相关的突变已经得到表征并且可以由本发明检测(参见例如Rooney等,Molecular and genetic properties of tumors associatedwith local immune cytolytic activity,Cell.2015年1月15日;160(1-2):48-61)。可以基于这些突变的检测开发用于患者的个性化疗法(参见例如WO2016100975A1)。在某些实施方案中,与细胞裂解活性相关联的癌症特异性突变可以是选自由以下组成的组的基因中的突变:CASP8、B2M、PIK3CA、SMC1A、ARID5B、TET2、ALPK2、COL5A1、TP53、DNER、NCOR1、MORC4、CIC、IRF6、MYOCD、ANKLE1、CNKSR1、NF1、SOS1、ARID2、CUL4B、DDX3X、FUBP1、TCP11L2、HLA-A、B或C、CSNK2A1、MET、ASXL1、PD-L1、PD-L2、IDO1、IDO2、ALOX12B和ALOX15B,或拷贝数增加,不包括影响以下染色体带中的任一个的全染色体事件:
6q16.1-q21、6q22.31-q24.1、6q25.1-q26、7p11.2-q11.1、8p23.1、8p11.23-p11.21(含有IDO1、IDO2)、9p24.2-p23(含有PDL1、PDL2)、10p15.3、10p15.1-p13、11p14.1、12p13.32-p13.2、17p13.1(含有ALOX12B、ALOX15B)和22q11.1-q11.21。
在某些实施方案中,本发明用于在疗程期间和在治疗完成之后检测癌症突变(例如抗性突变)。本发明的灵敏度可以允许在治疗期间出现的克隆突变的非侵入性检测并且可以用于检测疾病的复发。
在某些示例性实施方案中,差异表达的微小RNA(miRNA)的miRNA和/或miRNA标识的检测可以用于检测或监测癌症的进展和/或检测对癌症疗法的抗药性。举例来说,Nadal等(Nature Scientific Reports,(2015)doi:10.1038/srep12464)描述了可以用于检测非小细胞肺癌(NSCLC)的mRNA标识。
在某些示例性实施方案中,细胞的克隆亚群中抗性突变的存在可以用于确定治疗方案。在其他实施方案中,可以基于常见肿瘤突变施用用于治疗患者的个性化疗法。在某些实施方案中,常见突变对治疗作出反应而产生并且导致抗药性。在某些实施方案中,本发明可以用于针对获得突变的细胞或带有此类抗药性突变的细胞的扩增来监测患者。
用各种化学治疗剂,尤其用例如酪氨酸激酶抑制剂的靶向疗法治疗频繁导致靶分子中抵抗治疗剂活性的新突变。用以克服这种抗性的多种策略正在评估中,包括不受这些突变影响的第二代疗法的开发和用多种剂,包括作用于抗性突变下游的那些剂的治疗。在例示性实施方案中,针对依鲁替尼,一种靶向布鲁顿氏酪氨酸激酶(BTK)并且用于CLL和某些淋巴瘤的分子的常见突变是在位置481处的半胱氨酸至丝氨酸变化(BTK/C481S)。靶向表皮生长因子受体(EGFR)的酪氨酸激酶结构域的埃罗替尼通常用于肺癌治疗,并且在疗法之后总是发展出抗性肿瘤。抗性克隆体中发现的常见突变是在位置790处的苏氨酸至甲硫氨酸突变。
在癌症患者的群体之间共享的非沉默突变和可以用本发明检测的常见抗性突变在本领域中是已知的(参见例如WO/2016/187508)。在某些实施方案中,可以通过用依鲁替尼、埃罗替尼、伊马替尼、吉非替尼、克唑替尼、曲妥珠单抗、威罗菲尼、RAF/MEK、检查点阻断疗法或抗雌激素疗法治疗来诱导抗药性突变。在某些实施方案中,癌症特异性突变存在于一种或多种编码选自由以下组成的组的蛋白质的基因中:程序性死亡配体1(PD-L1)、雄激素受体(AR)、布鲁顿氏酪氨酸激酶(BTK)、表皮生长因子受体(EGFR)、BCR-Abl、c-kit、PIK3CA、HER2、EML4-ALK、KRAS、ALK、ROS1、AKT1、BRAF、MEK1、MEK2、NRAS、RAC1和ESR1。
免疫检查点是减慢或阻止免疫反应的抑制性途径并且防止因免疫细胞的不受控活性所致的过度组织损伤。在某些实施方案中,所靶向的免疫检查点是程序性死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施方案中,所靶向的免疫检查点是细胞毒性T-淋巴细胞相关抗原(CTLA-4)。在额外实施方案中,所靶向的免疫检查点是CD28和CTLA4 Ig超家族的另一个成员,例如BTLA、LAG3、ICOS、PDL1或KIR。在其他额外实施方案中,所靶向的免疫检查点是TNFR超家族的成员,例如CD40、OX40、CD137、GITR、CD27或TIM-3。
最近,已经在单细胞水平上表征肿瘤和其微环境中的基因表达(参见例如Tirosh等Dissecting the multicellular ecosystem of metastatic melanoma by singlecell RNA-seq.Science 352,189-196,doi:10.1126/science.aad0501(2016));Tirosh等,Single-cell RNA-seq supports a developmental hierarchy in humanoligodendroglioma.Nature.2016年11月10日;539(7628):309-313.doi:10.1038/nature20123.Epub 2016年11月2日;以及国际专利公布序列号WO 2017004153 A1)。在某些实施方案中,可以使用本发明检测基因标识。在一个实施方案中,在肿瘤微环境中监测或检测补体基因。在一个实施方案中,监测或检测MITF和AXL程序。在一个实施方案中,检测肿瘤特异性干细胞或祖细胞标识。此类标识指示了免疫反应的状态和肿瘤的状态。在某些实施方案中,可以在增殖、对治疗的抗性和免疫细胞的丰度方面检测肿瘤的状态。
因此,在某些实施方案中,本发明提供了用于循环DNA,例如肿瘤DNA的低成本、快速、多元化癌症检测板块,尤其用于监测疾病复发或常见抗性突变的发展。
免疫疗法应用
本文所公开的实施方案还可以适用于其他免疫疗法情形。举例来说,在一些实施方案中,对受试者中的免疫反应进行诊断、预后和/或分段的方法包括检测一种或多种生物标志的表达、活性和/或功能的第一水平以及将所检测的水平与对照水平相比较,其中所检测的水平与对照水平的差异指示受试者中免疫反应的存在。
在某些实施方案中,本发明可以用于确定肿瘤浸润性淋巴细胞(TIL)的功能障碍或活化。可以使用已知方法从肿瘤中分离TIL。可以分析TIL以确定其是否应该用于过继细胞转移疗法中。另外,嵌合抗原受体T细胞(CAR T细胞)在施用于受试者之前可以针对功能障碍或活化的标识进行分析。功能障碍和活化的T细胞的例示性标识已有描述(参见例如Singer M等,A Distinct Gene Module for Dysfunction Uncoupled from Activationin Tumor-Infiltrating T Cells.Cell.2016年9月8日;166(6):1500-1511.e9.doi:10.1016/j.cell.2016.08.052)。
在一些实施方案中,C2c2用于评估免疫细胞,例如T细胞(例如CD8+和/或CD4+T细胞)的状态。特别地,可以例如基于与一种或多种T细胞状态相关联的基因或基因标识来确定T细胞活化和/或功能障碍。以这种方式,c2c2可以用于确定T细胞的一个或多个亚群的存在。
在一些实施方案中,C2c2可以用于诊断测定中或可以用作确定患者是否适合于施用免疫疗法或另一种类型的疗法的方法。举例来说,可以经由c2c2进行基因或生物标志标识的检测以确定患者是否对给定的治疗有反应,或如果患者无反应,那么这可能归因于T细胞功能障碍。此种检测提供关于患者最适于接受的疗法类型的信息。举例来说,患者是否应该接受免疫疗法。
在一些实施方案中,本文所公开的系统和测定可以允许临床医师鉴别患者对疗法(例如过继细胞转移(ACT)疗法)的反应是否归因于细胞功能障碍,并且如果是这样的话,跨越生物标志标识的上调和下调的水平将允许解决问题。举例来说,如果接受ACT的患者是无反应的,那么可以通过本文所公开的测定来测定作为ACT的一部分施用的细胞以确定已知与细胞活化和/或功能障碍状态相关联的生物标志标识的相对表达水平。如果特定抑制性受体或分子在ACT细胞中上调,那么可以用受体或分子的抑制剂治疗患者。如果特定刺激性受体或分子在ACT细胞中下调,那么可以用受体或分子的激动剂治疗患者。
在某些示例性实施方案中,本文所描述的系统、方法和装置可以用于筛选鉴别特定细胞类型、细胞表型或细胞状态的基因标识。同样地,经由使用例如压缩传感的方法,本文所公开的实施方案可以用于检测转录组。基因表达数据是高度结构化的,使得一些基因的表达水平预测其他基因的表达水平。基因表达数据是高度结构化的认知允许假设系统中的自由度数是很小的,这允许假设相对基因丰度的计算基础是稀疏的。有可能作出若干生物学上推动的假设,其允许申请者在欠取样下恢复非线性相互作用项而无需具有基因可能相互作用的任何特定认知。特别地,如果申请者假设遗传相互作用是低秩的、稀疏的或这些的组合,那么真正的自由度数相对于完全组合扩展是很小的,这使申请者能够推断具有相对小的扰动数的完整非线性景观。围绕这些假设工作,矩阵补全和压缩传感的分析理论可以用于设计欠取样的组合扰动实验。另外,核学习框架可以用于通过创建组合扰动的预测功能而不直接学习任何个别相互作用系数来采用欠取样压缩传感提供了用以鉴别有待检测的靶转录物的最小数目的方式以获得综合基因表达型态。压缩传感的方法在2016年10月27日提交的PCT/US2016/059230"Systems and Methods for Determining RelativeAbundances of Biomolecules"中公开,其以引用的方式并入本文中。使用如压缩传感的方法鉴别最小转录物标靶组,然后可以设计一组相应的向导RNA以检测所述转录物。因此,在某些示例性实施方案中,获得细胞的基因表达型态的方法包括使用本文所公开的实施方案检测提供细胞或细胞群体的基因表达型态的最小转录物组。
检测核酸标记的项目
或者,本文所描述的实施方案可以用于检测核酸标识符。核酸标识符是可以用于鉴别特定物品的非编码核酸。示例性核酸标识符,例如DNA水印,在Heider和Barnekow.“DNAwatermarks:A proof of concept"BMC Molecular Biology 9:40(2008)中描述。核酸标识符还可以是核酸条形码。基于核酸的条形码是核苷酸(例如DNA、RNA或它们的组合)的短序列,其用作相关分子,例如靶分子和/或靶核酸的标识符。核酸条形码可以具有至少例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90或100个核苷酸的长度,并且可以呈单链或双链形式。一个或多个核酸条形码可以附接或“标记”至靶分子和/或靶核酸。这种附接可以是直接的(例如条形码与靶分子的共价或非共价结合)或间接的(例如经由额外分子,例如特异性结合剂,例如抗体(或其他蛋白质),或条形码接收衔接子(或其他核酸分子))。靶分子和/或靶核酸可以用多个核酸条形码以组合方式,例如核酸条形码多联体作标记。通常,核酸条形码用于将靶分子和/或靶核酸鉴别为来自特定区室(例如离散容积),具有特定物理特性(例如亲和力、长度、序列等),或已经经受某些治疗条件。靶分子和/或靶核酸可以与多个核酸条形码相关联以提供关于所有这些特征(和更多特征)的信息。产生核酸条形码的方法在例如国际专利申请公布号WO/2014/047561中公开。
本申请进一步提供了展示稳固活性的C2c2直系同源物,使其特别适合于RNA裂解和检测的不同应用。这些应用包括但不限于本文所描述的那些。更特别地,展示比所测试的其他具有更强活性的直系同源物是从生物体韦德纤毛菌(LwC2c2)鉴别的C2c2直系同源物。本申请因此提供了修饰所关注的靶基因座的方法,所述方法包括向所述基因座递送非天然产生的或工程改造的组合物,所述组合物包含C2c2效应蛋白,更特别是如本文所描述的具有增加的活性的C2c2效应蛋白和一种或多种核酸组分,其中至少一种或多种核酸组分经过工程改造,一种或多种核酸组分将复合物引导至所关注的标靶,并且效应蛋白与一种或多种核酸组分形成复合物并且所述复合物结合至所关注的靶基因座。在特定实施方案中,所关注的靶基因座包含RNA。本申请进一步提供了在RNA序列特异性干扰、RNA序列特异性基因调控、RNA或RNA产物或lincRNA或非编码RNA或细胞核RNA或mRNA的筛选、诱变、荧光原位杂交或育种中使用具有增加的活性的Cc2效应蛋白。
在以下实施例中进一步描述了本发明,这些实施例不限制权利要求中所描述的本发明的范围。
实施例
实施例1-一般方案
存在两种方式来进行DNA和RNA的C2c2诊断测试。在递送检测适体之后,这种方案还可以与蛋白质检测变体一起使用。第一种是两步反应,其中扩增和C2c2检测独立地完成。第二种是所有物质组合在一个反应中并且这被称为两步反应。重要的是谨记扩增对于较高浓度样品可能不是必需的,所以很好的是具有单独的C2c2方案,其并不内嵌有扩增。
仅CRISPR效应物-无扩增:
表7
组分 体积(μL)
蛋白质(最终44nM) 2
crRNA(最终12nM) 1
背景标靶(总共100ng) 1
靶RNA(可变) 1
RNA传感器探针(125nM) 4
MgCl<sub>2</sub>(最终6mM) 2
反应缓冲液10x 2
RNA酶抑制剂(鼠类,来自NEB) 2
H<sub>2</sub>O 5
总计 20
反应缓冲液是:40mM Tris-HCl、60mM NaCl,pH 7.3
在37℃下进行这个反应20分钟至3小时。在激发:485nm/20nm,发射:528nm/20nm下读出。可以在20分钟开始检测单分子灵敏度的信号,但过程灵敏度的信号对于较长反应时间是较高的。
两步反应:
表8
RPA扩增混合物
Figure BDA0002523004990001451
Figure BDA0002523004990001461
将这种反应物混合在一起,然后再悬浮于冷冻干燥的酶混合物的两个至三个管中。将5μL 280mM MgAc添加至混合物中以开始反应。进行反应10-20分钟。每个反应是20μL,因此这足够用于至多五个反应。
表9
C2c2检测混合物
Figure BDA0002523004990001462
Figure BDA0002523004990001471
反应缓冲液是:40mM Tris-HCl、60mM NaCl,pH7.3
进行这个反应20分钟至3小时。最小检测时间为约20分钟以观察单分子灵敏度。进行反应更长时间仅增强灵敏度。
表10
一锅式反应:
Figure BDA0002523004990001472
所提及的NEB试剂盒是HighScribe T7高产量试剂盒。为使缓冲液再悬浮,使用1.5x浓度:使59μL缓冲液再悬浮于冷冻干燥底物的三个管中并且使用上述混合物。每个反应是20μL,因此这足够用于5个反应。早在30-40分钟就观测到这个反应的单分子灵敏度。
实施例2-来自韦德纤毛菌的C2C2介导DNA和RNA的高度灵敏和特异性检测
快速、便宜和灵敏的核酸检测可以帮助定点护理病原体检测、基因分型和疾病监测。RNA导向的RNA靶向CRISPR效应物Cas13a(先前称为C2c2)在标靶识别后展现混杂RNA酶活性的“附带效应”。我们将Cas13a的附带效应与等温扩增组合以确立基于CRISPR的诊断(CRISPR-Dx),从而提供具有渺摩尔灵敏度和单碱基错配特异性的快速DNA或RNA检测。我们使用这个基于Cas13a的分子检测平台,称为SHERLOCK(特异性高灵敏度酶促报告子解锁(Specific High Sensitivity Enzymatic Reporter UnLOCKing)),以检测寨卡和登革病毒的特异性株系、区分病原性细菌、对人DNA进行基因分型以及鉴别无细胞肿瘤DNA突变。此外,为了不依赖于冷链和长期储存可以冻干SHERLOCK反应试剂,并且易于在纸上复原用于实地应用。
在便携平台上在高灵敏度和单碱基特异性下快速检测核酸的能力可以帮助诊断和监测、流行病学和一般实验室任务。尽管方法是用于检测核酸(1-6),但其在灵敏度、特异性、简易性、成本和速度当中有所权衡。微生物成簇的规律间隔的短回文重复(CRISPR)和CRISPR相关(CRISPR-Cas)适应性免疫系统含有可编程的核酸内切酶,其可以支持用于基于CRISPR的诊断(CRISPR-Dx)。虽然一些Cas酶靶向DNA(7、8),但单效应RNA导向的RNA酶,例如Cas13a(先前称为C2c2)(8)可以用CRISPR RNA(crRNA)重新编程(9-11)以提供用于特异性RNA传感的平台。在识别其RNA标靶后,活化的Cas13a参与附近非靶向的RNA的“附带”裂解(10)。这种crRNA编程的附带裂解活性允许Cas13a在体内通过触发程序性细胞死亡(10)或体外通过标记的RNA的非特异性降解(10、12)来检测特异性RNA的存在。此处,我们描述了SHERLOCK(特异性高灵敏度酶促报告子解锁)、基于核酸扩增的具有渺摩尔灵敏度的体外核酸检测平台和3Cas13a介导的商业报告子RNA的附带裂解(12),从而允许标靶的实时检测(图17)。
方法
克隆用于表达的C2c2基因座和蛋白质
对于细菌体内效率测定,将来自韦德纤毛菌F0279和沙氏纤毛菌的C2c2蛋白质预定为用于哺乳动物表达的密码子优化的基因(Genscript,Jiangsu,China),并且与侧接β-内酰胺酶靶向或非靶向间隔区的相应正向重复一起克隆至pACYC184骨架中。由J23119启动子驱动间隔区表达。
对于蛋白质纯化,将哺乳动物密码子优化的C2c2蛋白质克隆至用于蛋白质纯化的细菌表达载体(6x His/Twin Strep SUMO,从Ilya Finkelstein作为馈赠接受的基于pET的表达载体)中。
细菌体内C2c2效率测定
将LwC2c2和LshC2c2体内效率质粒和先前描述的β-内酰胺酶质粒(Abudayyeh2016)分别以90ng和25ng共转化至NovaBlue Singles感受态细胞(Millipore)中。转化之后,将细胞的稀释液涂于氨苄西林和氯霉素LB-琼脂板上并且在37C下孵育过夜。次日对菌落进行计数。
核酸标靶和crRNA制备
用KAPA Hifi热启动器(Kapa Biosystems)对核酸标靶进行PCR扩增,使用MinElute凝胶提取试剂盒(Qiagen)进行凝胶提取和纯化。使用HiScribe T7快速高产量RNA合成试剂盒(New England Biolabs)在30℃下将纯化的dsDNA与T7聚合酶一起孵育过夜,并且用MEGAclear转录清洁试剂盒(Thermo Fisher)纯化RNA。
对于crRNA制备,将构建体预定为具有附加T7启动子序列的DNA(Integrated DNATechnologies)。将crRNA DNA粘接至短T7引物(最终浓度10uM),并且使用HiScribe T7快速高产量RNA合成试剂盒(New England Biolabs)在37℃下与T7聚合酶一起孵育过夜。使用RNAXP清洁珠粒(Beckman Coulter)以珠粒与反应体积的2x比率纯化crRNA,额外补充1.8x异丙醇(Sigma)。
NASBA等温扩增
NASBA反应的细节在[Pardee 2016]中描述。对于20μL总反应体积,在4℃下组装6.7μL反应缓冲液(Life Sciences,NECB-24)、3.3μL核苷酸混合物(Life Sciences,NECN-24)、0.5μL不含核酸酶的水、0.4μL 12.5μM NASBA引物、0.1uL RNA酶抑制剂(Roche,03335402001)和4μL RNA扩增子(或水用于阴性对照),并且在65℃下孵育2分钟,然后在41℃下孵育10分钟。将5μL酶混合物(Life Sciences,NEC-1-24)添加至每个反应中,并且在41℃下孵育反应混合物2小时。所使用的NASBA引物是5'-AATTCTAATACGACTCACTATAGGGGGATCCTCTAGAAATATGGATT-3'(SEQ ID NO:16)和5'-CTCGTATGTTGTGTGGAATTGT-3'(SEQ ID NO:17),并且加下划线部分指示T7启动子序列。
重组酶聚合酶扩增
使用NCBI Primer blast(Ye等,BMC Bioinformaics 13,134(2012),除了扩增子大小(在100nt与140nt之间)、引物熔融温度(在54C与67C之间)和引物大小(在30nt与35nt之间)以外使用默认参数来设计用于RPA的引物。然后将引物预定为DNA(Integrated DNATechnologies)。
除了在输入模板之前添加280mM MgAc以外,分别如
Figure BDA0002523004990001501
Basic或
Figure BDA0002523004990001502
Basic RT(TwistDx)所指示来运作RPA和RT-RPA反应。除非另有描述,否则在37C下用1uL输入运作反应2小时。
LwC2c2蛋白质纯化
将C2c2细菌表达载体转化至RosettaTM2(DE3)pLysS Singles感受态细胞(Millipore)中。使16mL起子培养物在特级肉汤4生长培养基(12g/L胰蛋白胨、24g/L酵母提取物、9.4g/L K2HPO、2.2g/L KH2PO4,Sigma)(TB)中生长,用于接种4L TB,将其在37C、300RPM下孵育直至OD600达到0.6。此时,通过用IPTG(Sigma)补充至500uM最终浓度来诱导蛋白质表达,将细胞冷却至18C持续16小时用于蛋白质表达。然后在4C下将细胞以5200g离心15分钟。收集细胞团块并且储存于-80C下用于稍后纯化。
在4C下进行蛋白质纯化的所有后续步骤。将细胞团块压碎并且再悬浮于补充有蛋白酶抑制剂(Complete Ultra无EDTA片剂)、溶菌酶和全能核酸酶(benzonase)的溶解缓冲液(20mM Tris-Hcl、500mM NaCl、1mM DTT,pH 8.0)中,继之以超声波处理(Sonifier 450,Branson,Danbury,CT),使用以下条件:1秒上和2秒下的振幅100,超声波处理总时间10分钟。通过在4C下以10,000g离心1小时使溶解产物变洁净,并且经Stericup 0.22微米过滤器(EMD Millipore)过滤上清液。将过滤的上清液施加至StrepTactin琼脂糖(GE)并且在旋转下孵育1小时,继而将蛋白质结合的StrepTactin树脂在溶解缓冲液中洗涤三次。使树脂与250个单位的SUMO蛋白酶(ThermoFisher)一起再悬浮于SUMO消化缓冲液(30mM Tris-HCl、500mM NaCl、1mM DTT、0.15%Igepal(NP-40),pH 8.0)中并且在4C下在旋转下孵育过夜。通过SDS-PAGE和考马斯蓝(Commassie Blue)染色确认消化,并且通过使树脂快速离心来分离蛋白质洗脱物。经由FPLC(AKTA PURE,GE Healthcare Life Sciences)将蛋白质加载至5mLHiTrap SP HP阳离子交换柱(GE Healthcare Life Sciences)上,并且在洗脱缓冲液(20mMTris-HCl、1mM DTT、5%甘油,pH 8.0)中在130mM至2M NaCl的盐梯度上洗脱。通过SDS-PAGE针对LwC2c2的存在测试所得部分,并且汇集含有蛋白质的部分,并且经由离心过滤器单元在S200缓冲液(10mM HEPES、1M NaCl、5mM MgCl2、2mM DTT,pH 7.0)中浓缩至1mL。经由FPLC将浓缩的蛋白质加载至凝胶过滤柱(
Figure BDA0002523004990001511
200Increase 10/300GL,GE HealthcareLife Sciences)上。通过SDS-PAGE分析来自凝胶过滤的所得部分,并且汇集含有LwC2c2的部分,并且将缓冲液换成储存缓冲液(600mM NaCl、50mM Tris-HCl pH 7.5、5%甘油、2mMDTT)并在-80C下冷冻以供储存。
LwC2c2附带检测
除非另有指示,否则在核酸酶测定缓冲液(40mM Tris-HCl、60mM NaCl、6mMMgCl2,pH 7.3)中用45nM纯化的LwC2c2、22.5nM crRNA、125nM底物报告子(ThermoScientific RNAse Alert v2)、2μL鼠类RNA酶抑制剂、100ng背景总RNA和不同量的输入核酸标靶进行检测测定。如果输入是来自RPA反应的包括T7启动子的扩增DNA,那么修改上述C2c2反应以包括1mM ATP、1mM GTP、1mM UTP、1mM CTP和0.6μL T7聚合酶混合物(NEB)。在荧光板读取器(BioTek)上在37℃下使反应进行1-3小时(除非另有指示),每5分钟测量荧光动力学。
通过将上述反应条件与RPA扩增混合物整合来进行组合RPA-DNA扩增、DNA至RNA的T7聚合酶转变和C2c2检测的一锅式反应。简单地说,50μL一锅式测定由以下组成:0.48μM正向引物、0.48μM反向引物、1x RPA再水合缓冲液、不同量的DNA输入、45nM LwC2c2重组蛋白质、22.5nM crRNA、250ng背景总RNA、200nM底物报告子(RNase alert v2)、4uL RNA酶抑制剂、2mM ATP、2mM GTP、2mM UTP、2mM CTP、1μL T7聚合酶混合物、5mM MgCl2和14mM MgAc。
使用TaqMan探针的定量PCR(qPCR)分析
为比较SHERLOCK定量与其他已确立的方法,对ssDNA 1的稀释系列进行qPCR。针对ssDNA 1设计TaqMan探针和引物组(序列如下)并且用IDT合成。使用TaqMan快速高级主混合物(Thermo Fisher)进行测定并且在Roche LightCycler 480上测量。
表11.qPCR引物/探针序列表.
Figure BDA0002523004990001521
使用SYBR Green II的实时RPA
为比较SHERLOCK定量与其他已确立的方法,我们对ssDNA 1的稀释系列进行RPA。为实时定量DNA的积累,我们将1x SYBR Green II(Thermo Fisher)添加至上文所描述的典型RPA反应混合物中,这提供了与核酸的量相关的荧光信号。在荧光板读取器(BioTek)上在37℃下使反应进行1小时,每5分钟测量荧光动力学。
慢病毒制备和加工
慢病毒制备和加工是基于先前已知的方法。简单地说,使用HeBS-CaCl2方法将10μg包括寨卡或登革RNA片段的pSB700衍生物、7.5μg psPAX2和2.5μg pMD2.G转染至HEK293FT细胞(Life Technologies,R7007)。更换补充有10%FBS、1%青霉素-链霉素和4mMGlutaMAX(ThermoFisher Scientific)的DMEM培养基之后28小时,使用0.45μm针筒式过滤器过滤上清液。ViralBind慢病毒纯化试剂盒(Cell Biolabs,VPK-104)和Lenti-X浓缩器(Clontech,631231)用于从上清液纯化和制备慢病毒。使用QuickTiter慢病毒试剂盒(CellBiolabs,VPK-112)定量病毒浓度。将病毒样品外加至7%人血清(Sigma,H4522)中,加热至95℃持续2分钟并且用作RPA的输入。
寨卡人血清样品的分离和cDNA纯化
用AVL缓冲液(Qiagen)使可疑寨卡阳性人血清或尿液样品灭活,并且用QIAamp病毒RNA小型试剂盒(Qiagen)达成RNA的分离。通过混合随机引物、dNTP和样品RNA,继而在70℃下热变性7分钟使分离的RNA转变成cDNA。然后与Superscript III(Invitrogen)一起在22-25℃下孵育10分钟,在50℃下孵育45分钟,在55℃下孵育15分钟并且在80℃下孵育10分钟来逆转录变性的RNA。然后在37℃下将cDNA与RNA酶H(New England Biolabs)一起孵育20分钟以破坏RNA:cDNA杂交体中的RNA。
从人唾液中提取基因组DNA
从收集前30分钟限制消耗食物或饮料的志愿者收集2mL唾液。然后如试剂盒方案所推荐,使用
Figure BDA0002523004990001531
DNA血液小型试剂盒(Qiagen)加工样品。对于煮沸的唾液样品,将400μL磷酸盐缓冲盐水(Sigma)添加至100μL志愿者唾液中并且以1800g离心5分钟。倾析上清液并且使团块与0.2%Triton X-100(Sigma)一起再悬浮于磷酸盐缓冲盐水中,随后在95℃下孵育5分钟。1μL样品用作RPA反应的直接输入。
冷冻干燥和纸沉积
将玻璃纤维滤纸(Whatman,1827-021)用高压釜处理90分钟(ConsolidatedStills and Sterilizers,MKII)并且在5%不含核酸酶的BSA(EMD Millipore,126609-10GM)中阻断过夜。用不含核酸酶的水(Life technologies,AM9932)将纸冲洗一次后,在60℃下将其与4%RNAsecureTM(Life technologies,AM7006)一起孵育20分钟,并且用不含核酸酶的水再冲洗三次。使用前,在80℃下在热板(Cole-Parmer,IKA C-Mag HS7)上将处理的纸干燥20分钟。将1.8μL如早先所指示的C2c2反应混合物置于放置在黑色透明底384孔板(Corning,3544)中的圆盘(2mm)上。对于冷冻干燥的测试,将含有反应混合物圆盘的板在液氮中急速冷冻,并且如Pardee等(2)所描述冷冻干燥过夜。将RPA样品在不含核酸酶的水中以1:10稀释,并且将1.8μL混合物加载至纸圆盘上,并且使用板读取器(BioTek Neo)在37℃下孵育。
细菌基因组DNA提取
对于涉及CRE检测的实验,使细菌培养物在溶菌肉汤(LB)中生长至对数中期,然后成团并且视情况而定,使用制造商用于革兰氏阴性或革兰氏阳性细菌的方案,使用QiagenDNeasy血液和组织试剂盒进行gDNA提取和纯化。通过Quant-It dsDNA测定在Qubit荧光计上定量gDNA,并且经由200-300nm吸收光谱在Nanodrop分光光度计上评价其质量。
对于辨别大肠杆菌与绿脓假单胞菌的实验,使细菌培养物在鲁里亚-贝塔尼(Luria-Bertani,LB)肉汤中生长至静止期早期。使用便携的PureLyse细菌gDNA提取试剂盒(Claremont BioSolutions)加工1.0mL大肠杆菌与绿脓假单胞菌。将1X结合缓冲液添加至细菌培养物中,随后穿过电池供电的溶解筒持续三分钟。含0.5X结合缓冲液的水用作洗涤溶液,随后用150μL水洗脱。
数字微滴PCR定量
为确认图1C中所用的ssDNA 1和ssRNA 1标准稀释液的浓度,我们进行数字微滴PCR(ddPCR)。对于DNA定量,使用被设计成靶向ssDNA 1序列的PrimeTime qPCR探针/引物测定,使用用于探针的ddPCR超级混合物(无dUTP)制成微滴。对于RNA定量,使用被设计成靶向ssRNA 1序列的PrimeTime qPCR探针/引物测定,使用用于探针的一步RT-ddPCR试剂盒制成微滴。在任一种情况下使用QX200微滴产生器(BioRad)产生微滴并且转移至PCR板。如试剂盒的方案中所描述在热循环仪上进行基于微滴的扩增,随后经由在QX200微滴读取器上测量来确定核酸浓度。
用于人基因分型的合成标准
为建立用于人样品基因型的准确调用的标准,我们围绕SNP标靶设计引物以扩增来自人基因组DNA的约200bp区域,其代表两个纯合基因型中的每一个。然后通过将纯合标准以1:1比率混合来制成杂合标准。然后将这些标准稀释至等效基因组浓度(约0.56fg/μL)并且与真正的人样品一起用作SHERLOCK的输入。
肿瘤突变体无细胞DNA(cfDNA)的检测
模拟实际患者cfDNA样品的仿制cfDNA标准购自商业销售商(Horizon DiscoveryGroup)。这些标准对于BRAF V600E与EGFR L858R突变体以四个等位基因分数(100%WT以及0.1%、1%和5%突变体)提供。将3μL这些标准作为输入提供给SHERLOCK。
荧光数据的分析
为计算背景扣除荧光数据,扣除样品的初始荧光以允许在不同条件之间比较。从样品扣除背景条件(无输入或无crRNA条件)的荧光以产生背景扣除荧光。
通过用每种向导除以向导值的和来计算用于SNP或株系辨别的向导比率,以调整样品与样品之间的总体变化。如下计算用于SNP或株系辨别的crRNA比率以调整样品与样品之间的总体变化:
Figure BDA0002523004990001551
其中Ai和Bi分别是指对于给定的个体,传感等位基因A或等位基因B的crRNA的技术性重复i的SHERLOCK强度值。因为我们通常每种crRNA具有四个技术性重复,所以m和n等于4并且分母等效于对于给定的SNP基因座和个体的全部八个crRNA SHERLOCK强度值的和。因为存在两种crRNA,所以对于个体跨越crRNA中的每一种的crRNA比率平均值将始终和是2。因此,在纯合性的理想情况下,阳性等位基因crRNA的平均crRNA比率将是2并且阴性等位基因crRNA的平均crRNA比率将是0。在杂合性的理想情况下,两种crRNA的每一种的平均crRNA比率将是1。
LwCas13a裂解需求的表征
原间隔区侧接位点(PFS)是对于Cas13a的稳固核糖核酸酶活性所需的在靶位点附近存在的特异性基序。PFS位于靶位点的3'端并且先前由我们的小组对LshCas13a表征为H(不是G)(1)。尽管这个基序类似于原间隔区邻近基序(PAM),一种用于DNA靶向2类系统的序列限制,但这个基序功能上是不同的,这是因为其并不涉及于防止内源系统中的CRISPR基因座的自靶向。Cas13a的未来结构研究将可能阐明PFS对Cas13a:crRNA靶复合物形成和裂解活性的重要性。
我们从大肠杆菌纯化重组LwCas13a蛋白质(图2D-E)并且测定其使具有每个可能的原间隔区侧接位点(PFS)核苷酸(A、U、C或G)的173-nt ssRNA裂解的能力(图2F)。类似于LshCas13a,LwCas13a可以使具有A、U或C PFS的标靶稳固地裂解,对具有G PFS的ssRNA的活性较小。尽管我们观察到对具有G PFS的ssRNA 1的活性较弱,但我们仍然观察到对于具有GPFS基序的两个靶位点(表3;rs601338crRNA和寨卡靶向crRNA 2)的稳固检测。有可能在每种情况下不需要H PFS并且在许多情况下用G PFS可以达成强裂解或附带活性。
重组酶聚合酶扩增(RPA)和其他等温扩增策略的论述
重组酶聚合酶扩增(RPA)是由以下三种基本酶组成的等温扩增技术:重组酶、单链DNA结合蛋白(SSB)和链置换聚合酶。RPA克服了其他扩增策略,尤其聚合酶链反应(PCR)中存在的许多技术困难,这是因为酶全部在约37℃的恒定温度下操作,所以不需要温度调控。RPA将用于双链模板的总熔融和引物粘接的温度循环替换为由体内DNA复制和修复启示的酶促方法。重组酶-引物复合物扫描双链DNA并且有助于在互补位点处的链交换。链交换由SSB稳定,从而允许引物保持结合。重组酶的自发解体在其ADP结合状态中发生,从而允许链置换聚合酶侵入并延长引物,允许在定点护理和实地设置中不可用的复杂仪器不存在的情况下扩增。在37-42℃的温度范围内这个过程的循环重复引起指数性DNA扩增。所公布的原始配方使用枯草芽孢杆菌Pol I(Bsu)作为链置换聚合酶,T4 uvsX作为重组酶,以及T4gp32作为单链DNA结合蛋白(2),不过尚不明确哪些组分在本研究中所用的由TwistDx出售的当前配方中。
另外,RPA可具有许多限制:
1)尽管Cas13a检测是定量的(图15),但实时RPA定量可能有困难,这是因为当重组酶使用所有可用的ATP时其快速饱和。虽然实时PCR由于其循环扩增的能力是定量的,但RPA不具有严密控制扩增速率的机制。可以作出某些调整以减小扩增速度,例如减小可用的镁或引物浓度,降低反应温度,或设计无效引物。尽管我们观察到定量SHERLOCK的一些情况,例如在图31、32和52中,但情况并不总是如此并且取决于模板。
2)RPA效率可能对引物设计是灵敏的。制造商通常推荐设计较长引入以确保在平均GC含量(40-60%)下的有效重组酶结合并且筛选至多100个引物对以发现高度灵敏引物对。我们在SHERLOCK下已经发现,我们仅必须设计两个引物对来达成具有单分子灵敏度的渺摩尔测试。这种稳固性可能是归因于由组成上活性的Cas13a附带活性对信号的额外扩增,这抵消了扩增子扩增中的任何无效性。这种质量对于图34中我们的细菌病原体鉴别尤为重要。扩增高度结构化区域,例如细菌基因组中的16S rRNA基因位点经历了问题,这是因为不存在RPA中所涉及的熔融步骤。因此,引物中的二级结构变成问题,限制了扩增效率并且因此限制灵敏度。尽管有这些RPA特定的问题,但由于来自Cas13a的额外信号扩增,因而相信本文所公开的实施方案是成功的。
3)扩增序列长度对于有效RPA必须是短的(100-200bp)。对于大多数应用,这并不是重大问题并且甚至可能是有利的(例如,平均片段大小是160bp的cfDNA检测)。有时,大扩增子长度是重要的,例如当需要通用引物用于细菌检测并且用于辨别的SNP散布在大片区域上时。
SHERLOCK的模块性允许在T7转录和Cas13a检测之前使用任何扩增技术,甚至是非等温方法。这种模块性能够由单个反应中T7和Cas13a步骤的相容性来达成,从而允许对具有T7启动子的任何扩增的DNA输入进行检测。在使用RPA之前,尝试基于核酸序列的扩增(NASBA)(3、4)用于我们的检测测定(图10)。然而,NASBA并不大大改善Cas13a的灵敏度(图11和53)。在检测之前可以采用的其他扩增技术包括PCR、环介导的等温扩增(LAMP)(5)、链置换扩增(SDA)(6)、解旋酶依赖性扩增(HDA)(7)和切口酶扩增反应(NEAR)(8)。互换任何等温技术的能力允许SHERLOCK克服任一种扩增技术的特定限制。
工程改造的错配的设计
我们先前显示,当标靶:crRNA双链体中存在两个或更多个错配时LshCas13a标靶裂解减少,但相对不受单错配影响,这是我们确认LwCas13a附带裂解的观测结果(图36A)。我们假定,通过将额外突变引入crRNA间隔区序列中,我们将使针对具有额外错配(总共两个错配)的标靶的附带裂解不稳定,同时保留仅在单错配的情况下将存在的中靶附带裂解。为测试工程改造增加的特异性的可能性,我们设计了多个靶向ssRNA 1的crRNA并且在crRNA的长度上包括错配(图36A)以优化中靶附带裂解并且使因单错配而不同的标靶的附带裂解降至最低。我们观测到这些错配并不减少ssRNA 1的附带裂解,但显著减小包括额外错配的标靶(ssRNA 2)的信号。最好地区分ssRNA 1和2的所设计的crRNA包括接近于ssRNA2错配的合成错配,实际上在杂交的RNA中形成“气泡”或变形。由标靶中存在的合成错配和额外错配的配合(即,双重错配)引起的灵敏度损失与LshCas13a和LwCas13a对连续或附近的双重错配的灵敏度一致,并且提出了能够实现单核苷酸区别的crRNA的合理设计的基础(图36B)。
对于ZIKV和DENV株系的错配检测,我们的全长crRNA含有两个错配(图37A、B)。归因于株系之间的高序列分歧,我们不能发现在两个基因组之间仅具有单核苷酸差异的28nt连续段。然而,我们预测较短crRNA将仍然是功能性的,并且设计针对两个ZIKV株系中的标靶的较短23nt crRNA,所述株系包括间隔区序列中的合成错配和靶序列中的仅一个错配。这些crRNA仍然可以区分ZIKV的非洲和美洲株系(图36C)。23nt和20nt crRNA的后续测试显示,间隔区长度的减小降低活性,但维持或增强辨别单错配的能力(图57A-G)。为了更好地理解可以如何引入合成错配以有助于单核苷酸突变的辨别,我们跨越间隔区的最初七个位置在以下三种不同间隔区长度下拼贴合成错配:28nt、23nt和20nt(图57A)。在第三个位置处具有突变的标靶上,当合成错配在间隔区的位置5处时LwCas13a显示最大特异性,在较短间隔区长度下具有改善的特异性,但具有较低水平的中靶活性(图57B-G)。我们还使靶突变跨越位置3-6偏移并且拼贴间隔区中围绕突变的合成错配(图58)。
通过SHERLOCK使用合成标准的基因分型
从SNP基因座的PCR扩增建立的合成标准的评估允许基因型的准确鉴别(图60A、B)。通过在个体的样品与合成标准的SHERLOCK结果之间计算所有比较(ANOVA),可以通过发现具有最相似的SHERLOCK检测强度的合成标准来鉴别每个个体的基因型(图60C、D)。这种SHERLOCK基因分型方法可普及至任何SNP基因座(图60E)。
SHERLOCK是可负担的、可适应的CRISPR-Dx平台
对于SHERLOCK的成本分析,省略确定成本可忽略不计的试剂,包括用于crRNA合成的DNA模板、RPA中所用的引物、常用缓冲液(MgCl2、Tris HCl、甘油、NaCl、DTT)、玻璃微纤维滤纸和RNAsecure试剂。对于DNA模板,来自IDT的超聚体(ultramer)合成提供了用于40个体外转录反应的物质(每个足够用于约10,000个反应),花费约70美元,这为crRNA合成增添可忽略不计的成本。对于RPA引物,花费约10美元可以购买25nmol IDT合成的30nt DNA引物,提供了足够用于5000个SHERLOCK反应的物质。花费0.50美元/张可得到玻璃微纤维纸,这足以用于数千个SHERLOCK反应。4%RNAsecure试剂成本是7.20美元/毫升,这足以用于500个测试。
另外,对于所有实验,除了基于纸的测定外,使用384孔板(Corning 3544),成本是0.036美元/反应。由于可忽略不计的成本,这不包括于总成本分析中。另外,SHERLOCK-POC不需要使用塑料容器,这是因为其可以在纸上容易地进行。本文所用的SHERLOCK的读出方法是配备有过滤器组或单色器的板读取器。作为资本投资,读取器的成本不包括于计算中,这是因为成本随着更多反应在仪器上运作而急剧降低并且可忽略不计。对于POC应用,可以使用更便宜和便携的替代品,例如手持式分光光度计(9)或便携电子读取器(4),这使仪器的成本降至<200美元。虽然这些更便携的解决方案与更庞大的仪器相比将降低读出的速度和简易性,但其允许更广泛的使用。
结果
本文所描述的测定和系统一般可以包括扩增和检测的两步过程。在第一步期间,例如通过等温扩增来扩增核酸样品RNA或DNA。在第二步期间,将扩增的DNA转录至RNA中,随后与CRISPR效应物,例如C2c2一起孵育,并且对crRNA进行编程以检测靶核酸序列的存在。为能够进行检测,将已经用淬灭的荧光团作标记的报告子RNA添加至反应中。报告子RNA的附带裂解引起荧光团的解淬灭(un-quenching)并且允许核酸标靶的实时检测(图17A)。
为达成稳固的信号检测,从生物体韦德纤毛菌(LwC2c2)鉴别并评估C2c2的直系同源物。通过将LwC2c2蛋白质与合成CRISPR阵列一起在大肠杆菌中表达并且对其进行编程以使β-内酰胺酶mRNA内的靶位点裂解,使得在氨苄西林选择下细菌死亡来评估所述蛋白质的活性(图2B)。LwC2c2基因座相比LshC2c2基因座观测到较少存活的大肠杆菌菌落,展示LwC2c2直系同源物的较高裂解活性(图2C)。然后从大肠杆菌纯化人密码子优化的LwC2c2蛋白质(图2D-E),并且使用不同原间隔区侧接位点(PFS)核苷酸测定其使173-nt ssRNA裂解的能力(图2F)。LwC2c2能够使可能四个PFS标靶中的每一个裂解,对具有G PFS的ssRNA的活性略小。
使用可商购的RNA荧光板读取器测量LwC2c2 RNA酶附带活性的实时测量(图17A)。为确定LwC2c2活性的基线灵敏度,将LwC2c2与ssRNA标靶1(ssRNA 1)和与ssRNA标靶内的位点互补的crRNA以及RNA传感器探针一起孵育(图18)。这得到约50fM的灵敏度(图27A),尽管这比其他新近核酸检测技术(Pardee等,2014)更灵敏,但对于需要亚飞摩尔检测性能的许多诊断应用不够灵敏(Barletta等,2004;Emmadi等,2011;Rissin等,2010;Song等,2013)。
为增加灵敏度,在与LwC2c2一起孵育之前增添等温扩增步骤。将LwC2c2介导的检测与先前所用的等温扩增方法,例如基于核酸序列的扩增(NASBA)(Compton,1991;Pardee等,2016)相结合在一定程度上改善灵敏度(图11)。测试替代性等温扩增方法重组酶聚合酶扩增(RPA)(Piepenburg等,2006),其可以用于在不足两小时内以指数方式扩增DNA。通过将T7 RNA聚合酶启动子添加至RPA引物上,可以使扩增的DNA转变成RNA用于由LwC2c2进行后续检测(图17)。因此,在某些示例性实施方案中,测定包括通过RPA扩增、DNA至RNA的T7 RNA聚合酶转变和通过来自淬灭的报告子的荧光的C2c2解锁对RNA的后续检测的组合。
对ssRNA 1的合成的DNA型式使用示例性方法,有可能达成在每个反应1-10个分子的范围内的渺摩尔灵敏度(图27B,左侧)。为验证检测的准确度,使用数字微滴PCR限定输入DNA的浓度并且确认最低可检测的标靶浓度(2aM)是每微升的单分子浓度。通过添加逆转录步骤,RPA还可以将RNA扩增成dsDNA形式,允许达成对ssRNA 1的渺摩尔灵敏度(27B,右侧)。类似地,通过数字微滴PCR确认RNA标靶的浓度。为评估示例性方法用作POC诊断测试的可行性,测试所有组分-RPA、T7聚合酶扩增和LwC2c2检测-在单个反应中起作用的能力并且发现一锅式测定型式的渺摩尔灵敏度(图22)。
测定能够在液体中或在纸上进行灵敏病毒检测
接下来确定测定是否将在需要高灵敏度并且可以得益于便携诊断的传染病应用中有效。为测试模型系统中的检测,产生带有寨卡病毒基因组和相关黄病毒登革的RNA片段的慢病毒(Dejnirattisai等,2016)并且定量病毒颗粒的数目(图31A)。所检测的仿制病毒的水平低至2aM。同时,还有可能在含有寨卡和登革RNA片段的这些代理病毒之间显示出明确的辨别(图31B)。为确定测定是否将与冷冻干燥相容以消除对用于分配的冷链的依赖性,将反应组分冷冻干燥。使用样品再水合冻干的组分之后,检测20fM ssRNA 1(图33A)。因为资源贫乏和POC设置将得益于易于可用的纸测试,所以还评估在玻璃纤维纸上C2c2检测的活性并且发现纸上点斑的C2c2反应能够靶向检测(图33B)。以组合形式,对C2c2检测反应进行冷冻干燥和纸上点斑促成ssRNA 1的灵敏检测(图33C)。在溶液中的LwC2c2与冷冻干燥的LwC2c2之间对于合成寨卡病毒RNA片段的检测也观测到类似水平的灵敏度,展示冷冻干燥的SHERLOCK的稳固性和快速POC寨卡病毒诊断的潜力(图33D-E)。为此目的,对测定的POC变体的能力进行测试以确定辨别寨卡RNA与登革RNA的能力(图31C)。虽然纸上点斑和冻干略微降低读出的绝对信号,但与具有登革对照序列的仿制病毒的检测相比,测定仍然显著检测到浓度低至20aM的仿制寨卡病毒(图31D)。
已经报道了人中的寨卡病毒RNA水平低至患者唾液中的3x 106个拷贝/毫升(4.9fM)和患者血清中的7.2x 105个拷贝/毫升(1.2fM)(Barzon等,2016;Gourinat等,2015;Lanciotti等,2008)。从所获得的患者样品,观测到低至1.25x 103个拷贝/毫升(2.1aM)的浓度。为评估测定是否能够进行低滴度临床分离株的寨卡病毒检测,从患者中提取病毒RNA并且进行逆转录,并且所得cDNA用作测定的输入(图32A)。在低至1.25个拷贝/微升(2.1aM)的浓度下观测到对寨卡人血清样品的显著检测(图32B)。此外,来自患者样品的信号预测寨卡病毒RNA拷贝数并且可以用于预测病毒负荷(图31F)。为测试对于核酸纯化不可用的疾病情况的广泛应用性,测试外加至人血清中的ssRNA 1的检测,并且确定测定在低于2%的血清水平下活化(图33G)。
细菌病原体区别和基因区别
为确定测定是否可以用于区分细菌病原体,选择16S V3区作为初始标靶,这是因为保守侧接区允许跨越细菌种类使用通用RPA引物,并且可变内区允许区别种类。设计一组5个可能的靶向crRNA用于病原性株系以及分离的大肠杆菌和绿脓假单胞菌gDNA(图34A)。测定能够区分大肠杆菌或绿脓假单胞菌gDNA并且对于其他种类的crRNA显示出低背景信号(图34A、B)。
测定还可以适应于快速检测和区分所关注的细菌基因,例如抗生素抗性基因。碳青霉烯抗性肠道菌(CRE)是重大的新兴公共卫生挑战(Gupta等,2011)。评估测定用以检测碳青霉烯抗性基因的能力,以及测试是否可以区分不同碳青霉烯抗性基因。从带有肺炎克雷伯菌碳青霉烯酶(KPC)或新德里金属-β-内酰胺酶1(NDM-1)抗性基因的临床分离株获得肺炎克雷伯菌,并且设计crRNA以区分基因。所有CRE具有比缺乏这些抗性基因的细菌显著的信号(图35A),并且我们可以显著区分KPC与NDM-1抗性株系(图35B)。
CRISPR RNA导向的RNA酶的单碱基错配特异性
已经显示,某些CRISPR RNA导向的RNA酶直系同源物,例如LshC2c2并不容易区分单碱基错配(Abudayyeh等,2016)。如本文所展示,LwC2c2也共享这种特征(图37A)。为增加LwC2c2裂解的特异性,开发用于将合成错配引入crRNA:标靶双链体中的系统,其增加对错配的总灵敏度并且能够实现单碱基错配灵敏度。设计标靶1的多个crRNA并且在crRNA的长度上包括错配(图37A)以优化中靶裂解并且使因单错配而不同的标靶的裂解降至最低。这些错配并不降低ssRNA标靶1的裂解效率,但显著减小包括额外错配的标靶(ssRNA标靶2)的信号。最好地区分标靶1和2的所设计的crRNA包括接近于标靶2错配的合成错配,实际上形成“气泡”。由标靶中存在的合成错配和额外错配的配合(即,双重错配)引起的灵敏度损失与LshC2c2对连续或附近的双重错配的灵敏度一致(Abudayyeh等,2016),并且提出了能够实现单核苷酸区别的crRNA的合理设计的格局(图37B)。
在已经展示可以工程改造C2c2以识别单碱基错配下,确定这种工程改造的特异性是否可以用于区分密切相关的病毒病原体。多个crRNA被设计成检测寨卡病毒的非洲或美洲株系(图37A)和登革病毒的株系1或3(图37C)。这些crRNA包括间隔区序列中的合成错配,当与中靶株系呈双链体时归因于合成错配而导致单个气泡形成。然而,当合成错配间隔区与脱靶株系呈双链体时,归因于合成错配和SNP错配而形成两个气泡。合成错配crRNA以显著高于脱靶株系的信号检测其相应株系,从而允许稳固的株系区别(图37B、37D)。归因于株系之间的显著序列相似性,不可能发现在两个基因组之间仅具有单核苷酸差异的28nt连续段以展示真正的单核苷酸株系区别。然而,预测较短crRNA将仍然是功能性的,这是因为其与LshC2c2一起(Abudayyeh等,2016),并且因此设计针对两个寨卡株系中的标靶的较短23-nt crRNA,所述株系包括间隔区序列中的合成错配和靶序列中的仅一个错配。这些crRNA仍然能够在高灵敏度下区分寨卡的非洲和美洲株系(图36C)。
使用从唾液纯化的DNA的快速基因分型
从人唾液的快速基因分型可以适用于急诊药物基因组学情况或用于家庭诊断。为展示本文所公开的实施方案用于基因分型的潜力,选择五个基因座以使用23andMe基因分型数据作为黄金标准为C2c2检测定基准(Eriksson等,2010)(图38A)。五个基因座横跨大范围的功能性关联,包括对例如抑制素(statin)或醋氨酚(acetaminophen)的药物的敏感度、诺如病毒易感性以及心脏病风险(表12)。
表12:所测试的SNP变体
Figure BDA0002523004990001631
Figure BDA0002523004990001641
从四名人受试者收集唾液,并且使用简单的商业试剂盒在小于一小时内纯化基因组DNA。四名受试者具有跨越五个基因座的一组多样的基因型,对此提供了足够宽的取样空间以为用于基因分型的测定定基准。对于五个SNP基因座中的每一个,使用RPA用适当引物扩增受试者的基因组DNA,继而用LwC2c2检测,并且设计crRNA对以特异性地检测两个可能等位基因之一(图38B)。测定特定地足以在高显著性下区分等位基因并且推断纯合与杂合基因型。因为在检测之前对唾液进行DNA提取方案,所以测试测定以确定是否可以更适用于通过使用加热至95℃持续5分钟的唾液而无需任何进一步提取的POC基因分型。测定能够对唾液仅经受加热持续5分钟,然后进行后续扩增和C2c2检测的两名患者正确地进行基因分型(图40B)。
在低等位基因分数下cfDNA中的癌性突变的检测
因为测定对标靶中的单核苷酸差异具有高度特异性,所以设计测试以确定测定是否足够灵敏来检测无细胞DNA(cfDNA)中的癌症突变。cfDNA片段是小百分比(0.1%至5%)的野生型cfDNA片段(Bettegowda等,2014;Newman等,2014;Olmedillas Lopez等,2016;Qin等,2016)。在cfDNA领域中的重大挑战是检测这些突变,这是因为在给出血液的背景中所发现的高水平的非突变DNA下通常难以发现这些突变(Bettegowda等,2014;Newman等,2014;Qin等,2016)。POC cfDNA癌症测试还将适用于癌症存在的定期筛选,尤其对于处于缓解期的风险下患者。
通过在crRNA靶位点中具有单突变的ssDNA1的背景中稀释dsDNA标靶1来确定测定用以检测野生型背景中的突变体DNA的能力(图41A-B)。LwC2c2能够传感dsDNA 1达到低至背景dsDNA的0.1%和dsDNA 1的渺摩尔浓度内的水平。这个结果显示,背景突变体dsDNA 1的LwC2c2裂解足够低以允许在0.1%等位基因分数下稳固检测中靶dsDNA。在低于0.1%的水平下,背景活性可能成问题,这阻止正确标靶的任何进一步显著检测。
因为测定可以在临床相关范围内的等分基因分数下传感合成标靶,所以评估测定是否能够检测cfDNA中的癌症突变。设计针对两种不同癌症突变EGFR L858R和BRAF V600E的RPA引物,并且在类似于实际人cfDNA样品的5%、1%和0.1%的等位基因分数下使用商业cfDNA标准以供测试。使用一对可以区分突变体等位基因与野生型等位基因的crRNA(图38C),达成对两种突变体基因座的0.1%等位基因分数的检测(图39A-B)。
论述
通过组合C2c2的天然特性与等温扩增和淬灭的荧光探针,本文所公开的测定和系统已经展示为通用的稳固方法来检测RNA和DNA,并且适合于多种快速诊断,包括传染病应用和快速基因分型。本文所公开的测定和系统的主要优点是在数天之内花费低至0.6美元/测试可以重新设计并合成新的POC测试。
因为许多人疾病应用需要检测单错配的能力,所以开发合理的方法以通过将合成错配引入crRNA的间隔区序列中使crRNA工程改造成对靶序列中的单错配具有高度特异性。用CRISPR效应物达成特异性的其他方法依靠在许多向导设计上基于筛选的方法(Chavez等,2016)。使用设计的错配crRNA,展示因单错配而不同的位点中的寨卡和登革病毒株的辨别、来自人唾液gDNA的SNP的快速基因分型以及cfDNA样品中的癌症突变的检测。
测定平台的低成本和适应性适用于其他应用,包括(i)代替特异性qPCR测定,例如Taqman的一般RNA/DNA定量经验,(ii)类似于微阵列的快速、多元化RNA表达检测,以及(iii)其他灵敏检测应用,例如来自食物中的其他来源的核酸污染的检测。另外,C2c2可以潜在地用于生物设置内,例如细胞中的转录物的检测,并且在给出C2c2检测的高度特异性性质下,有可能追踪活细胞中的转录物或疾病相关突变的等位基因特异性表达。在适体的广泛可用性下,还有可能通过将适体对蛋白质的检测与揭露RPA的隐蔽扩增位点继之以C2c2检测相结合来传感蛋白质。
使用CRISPR-Cas13a/C2c2的核酸检测:渺摩尔灵敏度和单核苷酸特异性
为达成稳固的信号检测,我们从韦德纤毛菌(LwCas13a)鉴别Cas13a的直系同源物,其相对于沙氏纤毛菌Cas13a(LshCas13a)展现较高的RNA导向的RNA酶活性(10)(图2,还参见上文“LwCas13a裂解需求的表征”)。与ssRNA标靶1(ssRNA 1)、crRNA和报告子(淬灭的荧光RNA)一起孵育的LwCas13a(图18)(13)得到约50fM的检测灵敏度(图51、15),这对于许多诊断应用不够灵敏(12、14-16)。我们因此探索了将基于Cas13a的检测与不同等温扩增步骤组合(图10、11、53、16)(17、18)。在探索的方法当中,重组酶聚合酶扩增(RPA)(18)得到最高灵敏度并且可以与T7转录相结合以使扩增的DNA转变成RNA用于由LwCas13a进行后续检测(还参见上文“重组酶聚合酶扩增(RPA)和其他等温扩增策略的论述”)。我们涉及了通过RPA扩增、扩增的DNA至RNA的T7 RNA聚合酶转录和通过Cas13a附带RNA裂解介导的报告子信号作为SHERLOCK释放对靶RNA检测的这种组合。
我们首先确定SHERLOCK用于检测RNA(当与逆转录相结合时)或DNA标靶的灵敏度。如通过数字微滴PCR(ddPCR)验证,我们达成了RNA与DNA的单分子灵敏度(图27、51、54A、B)。当我们在单个反应中组合所有SHERLOCK组分时维持渺摩尔灵敏度,从而展示这个平台作为定点护理(POC)诊断的可行性(图54C)。SHERLOCK具有与两种已确立的灵敏核酸检测方法ddPCR和定量PCR(qPCR)类似水平的灵敏度,而单独的RPA对于检测低水平的标靶不够灵敏(图55A-D)。此外,如由跨越重复的变异系数来测量,SHERLOCK相比ddPCR、qPCR和RPA显示较小的变异(图55E-F)。
我们接下来检查SHERLOCK是否将在需要高灵敏度的传染病应用中有效。我们产生了带有寨卡病毒(ZIKV)或相关黄病毒登革(DENV)的基因组片段的慢病毒(19)(图31A)。SHERLOCK检测低至2aM的病毒颗粒并且可以辨别ZIKV与DENV(图31B)。为了探索SHERLOCK在实地中的潜在用途,我们首先展示了冻干并随后再水合的Cas13acrRNA复合物(20)可以检测20fM非扩增的ssRNA 1(图33A)并且标靶检测也可能在玻璃纤维纸上进行(图33B)。SHERLOCK的其他组分也适用于冷冻干燥:RPA在环境温度下作为冻干的试剂提供,并且我们先前展示了T7聚合酶耐受冷冻干燥(2)。以组合形式,对Cas13a检测反应进行冷冻干燥和纸上点斑促成与水性反应可比水平的ssRNA 1的灵敏检测(图33C-E)。尽管纸上点斑和冻干略微降低读出的绝对信号,但SHERLOCK(图31C)在低至20aM的浓度下可以容易地检测仿制ZIKV病毒(图31D)。SHERLOCK还能够检测临床分离株(血清、尿液或唾液)中的ZIKV,其中滴度可以低至2x 103个拷贝/毫升(3.2aM)(21)。如通过qPCR验证(图32F和52B),从患者血清或尿液样品中提取并逆转录成cDNA的ZIKV RNA(图32E和52A)可以在低至1.25x 103个拷贝/毫升(2.1aM)的浓度下检测。此外,来自患者样品的信号预测ZIKV RNA拷贝数并且可以用于预测病毒负荷(图33F)。为模拟样品检测而无需核酸纯化,我们测量了外加至人血清中的ssRNA 1的检测,并且发现Cas13a可以检测含有至多2%血清的反应中的RNA(图33G)。CRISPR-dx的另一个重要的流行病学应用是细菌病原体的鉴别和特异性细菌基因的检测。我们靶向16S rRNA基因V3区,其中保守侧接区允许跨越细菌种类使用通用RPA引物,并且可变内区允许区别种类。在用于不同病原性株系以及从大肠杆菌和绿脓假单胞菌分离的gDNA的一组五个可能的靶向crRNA中(图34A),SHERLOCK对株系正确地进行基因分型并且显示低交叉反应性(图34B)。另外,我们能够使用SHERLOCK区分具有以下两种不同抗性基因的肺炎克雷伯菌的临床分离株:肺炎克雷伯菌碳青霉烯酶(KPC)和新德里金属-β-内酰胺酶1(NDM-1)(22)(图56)。
为增加SHERLOCK的特异性,我们将合成错配引入crRNA:标靶双链体中,这使得LwCas13a能够辨别因单碱基错配而不同的标靶(图36A、B;还参见上文“工程改造的错配的设计”)。我们设计了在间隔区序列中具有合成错配的多个crRNA以检测ZIKV的非洲或美洲株系(图37A)和DENV的株系1或3(图37C)。合成错配crRNA以显著高于脱靶株系的信号(双尾司徒登t检验;p<0.01)检测其相应株系,从而允许基于单错配的稳固的株系辨别(图37B、D,36C)。进一步表征揭示,当突变在间隔区的位置3处并且合成错配在位置5处时,Cas13a检测达成最大特异性同时维持中靶灵敏度(图57和58)。检测单碱基差异的能力开辟了使用SHERLOCK用于快速人基因分型的机会。我们选择横跨一系列健康相关的单核苷酸多态性(SNP)(表1)的五个基因座并且在这些SNP处使用23andMe基因分型数据作为黄金标准为SHERLOCK检测定基准(23)(图38A)。我们从跨越所关注的基因座具有多样化基因型的四名人受试者收集唾液,并且经由商业柱纯化或直接加热五分钟来提取基因组DNA(20)。SHERLOCK以高显著性和足够的特异性区分等位基因来推断纯合与杂合基因型(图38B、40、59、60;还参见上文“通过SHERLOCK使用合成标准的基因分型”)。最后,我们试图确定SHERLOCK是否可以检测无细胞(cf)DNA片段中的低频癌症突变,这由于患者血液中高水平的野生型DNA而有挑战性(24-26)。我们首先发现SHERLOCK可以检测在基因组DNA的背景中稀释的渺摩尔浓度的ssDNA 1(图61)。接下来,我们发现SHERLOCK还能够在低至背景DNA的0.1%的水平下检测含单核苷酸多态性(SNP)的等位基因(图41A、B),所述水平处于临床相关范围内。我们然后展示SHERLOCK可以检测具有低至0.1%的等位基因分数的仿制cfDNA样品中的两种不同癌症突变EGFR L858R和BRAF V600E(图38、39)(20)。
SHERLOCK平台适用于其他应用,包括(i)代替特异性qPCR测定,例如TaqMan的一般RNA/DNA定量,(ii)快速、多元化RNA表达检测,以及(iii)其他灵敏检测应用,例如核酸污染的检测。另外,Cas13a可以潜在地检测生物设置内的转录物并且追踪活细胞中转录物或疾病相关突变的等位基因特异性表达。我们已经显示,SHERLOCK是用以检测RNA和DNA的通用的稳固方法,其适合于包括传染病应用和灵敏基因分型的快速诊断。很有信心在数天之内花费低至0.61美元/测试可以重新设计并合成SHERLOCK纸测试(还参见上文“SHERLOCK是可负担的、可适应的CRISPR-Dx平台”),这是因为所测试的几乎每个crRNA促成高灵敏度和特异性。这些质量突出了CRISPR-Dx的能力并且开辟了生物分子的快速、稳固和灵敏检测的新途径。
表13:所使用的RPA引物
Figure BDA0002523004990001681
Figure BDA0002523004990001691
Figure BDA0002523004990001701
Figure BDA0002523004990001711
Figure BDA0002523004990001721
表14:所使用的crRNA序列
Figure BDA0002523004990001722
Figure BDA0002523004990001731
Figure BDA0002523004990001741
Figure BDA0002523004990001751
Figure BDA0002523004990001761
Figure BDA0002523004990001771
Figure BDA0002523004990001781
Figure BDA0002523004990001791
Figure BDA0002523004990001801
Figure BDA0002523004990001811
Figure BDA0002523004990001821
Figure BDA0002523004990001831
Figure BDA0002523004990001841
Figure BDA0002523004990001851
Figure BDA0002523004990001861
Figure BDA0002523004990001871
Figure BDA0002523004990001881
Figure BDA0002523004990001891
表15:本实施例中所使用的RNA和DNA标靶
Figure BDA0002523004990001892
Figure BDA0002523004990001901
Figure BDA0002523004990001911
Figure BDA0002523004990001921
Figure BDA0002523004990001931
Figure BDA0002523004990001941
表16:本实施例中所使用的质粒
Figure BDA0002523004990001942
实施例3-使用侧流试纸条进行SHERLOCK检测
基于侧流的技术由于其视觉读出和检测速度已广泛用于即时环境。我们开发了一种用于将RNA酶活性与带有FAM和生物素的珠固定报告子的释放关联起来的系统,从而允许在商业侧流条带上进行检测(图87A)。我们发现,尽管与基于荧光的读出相比灵敏度降低(图87B,图87C),此方法仍然可以可靠地检测SHERLOCK活性。
我们设计了一种基于FAM生物素报告子的破坏而非释放的替代侧流读出。大量报告子会使比色的抗FAM抗体在条带的第一线路积聚,从而阻止抗体与第二线路上的蛋白A结合;报告子的裂解会减少第一线路处的积累,并导致在第二线路产生信号(图85A)。我们测试了此设计对寨卡和登革热ssRNA的视觉检测,发现可以在90分钟内以10aM条件灵敏度进行检测(图85B、图85C和图88A、图88B),这表明侧流读出对于多种标靶可靠。
实施例4–侧流在大豆检测和癌症诊断中的应用
为了进一步证明侧流SHERLOCK的实用性,我们将该系统应用于农业和健康相关的生物技术场景。从监管的角度以及对于监测豆类使用的公司而言,对经遗传修饰的大豆的检测都很重要。我们设计了一种对CP4-EPSPS基因进行基因分型的SHERLOCK测定法,CP4-EPSPS基因是来自根瘤土壤杆菌菌株CP4的5-烯醇丙酮酸莽草酸-3-磷酸合酶的耐除草剂形式,它可使经修饰的植物对除草剂Roundup具有抗性。我们设计了感测CP4-EPSPS或凝集素(野生型大豆中存在的基因)的crRNA,并使用不到5分钟的快速粗提协议从Roundup Ready和野生型大豆中收获了DNA。我们发现,SHERLOCK能够在很短的时间(约20分钟)内成功地对RR豆进行基因分型,切来自粗提取物的背景很少。此外,使用定量SHERLOCK,我们可以准确地预测野生型和RR豆混合物中RR豆的百分比。因为GMO检测最适合作为现场即时技术,所以我们调整SHERLOCK测定用于侧流,并且发现我们可使用视觉读出在试纸条上对大豆进行灵敏的基因分型。此外,侧流读出适合快速检测,总孵育时间为30分钟,从而允许在纸上直观地进行可靠的SHERLOCK检测(图89)。
利用SHERLOCKv1,我们在无细胞DNA标准液上验证了该技术以显示对癌症突变的检测。利用SHERLOCKv2,我们有志于检测患者血液样品中的癌症突变,这很困难,因为cfDNA的浓度通常很低(为约1ng/μL),而要检测的实际突变仅占0.1%-5%的一小部分。我们设计了一种SHERLOCK测定法来检测EGFR L858R突变,并从携带该突变的患者和没有该突变的患者中分离出cfDNA。我们发现,SHERLOCK能够成功检测到突变(图86G),并且也可使用侧流试纸条以视觉读出完成该检测(图86H、图86I)。我们还设计了一种SHERLOCK测定法来检测肺癌中涉及的典型EGFR外显子19缺失(5个氨基酸),并且发现SHERLOCK既可经由荧光灵敏地检测到这种基因组改变(图86J和图90A)又可在侧流试带上灵敏地检测到这种基因组改变(图86K、图86L和图90B、图90C)。
实施例5-使用CRISPR-CAS13对植物基因进行核酸检测
方法
Cas13和Csm6直系同源物的蛋白质表达和纯化。
如之前所述进行LwaCas13a表达和纯化(Gootenberg等Science356:438-442(2017))。表达PsmCas13b和Csm6直系同源物,并用改良的方案加以纯化。简单来说,将细菌表达载体转化至RosettaTM2(DE3)pLysS Singles感受态细胞(Millipore)中。使12.5mL发酵剂培养物在Terrific Broth 4生长培养基(Sigma)(TB)中生长过夜,使用所述培养基接种4L的TB,在37℃和300RPM下生长,直至OD600为0.5。此时,通过用IPTG(Sigma)补充至500μM最终浓度来诱导蛋白质表达,并且将细胞冷却至18℃持续16小时用于蛋白质表达。然后将细胞在4℃下以5000g离心15分钟。收集细胞团块并且储存于-80℃下用于稍后纯化。
在4℃下进行蛋白质纯化的所有后续步骤。将细胞团块压碎并且再悬浮于补充有蛋白酶抑制剂(Complete Ultra无EDTA片剂)、溶菌酶(500μg/1ml)和全能核酸酶(benzonase)的溶解缓冲液(20mM Tris-Hcl、500mM NaCl、1mM DTT,pH 8.0)中,继之使用LM20微射流机系统以27,000PSI进行高压细胞破坏。通过在4℃下以10,000g离心1小时使溶解产物变洁净。将上清液施加至5mL的StrepTactin琼脂糖(GE)并且在旋转下孵育1小时,继而将蛋白质结合的StrepTactin树脂在溶解缓冲液中洗涤三次。使树脂与250个单位的SUMO蛋白酶(250mg/ml)一起再悬浮于SUMO消化缓冲液(30mM Tris-HCl、500mM NaCl、1mM DTT、0.15%Igepal(NP-40),pH 8.0)中并且在4℃下在旋转下孵育过夜。将悬浮液施加至柱,以通过重力流从树脂上洗脱和分离。用1倍柱体积的溶解缓冲液将树脂洗涤两次,以最大程度地洗脱蛋白质。将洗脱液在阳离子交换缓冲液(20mM HEPES、1mM DTT、5%甘油,pH 7.0;对于EiCsm6和LsCsm6,pH 7.5)中稀释,以降低盐浓度,以准备阳离子交换色谱法至250mM。
为了进行阳离子交换和凝胶过滤纯化,经由FPLC(AKTA PURE,GE HealthcareLife Sciences)将蛋白质加载至5mL HiTrap SP HP阳离子交换柱(GE Healthcare LifeSciences)上,并且在洗脱缓冲液(20mM HEPES、1mM DTT、5%甘油,pH 7.0)中在250mM至2MNaCl的盐梯度上洗脱。通过SDS-PAGE针对重组蛋白的存在测试所得部分,并且汇集含有蛋白质的部分,并且经由离心过滤器单元(Millipore 50MWCO)在S200缓冲液(10mM HEPES、1MNaCl、5mM MgCl2、2mM DTT,pH 7.0)中浓缩至1mL。经由FPLC将浓缩的蛋白质加载至凝胶过滤柱(
Figure BDA0002523004990001972
200Increase 10/300GL,GE Healthcare Life Sciences)上。通过SDS-PAGE分析来自凝胶过滤的所得部分,并且汇集含有蛋白质的部分,并且将缓冲液换成储存缓冲液(600mM NaCl、50mM Tris-HCl pH 7.5、5%甘油、2mM DTT)并在-80℃下冷冻以供储存。
表17中可得本研究中纯化的所有蛋白质的登录号和质粒图谱。
表17.本研究中所使用的蛋白质序列。
Figure BDA0002523004990001971
从大豆中粗提取核酸.
如先前所述进行快速核酸提取(Wang等Anal Chem 89:4413-4418(2017))。简单来说,将20mg压碎的大豆添加到200μL提取缓冲液(500mM NaOH和10mM EDTA)中,涡旋5秒,并在室温下孵育1分钟。将上清液按1:10稀释后,将0.4μL提取的基因组DNA添加到20μL RPA反应中,并用于SHERLOCK。
crRNA制备.
为了制备crRNA,订购了带有附加T7启动子序列的超聚体DNA(Integrated DNATechnologies)形式的构建体。将crRNA DNA退火至短T7引物(最终浓度为10uM),并使用HiScribe T7快速高收率RNA合成试剂盒(New England Biolabs)在37℃下与T7聚合酶一起孵育过夜。使用RNAXP清洁珠(Beckman Coulter)以2x的珠子与反应体积的比率纯化crRNA,并另外添加1.8x的异丙醇(Sigma)。
表18中可得本研究中所使用的所有crRNA序列。所示为SEQ ID NO:433-441,完整的crRNA序列由SEQ ID NO:433表示,间隔区序列由SEQ ID NO:434表示,正向重复由SEQ IDNO:435表示。其余的序列标识符遵循相同的模式。
表18.本研究中所使用的crRNA序列.
Figure BDA0002523004990001981
重组酶聚合酶扩增(RPA)
使用NCBI Primer-BLAST 24使用默认参数来设计用于RPA的引物,不同之处在于扩增子大小(在100nt与140nt之间)、引物熔融温度(在54℃与67℃之间)和引物大小(在30nt与35nt之间)。然后将引物预定为DNA(Integrated DNA Technologies)。
Figure BDA0002523004990001982
Basic(TwistDx)所指示来运作RPA反应,不同之处在于在输入模板之前添加280mM MgAc。除非另有描述,否则在37℃下用1μL输入运作反应10分钟。
对于SHERLOCK核酸定量,在较低的240nM浓度下测试RPA引物浓度。
当使用RPA扩增多个标靶时,将引物浓度调整为480nM的最终浓度。即,对于两个引物对添加120nM各引物用于双链体检测。
表19中可得本研究中所使用的所有RPA引物。所示为SEQ ID NO:442-447,正向引物序列由SEQ ID NO:442和445表示,具有T7RNAP启动子序列的正向引物序列由SEQ ID NO:443和446表示,反向引物序列由SEQ ID NO:444和447表示。
表19.本研究中所使用的RPA引物.
Figure BDA0002523004990001983
荧光裂解测定.
除非另有指示,否则在核酸酶测定缓冲液(20mM HEPES、60mM NaCl、6mM MgCl2,pH6.8)中,用45nM纯化Cas13、22.5nM crRNA、淬灭的荧光RNA报告子(125nM RNA酶Alert v2,Thermo Scientific,均聚物和二核苷酸报告子(IDT);250nM的polyA Trilink报告子)、0.5μL鼠类RNA酶抑制剂(New England Biolabs)、25ng的背景总人RNA(从HEK293FT培养物中纯化)和可变数量的输入核酸标靶进行检测测定。在荧光板读取器(BioTek)上在37℃下使反应进行30分钟-3小时(除非另有指示),每5分钟测量荧光动力学。
表20中可得本研究中所使用的所有裂解报告子。所示为SEQ ID NO:448-451。
表20.本研究中所使用的RNA报告子.
Figure BDA0002523004990001991
SHERLOCK核酸检测.
用45nM纯化Cas13、22.5nM crRNA、淬灭的荧光RNA报告子(125nM RNA酶Alert v2和250nM的polyA Trilink报告子)、0.5μL鼠类RNA酶抑制剂(New England Biolabs)、25ng的背景总人RNA(从HEK293FT培养物中纯化)和1uL的RPA反应物在核酸酶测定缓冲液(20mMHEPES、60mM NaCl、6mM MgCl2,pH 6.8)、rNTP混合物(最终1mM,NEB),0.6μL T7聚合酶(Lucigen)和3mM MgCl2中进行检测测定。在荧光板读取器(BioTek)上在37℃下使反应进行30分钟-3小时(除非另有指示),每5分钟测量荧光动力学。
Cas13-Csm6荧光裂解测定.
如针对标准Cas13荧光裂解反应所述,进行Cas13-Csm6组合的荧光裂解测定,改动如下。除非另有指示,否则将Csm6蛋白添加到10nm最终浓度,400nm Csm6荧光报告子和500nm Csm6活化剂中。由于rNTPs干扰Csm6活性,因此在RPA预扩增步骤中进行了IVT,然后添加1μL的此反应物作为Cas13-Csm6裂解测定的输入。
表21中可得本研究中所使用的所有Csm6活化剂(SEQ ID NO:452)。
表21.本研究中所使用的Csm6活化序列.
Figure BDA0002523004990002001
使用FAM生物素报告子对Cas13活性进行侧流读出.
为了进行侧流检测,除非另有指示,否则将RPA运作10分钟且将SHERLOCK-LwaCas13a反应运作20分钟,并且反应如上所述进行,不同之处在于将荧光报告子替换为1uM最终浓度的FAM-RNA-生物素报告子。孵育后,将完整20μL LwaCas13a反应物添加到100μL HybriDetect 1测定缓冲液(Milenia)中,并在HybriDetect 1侧流条带(Milenia)上运作。
结果
SHERLOCK利用了Cas13的条件性混杂RNA酶活性,这被称为附带效应(Abudayyeh等Science 353,aaf5573,doi:10.1126/science.aaf5573(2016)),其中Cas13酶在靶RNA识别后在溶液中裂解非CRISPR RNA crRNA)靶RNA物质。通过将Cas13与淬灭的荧光RNA报告子(Abudayyeh等Science 353,aaf5573,doi:10.1126/science.aaf5573(2016);East-Seletsky等Nature538:270-273(2016))或RNA侧流报告子(Gootenberg等)组合,SHERLOCK可以在Cas13识别靶核酸物质后产生荧光或比色侧流读出。我们最近开发了SHERLOCKv2平台,该平台组合了相同样本多重化、侧流视觉读出、定量和Csm6信号检测扩大(Gootenberg等)。在这里,我们开发了一种专门用于农业应用的SHERLOCKv2方法,该方法聚焦于用于监测GMO的大豆基因分型和性状定量。
大豆性状的检测对于全球监测食品供应中的GMO性状很重要,并且已经开发出了许多检测方法来检测最常见性状,即Roundup Ready(RR)抗性基因(Wang等Food Control29:213-220(2013);Wu等Int J Mol Sci 13:1919-193292012);Guan等Food Anal Method3:313-320(2010))。但是,这些方法有许多局限性,包括需要仪器、高于渺摩尔浓度的较差的灵敏度以及超过30分钟的孵育时间。为使得使用SHERLOCK进行大豆性状检测的基于CRISPR的诊断成为可能,我们首先为大豆(大豆(Glycine max))种子建立了快速的DNA提取策略,之前无需直接进行DNA纯化即可直接进行SHERLOCK检测(图91A)。通过使用简单的手工工具生产研磨的种子材料,然后将此材料在提取溶液中再水合,我们完成了对基因组DNA的有效提取和RPA的核酸预扩增。我们通过设计针对编码来自土壤杆菌属种株系CP4的5-烯醇丙酮酸莽草酸3-磷酸合酶(EPSPS)的基因(CP4 EPSPS)的crRNA开发了用于检测的Cas13测定,所述基因赋予对Roundup的抗性,并且使用管家基因凝集素作为对照。我们发现,经由荧光扩增对预扩增的粗大豆提取物进行Cas13检测,能够仅在RR大豆中准确鉴别CP4 EPSPS基因(图91B,图92A-图92B)。为了评估SHERLOCK定量异质混合物中GM种子含量的能力,我们优化了SHERLOCK来定量野生型和RR大豆组合中的CP4 EPSPS。使用来自种子混合物的分离的基因组DNA,我们能够区分CP4 EPSPS转基因量中的20%差异,并且在30分钟内建立用于GM含量估算的标准曲线(图91C,图93A-图93C)。
同时检测凝集素或其他管家基因对于阳性对照和加载标准化很重要,但是对于每个个别crRNA运作反应并不方便,特别是在样品量有限或等分试样之间DNA含量不同的情况下。通过表征Cas13直系同源物的碱基切割偏好,我们发现了具有互斥的基础偏好的直系同源物,从而允许通过正交报告子在不同光谱通道中测量附带裂解(Gootenberg等)。(图91D)。因此,我们开发了一种使用聚尿苷RNA报告子围绕LwaCas13a以及使用聚腺嘌呤报告子围绕PsmCas13b进行测定的方法。使用与CP4 EPSPS基因互补的LwaCas13a crRNA和针对凝集素基因的PsmCas13b crRNA,我们能够在同一反应中检测到这两个基因,并将RR大豆正确分类为具有CP4 EPSPS基因(图91E)。即使未检测到抗性转基因,样品中凝集素的检测也使我们能够确定存在大豆物质。
在许多现场应用中,仪器可能无法读出荧光信号。为了更容易地进行视觉检测,通过用在相反的两端分别用生物素和FAM功能化的RNA替代淬灭的荧光RNA报告子,我们在SHERLOCKv2中创建了报告子(Gootenberg等),从而与基于侧流条带的读出兼容(图91F)。在不存在报告RNA裂解的情况下,RNA报告子被吸附在链霉亲和素线上,并捕获被金纳米颗粒标记的抗FAM抗体。如果RNA报告子被附带效应破坏,那么抗体将流到第二捕获线。为了通过快速RR大豆检测证明这一概念,我们在10分钟内用来自粗大豆提取物的RPA预扩增了CP4EPSPS转基因,然后在20分钟内用侧流RNA报告子进行了LwaCas13a检测反应,结果仅在来自转基因RR种子的DNA中产生了侧流信号(图91G,图91H)。
我们还发现,通过将III型CRISPR相关内切核糖核酸酶Csm6结合到SHERLOCK反应中(Gootenberg等),可将CP4 EPSPS基因的信号检测提高约3倍(Kazlauskiene等Science357:605-609(2017);Niewoehner等Nature548:543-548 92017))。(图94)。通过使用LwaCas13a附带活性产生具有2`,3`环状磷酸酯的六腺苷酸(hexadenylate)来刺激Csm6裂解活性,我们可活化EiCsm6和LsCsm6两者引起信号放大,从而在SHERLOCK测定中进行更大的信号检测(图94)。
总而言之,SHERLOCK技术为许多生物技术和农业应用提供了有用的平台,包括全世界范围内监测GMO性状以及快速且早期发现植物病原体或害虫。
实施例6
SHERLOCK的另一个目标是设计视觉活性读出,而不需要其他仪器。申请人首先基于金纳米粒子簇的分解测试了比色RNA酶报告子(20,21),但是在这种特定情形下读出需要的RNA酶活性水平超出Cas13附带活性所能达到的水平(图95)。然后申请人设计了一种基于FAM-生物素报告子破坏的侧流读出,使得可以在在商业侧流条带上进行检测。大量报告子会使抗FAM抗体-金纳米颗粒缀合物在条带的第一线路积聚,从而阻止抗体-金缀合物与第二线路上的蛋白A结合;报告子的裂解会减少第一线路处的积累,并导致在第二线路产生信号(图96)。我们针对ZIKV或DENV ssRNA的无仪器检测对此设计进行了测试,发现可以在90分钟内以低至2aM的条件灵敏度进行检测(图96和图97)。此外,申请人发现他们可以从人唾液中快速提取基因组DNA(<10分钟),无需纯化即可直接输入SHERLOCK中,从而在23分钟内通过荧光以及2小时内通过侧流进行快速基因分型(图98)。这举例说明了封闭管测定形式,其中整个SHERLOCK反应在一锅式测定中进行,而无需任何样品纯化。
申请人还应用了该系统来创建快速且便携式的纸质测试,以用于非小细胞肺癌(NSCLC)患者的液体活检中的突变检测。申请人设计了SHERLOCK测定来检测EGFR L858R突变或外显子19缺失(5个氨基酸)以及来自有或没有这些突变的患者中分离的cfDNA(图96),如通过靶向测序所证实的(表28)。SHERLOCK通过基于荧光的读出(图96)和基于侧流的读出(图96和图99)成功地检测到了这些突变。基于荧光的SHERLOCK还能够在合成和患者cfDNA液体活检样品中检测到不同的常见EGFR突变T790M(图99(e)(f))。
为了提高检测的稳健性并减少假阳性读出的可能性,我们将Csm6与Cas13检测结合在侧流上(图96)。我们在Csm6和活化剂的存在下测试了各种序列和长度的侧流报告子,发现长的A-C报告子显示出强的裂解信号(图100A,图100B)。我们将该报告子与Cas13侧流报告子结合用于快速检测仅依赖于Csm6进行扩增的DENV ssRNA(即,在不存在RPA的情况下)(图96(L))。随后,我们结合RPA、Cas13/Csm6和侧流读出来检测酰基转移酶标靶,发现Csm6赋予的信号增加允许通过侧流进行更快速的检测(图100C-图100D),且背景降低。
材料和方法
Cas13和Csm6直系同源物的蛋白质表达和纯化
如前所述(3)进行LwaCas13a表达和纯化,稍作改动并且在下文详细说明。表达LbuCas13a、LbaCas13a、Cas13b和Csm6直系同源物,并用改良的方案加以纯化。简单来说,将细菌表达载体转化至RosettaTM 2(DE3)pLysS Singles感受态细胞(Millipore)中。使12.5mL发酵剂培养物在Terrific Broth 4生长培养基(Sigma)(TB)中生长过夜,使用所述培养基接种4L的TB,在37℃和300RPM下生长,直至OD600为0.5。此时,通过用IPTG(Sigma)补充至500μM最终浓度来诱导蛋白质表达,将细胞冷却至18℃持续16小时用于蛋白质表达。然后将细胞在4℃下以5000g离心15分钟。收集细胞团块并且储存于-80℃下用于稍后纯化。
在4℃下进行蛋白质纯化的所有后续步骤。将细胞团块压碎并且再悬浮于补充有蛋白酶抑制剂(Complete Ultra无EDTA片剂)、溶菌酶(500μg/1ml)和全能核酸酶(benzonase)的溶解缓冲液(20mM Tris-Hcl、500mM NaCl、1mM DTT,pH 8.0)中,继之使用LM20微射流机系统以27,000PSI进行高压细胞破坏。通过在4℃下以10,000g离心1小时使溶解产物变洁净。将上清液施加至5mL的StrepTactin琼脂糖(GE)并且在旋转下孵育1小时,继而将蛋白质结合的StrepTactin树脂在溶解缓冲液中洗涤三次。使树脂与250个单位的SUMO蛋白酶(250mg/ml)一起再悬浮于SUMO消化缓冲液(30mM Tris-HCl、500mM NaCl、1mM DTT、0.15%Igepal(NP-40),pH 8.0)中并且在4℃下在旋转下孵育过夜。将悬浮液施加至柱,以通过重力流从树脂上洗脱和分离。用1倍柱体积的溶解缓冲液将树脂洗涤两次,以最大程度地洗脱蛋白质。将洗脱液在阳离子交换缓冲液(20mM HEPES、1mM DTT、5%甘油,pH 7.0;对于LbuCas13a、LbaCas13a、EiCsm6、LsCsm6、TtCsm6,pH 7.5)中稀释,以降低盐浓度,以准备阳离子交换色谱法至250mM。
为了进行阳离子交换和凝胶过滤纯化,经由FPLC(AKTA PURE,)GE HealthcareLife Sciences)将蛋白质加载至5mL HiTrap SP HP阳离子交换柱(GE Healthcare LifeSciences)上,并且在洗脱缓冲液(20mM HEPES、1mM DTT、5%甘油,pH 7.0;对于LbuCas13a、LbaCas13a,pH 7.5)中在250mM至2M NaCl的盐梯度上洗脱。通过SDS-PAGE针对重组蛋白的存在测试所得部分,并且汇集含有蛋白质的部分,并且经由离心过滤器单元(Millipore50MWCO)在S200缓冲液(10mM HEPES、1M NaCl、5mM MgCl2、2mM DTT,pH 7.0)中浓缩至1mL。经由FPLC将浓缩的蛋白质加载至凝胶过滤柱(
Figure BDA0002523004990002041
200Increase 10/300GL,GE Healthcare Life Sciences)上。通过SDS-PAGE分析来自凝胶过滤的所得部分,并且汇集含有蛋白质的部分,并且将缓冲液换成储存缓冲液(600mM NaCl、50mM Tris-HClpH 7.5、5%甘油、2mM DTT)并在-80℃下冷冻以供储存。
表22中可得本研究中纯化的所有蛋白质的登录号和质粒图谱。
核酸标靶和crRNA制备
用NEBNext PCR主混合物对用于Cas12a和基因组DNA检测的核酸标靶进行PCR扩增,凝胶提取,并使用MinElute凝胶提取试剂盒(Qiagen)纯化。对于基于RNA的检测,使用HiScribe T7快速高产量RNA合成试剂盒(New England Biolabs)在30℃下将纯化的dsDNA与T7聚合酶一起孵育过夜,并且用MEGAclear转录清洁试剂盒(Thermo Fisher)纯化RNA。
如前所述(3)进行crRNA制备,稍作改动并且在下文详细说明。为了制备crRNA,订购了带有附加T7启动子序列的超聚体DNA(Integrated DNA Technologies)形式的构建体。将crRNA DNA退火至短T7引物(最终浓度为10uM),并使用HiScribe T7快速高收率RNA合成试剂盒(New England Biolabs)在37℃下与T7聚合酶一起孵育过夜。使用RNAXP清洁珠(BeckmanCoulter)以2x的珠子与反应体积的比率纯化crRNA,并另外添加1.8x的异丙醇(Sigma)。
表23中可得本研究中所使用的所有crRNA序列。表23列出了SEQ ID NO:453-827,其中SEQ ID NO:453表示完整的crRNA序列,SEQ ID NO:454表示间隔区,并且SEQ ID NO:455代表LwaCas13a的正向重复。表中的其余序列标识符遵循相同的模式。表24中可得本研究中所使用的所有DNA和RNA靶序列。
使用NCBI Primer-BLAST(27)使用默认参数来设计用于RPA的引物,不同之处在于扩增子大小(在100nt与140nt之间)、引物熔融温度(在54℃与67℃之间)和引物大小(在30nt与35nt之间)。然后将引物预定为DNA(Integrated DNA Technologies)。
除了在输入模板之前添加280mM MgAc以外,分别如
Figure BDA0002523004990002051
Basic或
Figure BDA0002523004990002052
Basic RT(TwistDx)所指示来运作RPA和RT-RPA反应。除非另有描述,否则在37℃下用1μL输入运作反应1小时。
对于SHERLOCK核酸定量,以标准浓度(480nM最终浓度)和更低的浓度(240nM、120nM、60nM、24nM)测试RPA引物浓度,以找到最佳浓度。将RPA反应进一步进行20分钟。
当使用RPA扩增多个标靶时,将引物浓度调整为480nM的最终浓度。即,对于两个引物对添加120nM各引物用于双链体检测。
表25中可得本研究中所使用的所有RPA引物。所示为为SEQ ID NO:841-870,其中SEQ ID NO:841表示正向引物序列,SEQ ID NO:842表示具有T7 RNAP启动子的正向引物序列,并且SEQ ID NO:843表示DENV ssRNA的反向引物序列。其余的序列标识符遵循相同的模式。
荧光裂解测定
如前所述(3)进行检测测定,稍作改动并且在下文详细说明程序。除非另有指示,否则在核酸酶测定缓冲液(20mM HEPES、60mM NaCl、6mM MgCl2,pH 6.8)中,用45nM纯化Cas13、22.5nM crRNA、淬灭的荧光RNA报告子(125nM RNA酶Alert v2,Thermo Scientific,均聚物和二核苷酸报告子(IDT);250nM的polyA Trilink报告子)、0.5μL鼠类RNA酶抑制剂(New England Biolabs)、25ng的背景总人RNA(从HEK293FT培养物中纯化)和可变数量的输入核酸标靶进行检测测定。对于Csm6荧光裂解反应,将10nM最终浓度的蛋白质连同500nM的2’,3’环状磷酸酯寡腺苷酸、250nM的荧光报告子和0.5μL鼠类RNA酶抑制剂在核酸酶测定缓冲液(20mM HEPES、60mM NaCl、6mM MgCl2,pH 6.8)中使用。在荧光板读取器(BioTek)上在37℃下使反应进行1-3小时(除非另有指示),每5分钟测量荧光动力学。在涉及AsCas12a的反应中,使用来自IDT的重组蛋白包括45nM AsCas12a。在多重反应的情况下,在反应中使用45nM各蛋白质和22.5nM各crRNA。
表26中可得本研究中所使用的所有裂解报告子。所示为SEQ ID NO:871-877,其代表长度为10个核苷酸或更长的序列。短于10个核苷酸的序列未分配序列标识符。
SHERLOCK核酸检测
用45nM纯化Cas13、22.5nM crRNA、淬灭的荧光RNA报告子(125nM RNA酶Alert v2,Thermo Scientific,均聚物和二核苷酸报告子(IDT);250nM的polyA Trilink报告子)、0.5μL鼠类RNA酶抑制剂(New England Biolabs)、25ng的背景总人RNA(从HEK293FT培养物中纯化)和1uL的RPA反应物在核酸酶测定缓冲液(20mM HEPES、60mM NaCl、6mM MgCl2,pH 6.8)、rNTP混合物(最终1mM,NEB),0.6μL T7聚合酶(Lucigen)和3mM MgCl2中进行检测测定。在荧光板读取器(BioTek)上在37℃下使反应进行1-3小时(除非另有指示),每5分钟测量荧光动力学。
对于一锅式核酸检测,如前所述(3)进行检测测定,稍作改动。单一100μL组合反应测定由以下组成:0.48μM正向引物、0.48μM反向引物、1x RPA再水合缓冲液、不同量的DNA输入、45nM LwCas13a重组蛋白质、22.5nM crRNA、125ng背景总人RNA、125nM底物报告子(RNA酶alert v2)、2.5μL鼠类RNA酶抑制剂(New England Biolabs)、2mM ATP、2mM GTP、2mMUTP、2mM CTP、1μL T7聚合酶混合物(Lucigen)、5mM MgCl2和14mM MgAc。在荧光板读取器(BioTek)上在37℃下使反应进行1-3小时(除非另有指示),每5分钟测量荧光动力学。对于侧流读出,将20uL的组合反应物添加到100μL HybriDetect 1测定缓冲液(Milenia)中,并在HybriDetect 1侧流条带(Milenia)上运作。
用于裂解片段分析的核酸标记
从dsDNA模板体外转录靶RNA并如上所述进行纯化。如上文针对荧光裂解反应所述进行体外裂解反应,改动如下。荧光报告子取代了1μg RNA靶,并且没有使用背景RNA。将裂解反应在37℃下进行5分钟(LwaCas13a)或1小时(PsmCas13b)。将裂解反应物使用RNAclean&concentrator-5试剂盒(Zymo Research)纯化,并在10uL UltraPure水(Gibco)中洗脱。按照5’EndTag labeling Reaction(Vector Laboratories)试剂盒方案,进一步用10μg马来酰亚胺IRDye 800CW(Licor)标记裂解反应。为了确定由Cas13裂解产生的5'末端,对所述方案进行改动以执行碱性磷酸酶(AP)处理或用UltraPure水替代以仅标记含有5'-OH的RNA种类,而未消化的三磷酸(PPP)RNA种类则仅在进行AP处理时进行标记。
用于高分辨率裂解片段分析的质谱法
为了通过质谱法确定由Cas13附带RNA酶活性产生的裂解末端,如上所述进行体外裂解反应,改动如下。所使用的Cas13 RNA标靶最终浓度为1nM,Csm6活化剂最终浓度为3μM,并且不使用背景RNA。对于对照反应,用UltraPure水取代Cas13标靶,或者在不存在Cas13标靶、Cas13蛋白和Cas13crRNA的情况下,将标准的体外裂解反应物与含有2’,3’环状磷酸酯活化剂的六腺苷酸一起孵育。裂解反应在37℃下进行1小时,并使用New England BiolabssiRNA纯化方案进行纯化。简单来说,加入十分之一体积的3M NaOAc、2μL不含RNA酶的Glycoblue(Thermofisher)和三倍体积的95%冷乙醇,在-20℃下放置2小时,并以14,000g离心15分钟。去除上清液,添加两倍体积的80%EtOH,并在室温下温育10分钟。倾析上清液,并将样品以14,000g离心5分钟。风干团块后,添加50μL UltraGrade水并送入干冰中进行质谱分析。
对于质谱分析,将样品用UltraGrade水按1:1稀释,并结合Agilent 1290HPLC在Bruker Impact II q-TOF质谱仪上以负离子模式进行分析。将10μL注射到PLRP-S柱(50mm,5um粒径,1000埃孔径PLPL-S柱,2.1mm ID)上,使用0.1%于水中的氢氧化铵v/v作为流动相A和乙腈作为流动相B。将流速始终保持恒定在0.3ml/分钟。流动相的组成始于0%B,并在前2分钟内保持。此后,在接下来的8分钟内将组成改变为100%B,并保持一分钟。然后在0.1分钟内将组成恢复至0%B,然后在接下来的4.9分钟内保持以使柱重新平衡至起始条件。针对较大MW离子对质谱仪进行调谐,并在m/z
400-5000之间采集数据。通过注射甲酸钠通过m/z校准来自质谱仪的整个数据集。使用具有MaxEnt解卷积算法许可的Bruker Compass Data Analysis 4.3分析数据,以从带负电的离子数据生成计算出的中性质谱。
从人唾液中提取基因组DNA
如前所述(3)进行唾液DNA提取,稍作改动并且在下文详细说明。从收集前30分钟限制消耗食物或饮料的志愿者收集2mL唾液。然后如试剂盒方案所推荐,使用
Figure BDA0002523004990002081
DNA血液小型试剂盒(Qiagen)加工样品。对于煮沸的唾液样品,将400μL磷酸盐缓冲盐水(Sigma)添加至100μL志愿者唾液中并且以1800g离心5分钟。倾析上清液并且使团块与0.2%Triton X-100(Sigma)一起再悬浮于磷酸盐缓冲盐水中,随后在95℃下孵育5分钟。1μL样品用作RPA反应的直接输入。
数字微滴PCR定量
如前所述(3)进行ddPCR定量,稍作改动并且在下文详细说明。为了确认目标稀释液的浓度,我们进行了数字微滴PCR(ddPCR)。对于DNA定量,使用被设计用于靶序列的PrimeTime qPCR探针/引物测定(IDT),使用ddPCR Supermix for Probes(无dUTP)(BioRad)制成微滴。对于RNA定量,使用被设计用于靶序列的PrimeTime qPCR探针/引物测定,使用用于探针的一步RT-ddPCR试剂盒制成微滴。在任一种情况下使用QX200微滴产生器(BioRad)产生微滴并且转移至PCR板。如试剂盒的方案中所描述在热循环仪上进行基于微滴的扩增,随后经由在QX200微滴读取器上测量来确定核酸浓度。
Cas13-Csm6荧光裂解测定
如针对标准Cas13荧光裂解反应所述,进行Cas13-Csm6组合的荧光裂解测定,改动如下。除非另有指示,否则将Csm6蛋白添加到10nM最终浓度,400nM Csm6荧光报告子和500nM Csm6活化剂中。为了区分Cas13和Csm6附带RNA酶活性,使用了两种不同的荧光团进行荧光检测(FAM和HEX)。由于rNTPs干扰Csm6活性,因此在RPA预扩增步骤中进行了IVT,然后添加1μL的此反应物作为Cas13-Csm6裂解测定的输入。
在我们测试三步Cas13-Csm6裂解测定的情况下,通常按上述方法在不同时间进行RPA,然后在不同时间用作正常IVT反应的输入。然后将1μL的IVT用作上段所述的Cas13-Csm6反应的输入。表27中可得本研究中所使用的所有Csm6活化剂。
使用文库进行基序发现筛选
为了筛选Cas13裂解偏好,如上所述建立了体外RNA裂解反应并作如下改动。对于NGS文库制备,使用20nM的Cas13标靶,荧光报告子取代1μM的DNA-RNA寡核苷酸(IDT),所述寡核苷酸含有侧接DNA柄的6-mer随机核糖核苷酸段。将反应在37℃下进行60分钟(除非另有指示)。将反应物使用Zymo oligo-clean and concentrator-5试剂盒(Zymo research)纯化,并使用15μL UltraPure水洗脱。使用与DNA柄结合的基因特异性引物,将10μL纯化反应物用于逆转录。
根据qScript Flex cDNA试剂盒(quantabio)方案,在42℃下进行逆转录(RT)持续45分钟。为了评定裂解效率和产物纯度,将RT反应物在水中以1:10稀释,并加载到SmallRNA试剂盒上,并在Bioanalyzer 2100(Agilent)上运作。对于第一轮NGS文库制备,使用四微升RT反应物。使用NEBNext(NEB)扩增第一链cDNA,其中正向引物混合物最终浓度为625nM,反向引物为625nM,15个循环,3分钟98℃初始变性,10s 98℃循环变性,10s 63℃退火,20s 72℃延伸和2分钟72℃最后延伸。
将两微升的第一轮PCR反应物用于第二轮PCR扩增,以连接Illumina兼容性指数(NEB)进行NGS测序。使用相同的NEBNext PCR方案进行扩增。通过琼脂糖凝胶电泳(2%SybrGold E-Gel Invitrogen系统)分析PCR产物,汇集5μL各反应物。凝胶提取汇集的样品,用Qubit DNA 2.0DNA高灵敏度试剂盒定量,并归一化为4nM最终浓度。将最终文库稀释至2pM,并使用75循环试剂盒在NextSeq 500Illumina系统上进行测序。
基序筛选分析
为了分析随机基序文库筛选中优选基序的消耗,从序列数据中提取6-mer区域,并归一化为每个样品的总读取数。然后将归一化的读取计数用于在实验条件和匹配对照之间通过伪计数调整生成对数比。对于Cas13实验,匹配对照未添加靶RNA;对于Csm6和RNA酶A实验,匹配对照没有酶。使用对数比分布形状来确定富集基序的截止点。然后使用富集的基序确定1、2或3个核苷酸组合的发生率。使用Weblogo3生成基序对数(26)。
对Cas13蛋白和crRNA正向重复的系统发生分析
为了研究直系同源物聚类,在Geneious中使用MUSCLE对Cas13a和Cas13b蛋白序列生成多个序列比对,然后在R中使用欧几里德距离(Euclidean distance)以heatmap.2函数进行聚类。为了研究正向重复聚类,在Geneious中使用Geneious算法对Cas13a和Cas13b正向重复序列生成多个序列比对,然后在R中使用欧几里德距离以heatmap.2函数进行聚类。为了研究基于二核苷酸基序偏好的直系同源物的聚类,在R中使用欧几里德距离以heatmap.2函数对切割活性矩阵进行聚类。
金纳米颗粒比色法
由在5’和3'端带有硫醇的IDT(序列表26)合成RNA寡核苷酸。为了使硫醇基脱保护,将最终浓度为20mM的寡核苷酸在含有100mM DTT的150mM磷酸钠缓冲液中于室温还原2小时。然后使用sephadex NAP-5柱(GE Healthcare)将寡核苷酸纯化至最终体积为700μL的水中。如先前所述(20),将10μM的还原寡核苷酸以280μL的体积添加到600μL的2.32nM 15nm金纳米颗粒(Ted Pella)中,寡核苷酸与纳米颗粒的比例为2000:1。随后,将10μL的pH8.3的1M Tris-HCl和90μL的1M NaCl添加到寡纳米颗粒混合物中,并在室温下旋转孵育18小时。18小时后,再向其中添加1M Tris-HCl(5μL,pH 8.3)和5M NaCl(50μL),然后再在室温下旋转孵育15小时。孵育后,将最终溶液以22,000g离心25分钟。弃去上清液,将缀合的纳米颗粒重悬于50μL的200mM NaCl中。
使用RNA酶A测定测试纳米颗粒的RNA酶敏感性。将不同量的RNA酶A(ThermoFischer)添加到1x RNA酶A缓冲液和6μL缀合的纳米颗粒中,总反应体积为20μL。使用板分光光度计每5分钟监测520nm处的吸光度,持续3小时。
使用FAM生物素报告子对Cas13活性进行侧流读出
对于基于FAM-RNA-生物素报告子裂解的侧流,除非另有指示,否则将非RPALwaCas13a反应或SHERLOCK-LwaCas13a反应运作1小时,FAM-RNA-生物素报告子的最终浓度为1uM。孵育后,将20uL LwaCas13a反应上清液添加到100uL HybriDetect 1测定缓冲液(Milenia)中,并在HybriDetect 1侧流条带(Milenia)上运作。
用于REPAIR的REPAIR构建体克隆、哺乳动物细胞转染、RNA分离和NGS文库制备
如先前所述(23),克隆了用于模拟APC突变回复的构建体和用于REPAIR的向导构建体。简单来说,设计了以APC:c.1262G>A突变为中心的96nt序列柄将其在表达载体下进行金门克隆,并且将相应的向导序列金门克隆到用于PspCas13b向导的U6表达载体中。为了模拟患者样品,将300ng突变型或野生型APC表达载体用Lipofectamine 2000(Invitrogen)转染到HEK293FT细胞中,并且在转染后两天按照制造商的指示用Qiamp DNA Blood Midi Kit(Qiagen)收获DNA。将20ng DNA用作SHERLOCK-LwaCas13a反应的输入。
如前所述(23),使用REPAIR系统进行RNA校正:共转染150ng dPspCas13b-ADAR(DD)E488Q、200ng向导载体和30ng APC表达载体,并且在转染后两天,按照制造商指示使用RNeasy Plus Mini Kit(Qiagen)收获RNA。将30ng RNA用作SHERLOCK-LwaCas13a反应的输入。表29中可得本研究中用于REPAIR RNA编辑的所有质粒。
如前所述,独立地通过NGS确定RNA编辑部分。使用带有序列特异性引物的qScriptFlex试剂盒(Quanta Biosciences)对RNA进行逆转录。用NEBNext High Fidelity 2X PCRMastermix(New England Biosciences)扩增第一链cDNA,其中正向引物混合物最终浓度为625nM,反向引物为625nM,15个循环,3分钟98℃初始变性,10s 98℃循环变性,30s 65℃退火,30s 72℃延伸和2分钟72℃最后延伸。使用两微升的第一轮PCR反应物进行第二轮PCR扩增以连接Illumina兼容性指数,从而使用带有18个循环的相同方案,使用NEBNext进行NGS测序。通过琼脂糖凝胶电泳(2%Sybr Gold E-Gel Invitrogen)分析PCR产物,汇集5μL各反应物。凝胶提取汇集的样品,用Qubit DNA 2.0DNA高灵敏度试剂盒定量并归一化为4nM最终浓度,然后用300周期v2 MiSeq试剂盒(Illumina)读出。
SHERLOCK荧光数据分析
如前所述(3)进行SHERLOCK荧光分析,稍作改动并且在下文详细说明。为计算背景扣除荧光数据,扣除样品的初始荧光以允许在不同条件之间比较。从样品扣除背景条件(无输入或无crRNA条件)的荧光以产生背景扣除荧光。
如下计算用于SNP辨别的crRNA比率以调整样品与样品之间的总体变化:
Figure BDA0002523004990002121
其中Ai和Bi分别是指对于给定的个体,传感等位基因A或等位基因B的crRNA的技术性重复i的SHERLOCK强度值。因为我们通常每种crRNA具有四个技术性重复,所以m和n等于4并且分母等效于对于给定的SNP基因座和个体的全部八个crRNA SHERLOCK强度值的和。因为存在两种crRNA,所以对于个体跨越crRNA中的每一种的crRNA比率平均值将始终和是2。因此,在纯合性的理想情况下,阳性等位基因crRNA的平均crRNA比率将是2并且阴性等位基因crRNA的平均crRNA比率将是0。在杂合性的理想情况下,两种crRNA的每一种的平均crRNA比率将是1。因为在SHERLOCKv2中,我们通过测量不同颜色通道中的Ai和Bi来完成基因分型,所以我们将530颜色通道的比例缩放了6,以匹配480颜色通道中的强度值。
在不存在标靶的情况下对Cas13直系同源物的混杂裂解
Cas13家族的某些成员(如PinCas13b和LbuCas13a)在存在或不存在标靶的情况下均表现出混杂裂解,并且这种背景活性是依赖于二核苷酸报告子的(图101)。对于LbuCas13a,这种背景活性也依赖于间隔区。在一些报告子中,U和A碱基偏好在蛋白质或DR相似性内聚类。有趣的是,此处鉴定的二核苷酸偏好与从正向重复相似性或蛋白质相似性聚类的Cas13家族不对应(图101)。
用于PsmCas13b和CcaCas13b的crRNA设计的表征
为了确定用于PsmCas13b和CcaCas13b检测的最佳crRNA,我们测试了34-12nt的crRNA间隔区长度,发现PsmCas13b在间隔区长度为30时具有峰值灵敏度,而CcaCas13b在间隔区长度为28nt时具有等效的灵敏度,这证明了30nt间隔区对于Cas13活性评估的用途为了进一步探索与LwaCas13a相比,CcaCas13b和PsmCas13b靶向的稳健性,我们设计了11种均匀分布在ssRNA 1上的crRNA,发现LwaCas13a附带活性对crRNA设计具有稳健性,而CcaCas13b和PsmCas13b两者在不同crRNAs中表现出更大的活性变异性。
对其他正交基序的随机文库基序筛选为了进一步探索Cas13a和Cas13b直系同源物的裂解偏好多样性,我们开发了一种基于文库的方法来表征附带核酸内切酶活性的优选基序。我们使用了侧接恒定DNA柄的简并6-mer RNA报告子,所述报告子允许扩增和读出未裂解的序列。将这个文库与Cas13酶一起孵育会导致可检测的切割模式,这取决于靶RNA的添加(图S12B),对这些反应中消耗的基序进行测序后发现,随着消化时间的增加,文库的偏度也会增加,这指示裂解的优选基序的群体。来自高度消耗的基序的序列对数和成对碱基偏好重现了对于LwaCas13a和CcaCas13b观察到的U偏好以及对PsmCas13b观察到的A偏好。我们从筛选中确定的顶部基序中合成了报告子,以验证这些发现,并发现LwaCas13a、CcaCas13a和PsmCas13b均裂解了其最高度优选的基序。我们还发现了仅显示对一种直系同源物裂解而不显示对其他直系同源物裂解的多个序列,这可能允许从二核苷酸基序中进行替代正交读出。与不同标靶一起孵育的LwaCas13a产生相似的裂解基序偏好,表明无论标靶序列如何,附带活性的碱基偏好都是恒定的。
在LwaCas13a裂解后验证活化产物
使用质谱法,我们已验证LwaCas13a消化可产生预期的环状磷酸酯封端的Csm6活化产物。活化对带有poly U的3’保护的设计最有效,因为其他活化设计(包括带有poly-U和内部poly-U束的5'保护)在仅存在靶RNA的情况下活化Csm6的效率较低,同样地,LwaCas13a对UA基序几乎没有活性,而5'保护对阻止Csm6活化无效。
对RPA和Csm6反应结合的优化
由于将Csm6增强与RPA预扩增结合会增加信号和灵敏度,因此我们在存在与RPA结合所需的体外转录组分的情况下测试了Csm6的活性。我们发现,镁和游离rNTP都在存在环状磷酸酯活化剂的情况下降低Csm6的核酸酶活性(图S33A)。减少溶液中rNTP的量会减少转录的RNA的量,因此即使存在增加的报告子或活化剂浓度,也会对Cas13a的Csm6活化具有负面影响。
表22.本研究中所纯化的Cas13和Csm6蛋白.
Figure BDA0002523004990002151
表23.本研究中所使用的crRNA(SEQ ID NO:453-827).
Figure BDA0002523004990002161
Figure BDA0002523004990002171
Figure BDA0002523004990002181
Figure BDA0002523004990002191
Figure BDA0002523004990002201
Figure BDA0002523004990002211
Figure BDA0002523004990002221
表24.本研究中所使用的RNA和DNA标靶(SEQ ID NO:828-840).
Figure BDA0002523004990002222
表25.本研究中所使用的RPA引物(SEQ ID NO:841-870).
Figure BDA0002523004990002231
表26.本研究中所使用的裂解报告子(SEQ ID NO:871-877).
Figure BDA0002523004990002241
Figure BDA0002523004990002251
表27.本研究中所使用的Csm6活化剂.
Figure BDA0002523004990002261
表28.本研究中所使用的cfDNA样品的等位基因分数.
Figure BDA0002523004990002262
表29.本研究中所使用的REPAIR质粒.
Figure BDA0002523004990002263
表30.SHERLOCKv1和SHERLOCKv2的比较.
Figure BDA0002523004990002271
此实施例的参考文献
1.S.Shmakov et al.,Discovery and Functional Characterization ofDiverse Class 2CRISPR-Cas Systems.Mol Cell 60,385-397(2015).
2.O.O..Abudayych et al.,C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Scienee 353,aaf5573(2016).
3.J.S.Gootenberg et al.,Nuclcle aeld detection with CRISPR-Cas13aC2e2,Seience 356,438-442(2017).
4.A.East-Seletsky et al.,Twe disimct RNase actixities of CRISPR-C2c2enable guide-RNA processing and RNA detection、Nature 538,270~273(2016).
5.A,East-Seletsky,M,R,O′Connell,D.Burstein,G,J、Knott,J.A Dondna,RNATargeting by Funetionally Orthogonal Type VI-A CRISPR-Cas Enzymes.Mol Cell66,373-383 e373(2017).
6.S.Shmakov et al.,Oiversity ane evoiution of elass 2 CRISPR-Cassystems,Nat Rev Mierohiol 15,169-182(2017).
7.A.A.Smargon et al.,Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessery Proteins Csx27 andCsx28.Mnl Cell 65,618-630 e617(2017).
8.J.S.Chen,E.Ma.L.B,Harrington.X.Tian.J,A.Doudna.CRISPR-Cas12a targetbinding unleashes single-stranded DNase activiy.bioRriv.(2017).
9.W.H.Organi2ation,in Guidelines for Using HIV Testing Technologiesin Suveillance:Selection,Esaluation and Implementation:2009 Update.(Geneva,2009).
10.J.M.Barlctia,D.C.Edelman,N.T.Constantine。Lowering the detectionlimits of HIV-I viral load using real-time immuno-PCR for HIV-I p24amigen.Am.J Clin Pathol 122,20-27(2004).
11.L.Deng,R,A,Garrett,S.A.Shah,X,Peng,Q.She,A novel imerfrencemechanism by a type HIB CRISPR-Cmr module in Sulfolobus.Mol Microbiol 87,1088-1099(2013).
12.G.W.Goldberg,W.Jiang,D.Bikard,L.A.Merraffini,Conditional toleranceof temperate phages via transeription-dependent CRISPR-Cas targeting.Natrre514,633-637(2014).
13.W,Jiang,P,Samai,I.,A.Marraffini,Degradation of Phage Transcripisby CRISPR-Associated RNases Enables Type III CRISPR-Cas Imminity.Cell 164,710-721(2016).
14.O.Niewoehner,M.Jinek,Struetural basis for the endorilbonnxle aneaetivity of the type III-A CRISPR-asseciated pretein Can6.RNA 22,318-329(2016).
15.P.Samai et al.,Co-transcriptional DNA.anl RNA Cleavage during TypeIII CRISPR-Cas Inununity,Cell 161,1164-1174(2018).
16.R,H.Stials et al.,RNA targeting by the type III-A CRISPR-Cas Csmcomplex of Thermtis thermephilus.Mol Cell 56.S18-S30(2014).
17.G.Tamulaitis et al.,Programmable RNA shredding by the type III-ACRISPR-Cas system of Streptococcus thermophitos.Mol Cell 56,506-517(2014).
18.M.Kaziauskiene,G,Kostiuk,C,Venclovas,G.Tamalsaitis,V.Siksnys,Acyelie oligomeleotid signaling pathway in type III CRISPR-Cas systems,Seience357,605-609(2017).
19.O.Niewoehner et al.,Type III CRISPR-Cas systems produce cyelieoligoadenylate seeond messengers.Nature 548,543-548(2017).
20.W.Zhao,M.M.Ali,S.D.Aguirre,M.A.Brook。Y.Li.Paper-based bioasaysusing gold nanopaniele cokrrimelric probes.Anal Chem 80,8431-8437(2008).
21.W.Zhao.J.C.Lam.W.Chjuman,M.A.Brook,Y.Li,Enzymatic cleavage ofnueleie aeids on gold nanopartieles.a generic platform for facilecolorimetric biosensors.Smoll 4,810-816(2008).
22.O.O.Abudayyeh et al,RNA targeting with CRISPR-Cas13.Nature550.280-284(2017).
23.D.B.T.Cox et al.,RNA editing with CRISPR-Cas13.Sclence 358,1019-1027(2017).
24.S.Cottrell,D,Nicknell,L.Kaklamanis,W.F.Bodmer。Molecular analysisof APC muiatios in famitial adenomaious polyposis and sporadic coloncarcinomas.Lancet 340,626-630(1992).
25.C.Y.Chen,DNA polymerases drive DNA sequeneing-by-synthesistechnologies:both past and present.Front Microbiol 5,305(2014).
26.G.E.Crooks,G.Hon,J.M.Cbandonia,S.H.Brenner,Webl-ogo:a sequencelogo generator.Genome research 14,1188-1190(2004).
27.J.Ye et al.,Primer-BLAST a tool to design target-specific primersfor polymerase chain reaction.BMC Bioinformatics 13,134(2012).
实施例7-多重侧流
双重侧流的概念
此概念涉及两个探针:FAM-T*A*rArUG*C*-生物素(LwaCas13a切口)和FAM-T*A*rUrAG*C*-DIG(CcaCas13b10切口)。这些探针将结合双重多重侧流条带上的抗DIG线和链霉亲和素线。接着可扫描荧光并检测对应于附带活性的线强度的降低,由此检测靶序列的标靶存在。也可使用其他基序或探针(对于PsmCas13b使用poly A,对于Cas12感测使用DNA传感器)。
登革热RNA和ssRNA1的双重侧流分析
在此测定中,使用了两个探针:
·FAM-T*A*rArUG*C*-生物素(LwaCas13a切口)-感测ssRNA 1
·FAM-T*A*rUrAG*C*-DIG(CcaCas13b10切口)-感测登革热RNA
结果显示在图103A和图103B中。
四重侧流分析
申请人已经设计并合成了允许4条线并同时检测4种标靶的侧流条带。
使用的探针如下:
·/5TYE665/T*A*rArUG*C*/3AlexF488N/-LwaCas13a
·/5TYE665/T*A*rUrAG*C*/36-FAM/-CcaCas13b
·/5TYE665/rArArArArA/3Bio/-PsmCas13b
·/5TYE665/AAAAA/3Dig_N/-AsCas12a
所述条带含有抗Alexa-fluor-488、抗FAM、链霉亲和素和抗Dig线,最多可检测4种标靶。将感测Tye665染料,并且线荧光强度的降低将表明标靶的存在。
另外的实施方案在以下编号的段落中描述。
1.一种侧流装置,所述侧流装置包括衬底,所述衬底包括第一端,其中所述第一端包括样品加载部分,以及加载有可检测配体的第一区域、CRISPR效应系统、检测构建体、包括第一结合剂的第一捕获区域和包括第二结合剂的第二捕获区域,其中所述CRISPR效应系统包含CRISPR效应蛋白和一个或多个向导序列,每一向导序列被配置成结合一种或多种靶分子。
2.如段落1所述的侧流装置,其中所述检测构建体各自包含RNA或DNA寡核苷酸,所述RNA或DNA寡核苷酸在第一端上包含第一分子并且在第二端上包含第二分子。
3.如段落1或2所述的侧流装置,其中所述样品加载部分还包括一种或多种扩增试剂用于扩增所述一种或多种靶分子。
4.如段落3所述的侧流装置,其中所述试剂用于扩增所述一种或多种靶RNA分子包括基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、切口酶扩增反应(NEAR)、PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分枝扩增法(RAM)。
5.如段落2所述的侧流装置,其中所述第一分子是FITC,并且所述第二分子是生物素,反之亦然。
6.如段落5所述的侧流装置,其中所述第一捕获区域与所述样品加载部分相邻并且处于所述侧流衬底的同一端上。
7.如段落5或6所述的侧流装置,其中所述第一捕获区域包括特异性地结合所述报告构建体的所述第一分子的第一结合剂。
8.如段落7所述的侧流装置,其中所述第一结合剂是固定的或以其他方式固定化至所述第一捕获区域的抗体。
9.如段落1至8中任一项所述的侧流装置,其中所述第二捕获区域朝向所述侧流衬底的与所述第一结合区域相反的一端定位。
10.如段落9所述的侧流装置,其中所述第二捕获区域包括特异性地结合所述报告构建体的所述第二分子或所述可检测配体的第二结合剂。
11.如段落10所述的侧流装置,其中所述第二结合剂是固定的或以其他方式固定化至所述第二捕获区域的抗体或抗体结合蛋白。
12.如段落1-11中任一项所述的侧流装置,其中所述可检测配体是金纳米颗粒。
13.如段落12所述的侧流装置,其中所述金纳米颗粒被特异性地结合所述检测构建体的所述第二分子的结合剂修饰。
14.如段落13所述的侧流装置,其中所述第一抗体是抗FITC抗体。
15.如段落8所述的侧流装置,其中所述抗体是抗FITC抗体。
16.如段落8所述的侧流装置,其中所述抗体是抗生物素抗体。
17.如段落1-16中任一项所述的侧流装置,其中所述衬底是柔性材料衬底。
18.如段落1-17中任一项所述的侧流装置,其中所述柔性材料衬底是纸衬底或基于柔性聚合物的衬底。
19.如段落18所述的侧流装置,其中所述CRISPR效应蛋白是靶向RNA的效应蛋白、靶向DNA的蛋白或它们的组合。
20.如段落19所述的侧流装置,其中所述靶向RNA的效应蛋白是Cas13。
21.如段落20所述的侧流装置,其中所述Cas13效应蛋白来自选自由以下组成的组的属的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属、弯曲杆菌属和毛螺菌属。
22.如段落21所述的侧流装置,其中所述Cas13效应蛋白来自选自由以下组成的组的生物体:沙氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属种马赛-P2398;和纤毛菌属种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属种TSL5-1;假丁酸弧菌属种OR37;丁酸弧菌属种YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
23.如段落22所述的侧流装置,其中所述Ca13效应蛋白是韦德纤毛菌F0279或韦德纤毛菌F0279(Lw2)C2c2效应蛋白。
24.如段落19所述的侧流装置,其中所述靶向DNA的效应蛋白是Cas12。
25.如段落24所述的侧流装置,其中所述Ca12是Cpf1、C2c1或它们的组合。
26.如段落1至25中任一项所述的侧流装置,其中所述一个或多个向导序列针对疾病状态具诊断性。
27.如段落26所述的侧流装置,其中所述疾病状态是癌症。
28.如段落26所述的侧流装置,其中所述疾病状态是自身免疫疾病。
29.如段落26所述的侧流装置,其中所述疾病状态是感染。
30.如段落29所述的侧流装置,其中所述感染由病毒、细菌、真菌、原生动物或寄生虫引起。
31.如段落30所述的侧流装置,其中所述感染是病毒感染。
32.如段落31所述的侧流装置,其中所述病毒感染由DNA病毒引起。
33.如段落32所述的侧流装置,其中所述DNA病毒是肌病毒科、短尾病毒科、长尾病毒科、异疱疹病毒科、疱疹病毒科(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科、脂毛病毒科、小杆状病毒科、腺病毒科、瓶状病毒科、囊泡病毒科、非洲猪瘟病毒科(包括非洲猪瘟病毒)、杆状病毒科、西坎达病毒科、棒状病毒科、覆盖噬菌体科、小纺锤形噬菌体科、球状病毒科、滴状病毒科、唾液腺肥大病毒科、虹彩病毒科、马赛病毒科、拟菌病毒科、裸病毒科、线头病毒科、潘多拉病毒科、乳头瘤病毒科、藻类DNA病毒科、芽生噬菌体科、多DNA病毒、多瘤病毒科(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(包括牛痘和天花)、球脂状病毒科、复层噬菌体科、图里病毒科、甲藻DNA病毒、盐末端蛋白病毒、瑞兹病毒。
34.如段落31所述的侧流装置,其中所述病毒感染由双链RNA病毒、正义RNA病毒、反义RNA病毒、逆转录病毒或它们的组合引起。
35.如段落34所述的侧流装置,其中所述病毒感染由冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或丁型病毒引起。
36.如段落35所述的侧流装置,其中所述病毒感染由冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒引起。
37.如段落30所述的侧流装置,其中所述感染是细菌感染。
38.如段落37所述的侧流装置,其中引起所述细菌感染的细菌是不动杆菌属种、放线杆菌属种、放线菌目种、放线菌属种、气球菌属种、气单胞菌属种、红孢子虫属种、产碱杆菌属种、芽孢杆菌属种、拟杆菌属种、巴尔通体属种、双歧杆菌属种、博德特氏菌属种、包柔氏螺旋体属种、布鲁氏菌属种、伯克氏菌属种、弯曲杆菌属种、嗜二氧化碳噬细胞菌属种、衣原体属种、柠檬酸杆菌属种、柯克斯体属种、棒状杆菌属种、梭菌属种、艾肯菌属种、肠杆菌属种、埃希氏菌属种、肠球菌属种、埃立克体属种、表皮癣菌属种、丹毒丝菌属种、真杆菌属种、弗朗西斯菌属种、梭杆菌属种、加德纳菌属种、孪生球菌属种、嗜血杆菌属种、螺杆菌属种、金氏菌属种、克雷伯菌属种、乳杆菌属种、乳球菌属种、李斯特菌属种、钩端螺旋体属种、军团菌属种、钩端螺旋体属种、明串珠菌属种、曼氏杆菌属种、小孢子菌属种、微球菌属种、莫拉菌属种、摩根氏菌属种、动弯杆菌属种、微球菌属种、分枝杆菌属种、支原体属种、诺卡氏菌属种、奈瑟氏菌属种、巴斯德菌属种、片球菌属种、消化链球菌属种、糠疹癣菌属种、邻单胞菌属种、普雷沃菌属种、卟啉单胞菌属种、变形杆菌属种、普罗威登斯菌属种、假单胞菌属种、丙酸杆菌属种、红球菌属种、立克次体属种、红球菌属种、沙雷氏菌属种、寡养单胞菌属种、沙门氏菌属种、沙雷氏菌属种、志贺氏菌属种、葡萄球菌属种、链球菌属种、螺菌属种、链杆菌属种、密螺旋体属种、养障体属种、毛癣菌属种、脲原体属种、韦荣氏球菌属种、弧菌属种、耶尔森菌属种、黄单胞菌属种,或它们的组合。
39.如段落30所述的侧流装置,其中所述感染由真菌引起。
40.如段落39所述的侧流装置,其中所述真菌是曲霉属、芽生菌属、念珠菌属、球孢子菌属、新型隐球菌、格特隐球菌、组织胞浆菌属种(如荚膜组织胞浆菌)、肺孢子菌属种(如耶氏肺孢子菌)、葡萄穗霉属(如纸葡萄穗霉)、毛霉菌属、孢子丝菌属、真菌性眼睛感染癣、突脐蠕孢属、枝孢属、地霉属、酵母属、汉逊酵母属种、假丝酵母属种、克鲁维酵母属种、德巴利酵母属种、毕赤酵母属种、青霉菌属种、枝孢属种、丝衣霉属种,或它们的组合。
41.如段落30所述的侧流装置,其中所述感染由原生动物引起。
42.如段落41所述的侧流装置,其中所述原生动物是眼虫动物界、异叶足纲、双滴虫目、变形虫界、芽囊原虫属、顶复亚门,或它们的组合。
43.如段落30所述的侧流装置,其中所述感染由寄生虫引起。
44.如段落43所述的侧流装置,其中所述寄生虫是克氏锥虫(恰加斯病)、布氏冈比亚锥虫、布氏罗得西亚锥虫、巴西利什曼原虫、婴儿利什曼原虫、墨西哥利什曼原虫、硕大利什曼原虫、热带利什曼原虫、杜氏利什曼原虫、福氏耐格里变形虫、肠贾第虫(蓝氏贾第鞭毛虫、十二指肠贾第虫)、卡氏棘阿米巴虫、巴氏阿米巴原虫、痢疾阿米巴、人芽囊原虫、田鼠巴贝虫、微小隐孢子虫、卡晏环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫,或它们的组合。
45.如段落1至44中任一项所述的侧流装置,其中所述样品是生物样品或环境样品。
46.如段落45所述的侧流装置,其中所述生物样品是血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液(例如获自脓肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节或受如类风湿性关节炎、骨关节炎、痛风或化脓性关节炎等疾病影响的关节)的流体,或皮肤或粘膜表面的拭子。
47.如段落45所述的侧流装置,其中所述环境样品获自食物样品、纸表面、织物、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品,或它们的组合。
48.如段落31所述的侧流装置,其中所述疾病状态是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病或环境获得性疾病。
49.如段落26所述的侧流装置,其中所述疾病状态的特征在于抗生素或药物抗性或易感基因或转录物或多肽,优选地在病原体或细胞中的存在或不存在。
50.如段落49所述的侧流装置,其中所述一种或多种向导分子识别生物材料。
51.如段落50所述的侧流装置,其中所述生物材料是基因修饰的材料。
52.如段落51所述的侧流装置,其中所述基因修饰的材料是基因修饰的植物。
53.如段落2所述的侧流装置,其中所述第一分子是FITC,并且所述第二分子是FAM。
54.如段落35所述的侧流装置,其中所述病毒感染由登革热病毒引起。
55.一种侧流装置,所述侧流装置包括衬底,所述衬底包括第一端,其中所述第一端包括样品加载部分,以及加载有可检测配体的第一区域、两个或更多个CRISPR效应系统、两种或更多种检测构建体、一个或多个第一捕获区域、两个或更多个第二捕获区域,所述一个或多个第一捕获区域各自包括第一结合剂,所述两个或更多个第二捕获区域各自包括第二结合剂,其中所述两个或更多个CRISPR效应系统各自包含CRISPR效应蛋白和一个或多个向导序列,每一向导序列被配置成结合一种或多种靶分子。
56.如段落55所述的侧流装置,其中所述两种或更多种检测构建体各自包含RNA或DNA寡核苷酸,所述RNA或DNA寡核苷酸在第一端上包含第一分子并且在第二端上包含第二分子。
57.如段落56所述的侧流装置,所述侧流装置包括两个CRISPR效应系统和两种检测构建体。
58.如段落56所述的侧流装置,所述侧流装置包括四个CRISPR效应系统和四种检测构建体。
59.如段落55至58中任一项所述的侧流装置,其中所述样品加载部分还包括一种或多种扩增试剂用于扩增所述一种或多种靶分子。
60.如段落57所述的侧流装置,其中第一检测构建体包含FAM作为第一分子并且包含生物素作为第二分子,反之亦然,并且第二检测构建体包含FAM作为第一分子并且包含地高辛(DIG)作为第二分子,反之亦然。
61.如段落60所述的侧流装置,其中所述CRISPR效应蛋白是靶向RNA的效应蛋白。
62.如段落61所述的侧流装置,其中所述靶向RNA的效应蛋白是C2c2。
63.如段落19所述的侧流装置,其中所述靶向RNA的效应蛋白是Cas13b。
64.如段落58所述的侧流装置,其中第一检测构建体包含Tye665作为第一分子并且包含Alexa-fluor-488作为第二分子,反之亦然;其中第二检测构建体包含Tye665作为第一分子并且包含FAM作为第二分子,反之亦然;其中第三检测构建体包含Tye665作为第一分子并且包含生物素作为第二分子,反之亦然;其中第四检测构建体包含Tye665作为第一分子并且包含DIG作为第二分子,反之亦然。
65.如段落64所述的侧流装置,其中所述CRISPR效应蛋白是靶向RNA的效应蛋白或靶向DNA的效应蛋白。
66.如段落65所述的侧流装置,其中所述靶向RNA的效应蛋白是C2c2。
67.如段落65所述的侧流装置,其中所述靶向RNA的效应蛋白是Cas13b。
68.如段落65所述的侧流装置,其中所述靶向DNA的效应蛋白是Cas12a。
69.一种用于检测样品中的靶核酸的方法,所述方法包括使样品与根据段落1至68中任一项所述的侧流装置的包括所述样品加载部分的所述第一端接触;其中所述样品从所述衬底的所述样品加载部分流向所述第一捕获区域和所述第二捕获区域并且产生可检测信号。
70.如段落54所述的方法,其中所述样品是液体样品,或者其中已经将所述样品溶解于水性溶剂中。
71.如段落54或55所述的方法,其中所述样品不含有靶核酸。
72.如段落56所述的方法,其中所述可检测信号出现在所述第一捕获区域处。
73.如段落54或55所述的方法,其中所述样品含有靶核酸。
74.如段落58所述的方法,其中所述可检测信号出现在所述第二捕获区域处。
75.如段落58或59所述的方法,其中靶核酸的存在指示疾病状态。
***
本发明所描述的方法、药物组合物和试剂盒的各种修改和变更在不偏离本发明的范围和精神的情况下将为本领域技术人员显而易见。尽管已经结合特定实施方案描述本发明,但将了解,本发明能够进行进一步修改并且所要求的发明内容不应过度地限于此类特定实施方案。确实,本领域技术人员显而易见的对所描述的本发明实施方式的各种修改意图处于本发明的范围内。本申请意图涵盖本发明的任何变更、用途或改编,其一般遵循本发明的原理并且包括偏离本公开的内容,所述内容处于本发明所属领域内的已知惯例的范围内并且可以应用于本文之前所陈述的基本特征。

Claims (75)

1.一种侧流装置,所述侧流装置包括衬底,所述衬底包括第一端,其中所述第一端包括样品加载部分,以及加载有可检测配体的第一区域、CRISPR效应系统、检测构建体、包括第一结合剂的第一捕获区域和包括第二结合剂的第二捕获区域,其中所述CRISPR效应系统包含CRISPR效应蛋白和一个或多个向导序列,每一向导序列被配置成结合一种或多种靶分子。
2.如权利要求1所述的侧流装置,其中所述检测构建体包含RNA或DNA寡核苷酸,所述RNA或DNA寡核苷酸在第一端上包含第一分子并且在第二端上包含第二分子。
3.如权利要求1所述的侧流装置,其中所述样品加载部分还包括一种或多种扩增试剂用于扩增所述一种或多种靶分子。
4.如权利要求3所述的侧流装置,其中所述试剂用于扩增所述一种或多种靶RNA分子包括基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、切口酶扩增反应(NEAR)、PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分枝扩增法(RAM)。
5.如权利要求2所述的侧流装置,其中所述第一分子是FITC,并且所述第二分子是生物素,反之亦然。
6.如权利要求5所述的侧流装置,其中所述第一捕获区域与所述样品加载部分相邻并且处于所述侧流衬底的同一端上。
7.如权利要求5所述的侧流装置,其中所述第一捕获区域包括特异性地结合所述报告构建体的所述第一分子的第一结合剂。
8.如权利要求7所述的侧流装置,其中所述第一结合剂是固定的或以其他方式固定化至所述第一捕获区域的抗体。
9.如权利要求1所述的侧流装置,其中所述第二捕获区域朝向所述侧流衬底的与所述第一结合区域相反的一端定位。
10.如权利要求9所述的侧流装置,其中所述第二捕获区域包括特异性地结合所述报告构建体的所述第二分子或所述可检测配体的第二结合剂。
11.如权利要求10所述的侧流装置,其中所述第二结合剂是固定的或以其他方式固定化至所述第二捕获区域的抗体或抗体结合蛋白。
12.如权利要求1所述的侧流装置,其中所述可检测配体是金纳米颗粒。
13.如权利要求12所述的侧流装置,其中所述金纳米颗粒被特异性地结合所述检测构建体的所述第二分子的结合剂修饰。
14.如权利要求13所述的侧流装置,其中所述第一抗体是抗FITC抗体。
15.如权利要求8所述的侧流装置,其中所述抗体是抗FITC抗体。
16.如权利要求8所述的侧流装置,其中所述抗体是抗生物素抗体。
17.如权利要求1所述的侧流装置,其中所述衬底是柔性材料衬底。
18.如权利要求1所述的侧流装置,其中所述柔性材料衬底是纸衬底或基于柔性聚合物的衬底。
19.如权利要求18所述的侧流装置,其中所述CRISPR效应蛋白是靶向RNA的效应蛋白、靶向DNA的蛋白或它们的组合。
20.如权利要求19所述的侧流装置,其中所述靶向RNA的效应蛋白是Cas13。
21.如权利要求20所述的侧流装置,其中所述Cas13效应蛋白来自选自由以下组成的组的属的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属、弯曲杆菌属和毛螺菌属。
22.如权利要求21所述的侧流装置,其中所述Cas13效应蛋白来自选自由以下组成的组的生物体:沙氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属种马赛-P2398;和纤毛菌属种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属种TSL5-1;假丁酸弧菌属种OR37;丁酸弧菌属种YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
23.如权利要求22所述的侧流装置,其中所述Ca13效应蛋白是韦德纤毛菌F0279或韦德纤毛菌F0279(Lw2)C2c2效应蛋白。
24.如权利要求19所述的侧流装置,其中所述靶向DNA的效应蛋白是Cas12。
25.如权利要求24所述的侧流装置,其中所述Ca12是Cpf1、C2c1或它们的组合。
26.如权利要求1至25中任一项所述的侧流装置,其中所述一个或多个向导序列针对疾病状态具诊断性。
27.如权利要求26所述的侧流装置,其中所述疾病状态是癌症。
28.如权利要求26所述的侧流装置,其中所述疾病状态是自身免疫疾病。
29.如权利要求26所述的侧流装置,其中所述疾病状态是感染。
30.如权利要求29所述的侧流装置,其中所述感染由病毒、细菌、真菌、原生动物或寄生虫引起。
31.如权利要求30所述的侧流装置,其中所述感染是病毒感染。
32.如权利要求31所述的侧流装置,其中所述病毒感染由DNA病毒引起。
33.如权利要求32所述的侧流装置,其中所述DNA病毒是肌病毒科、短尾病毒科、长尾病毒科、异疱疹病毒科、疱疹病毒科(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科、脂毛病毒科、小杆状病毒科、腺病毒科、瓶状病毒科、囊泡病毒科、非洲猪瘟病毒科(包括非洲猪瘟病毒)、杆状病毒科、西坎达病毒科、棒状病毒科、覆盖噬菌体科、小纺锤形噬菌体科、球状病毒科、滴状病毒科、唾液腺肥大病毒科、虹彩病毒科、马赛病毒科、拟菌病毒科、裸病毒科、线头病毒科、潘多拉病毒科、乳头瘤病毒科、藻类DNA病毒科、芽生噬菌体科、多DNA病毒、多瘤病毒科(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(包括牛痘和天花)、球脂状病毒科、复层噬菌体科、图里病毒科、甲藻DNA病毒、盐末端蛋白病毒、瑞兹病毒。
34.如权利要求31所述的侧流装置,其中所述病毒感染由双链RNA病毒、正义RNA病毒、反义RNA病毒、逆转录病毒或它们的组合引起。
35.如权利要求34所述的侧流装置,其中所述病毒感染由冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或丁型病毒引起。
36.如权利要求35所述的侧流装置,其中所述病毒感染由冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒引起。
37.如权利要求30所述的侧流装置,其中所述感染是细菌感染。
38.如权利要求37所述的侧流装置,其中引起所述细菌感染的细菌是不动杆菌属种、放线杆菌属种、放线菌目种、放线菌属种、气球菌属种、气单胞菌属种、红孢子虫属种、产碱杆菌属种、芽孢杆菌属种、拟杆菌属种、巴尔通体属种、双歧杆菌属种、博德特氏菌属种、包柔氏螺旋体属种、布鲁氏菌属种、伯克氏菌属种、弯曲杆菌属种、嗜二氧化碳噬细胞菌属种、衣原体属种、柠檬酸杆菌属种、柯克斯体属种、棒状杆菌属种、梭菌属种、艾肯菌属种、肠杆菌属种、埃希氏菌属种、肠球菌属种、埃立克体属种、表皮癣菌属种、丹毒丝菌属种、真杆菌属种、弗朗西斯菌属种、梭杆菌属种、加德纳菌属种、孪生球菌属种、嗜血杆菌属种、螺杆菌属种、金氏菌属种、克雷伯菌属种、乳杆菌属种、乳球菌属种、李斯特菌属种、钩端螺旋体属种、军团菌属种、钩端螺旋体属种、明串珠菌属种、曼氏杆菌属种、小孢子菌属种、微球菌属种、莫拉菌属种、摩根氏菌属种、动弯杆菌属种、微球菌属种、分枝杆菌属种、支原体属种、诺卡氏菌属种、奈瑟氏菌属种、巴斯德菌属种、片球菌属种、消化链球菌属种、糠疹癣菌属种、邻单胞菌属种、普雷沃菌属种、卟啉单胞菌属种、变形杆菌属种、普罗威登斯菌属种、假单胞菌属种、丙酸杆菌属种、红球菌属种、立克次体属种、红球菌属种、沙雷氏菌属种、寡养单胞菌属种、沙门氏菌属种、沙雷氏菌属种、志贺氏菌属种、葡萄球菌属种、链球菌属种、螺菌属种、链杆菌属种、密螺旋体属种、养障体属种、毛癣菌属种、脲原体属种、韦荣氏球菌属种、弧菌属种、耶尔森菌属种、黄单胞菌属种,或它们的组合。
39.如权利要求30所述的侧流装置,其中所述感染由真菌引起。
40.如权利要求39所述的侧流装置,其中所述真菌是曲霉属、芽生菌属、念珠菌属、球孢子菌属、新型隐球菌、格特隐球菌、组织胞浆菌属种(如荚膜组织胞浆菌)、肺孢子菌属种(如耶氏肺孢子菌)、葡萄穗霉属(如纸葡萄穗霉)、毛霉菌属、孢子丝菌属、真菌性眼睛感染癣、突脐蠕孢属、枝孢属、地霉属、酵母属、汉逊酵母属种、假丝酵母属种、克鲁维酵母属种、德巴利酵母属种、毕赤酵母属种、青霉菌属种、枝孢属种、丝衣霉属种,或它们的组合。
41.如权利要求30所述的侧流装置,其中所述感染由原生动物引起。
42.如权利要求41所述的侧流装置,其中所述原生动物是眼虫动物界、异叶足纲、双滴虫目、变形虫界、芽囊原虫属、顶复亚门,或它们的组合。
43.如权利要求30所述的侧流装置,其中所述感染由寄生虫引起。
44.如权利要求43所述的侧流装置,其中所述寄生虫是克氏锥虫(恰加斯病)、布氏冈比亚锥虫、布氏罗得西亚锥虫、巴西利什曼原虫、婴儿利什曼原虫、墨西哥利什曼原虫、硕大利什曼原虫、热带利什曼原虫、杜氏利什曼原虫、福氏耐格里变形虫、肠贾第虫(蓝氏贾第鞭毛虫、十二指肠贾第虫)、卡氏棘阿米巴虫、巴氏阿米巴原虫、痢疾阿米巴、人芽囊原虫、田鼠巴贝虫、微小隐孢子虫、卡晏环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫,或它们的组合。
45.如权利要求1所述的侧流装置,其中所述样品是生物样品或环境样品。
46.如权利要求45所述的侧流装置,其中所述生物样品是血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液(例如获自脓肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节或受如类风湿性关节炎、骨关节炎、痛风或化脓性关节炎等疾病影响的关节)的流体,或皮肤或粘膜表面的拭子。
47.如权利要求45所述的侧流装置,其中所述环境样品获自食物样品、纸表面、织物、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品,或它们的组合。
48.如权利要求31所述的侧流装置,其中所述疾病状态是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病或环境获得性疾病。
49.如权利要求26所述的侧流装置,其中所述疾病状态的特征在于抗生素或药物抗性或易感基因或转录物或多肽,优选地在病原体或细胞中的存在或不存在。
50.如权利要求49所述的侧流装置,其中所述一种或多种向导分子识别生物材料。
51.如权利要求50所述的侧流装置,其中所述生物材料是基因修饰的材料。
52.如权利要求51所述的侧流装置,其中所述基因修饰的材料是基因修饰的植物。
53.如权利要求2所述的侧流装置,其中所述第一分子是FITC并且所述第二分子是FAM。
54.如权利要求35所述的侧流装置,其中所述病毒感染由登革热病毒引起。
55.一种侧流装置,所述侧流装置包括衬底,所述衬底包括第一端,其中所述第一端包括样品加载部分,以及加载有可检测配体的第一区域、两个或更多个CRISPR效应系统、两种或更多种检测构建体、一个或多个第一捕获区域、两个或更多个第二捕获区域,所述一个或多个第一捕获区域各自包括第一结合剂,所述两个或更多个第二捕获区域各自包括第二结合剂,其中所述两个或更多个CRISPR效应系统各自包含CRISPR效应蛋白和一个或多个向导序列,每一向导序列被配置成结合一种或多种靶分子。
56.如权利要求55所述的侧流装置,其中所述两种或更多种检测构建体各自包含RNA或DNA寡核苷酸,所述RNA或DNA寡核苷酸在第一端上包含第一分子并且在第二端上包含第二分子。
57.如权利要求56所述的侧流装置,所述侧流装置包括两个CRISPR效应系统和两种检测构建体。
58.如权利要求56所述的侧流装置,所述侧流装置包括四个CRISPR效应系统和四种检测构建体。
59.如权利要求55所述的侧流装置,其中所述样品加载部分还包括一种或多种扩增试剂用于扩增所述一种或多种靶分子。
60.如权利要求57所述的侧流装置,其中第一检测构建体包含FAM作为第一分子并且包含生物素作为第二分子,反之亦然,并且第二检测构建体包含FAM作为第一分子并且包含地高辛(DIG)作为第二分子,反之亦然。
61.如权利要求60所述的侧流装置,其中所述CRISPR效应蛋白是靶向RNA的效应蛋白。
62.如权利要求61所述的侧流装置,其中所述靶向RNA的效应蛋白是C2c2。
63.如权利要求19所述的侧流装置,其中所述靶向RNA的效应蛋白是Cas13b。
64.如权利要求58所述的侧流装置,其中第一检测构建体包含Tye665作为第一分子并且包含Alexa-fluor-488作为第二分子,反之亦然;其中第二检测构建体包含Tye665作为第一分子并且包含FAM作为第二分子,反之亦然;其中第三检测构建体包含Tye665作为第一分子并且包含生物素作为第二分子,反之亦然;并且其中第四检测构建体包含Tye665作为第一分子并且包含DIG作为第二分子,反之亦然。
65.如权利要求64所述的侧流装置,其中所述CRISPR效应蛋白是靶向RNA的效应蛋白或靶向DNA的效应蛋白。
66.如权利要求65所述的侧流装置,其中所述靶向RNA的效应蛋白是C2c2。
67.如权利要求65所述的侧流装置,其中所述靶向RNA的效应蛋白是Cas13b。
68.如权利要求65所述的侧流装置,其中所述靶向DNA的效应蛋白是Cas12a。
69.一种用于检测样品中的靶核酸的方法,所述方法包括使样品与根据权利要求1至53中任一项所述的侧流装置的包括所述样品加载部分的所述第一端接触;其中所述样品从所述衬底的所述样品加载部分流向所述第一捕获区域和所述第二捕获区域并且产生可检测信号。
70.如权利要求54所述的方法,其中所述样品是液体样品,或者其中已经将所述样品溶解于水性溶剂中。
71.如权利要求54所述的方法,其中所述样品不含有靶核酸。
72.如权利要求56所述的方法,其中所述可检测信号出现在所述第一捕获区域处。
73.如权利要求54所述的方法,其中所述样品含有靶核酸。
74.如权利要求58所述的方法,其中所述可检测信号出现在所述第二捕获区域处。
75.如权利要求58或59所述的方法,其中靶核酸的存在指示疾病状态。
CN201880078358.2A 2017-10-04 2018-10-04 基于crispr效应系统的诊断 Pending CN111630162A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201762568309P 2017-10-04 2017-10-04
US62/568,309 2017-10-04
US201762610144P 2017-12-22 2017-12-22
US62/610,144 2017-12-22
US201862623529P 2018-01-29 2018-01-29
US62/623,529 2018-01-29
US201862630787P 2018-02-14 2018-02-14
US62/630,787 2018-02-14
PCT/US2018/054472 WO2019071051A1 (en) 2017-10-04 2018-10-04 DIAGNOSTICS BASED ON A CRISPR EFFECTOR SYSTEM

Publications (1)

Publication Number Publication Date
CN111630162A true CN111630162A (zh) 2020-09-04

Family

ID=65995340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880078358.2A Pending CN111630162A (zh) 2017-10-04 2018-10-04 基于crispr效应系统的诊断

Country Status (11)

Country Link
US (1) US11633732B2 (zh)
EP (1) EP3692146A4 (zh)
JP (1) JP2020537121A (zh)
KR (1) KR102628577B1 (zh)
CN (1) CN111630162A (zh)
AU (1) AU2018346530A1 (zh)
BR (1) BR112020006757A2 (zh)
CA (1) CA3076518A1 (zh)
IL (1) IL273360A (zh)
RU (1) RU2020115264A (zh)
WO (1) WO2019071051A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112280877A (zh) * 2020-11-09 2021-01-29 中国人民解放军军事科学院军事医学研究院 一种用于贝氏柯克斯体核酸检测的CRISPR-Cas13a系统
CN112301162A (zh) * 2020-10-22 2021-02-02 清华-伯克利深圳学院筹备办公室 同时检测dna病毒和rna病毒的病毒核酸检测方法
CN113667718A (zh) * 2021-08-25 2021-11-19 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2403964B1 (en) 2009-03-02 2021-09-08 Massachusetts Institute of Technology Methods and products for in vivo enzyme profiling
EP3950704A1 (en) 2011-03-15 2022-02-09 Massachusetts Institute Of Technology Multiplexed detection with isotope-coded reporters
CA2914754A1 (en) 2013-06-07 2014-12-11 Massachusetts Institute Of Technology Affinity-based detection of ligand-encoded synthetic biomarkers
WO2017177115A1 (en) 2016-04-08 2017-10-12 Massachusetts Institute Of Technology Methods to specifically profile protease activity at lymph nodes
CA3022928A1 (en) 2016-05-05 2017-11-09 Massachusetts Institute Of Technology Methods and uses for remotely triggered protease activity measurements
CA3059358A1 (en) 2017-04-07 2018-10-11 Massachusetts Institute Of Technology Methods to spatially profile protease activity in tissue and sections
US11584955B2 (en) * 2017-07-14 2023-02-21 Shanghai Tolo Biotechnology Company Limited Application of Cas protein, method for detecting target nucleic acid molecule and kit
RU2020115264A (ru) 2017-10-04 2021-11-08 Зе Броад Институт, Инк. Диагностика на основе эффекторной системы crispr
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
AU2019318079A1 (en) * 2018-08-07 2021-01-28 Massachusetts Institute Of Technology Novel Cas12b enzymes and systems
CN113474456A (zh) * 2018-11-14 2021-10-01 博德研究所 基于crispr系统的液滴诊断系统和方法
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP3911753A1 (en) 2019-01-17 2021-11-24 Massachusetts Institute of Technology Sensors for detecting and imaging of cancer metastasis
WO2020186223A1 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Sherlock assays for tick-borne diseases
WO2020186231A2 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
CN110453011B (zh) * 2019-07-19 2021-09-07 中山大学 一种基于CRISPR/Cas12a快速精准检测非洲猪瘟病毒的方法及应用
CN110468188B (zh) * 2019-08-22 2023-08-22 广州微远医疗器械有限公司 用于二代测序的标签序列集及其设计方法和应用
EP4025345A4 (en) * 2019-09-03 2024-02-28 Univ Colorado Regents SYSTEMS, METHODS AND COMPOSITIONS FOR RAPID EARLY DETECTION OF INFECTION HOST RNA BIOMARKERS AND EARLY IDENTIFICATION OF CORONAVIRUS COVID-19 INFECTION IN HUMANS
CN110894557A (zh) * 2019-09-20 2020-03-20 武汉大学 基于CRISPR方式检测非洲猪瘟病毒的crRNA及试剂盒
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
WO2021167687A1 (en) * 2020-02-18 2021-08-26 Massachusetts Institute Of Technology Multiplexed in vivo disease sensing with nucleic acid-barcoded reporters
CN111893211B (zh) * 2020-03-02 2021-07-06 广东药科大学 一种检测新型冠状病毒及流感病毒的试剂盒
EP3875602A1 (en) 2020-03-05 2021-09-08 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk Onderzoek TNO Nucleic acid fluorescence detection
WO2021188569A1 (en) * 2020-03-17 2021-09-23 Detect, Inc. Rapid diagnostic test with blister pack
CN111440793B (zh) * 2020-03-20 2021-11-05 武汉博杰生物医学科技有限公司 一种新型冠状病毒核酸检测试剂盒
US11851702B2 (en) 2020-03-23 2023-12-26 The Broad Institute, Inc. Rapid diagnostics
CN111500771B (zh) * 2020-04-20 2021-03-23 上海国际旅行卫生保健中心(上海海关口岸门诊部) 一种新型冠状病毒SARS-CoV-2检测的引物组和试剂盒
WO2021231459A2 (en) * 2020-05-11 2021-11-18 The Regents Of The University Of Colorado, A Body Corporate Compositions, methods and uses for quantifying transcription and biosensing of small molecules using a type vi crispr-cas assay
JP2023527150A (ja) * 2020-05-19 2023-06-27 マンモス バイオサイエンシズ インコーポレイテッド 核酸の検出のための装置、アッセイ、及び方法
CN111996291A (zh) * 2020-08-21 2020-11-27 深圳海关动植物检验检疫技术中心 用于西尼罗河病毒检测的试剂、试剂盒、检测方法及应用
CN112195257A (zh) * 2020-10-17 2021-01-08 辽宁佰昊生物科技有限公司 一种检测副溶血弧菌的引物组、试剂、试剂盒及检测方法
CN112538550B (zh) * 2020-12-26 2023-05-09 江苏省农业科学院 基于RT-RPA和CRISPR/Cas的DHAV-1和DHAV-3检测体系及应用
JP2024502033A (ja) * 2020-12-31 2024-01-17 ザ・ボード・オブ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・イリノイ 活性化・切断および計数(acc)技術を使用する核酸配列の特異的検出
WO2022170013A1 (en) * 2021-02-05 2022-08-11 University Of Connecticut Multiplexed, crispr-based diagnostics of sars-cov-2 in autonomous microfluidic device
CN113061650A (zh) * 2021-02-19 2021-07-02 中国科学院深圳先进技术研究院 一种病原体核酸的即时检测系统及方法
CN113274555B (zh) * 2021-05-31 2022-05-03 清华大学 一种具有仿生螺旋取向化微结构的人工心室及其制备方法
US11814689B2 (en) 2021-07-21 2023-11-14 Montana State University Nucleic acid detection using type III CRISPR complex
CN113637804B (zh) * 2021-09-16 2023-10-20 赣南师范大学 一种基于rt-pcr技术检测rb-n1基因型柑橘衰退病毒用试剂盒及其检测方法
CN113933302B (zh) * 2021-10-15 2024-01-05 牡丹江医学院 一种血液检验平台及其使用方法
KR20230117058A (ko) * 2022-01-28 2023-08-07 주식회사 페로카 Egfr 돌연변이를 특이적으로 검출할 수 있는 형광 신호 기반 핵산 검출 조성물 및 방법
CN114836579B (zh) * 2022-06-02 2024-05-07 昆明理工大学 中枢神经系统感染性病原体的多重荧光定量pcr检测引物组合
WO2024055019A1 (en) * 2022-09-09 2024-03-14 The Forsyth Institute Methods and systems for detection of oral bacteria

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015109255A1 (en) * 2014-01-16 2015-07-23 Genisphere, Llc Lateral flow assays using dna dendrimers
WO2016022872A1 (en) * 2014-08-08 2016-02-11 Ortho-Clinical Diagnostics, Inc. Lateral flow assay device
WO2016028843A2 (en) * 2014-08-19 2016-02-25 President And Fellows Of Harvard College Rna-guided systems for probing and mapping of nucleic acids

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130224729A1 (en) * 2009-08-12 2013-08-29 President And Fellows Of Harvard College Biodetection Methods and Compositions
DE102010003782B4 (de) 2010-04-08 2023-09-28 Ist Innuscreen Gmbh Vorrichtung zum Nachweis von Nukleinsäuren
WO2013188638A2 (en) 2012-06-15 2013-12-19 The Regents Of The University Of California Endoribonucleases and methods of use thereof
IL239317B (en) 2012-12-12 2022-07-01 Broad Inst Inc Providing, engineering and optimizing systems, methods and compositions for sequence manipulation and therapeutic applications
GB201318728D0 (en) 2013-10-23 2013-12-04 Mologic Ltd Detection of cleavage activity of an enzyme
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
KR20180133374A (ko) 2015-10-22 2018-12-14 더 브로드 인스티튜트, 인코퍼레이티드 타입 vi-b crispr 효소 및 시스템
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
US10337051B2 (en) * 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
CA3028158A1 (en) * 2016-06-17 2017-12-21 The Broad Institute, Inc. Type vi crispr orthologs and systems
US20210166783A1 (en) 2016-08-17 2021-06-03 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
AU2017371324A1 (en) 2016-12-09 2019-07-11 Massachusetts Institute Of Technology CRISPR effector system based diagnostics
KR20190140918A (ko) 2017-03-15 2019-12-20 더 브로드 인스티튜트, 인코퍼레이티드 바이러스 검출을 위한 crispr 이펙터 시스템 기반 진단
EP3645728A4 (en) 2017-06-26 2021-03-24 The Broad Institute, Inc. NEW CRISPR TYPE VI ORTHOLOGISTS AND RELATED SYSTEMS
US10476825B2 (en) * 2017-08-22 2019-11-12 Salk Institue for Biological Studies RNA targeting methods and compositions
RU2020115264A (ru) 2017-10-04 2021-11-08 Зе Броад Институт, Инк. Диагностика на основе эффекторной системы crispr
US20210108267A1 (en) * 2017-12-22 2021-04-15 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
US11608519B2 (en) 2018-07-30 2023-03-21 Tokitae Llc Specific detection of deoxyribonucleic acid sequences using novel CRISPR enzyme-mediated detection strategies
WO2020028729A1 (en) * 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015109255A1 (en) * 2014-01-16 2015-07-23 Genisphere, Llc Lateral flow assays using dna dendrimers
WO2016022872A1 (en) * 2014-08-08 2016-02-11 Ortho-Clinical Diagnostics, Inc. Lateral flow assay device
WO2016028843A2 (en) * 2014-08-19 2016-02-25 President And Fellows Of Harvard College Rna-guided systems for probing and mapping of nucleic acids

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ALEXANDRA EAST-SELETSKY ET AL.: "Two Distinct RNase Activities of CRISPR-C2c2 Enable Guide RNA Processing and RNA Detection", 《NATURE》, vol. 538, no. 7624, pages 270 - 273, XP055719305, DOI: 10.1038/nature19802 *
HUI YANG ET AL.: "PAM-dependent Target DNA Recognition and Cleavage by C2c1 CRISPR-Cas Endonuclease", 《CELL》, vol. 167, no. 7, XP029850724, DOI: 10.1016/j.cell.2016.11.053 *
JONATHAN S. GOOTENBERG ET AL.: "Nucleic acid detection with CRISPR-Cas13a/C2c2", 《SCIENCE》, vol. 356, no. 6336, pages 1 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112301162A (zh) * 2020-10-22 2021-02-02 清华-伯克利深圳学院筹备办公室 同时检测dna病毒和rna病毒的病毒核酸检测方法
CN112301162B (zh) * 2020-10-22 2023-09-22 清华-伯克利深圳学院筹备办公室 同时检测dna病毒和rna病毒的病毒核酸检测方法
CN112280877A (zh) * 2020-11-09 2021-01-29 中国人民解放军军事科学院军事医学研究院 一种用于贝氏柯克斯体核酸检测的CRISPR-Cas13a系统
CN113667718A (zh) * 2021-08-25 2021-11-19 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法
CN113667718B (zh) * 2021-08-25 2023-11-28 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法

Also Published As

Publication number Publication date
RU2020115264A (ru) 2021-11-08
IL273360A (en) 2020-05-31
CA3076518A1 (en) 2019-04-11
US11633732B2 (en) 2023-04-25
JP2020537121A (ja) 2020-12-17
KR102628577B1 (ko) 2024-01-23
EP3692146A4 (en) 2021-06-30
KR20200074102A (ko) 2020-06-24
US20200254443A1 (en) 2020-08-13
AU2018346530A1 (en) 2020-04-30
WO2019071051A1 (en) 2019-04-11
EP3692146A1 (en) 2020-08-12
RU2020115264A3 (zh) 2022-02-24
BR112020006757A2 (pt) 2020-10-06

Similar Documents

Publication Publication Date Title
US11633732B2 (en) CRISPR effector system based diagnostics
US20220025463A1 (en) Crispr effector system based diagnostics
JP7228514B2 (ja) Crisprエフェクターシステムベースの診断法
EP3746568B1 (en) Crispr effector system based diagnostics
US11898142B2 (en) Multi-effector CRISPR based diagnostic systems
US11618928B2 (en) CRISPR effector system based diagnostics for malaria detection
US11104937B2 (en) CRISPR effector system based diagnostics
US11021740B2 (en) Devices for CRISPR effector system based diagnostics
CN111836903A (zh) 基于crispr效应系统的多重诊断
CN111108220A (zh) 用于病毒检测的基于crispr效应系统的诊断
JP2024065113A (ja) Crisprエフェクター系に基づく診断

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40036719

Country of ref document: HK