CN112020562B - 基于crispr效应系统的诊断 - Google Patents

基于crispr效应系统的诊断 Download PDF

Info

Publication number
CN112020562B
CN112020562B CN201980019789.6A CN201980019789A CN112020562B CN 112020562 B CN112020562 B CN 112020562B CN 201980019789 A CN201980019789 A CN 201980019789A CN 112020562 B CN112020562 B CN 112020562B
Authority
CN
China
Prior art keywords
virus
species
rna
target
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980019789.6A
Other languages
English (en)
Other versions
CN112020562A (zh
Inventor
F·张
J·戈滕贝格
O·阿布达耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Publication of CN112020562A publication Critical patent/CN112020562A/zh
Application granted granted Critical
Publication of CN112020562B publication Critical patent/CN112020562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0065Oxidoreductases (1.) acting on hydrogen peroxide as acceptor (1.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y111/00Oxidoreductases acting on a peroxide as acceptor (1.11)
    • C12Y111/01Peroxidases (1.11.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/337Ribozyme
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/205Aptamer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/137Chromatographic separation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54366Apparatus specially adapted for solid-phase testing
    • G01N33/54386Analytical elements
    • G01N33/54387Immunochromatographic test strips
    • G01N33/54388Immunochromatographic test strips based on lateral flow
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本文所公开的实施方案利用靶向RNA的效应子以提供具有渺摩尔级灵敏度的稳健的基于CRISPR的诊断。本文所公开的实施方案可以相当的灵敏度水平检测DNA和RNA两者,并且可基于单碱基对差异将标靶与非标靶区分开,并且包括通过比色和/或荧光偏移进行的检测。此外,本文所公开的实施方案可以冷冻干燥的形式制备,以便于分配和定点护理(POC)应用。此类实施方案可用于人类健康的多种情形,包括例如病毒检测、细菌菌株分型、灵敏基因分型,和疾病相关无细胞DNA的检测。

Description

基于CRISPR效应系统的诊断
相关申请的交叉引用
本申请要求2018年1月29日提交的美国临时申请号62/623,531的权益。 以上确认的申请的全部内容特此以引用的方式完全并入本文中。
电子序列表引用
电子序列表(BROD_2505WP_ST25.txt”;大小为2.7MB,于2019年1月 28日创建)的内容以引用方式整体并入本文。
关于联邦资助研究的声明
本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的授权号MH100706和MH110049以及由美国国防威胁降低局(Defense Threat ReductionAgency)授予的授权号HDTRA1-14-1-0006在政府支持下完成的。 政府对本发明具有某些权利。
技术领域
本文所公开的主题大体上关于与CRISPR效应系统的使用相关的快速诊 断。
背景技术
核酸是生物信息的通用标识。在便携平台上以高灵敏度和单碱基特异性 快速检测核酸的能力具有以下潜力:为许多疾病的诊断和监测带来革新,提 供有价值的流行病学信息,并且用作可泛化的科学工具。尽管已经开发许多 方法用于检测核酸(Du等,2017;Green等,2014;Kumar等,2014;Pardee等, 2014;Pardee等,2016;Urdea等,2006),但其不可避免地在灵敏度、特异性、 简易性和速度当中有所权衡。举例来说,qPCR方法是灵敏但昂贵的并且依 赖复杂的仪器,这限制了在实验室设置中训练有素的操作者的可用性。其他 方法,例如组合等温核酸扩增与便携平台的新方法(Du等,2017;Pardee等, 2016),在定点护理(POC)设置中提供高检测特异性,但归因于低灵敏度而具有稍受限制的应用。因为核酸诊断对于多种保健应用变得日益相关,所以在 低成本下提供高特异性和灵敏度的检测技术将在临床与基础研究设置中具有 很大效用。
发明内容
在一个方面,本发明提供了一种核酸检测系统,所述核酸检测系统包括 检测CRISPR系统,所述检测CRISPR系统包含效应蛋白和一种或多种被设 计成结合至相应靶分子的向导RNA,以及包含具有酶活性的四链体的核酸适 体。在一些实施方案中,所述酶活性可以是过氧化物酶活性。在一些实施方 案中,所述系统可还包括核酸扩增试剂。
在一些实施方案中,所述四链体的所述酶活性在所述样品中产生颜色信 号。在一些实施方案中,所述四链体的所述酶活性的灭活产生颜色信号的损 失,所述颜色信号的损失指示所述靶分子的存在。
所述靶分子可以是靶DNA。在一些实施方案中,所述系统可还包括结合 所述靶DNA且包含RNA聚合酶启动子的引物。CRISPR系统效应蛋白可以 是靶向RNA的效应蛋白。在一些实施方案中,所述靶向RNA的效应蛋白可 包含一个或多个HEPN结构域。所述一个或多个HEPN结构域可包含RxxxxH 基序序列。所述RxxxH基序可包含R{N/H/K]X1X2X3H序列。
在一些实施方案中,X1可以是R、S、D、E、Q、N、G或Y,并且X2 可独立地是I、S、T、V或L,并且X3独立地是L、F、N、Y、V、I、S、D、 E或A。
在一些实施方案中,所述靶向RNA的CRISPR效应蛋白可以是C2c2。 在一些实施方案中,所述C2c2可在Cas 1基因的20kb内。
所述C2c2效应蛋白可来自选自由以下组成的组的属的生物体:纤毛菌 属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线 菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、 黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属、弯曲杆菌属和毛螺 菌属。
所述C2c2或Cas13b效应蛋白可来自选自由以下组成的组的生物体:沙 氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺 菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆 菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤 维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属某种马 赛-P2398;纤毛菌属某种口腔分类群879菌株F0557;毛螺菌科细菌NK4A144; 聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属某种TSL5-1;假丁酸弧菌属某 种OR37;丁酸弧菌属某种YAB3001;布劳特氏菌属某种马赛-P2398;纤毛 菌属某种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特 菌;和陌生非适应螺菌。
在特定实施方案中,所述C2c2效应蛋白可以是韦德纤毛菌F0279或韦 德纤毛菌F0279(Lw2)C2c2效应蛋白。
在一些实施方案中,所述核酸适体可识别赭曲毒素A(OTA)。
在一些实施方案中,所述一种或多种向导RNA可被设计成结合至包含 (合成)错配的相应靶分子。所述错配可在所述靶分子中的SNP或其他单核苷 酸变异的上游或下游。
在一些实施方案中,所述一种或多种向导RNA被设计成检测靶RNA或 DNA中的单核苷酸多态性,或RNA转录物的剪接变体。所述一种或多种向 导RNA可被设计成结合至一种或多种对疾病状态具诊断性的靶分子。在一些 实施方案中,所述疾病状态可以是癌症。在一些实施方案中,所述疾病状态 可以是自身免疫疾病。在一些实施方案中,所述疾病状态可以是感染。所述 感染可由病毒、细菌、真菌、原生动物或寄生虫引起。
在特定实施方案中,所述感染可以是病毒感染。所述病毒感染由DNA 病毒引起。所述DNA病毒可以是肌病毒科、短尾病毒科、长尾病毒科、异 疱疹病毒科、疱疹病毒科(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科、脂毛病毒科、小杆状病毒科、腺病毒科、瓶状病毒科、囊泡病毒科、 非洲猪瘟病毒科(包括非洲猪瘟病毒)、杆状病毒科、西坎达病毒科、棒状病 毒科、覆盖噬菌体科、小纺锤形噬菌体科、球状病毒科、滴状病毒科、唾液 腺肥大病毒科、虹彩病毒科、马赛病毒科、拟菌病毒科、裸病毒科、线头病 毒科、潘多拉病毒科、乳头瘤病毒科、藻类DNA病毒科、芽生噬菌体科、 多DNA病毒、多瘤病毒科(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科 (包括牛痘和天花)、球脂状病毒科、复层噬菌体科、图里病毒科、甲藻DNA 病毒、盐末端蛋白病毒、瑞兹病毒。
所述病毒感染可由双链RNA病毒、正义RNA病毒、反义RNA病毒、 逆转录病毒或它们的组合引起。
所述病毒感染可由冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病 毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒 科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或 丁型病毒引起。
所述病毒感染可由冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝 炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、 寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳 病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦 病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒引起。
在一些实施方案中,所述感染是细菌感染。引起所述细菌感染的细菌可 以是不动杆菌属某种、放线杆菌属某种、放线菌目种、放线菌属某种、气球 菌属某种、气单胞菌属某种、红孢子虫属某种、产碱杆菌属某种、芽孢杆菌 属某种、拟杆菌属某种、巴尔通体属某种、双歧杆菌属某种、博德特氏菌属 某种、包柔氏螺旋体属某种、布鲁氏菌属某种、伯克氏菌属某种、弯曲杆菌属某种、嗜二氧化碳噬细胞菌属某种、衣原体属某种、柠檬酸杆菌属某种、柯克斯体属某种、棒状杆菌属某种、梭菌属某种、艾肯菌属某种、肠杆菌属 某种、埃希氏菌属某种、肠球菌属某种、埃立克体属某种、表皮癣菌属某种、 丹毒丝菌属某种、真杆菌属某种、弗朗西斯菌属某种、梭杆菌属某种、加德 纳菌属某种、孪生球菌属某种、嗜血杆菌属某种、螺杆菌属某种、金氏菌属 某种、克雷伯菌属某种、乳杆菌属某种、乳球菌属某种、李斯特菌属某种、钩端螺旋体属某种、军团菌属某种、钩端螺旋体属某种、明串珠菌属某种、 曼氏杆菌属某种、小孢子菌属某种、微球菌属某种、莫拉菌属某种、摩根氏 菌属某种、动弯杆菌属某种、微球菌属某种、分枝杆菌属某种、支原体属某 种、诺卡氏菌属某种、奈瑟氏菌属某种、巴斯德菌属某种、片球菌属某种、 消化链球菌属某种、糠疹癣菌属某种、邻单胞菌属某种、普雷沃菌属某种、 卟啉单胞菌属某种、变形杆菌属某种、普罗威登斯菌属某种、假单胞菌属某种、丙酸杆菌属某种、红球菌属某种、立克次体属某种、红球菌属某种、沙 雷氏菌属某种、寡养单胞菌属某种、沙门氏菌属某种、沙雷氏菌属某种、志 贺氏菌属某种、葡萄球菌属某种、链球菌属某种、螺菌属某种、链杆菌属某 种、密螺旋体属某种、养障体属某种、毛癣菌属某种、脲原体属某种、韦荣 氏球菌属某种、弧菌属某种、耶尔森菌属某种、黄单胞菌属某种,或它们的 组合。
在一些实施方案中,所述感染可由真菌引起。所述真菌可以是曲霉属、 芽生菌属、念珠菌属、球孢子菌属、新型隐球菌、格特隐球菌、组织胞浆菌 属某种(如荚膜组织胞浆菌)、肺孢子菌属某种(如耶氏肺孢子菌)、葡萄穗霉属 (如纸葡萄穗霉)、毛霉菌病、孢子丝菌属、真菌性眼睛感染癣、突脐蠕孢属、 枝孢属、地霉属、酵母属、汉逊酵母属某种、假丝酵母属某种、克鲁维酵母属某种、德巴利酵母属某种、毕赤酵母属某种、青霉菌属某种、枝孢属某种、 丝衣霉属某种,或它们的组合。
在一些实施方案中,所述感染可由原生动物引起。所述原生动物可以是 眼虫门、异叶足纲、双滴虫目、变形虫界、芽囊原虫属、顶复亚门,或它们 的组合。
所述感染可由寄生虫引起。所述寄生虫可以是克氏锥虫(恰加斯病)、布 氏冈比亚锥虫、布氏罗得西亚锥虫、巴西利什曼原虫、婴儿利什曼原虫、墨 西哥利什曼原虫、硕大利什曼原虫、热带利什曼原虫、杜氏利什曼原虫、福 氏耐格里变形虫、肠贾第虫(兰伯氏贾第虫、十二指肠贾第虫)、卡氏棘阿米 巴虫、巴氏阿米巴原虫、溶组织内阿米巴、人芽囊原虫、田鼠巴贝虫、微小 隐孢子虫、卡晏环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫,或它们的组合。
在一些实施方案中,所述试剂用于扩增靶RNA分子包括基于核酸序列的 扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导等温扩增(LAMP)、链置换 扩增(SDA)、解旋酶依赖性扩增(HDA)、切口酶扩增反应(NEAR)、PCR、多 重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分枝扩增法 (RAM)。
所述系统可还包括富集CRISPR系统,其中所述富集CRISPR系统被设 计成在通过所述检测CRISPR系统进行检测之前结合所述相应靶分子。所述 富集CRISPR系统可包含无催化活性的CRISPR效应蛋白。所述无催化活性的CRISPR效应蛋白可以是无催化活性的C2c2。
所述富集CRISPR效应蛋白可还包含标签,其中所述标签用于拉下所述 富集CRISPR效应系统,或将所述富集CRISPR系统结合至固体衬底。在一些实施方案中,所述固体衬底可以是流通池。
在另一方面,本发明提供了一种诊断装置,所述诊断装置包括一个或多 个个别离散体积,每一个别离散体积包括如本文所描述的CRISPR系统。
在一些实施方案中,每一个别离散体积可还包括核酸扩增试剂。
在一些实施方案中,所述靶分子可以是靶DNA,并且所述个别离散体积 可还包括结合所述靶DNA且包含RNA聚合酶启动子的引物。
在一些实施方案中,所述个别离散体积可以是液滴。在一些实施方案中, 所述个别离散体积被限定在固体衬底上。在一些实施方案中,所述个别离散 体积是微孔。在一些实施方案中,所述个别离散体积是限定在衬底上的斑点。 在一些实施方案中,所述衬底可以是柔性材料衬底。在一些实施方案中,所 述柔性材料衬底可以是纸衬底或基于柔性聚合物的衬底。
在另一方面,本发明提供了一种用于检测样品中的靶核酸的方法,所述 方法包括将样品或样品组分配到一个或多个个别离散体积中,所述个别离散 体积包括如本文所描述的CRISPR系统;在足以允许一种或多种向导RNA与一种或多种靶分子结合的条件下孵育所述样品或样品组;经由所述一种或多 种向导RNA与所述一种或多种靶分子的结合来活化所述CRISPR效应蛋白, 其中活化所述CRISPR效应蛋白引起包含四链体的RNA适体的修饰,使得所 述四链体的酶活性被灭活;以及检测所述酶活性,其中检测到低于阈值指示 所述样品中一种或多种靶分子的存在。
在一些实施方案中,所述靶分子可以是靶DNA。在一些实施方案中,所 述方法可还包括将所述靶DNA与包含RNA聚合酶位点的引物结合。
所述方法可还包括扩增样品RNA或触发RNA。扩增RNA可包括通过 NASBA进行扩增。在一些实施方案中,扩增RNA可包括通过RPA进行扩 增。
所述样品可以是生物样品或环境样品。
所述生物样品可以是血液、血浆、血清、尿液、粪便、痰液、粘液、淋 巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或 玻璃体液,或任何身体分泌物、渗出物、渗出液(例如获自脓肿或任何其他感 染或发炎部位的流体),或获自关节(例如正常关节或受如类风湿性关节炎、 骨关节炎、痛风或化脓性关节炎等疾病影响的关节)的流体,或皮肤或粘膜表 面的拭子。
所述环境样品可获自食物样品、纸表面、织物、金属表面、木材表面、 塑料表面、土壤样品、淡水样品、废水样品、盐水样品,或它们的组合。
所述一种或多种向导RNA可被设计成检测靶RNA或DNA中的单核苷 酸多态性,或RNA转录物的剪接变体。所述一种或多种向导RNA可被设计 成结合至一种或多种对疾病状态具诊断性的靶分子。
所述一种或多种向导RNA可被设计成结合至无细胞核酸。
在一些实施方案中,所述疾病状态可以是感染、器官疾病、血液疾病、 免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾 病、遗传性疾病或环境获得性疾病。
在另一方面,本发明提供了一种用于检测样品中的靶核酸的方法,所述 方法包括使样品与如本文所描述的核酸检测系统接触以及将所述接触的样品 应用于侧流免疫色谱测定。
附图说明
图1–是示例性基于C2c2的CRISPR效应系统的示意图。
图2–提供了(A)来自韦德纤毛菌的CRISPR/C2c2基因座的示意图。示 出了来自LwC2c2和LshC2c2系统的代表性crRNA结构。(SEQ.I.D.No.142 和143)(B)C2c2活性的体内细菌测定的示意图。在氨苄西林(ampicillin)抗性 质粒中的β-内酰胺酶基因上游克隆原间隔区,并且使这种构建体转化至表达 与靶向或非靶向间隔区联合的C2c2的大肠杆菌(E.coli)中。对成功的转化体 进行计数以定量活性。(C)LwC2c2和LshC2c2体内活性的定量。(n=2个生物性重复;条形表示平均值±s.e.m.)(D)LwC2c2的最终尺寸排阻凝胶过滤。(E) LwC2c2逐步纯化的考马斯蓝(Coomassie blue)染色的丙烯酰胺凝胶。(F)针对 不同PFS标靶的LwC2c2的活性。LwC2c2靶向具有侧接间隔区的可变3'PFS 的荧光RNA,并且反应产物在变性凝胶上显现。LwC2c2显示略微偏向于G PFS。
图3–示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4 种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA 条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中, 经过3小时以5分钟时间间隔测量。
图4–示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4 种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA 条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中, 经过3小时以5分钟时间间隔测量。
图5–示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4 种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA 条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中, 经过3小时以5分钟时间间隔测量。
图6–示出了在不同稀释度下使用1μg、100ng、10ng和1ng标靶以4 种不同量的蛋白质/crRNA(1:4、1:16、1:32、1:64)用2个crRNA库、无crRNA 条件对示例性掩蔽构建体的检测,技术性重复,在(96+48)*2=288个反应中, 经过3小时以5分钟时间间隔测量。
图7–提供了根据某些示例性实施方案,使用掩蔽构建体和CRISPR效 应蛋白的示例性检测方案的示意图。
图8–提供了示出当使用向导RNA的不同库检测标靶时荧光随时间的 变化的一组图。
图9–提供了示出在不同浓度的CRISPR效应蛋白下跨越不同稀释度的 靶RNA检测的标准化荧光的图。
图10–是示出NASBA扩增反应的一般步骤的示意图。
图11–提供了示出通过NASBA用三种不同引物组扩增并且然后经受使 用猝灭的荧光探针的C2c2附带检测的核酸靶ssRNA 1的检测的图(n=2个技 术性重复;条形表示平均值±s.e.m.)。
图12–提供了示出附带效应可以用于检测慢病毒靶RNA的存在的图。
图13–提供了展示附带效应和NASBA可以检测aM浓度下的物质的图。
图14–提供了展示附带效应和NASBA快速辨别低浓度样品的图。
图15–示出了在特定时间点的标准化荧光预测样品输入浓度。在无扩增 的情况下来自Cas13a检测的荧光测量值与输入RNA浓度相关(n=2个生物性 重复;条形表示平均值±s.e.m.)。
图16–提供了RPA反应的示意图,其示出参与反应的组分。
图17–SHERLOCK的示意图;提供了示出经由相应地并入RPA或 RT-RPA步骤对DNA或RNA标靶的检测的示意图。在靶RNA识别后,附 带效应促使C2c2切割裂解报告子,产生荧光。可以经由重组酶聚合酶扩增 (RPA)使单分子量的RNA或DNA扩增成DNA并且转录产生RNA,然后由 C2c2检测。
图18–提供了经由C2c2附带检测所检测的ssRNA标靶的示意图(SEQ. I.D.No.144和145)。
图19–提供了展示使用RPA的单分子DNA检测的一组图(即,在C2c2 添加的15分钟内)。
图20–提供了展示将T7聚合酶混合至RPA反应中会不利地影响DNA 检测的一组图。
图21–提供了展示将聚合酶混合至RPA反应中不会不利地影响DNA检 测的一组图。
图22–提供了展示当同时孵育时RPA、T7转录和C2c2检测反应是相 容的并且达成单分子检测的图(n=2个技术性重复;条形表示平均值±s.e.m.)。
图23–提供了展示快速RPA-RNA时间孵育的功效的一组图。
图24–提供了展示增加T7聚合酶量增强RPA-RNA的灵敏度的一组图。
图25–提供了示出来自使用1.5x酶的一锅式反应的RPA-DNA检测测 定的结果的一组图。单分子(2aM)检测早在30分钟即达成。
图26–提供了展示RPA-DNA一锅式反应证实相对于输入浓度的荧光定 量减少的一组图。拟合曲线揭示标靶输入浓度与输出荧光之间的关系。
图27–提供了一组图,其展示(A)在无扩增的情况下RNA的C2c2检测 可以检测浓度低至50fM的ssRNA标靶(n=2个技术性重复;条形表示平均值 ±s.e.m.),以及(B)RPA-C2c2反应能够进行单分子DNA检测(n=4个技术性重复;条形表示平均值±s.e.m.)。
图28–提供了展示根据某些示例性实施方案产生的C2c2信号可以检测 纸衬底上的20pM标靶的一组图。
图29–提供了示出特异性RNA酶抑制剂能够去除纸上的背景信号的 图。
图30是示出在玻璃纤维衬底上使用根据某些示例性实施方案的系统的 检测的一组图。
图31–提供了一组图,其提供(A)根据某些示例性实施方案的寨卡RNA 检测的示意图。用通过C2c2附带检测靶向的寨卡RNA或同源登革RNA片 段包封慢病毒。48小时后收集培养基并且经受热裂解、RT-RPA和C2c2检 测。(B)RT-RAP-C2c2检测能够进行寨卡慢病毒颗粒的高度灵敏检测(n=4个 技术性重复,双尾司徒登t检验(Student t-test);*****,p<0.0001;条形表示 平均值±s.e.m.)(C)根据某些示例性实施方案,使用纸上冷冻干燥的C2c2的 寨卡RNA检测的示意图。(D)基于纸的测定能够进行寨卡慢病毒颗粒的高度灵敏检测(n-4个技术性重复,双尾司徒登t检验;****,p<0.0001;**,p<0.01, 条形表示平均值±s.e.m.)。
图32–提供了一组图,其展示(A)从人血清分离的寨卡RNA的C2c2检 测的示意图。血清中的寨卡RNA经受逆转录、RNA的RNA酶H降解、cDNA 的RPA以及C2c2检测。(B)C2c2能够进行人寨卡血清样品的高度灵敏检测。通过qPCR验证所示出的寨卡RNA的浓度(n=4个技术性重复,双尾司徒登t 检验;****,p<0.0001;条形表示平均值±s.e.m.)。
图33–提供了一组图,其展示(A)冷冻干燥的C2c2能够进行低飞摩尔范 围内的ssRNA 1的灵敏检测。C2c2能够进行纸上呈液体形式(B)或冷冻干燥 (C)的200pM ssRNA 1标靶的快速检测。反应能够进行在溶液中(D)(n=3)及 呈冷冻干燥形式(E)(n=3)的经过合成的寨卡RNA片段的灵敏检测。(F)示出输 入浓度与所检测的荧光之间的显著相关的人寨卡cDNA检测的定量曲线。(G) 在不同量的人血清存在下进行的ssRNA 1的C2c2检测(除非另有注释,否则 n=2个技术性重复;条形表示平均值±s.e.m.)。
图34–提供了(A)使用通用V3 RPA引物组对来自细菌基因组的16S rRNA基因的C2c2检测的示意图,(B)以及使用根据某些示例性实施方案进行 的测定达成大肠杆菌或绿脓假单胞菌(P.aeruginosa)gDNA的灵敏和特异性检 测的能力(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表 示平均值±s.e.m.)。Ec,大肠杆菌(Escherichiacoli);Kp,肺炎克雷伯菌 (Klebsiella pneumoniae);Pa,绿脓假单胞菌(Pseudomonasaeruginosa);Mt, 结核分枝杆菌(Mycobacterium tuberculosis);Sa,金黄色葡萄球菌(Staphylococcus aureus)。
图35–提供了一组图,其展示(A)来自肺炎克雷伯菌的四种不同临床分 离株的两种不同碳青霉烯(carbapenem)抗性基因(KPC和NDM-1)的检测,以 及(B)碳青霉烯抗性基因的检测(部分A)标准化为KPC与NDM-1crRNA测定 之间的信号比(n=2个技术性重复,双尾司徒登t检验;****,p<0.0001;条 形表示平均值±s.e.m.)。
图36–提供了一组图,其展示(A)C2c2对于单错配不灵敏,但可以区分 当加载有具有额外错配的crRNA时标靶中的单核苷酸差异。用11个crRNA 检测ssRNA标靶1-3,其中10个间隔区含有在crRNA中的各个位置处的合 成错配。错配的间隔区并不显示标靶1的降低的裂解,但显示错配标靶2和 3的受抑制的裂解(SEQ.I.D.No.146至159)。(B)示出具有合成错配的单碱基 特异性间隔区的合理设计的过程的示意图。合成错配接近于所关注的SNP或碱基放置。(SEQ.I.D.No.160至164)(C)株系SNP的高度特异性检测允许使 用具有截短(23个核苷酸)crRNA的C2c2检测来区别仅相差一个核苷酸的寨卡非洲对美洲RNA标靶(n=2个技术性重复,单尾司徒登t检验;*,p<0.05; ****,p<0.0001;条形表示平均值±s.e.m.)。
图37–提供了一组图,其展示:(A)用于检测的寨卡株系标靶区和crRNA 序列的示意图。(SEQ.I.D.No.165至170)。标靶中的SNP用红色或蓝色突出 显示并且向导序列中的合成错配涂红色。(B)株系SNP的高度特异性检测允 许使用SHERLOCK来区别寨卡非洲对美洲RNA标靶(n=2个技术性重复,双 尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.)(SEQ.I.D.No. 171至176)。(C)用于检测的登革株系标靶区和crRNA序列的示意图。标靶中 的SNP用红色或蓝色突出显示并且向导序列中的合成错配涂红色。(D)株系 SNP的高度特异性检测允许使用SHERLOCK来区别登革株系1对株系3 RNA标靶(n=2个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表 示平均值±s.e.m.)。
图38–提供了一组图,其示出(A)示出用C2c2检测的人SNP的位置的 圆环图。(B)根据某些示例性实施方案进行的测定可以区分人SNP。 SHERLOCK可以在人基因组中的四个不同SNP位点处对四个不同个体进行正确基因分型。在每个图的下方标注每个个体的基因型和等位基因传感 crRNA的身份(n=4个技术性重复;双尾司徒登t检验;*,p<0.05;**,p<0.01;***,p<0.001;****,p<0.0001;条形表示平均值±s.e.m.)。(C)根 据某些示例性实施方案对cfDNA的检测(例如癌症突变的无细胞DNA检测) 的过程的示意图。(D)用于检测EGFRL858R和BRAF V600E的示例性crRNA 序列。(SEQ.I.D.No.177至182)。对于无细胞DNA中的癌症突变所测定的 两个基因组基因座的序列。示出了具有用蓝色突出显示的SNP的靶基因组序 列和具有涂红色的合成错配的突变体/野生型传感crRNA序列。
图39–提供了一组图,其展示C2c2可以检测来自EGFR L858R(C)或 BRAF V600E(B)次要等位基因的仿制无细胞DNA样品中的突变体次要等位 基因(n=4个技术性重复,双尾司徒登t检验;*,p<0.05;**,p<0.01,****, P<0.0001;条形表示±s.e.m.)。
图40–提供了一组图,其展示(A)测定可以区分rs5082处的基因型(n=4 个技术性重复;*,p<0.05;**,p<0.01;***,p<0.001;****,p<0.0001; 条形表示平均值±s.e.m.)。(B)测定可以区分直接来自离心、变性和煮沸的唾液的gDNA中的rs601338处的基因型(n=3个技术性重复;*,p<0.05;条形 表示平均值±s.e.m.)。
图41–提供了(A)在与ssDNA 1仅相差单错配的标靶的背景中对ssDNA 1进行的示例性实施方案的示意图。(B)测定达成在错配的背景(与ssDNA仅 相差单错配的标靶)存在下ssDNA 1的单核苷酸特异性检测。各种浓度的靶 DNA与背景过量的具有一个错配的DNA组合并且通过测定来检测。
图42是示出具有不同染料Cy5的掩蔽构建体也允许有效检测的图。
图43是基于比色的金纳米颗粒测定的示意图。使用DNA接头与RNA 桥的组合使AuNP聚集。添加RNA酶活性后,ssRNA桥裂解并且释放AuNP, 促使特征性颜色朝向红色偏移。
图44是示出检测在520nm下分散的纳米颗粒的红色偏移的能力的图。 纳米颗粒是基于图43中所示的示例性实施方案并且使用不同浓度的RNA酶 A的添加而分散。
图45是示出RNA酶比色测试是定量的一组图。
图46是示出分散的纳米颗粒的颜色偏移在视觉上可检测的微孔板的照 片。
图47是展示比色偏移在纸衬底上可见的照片。测试在37℃下在玻璃纤 维934-AH上进行10分钟。
图48是用于蛋白质或小分子检测的根据某些示例性实施方案的构象转 换适体(A)的示意图。接合产物(B)用作靶向RNA的效应子的完整标靶,所述 效应子无法检测未接合的输入产物。(SEQ.I.D.No.202和424)。
图49是示出基于适体的接合可以建立RPA可检测底物的凝胶的图像。 将适体与各种水平的凝血酶一起孵育,然后与探针接合。接合的构建体用作 3分钟RPA反应的模板。500nM凝血酶具有比背景显著更高水平的扩增标靶。
图50示出了所选C2c2直系同源物的HEPN结构域的氨基酸序列(SEQ. I.D.No.204-233)。
图51使用RPA扩增(SHERLOCK)对RNA的Cas13a检测可以检测浓度 降至约2aM的ssRNA标靶,比单独的Cas13a更灵敏(n=4个技术性重复;条 形表示平均值±s.e.m.)。
图52–Cas13a检测可以用于传感病毒和细菌病原体。(A)从人临床样品 分离的ZIKV RNA的SHERLOCK检测的示意图。(B)SHERLOCK能够进行 人ZIKV阳性血清(S)或尿液(U)样品的高度灵敏检测。所示出的ZIKV RNA 的近似浓度通过qPCR确定(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示平均值±s.e.m.;n.d.,未检出)。
图53–通过使用引物组2的NASBA(图11)和SHERLOCK对ssRNA 1 的检测的比较(n=2个技术性重复;条形表示平均值±s.e.m.)。
图54–使用RPA和单反应SHERLOCK的核酸扩增。(A)用于图1C中 所用的稀释液的ssRNA 1的数字微滴PCR定量。基于ddPCR结果的稀释液 的调整浓度示于条形图上方。(B)用于图1D中所用的稀释液的ssDNA 1的数 字微滴PCR定量。基于ddPCR结果的稀释液的调整浓度示于条形图上方。(C) 当同时孵育时RPA、T7转录和Cas13a检测反应是相容的并且达成DNA 2的 单分子检测\(n=3个技术性重复,双尾司徒登t检验;n.s.,不显著;**,p<0.01;****,p<0.0001;条形表示平均值±s.e.m.)。
图55–SHERLOCK与其他灵敏核酸检测工具的比较。(A)使用数字微滴 PCR对ssDNA1稀释系列的检测分析(n=4个技术性重复,双尾司徒登t检验; n.s.,不显著;*,p<0.05;**,p<0.01;****,p<0.0001;红线表示平均 值,条形表示平均值±s.e.m。所测量的拷贝/微升低于10-1的样品未示出)。 (B)使用定量PCR对ssDNA 1稀释系列的检测分析(n=16个技术性重复,双尾 司徒登t检验;n.s.,不显著;**,p<0.01;****,p<0.0001;红线表示平均值,条形表示平均值±s.e.m。相对信号低于10-10的样品未示出)。(C)使 用具有SYBRGreen II的RPA对ssDNA 1稀释系列的检测分析(n=4个技术性 重复,双尾司徒登t检验;*,p<0.05;**,p<0.01;红线表示平均值,条 形表示平均值±s.e.m。相对信号低于100的样品未示出)。(D)使用 SHERLOCK对ssDNA 1稀释系列的检测分析(n=4个技术性重复,双尾司徒登t检验;**,p<0.01;****,p<0.0001;红线表示平均值,条形表示平均 值±s.e.m。相对信号低于100的样品未示出)。(E)一系列ssDNA 1稀释液对 于四种类型的检测方法的百分比变异系数。(F)6e2、6e1、6e0和6e-1ssDNA 1稀释液对于四种类型的检测方法的平均百分比变异系数。(条形表示平均值 ±s.e.m.)。
图56–临床细菌分离株的碳青霉烯抗性的检测。来自肺炎克雷伯菌的五 种临床分离株和大肠杆菌对照的两种不同碳青霉烯抗性基因(KPC和NDM-1) 的检测(n=4个技术性重复,双尾司徒登t检验;****,p<0.0001;条形表示 平均值±s.e.m.;n.d.,未检出)。
图57–对靶序列中的截短间隔区和单错配的LwCas13a灵敏度的表征。 (A)用于(B)-(G)中的截短间隔区crRNA的序列(SEQ.I.D.No.425-436)。还示 出了ssRNA 1和2的序列,其具有用红色突出显示的单碱基对差异。含有合 成错配的crRNA用涂红色的错配位置来展示。(B)在位置1-7处具有合成错配 的28nt间隔区crRNA对ssRNA 1和2的附带裂解活性(n=4个技术性重复; 条形表示平均值±s.e.m.)。(C)在(B)中测试的crRNA的特异性比率。特异性 比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA 2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。(D)在位置1-7处具有合 成错配的23nt间隔区crRNA对ssRNA 1和2的附带裂解活性(n=4个技术性 重复;条形表示平均值±s.e.m.)。(E)在(D)中测试的crRNA的特异性比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA 2)附带裂解 的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。(F)在位置1-7处具有合成错配的20nt间隔区crRNA对ssRNA 1和2的附带裂解活性(n=4个 技术性重复;条形表示平均值±s.e.m.)。(G)在(F)中测试的crRNA的特异性 比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶RNA(ssRNA 2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值±s.e.m.)。
图58–靶序列中相对于突变的理想合成错配位置的鉴别。(A)用于评估 理想合成错配位置以检测ssRNA 1与ssRNA 2之间的突变的序列(SEQ.I.D. No.437-462)。在每个标靶上,测试在涂色(红色)位置处具有合成错配的 crRNA。设计每一组合成错配crRNA以使得突变位置相对于间隔区的序列发 生位置偏移。设计间隔区以使得在间隔区内的位置3、4、5和6处评估突变。 (B)在不同位置处具有合成错配的crRNA对ssRNA 1和2的附带裂解活性。存在四组crRNA,其在间隔区:标靶双链体区内的任一位置3、4、5或6处具 有突变(n=4个技术性重复;条形表示平均值±s.e.m.)。(C)在(B)中测试的 crRNA的特异性比率。特异性比率以中靶RNA(ssRNA 1)附带裂解与脱靶 RNA(ssRNA 2)附带裂解的比率计算(n=4个技术性重复;条形表示平均值± s.e.m.)。
图59–使用SHERLOCK在额外基因座处的基因分型和从煮沸的唾液的 直接基因分型。SHERLOCK可以区分直接来自离心、变性和煮沸的唾液的基 因组DNA中的rs601338SNP位点处的基因型(n=4个技术性重复,双尾司徒 登t检验;**,p<0.01;****,p<0.001;条形表示平均值±s.e.m.)。
图60–用以对人SNP进行准确基因分型的合成基因分型标准的开发。(A)与PCR扩增的基因型标准相比,使用SHERLOCK在rs601338SNP位点 处对四个个体中的每一个进行的基因分型(n=4个技术性重复;条形表示平均 值±s.e.m.)。(B)与PCR扩增的基因型标准相比,使用SHERLOCK在 rs4363657SNP位点处对四个个体中的每一个进行的基因分型(n=4个技术性 重复;条形表示平均值±s.e.m.)。(C)每个个体的SHERLOCK结果与rs601338 SNP位点处的合成标准之间的计算p值的热图。示出了等位基因传感crRNA中的每一个的热图。将热图色表加标度以使得非显著性(p>0.05)呈红色并且 显著性(p<0.05)呈蓝色(n=4个技术性重复,单因素ANOVA)。(D)每个个体 的SHERLOCK结果与rs4363657SNP位点处的合成标准之间的计算p值的热 图。示出了等位基因传感crRNA中的每一个的热图。将热图色表加标度以使 得非显著性(p>0.05)呈红色并且显著性(p<0.05)呈蓝色(n=4个技术性重复, 单因素ANOVA)。(E)用于理解SHERLOCK基因分型的p值热图结果的指南。 通过选择对应于在个体与等位基因合成标准之间的p值>0.05的等位基因可 以容易地调用基因分型。红色区块对应于合成标准与个体的SHERLOCK结 果之间的非显著差异并且因此是基因型阳性结果。蓝色区块对应于合成标准 与个体的SHERLOCK结果之间的显著差异并且因此是基因型阴性结果。
图61–作为小部分的错配背景标靶的ssDNA 1的检测。在人基因组DNA 的背景下ssDNA 1的稀释系列的SHERLOCK检测。应注意,在所检测的 ssDNA 1标靶与背景基因组DNA之间不应存在序列相似性(n=2个技术性重 复;条形表示平均值±s.e.m.)。
图62A,图62B–来自具有寨卡病毒的患者的尿液(图62A)或血清(图62B) 样品在95℃(尿液)或65℃(血清)下热灭活5分钟。根据示例性实施方案,1 微升灭活的尿液或血清用作2小时RPA反应继之以3小时C2c2/Cas13a检测 反应的输入。误差条指示基于检测反应的n=4个技术性重复的1SD。
图63A,图63B–来自具有寨卡病毒的患者的尿液样品在95℃下热灭活 5分钟。根据示例性实施方案,1微升灭活的尿液用作30分钟RPA反应继之 以3小时(图63A)或1小时(图63B)C2c2/Cas13检测反应的输入。误差条指示 基于检测反应的n=4个技术性重复的1SD。
图64–来自具有寨卡病毒的患者的尿液样品在95℃下热灭活5分钟。1 微升灭活的尿液用作20分钟RPA反应继之以1小时C2c2/Cas13a检测反应 的输入。健康人尿液用作阴性对照。误差条指示基于n=4个技术性重复或检 测反应的1SD。
图65A,图65B–来自具有寨卡病毒的患者的尿液样品在95℃下热灭活 5分钟。1微升灭活的尿液用作20分钟RPA反应继之以在存在或不存在向导 RNA的情况下1小时C2c2/Cas13a检测反应的输入。数据((图65A)条形图(图 65B)散点图)通过从含有向导的检测反应中扣除无向导检测反应的平均荧光 值而使数据标准化。健康人尿液用作阴性对照。误差条指示基于检测反应的 n=4个技术性重复的1SD。
图66–示出了根据示例性实施方案,使用四种不同向导RNA设计对两 种疟疾特异性标靶的检测(SEQ.I.D.No.463-474)。
图67–提供显示不同Cas13b直系同源物的编辑偏好的图。密钥见表3。
图68–提供使用具有不同编辑偏好的不同Cas13b直系同源物的多重测 定的示意图(左),和证实使用Cas13b10和Cas13b5的这样的测定的可行性的 数据(右)。
图69–提供显示采用Cas13b5(普雷沃菌属某种MA2106)和Cas13b9(中 间普雷沃菌)直系同源物的双多重化的图。效应蛋白和向导序列两者包含在同 一反应中,允许在同一反应中使用不同荧光读出(聚U 530nm和聚A 485nm) 进行双多重化。
图70–提供与图69相同,但在这种情况下使用Cas13a(韦德纤毛菌 LwaCas13a)直系同源物和Cas13b直系同源物(普雷沃菌属某种MA2016, Cas13b5)。
图71–提供根据某些示例性实施方案,用多个向导序列铺设靶序列以确 定靶向的稳健性的方法(SEQ.I.D.No.475和476)。
图72-提供杂交链式反应(HCR)凝胶,其显示Cas13效应蛋白可用于解锁 引发剂,例如,引入如本文所描述的掩蔽构建体中的引发剂,以活化杂交链 式反应。
图73–提供显示在复杂溶解产物中检测铜绿假单胞菌的能力的数据。
图74–提供显示根据某些示例性实施方案的某些Cas13直系同源物的 离子偏好的数据。所有标靶浓度均为20nM输入,离子浓度为(1mM和10 mM)。
图75–提供显示Cas13b12具有1mM硫酸锌裂解偏好的数据。
图76–提供显示缓冲液优化可以增强Cas13b5对聚A报告子的信号比 的数据。旧缓冲液包含40mM Tris-HCL,60mM NaCl,6mM MgCl2,pH 7.3。 新缓冲液包含20mM HEPES pH6.8,6mM MgCl2和60mM NaCl。
图77–提供VI-A/C型Crispr系统和VI-B1和B2型系统的示意图以及 代表性Cas13b直系同源物的系统发生树。
图78–提供各种Cas13b直系同源物在不同核苷酸处和相对于LwCas13a 的相对裂解活性。
图79–提供显示各种实例Cas13直系同源物的相对灵敏度的图。
图80–提供显示使用示例性实施方案实现仄普托(zepto)摩尔(zM)检测 水平的能力的图。
图81–提供(A)使用具有不同编辑偏好的Cas13直系同源物和基于聚N 的掩蔽构建体的多重测定的示意图。结果以(B,D)图形和(C)热图格式显示。
图82–提供显示(A-C)在一系列条件下的寨卡RNA的引物优化实验的结 果、(D)寨卡RNA检测的结果和(E,F)假单胞菌检测的结果的数据。
图83–示出RNA导向的RNA靶向酶的Cas13b家族的生物化学表征和 增加的灵敏度和定量SHERLOCK。A)CRISPR-Cas13基因座和crRNA结构 的示意图。B)用由A、C、G或U碱基的六聚体均聚物组成的传感器探针靶向ssRNA 1的15种Cas13b直系同源物的碱基偏好的热图。C)LwaCas13a和 PsmCas13b的裂解基序偏好发现筛选和优选的双碱基基序的示意图。在热图 中表示的值是所有耗尽基序中每个双碱基的计数。如果-log2(标靶/无标靶)值 在LwaCas13a条件下高于1.0或在PsmCas13b条件下高于0.5,则基序被认 为耗尽。在-log2(标靶/无标靶)值中,标靶和无标靶分别表示在标靶和无标靶条件中的基序的频率。D)用U6或A6传感器探针靶向ssRNA 1的PsmCas13b 和LwaCas13a的正交碱基偏好。E)采用靶向登革热ssRNA标靶的LwaCas13a 和PsmCas13b的单分子SHERLOCK检测。F)在大反应体积中用LwaCas13a 和PsmCas13b进行单分子SHERLOCK检测,用于增加的靶向ssRNA标靶1 的灵敏度。G)在各种RPA引物浓度下铜绿假单胞菌合成DNA的定量。H)铜 绿假单胞菌合成DNA浓度与检测到的荧光的相关性。
图84–示出采用正交Cas13酶的样品内多重SHERLOCK。A)使用正交 Cas13酶的样品内多重的示意图。B)用LwaCas13a和PsmCas13b附带活性对 20nM寨卡和登革热合成RNA进行样品内多重检测。C)用LwaCas13a和 PsmCas13b在逐渐降低的浓度的金黄色葡萄球菌热核酸酶和铜绿假单胞菌酰 基转移酶合成标靶下进行样品内多重RPA和附带检测。D)用LwaCas13a和CcaCas13b在rs601338处对人类样品进行多重基因分型。E)用于检测疾病等位基因、使用REPAIR进行校正和对REPAIR校正进行评估的治疗诊断时间 表的示意图。F)用LwaCas13a和PsmCas13b对来自健康和疾病模拟样品的 APC等位基因进行样品内多重检测。G)在靶向的APC突变处的REPAIR编 辑效率的定量。H)用LwaCas13a和PsmCas13b对来自REPAIR靶向和非靶向 样品的APC等位基因进行样品内多重检测。
图85提供经纯化并且评估体外附带活性的15种Cas13b直系同源物的 树。显示Cas13b基因(蓝色)、Csx27/Csx28基因(红色/黄色)和CRISPR阵列(灰 色)。
图86–示出Cas13直系同源物的蛋白质纯化。A)本研究中使用的 Cas13b、LwCas13a和LbaCas13a的尺寸排阻色谱的色谱图。测量的UV吸光 度(mAU)相对于洗脱体积(ml)显示。B)纯化的Cas13b直系同源物的 SDS-PAGE凝胶。从左到右加载14种Cas13b直系同源物。蛋白质梯显示在左侧。C)LbaCas13a稀释(右)和BSA标准滴定(左)的最终SDS-PAGE凝胶。 显示BSA的5个稀释和LbaCas13的2个稀释。
图87–显示示出Cas13b直系同源物附带裂解的碱基偏好的图。A)使用 6个核苷酸长的均聚物腺嘌呤传感器靶向ssRNA 1的14种Cas13b直系同源 物的裂解活性。B)使用6个核苷酸长的均聚物尿苷传感器靶向ssRNA 1的14 种Cas13b直系同源物的裂解活性。C)使用6个核苷酸长的均聚物鸟嘌呤传感 器靶向ssRNA 1的14种Cas13b直系同源物的裂解活性。D)使用6个核苷酸 长的均聚物胞苷传感器靶向ssRNA 1的14种Cas13b直系同源物的裂解活性。
图88-显示Cas13附带裂解后的随机基序文库的大小分析。LwaCas13a、PsmCas13b、CcaCas13b和RNA酶A处理的文库样品的生物分析仪痕迹显示 RNA酶活性后文库大小的变化。Cas13直系同源物靶向登革热ssRNA并且由 于附带裂解而裂解随机基序文库。标志物标准品显示在第一泳道。
图89-显示RNA酶裂解后各种基序的表示。A)箱形图显示在5分钟和 60分钟时间点,LwaCas13a、PsmCas13b、CcaCas13b和RNA酶A的标靶与 无标靶的比率的基序分布。将RNA酶A比率与三种Cas13无标靶条件的平 均值进行比较。比率也是两个裂解反应重复的平均值。B)在60分钟时间点,LwaCas13a、PsmCas13b、CcaCas13b和RNA酶A的富集基序的数量。富集 基序计算为高于1(LwaCas13a、CcaCas13b和RNA酶A)或0.5(PsmCas13b) 的-log2(标靶/无标靶)阈值的基序。阈值为1对应于至少50%的耗尽,而阈值为0.5对应于至少30%的耗尽。C)由LwaCas13a、PsmCas13b和CcaCas13b 的富集基序产生的序列标志。LwaCas13a和CcaCas13b显示出如所预期的强 U偏好,而PsmCas13b显示对于基序中的A碱基的独特偏好,这与均聚物附 带活性偏好一致。D)显示LwaCas13a、PsmCas13b和CcaCas13b的正交基序 偏好的热图。热图中表示的值是各个显示的基序的-log2(标靶/无标靶)值。在 -log2(标靶/无标靶)值中,标靶和无标靶分别表示在标靶和无标靶条件下的基 序的频率。
图90-显示由随机基序文库筛选确定的RNA酶的单碱基和双碱基偏好。 A)显示在60分钟时间点如由随机基序文库裂解筛选所确定的LwaCas13a、 PsmCas13b、CcaCas13b和RNA酶A的单碱基偏好的热图。在热图中表示的 值是所有耗尽的基序中每个碱基的计数。如果-log2(标靶/无标靶)值在 LwaCas13a、CcaCas13b和RNA酶A条件下高于1.0或在PsmCas13b条件下 高于0.5,则基序被认为耗尽。在-log2(标靶/无标靶)值中,标靶和无标靶分别 表示在标靶和无标靶条件下的基序的频率。B)显示如由随机基序文库裂解筛 选确定的CcaCas13b的双碱基偏好的热图。在热图中表示的值是所有耗尽的 基序中每个双碱基的计数。如果-log2(标靶/无标靶)值在LwaCas13a、 CcaCas13b和RNA酶A条件下高于1.0或在PsmCas13b条件下高于0.5,则 基序被认为耗尽。在-log2(标靶/无标靶)值中,标靶和无标靶分别表示在标靶和无标靶条件下的基序的频率。C)显示如由随机基序文库裂解筛选确定的 RNA酶A的双碱基偏好的热图。在热图中表示的值是所有耗尽的基序中每个 双碱基的计数。如果-log2(标靶/无标靶)值在LwaCas13a、CcaCas13b和RNA 酶A条件下高于1.0或在PsmCas13b条件下高于0.5,则基序被认为耗尽。 在-log2(标靶/无标靶)值中,标靶和无标靶分别表示在标靶和无标靶条件下的基序的频率。
图91–示出由随机基序文库筛选确定的RNA酶的三碱基偏好。热图显 示在60分钟时间点如由随机基序文库裂解筛选确定的LwaCas13a、 PsmCas13b、CcaCas13b和RNA酶A的三碱基偏好。在热图中表示的值是所 有耗尽的基序中每个三碱基的计数。如果-log2(标靶/无标靶)值在LwaCas13a、CcaCas13b和RNA酶A条件下高于1.0或在PsmCas13b条件下高于0.5,则 基序被认为耗尽。在-log2(标靶/无标靶)值中,标靶和无标靶分别表示在标靶 和无标靶条件下的基序的频率。
图92–示出由随机基序文库筛选确定的RNA酶的四碱基偏好。热图显 示在60分钟时间点如由随机基序文库裂解筛选确定的(A)CcaCas13b、(B) LwaCas13a、(C)PsmCas13b和(D)RNA酶A的四碱基偏好。在热图中表示的 值是所有耗尽的基序中每个四碱基的计数。如果-log2(标靶/无标靶)值在 LwaCas13a、CcaCas13b和RNA酶A条件下高于1.0或在PsmCas13b条件下 高于0.5,则基序被认为耗尽。在-log2(标靶/无标靶)值中,标靶和无标靶分别表示在标靶和无标靶条件下的基序的频率。
图93-显示用聚X底物的体外裂解测试Cas13直系同源物的碱基裂解偏 好的结果。A)与crRNA或不与crRNA一起孵育的LwaCas13a对聚U、C、G 和A标靶的体外裂解。B)与crRNA或不与crRNA一起孵育的CcaCas13b对 聚U、C、G和A标靶的体外裂解。C)与crRNA或不与crRNA一起孵育的 PsmCas13b对聚U、C、G和A标靶的体外裂解。
图94-显示PsmCas13b裂解活性的缓冲液优化的结果。A)在靶向ssRNA 1后,测试多种缓冲液对PsmCas13b附带活性的影响。B)在不同的 PsmCas13b-crRNA复合物浓度下将优化的缓冲液与原始缓冲液进行比较。
图95–示出Cas13直系同源物的附带裂解的离子偏好。A)对于二价阳离 子Ca、Co、Cu、Mg、Mn、Ni和Zn,采用荧光聚U传感器的PsmCas13b的 裂解活性。将PsmCas13b与靶向合成登革热ssRNA的crRNA一起孵育。B) 对于二价阳离子Ca、Co、Cu、Mg、Mn、Ni和Zn,采用荧光聚A传感器的PsmCas13b的裂解活性。将PsmCas13b与靶向合成登革热ssRNA的crRNA 一起孵育。C)对于二价阳离子Ca、Co、Cu、Mg、Mn、Ni和Zn,采用荧光 聚U传感器的Pin2Cas13b的裂解活性。将Pin2Cas13b与靶向合成登革热 ssRNA的crRNA一起孵育。D)对于二价阳离子Ca、Co、Cu、Mg、Mn、Ni 和Zn,采用荧光聚A传感器的Pin2Cas13b的裂解活性。将Pin2Cas13b与靶 向合成登革热ssRNA的crRNA一起孵育。E)对于二价阳离子Ca、Co、Cu、 Mg、Mn、Ni和Zn,采用荧光聚U传感器的CcaCas13b的裂解活性。将 CcaCas13b与靶向合成登革热ssRNA的crRNA一起孵育。F)对于二价阳离子 Ca、Co、Cu、Mg、Mn、Ni和Zn,采用荧光聚A传感器的CcaCas13b的裂解活性。将CcaCas13b与靶向合成登革热ssRNA的crRNA一起孵育。
图96-显示具有腺嘌呤裂解偏好的Cas13直系同源物的裂解活性的比 较。A)与不同浓度的各自的靶向合成寨卡标靶的crRNA一起孵育的 PsmCas13b和LbaCas13a的裂解活性(n=4个技术性重复,双尾司徒登t-检验; n.s.,不显著;*,p<0.05;**,p<0.01;***,p<0.001;****,p<0.0001;条 形表示平均值±s.e.m.)。B)与不同浓度的各自的靶向合成登革热标靶的crRNA 一起孵育的PsmCas13b和LbaCas13a的裂解活性(n=4个技术性重复,双尾司徒登t-检验;n.s.,不显著;*,p<0.05;**,p<0.01;***,p<0.001;****, p<0.0001;条形表示平均值±s.e.m.)。
图97–示出采用SHERLOCK使用LwaCas13a和PsmCas13b对寨卡 ssRNA标靶4的渺摩尔级检测。A)用LwaCas13a和聚U传感器对不同浓度的 寨卡ssRNA的SHERLOCK检测。B)用PsmCas13b和聚A传感器对不同浓度 的寨卡ssRNA的SHERLOCK检测。
图98–示出采用SHERLOCK在不同浓度的CcaCas13b下对登革热 ssRNA的渺摩尔级检测。
图99-用拼贴ssRNA 1的crRNA测试Cas13直系同源物重编程性。A) 采用拼贴ssRNA1的crRNA的LwaCas13a和CcaCas13b的裂解活性。B)采 用拼贴ssRNA 1的crRNA的PsmCas13b的裂解活性。
图100–显示crRNA间隔区长度对Cas13直系同源物裂解的影响。A) 采用具有不同间隔区长度的靶向ssRNA 1的crRNA的PsmCas13b的裂解活 性。B)采用具有不同间隔区长度的靶向ssRNA1的crRNA的CcaCas13b的裂 解活性。
图101–示出用于定量SHERLOCK的引物浓度优化。A)与不同浓度的 寨卡RNA标靶和互补crRNA一起孵育的LwaCas13a在RPA引物浓度为480 nM下的SHERLOCK动力学曲线。B)与不同浓度的寨卡RNA标靶和互补crRNA一起孵育的LwaCas13a在RPA引物浓度为240nM下的SHERLOCK 动力学曲线。C)与不同浓度的寨卡RNA标靶和互补crRNA一起孵育的 LwaCas13a在RPA引物浓度为120nM下的SHERLOCK动力学曲线。D)与 不同浓度的寨卡RNA标靶和互补crRNA一起孵育的LwaCas13a在RPA引物 浓度为24nM下的SHERLOCK动力学曲线。E)用四种不同的RPA引物浓度: 480nM、240nM、120nM、60nM和24nM对不同浓度的寨卡RNA的 SHERLOCK检测。F)在不同RPA引物浓度下SHERLOCK的背景扣除荧光与 寨卡靶RNA浓度之间的平均R2相关性。G)在10倍稀释系列(黑点)和2倍稀 释系列(红点)中对不同浓度的寨卡RNA标靶的定量SHERLOCK检测。使用 120nM的RPA引物浓度。
图102–示出寨卡和登革热标靶的多重检测。A)使用靶向寨卡ssRNA标 靶的LwaCas13a和靶向登革热ssRNA标靶的PsmCas13b进行多重双色检测。 两个标靶均为20nM输入。显示的所有数据代表180分钟反应时间点。B)使 用靶向寨卡ssRNA标靶的LwaCas13a和靶向登革热ssRNA标靶的PsmCas13b 进行多重双色检测。两个标靶均为200pM输入。C)用CcaCas13a和PsmCas13b 附带活性对20pM寨卡和登革热合成RNA的样品内多重检测。
图103–示出寨卡和登革热ssRNA的样品内多重RNA检测。采用 PsmCas13b和CcaCas13b对逐渐降低的浓度的(B)寨卡和(A)登革热合成标靶 的样品内多重RPA和附带检测。
图104–示出突变和REPAIR编辑的非多重治疗诊断检测。A)用 LwaCas13a检测来自健康和疾病模拟样品的APC等位基因。B)用LwaCas13a 检测来自REPAIR靶向和非靶向样品的APC等位基因处的编辑校正。
图105–示出采用金纳米颗粒聚集对RNA酶活性的比色检测。A)RNA 酶活性的基于金纳米颗粒的比色读出的示意图。在不存在RNA酶活性的情况 下,RNA接头聚集金纳米颗粒,导致红色损失。RNA接头的裂解释放纳米 颗粒并导致红色变化。B)在不同单位的RNA酶A下RNA酶消化120分钟后 比色报告子的图像。C)在不同单位浓度的RNA酶A的消化下,AuNP比色报 告子在520nm吸收处的动力学。D)在用不同单位浓度的RNA酶A消化120 分钟后,AuNP比色报告子的520nm吸收。E)在不同单位浓度的RNA酶A 的消化下,达到AuNP比色报告子的A520半最大值的时间。
图106–示出来自大豆基因组DNA的CP4-EPSPS基因的定量检测。A) 在不同检测时间点,SHERLOCK背景扣除荧光与CP4-EPSPS豆百分比的平 均相关R2。豆百分比描述了round-up ready和野生型豆的混合物中的round-up ready豆的量。CP4-EPSPS基因仅存在于round-up ready豆中。B)在不同豆百 分比下的CP4-EPSPS抗性基因的SHLELOCK检测显示在30分钟孵育下SHERLOCK检测的定量性质。C)在不同豆百分比下对凝集素基因的SHERLOCK检测。豆百分比描述round-up ready和野生型豆的混合物中的 round-up ready豆的量。凝集素基因存在于这两种类型的豆中,因此不显示与 round-up ready豆百分比的关联。
图107–示出适体颜色产生。
图108–示出适体设计和浓度优化。
图109–示出比色检测的吸光度数据。
图110–示出比色变化的稳定性。
图111–示出寨卡ssRNA的比色检测与荧光检测的比较。
图112–示出切口酶扩增。
具体实施方式
一般定义
除非另有规定,否则本文所用的技术和科学术语具有与本公开所属领域 的普通技术人员通常所理解的相同的含义。在分子生物学中常用的术语和技 术的定义可以在以下文献中找到:Molecular Cloning:A Laboratory Manual,第 2版(1989)(Sambrook、Fritsch和Maniatis);Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等编辑);theseries Methods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson、 B.D.Hames和G.R.Taylor编辑):Antibodies,A LaboratoryManual(1988) (Harlow和Lane编辑):Antibodies A Laboratory Manual,第2版2013(E.A.Greenfield编辑);Animal Cell Culture(1987)(R.I.Freshney编辑);BenjaminLewin,Genes IX,Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等 (编辑),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版, 1994(ISBN0632021829);Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,VCH Publishers,Inc.出版, 1995(ISBN9780471185710);Singleton等,Dictionary of Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),三月, Advanced Organic ChemistryReactions,Mechanisms and Structure第4版,John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker和Jan van Deursen, Transgenic Mouse Methods and Protocols,第2版(2011)。
除非上下文另有明确指示,否则如本文所用的单数形式“一个”、“一种” 和“所述”包括单数和复数指示物。
术语“任选的”或“任选地”意指后续描述的事件、情形或替代物可能发生 或可能不发生,并且描述包括事件或情形发生的情况和不发生的情况。
由端点对数值范围的叙述包括归入相应范围内的所有数值和分数,以及 所叙述的端点。
如本文所用的术语“约”或“近似”当涉及例如参数、量、时距等可测量的 值时,有意涵盖指定值的变化和从指定值的变化,例如指定值和从指定值 +/-10%或更小、+/-5%或更小、+/-1%或更小和+/-0.1%或更小的变化,只要此 类变化适于在所公开的发明中执行即可。应了解,修饰语“约”或“近似”所涉 及的值本身也特定地并优选地公开。
在本说明书通篇提及“一个实施方案”、“实施方案”、“示例性实施方案” 意指结合实施方案描述的特定特征、结构或特性包括于本发明的至少一个实 施方案中。因此,在本说明书通篇各处出现短语“在一个实施方案中”、“在实 施方案中”或“示例性实施方案”不一定全部涉及同一实施方案,但可能如此。此外,如本领域技术人员从本公开将显而易见,在一个或多个实施方案中, 特定特征、结构或特性可以按任何适合的方式组合。此外,虽然本文所描述 的一些实施方案包括其他实施方案中所包括的一些特征而非其他特征,但不同实施方案的特征的组合有意处于本发明的范围内。举例来说,在随附权利 要求书中,所要求的实施方案中的任一个可以按任何组合形式使用。
现在将“C2c2”称为“Cas13a”,除非另有说明,否则这些术语在本文中可 互换使用。
本文所引用的所有公布、公布的专利文献、和专利申请特此以引用的方 式并入,引用程度如同每个个别公布、公布的专利文献、或专利申请特定地 并个别地指示以引用的方式并入一样。
综述
微生物成簇的规律间隔的短回文重复(Microbial Clustered RegularlyInterspaced Short Palindromic Repeats,CRISPR)和CRISPR相关(CRISPR-Cas) 适应性免疫系统含有可编程的核酸内切酶,例如Cas9和Cpf1(Shmakov等,2017;Zetsche等,2015)。尽管Cas9与Cpf1均靶向DNA,但单效应子RNA 导向的RNA酶最近已经被发现(Shmakov等,2015)和表征(Abudayyeh等, 2016;Smargon等,2017),包括C2c2,这提供了用于特异性RNA传感的平 台。可以使用CRISPR RNA(crRNA)容易地并且便利地对RNA导向的RNA 酶进行重新编程以使靶RNA裂解。不同于仅使DNA标靶裂解的DNA核酸 内切酶Cas9和Cpf1,RNA导向的RNA酶,如C2c2,在使其RNA标靶裂 解后保持活性,引起附近的非靶向RNA的“附带”裂解(Abudayyeh等,2016)。 这种crRNA编程的附带RNA裂解活性使得有机会使用RNA导向的RNA酶 通过触发可以充当读出的体内程序性细胞死亡或体外非特异性RNA降解来 检测特异性RNA的存在(Abudayyeh等,2016;East-Seletsky等,2016)。2类酶 的附带活性包括Cas13b和Cas12a酶,如Gootenberg等Science,2018年4月 27日;360(6387):439-444所述,所述文献以引用方式并入本文。
本文所公开的实施方案利用靶向RNA的效应子以提供具有渺摩尔级灵 敏度的稳健的基于CRISPR的诊断。本文所公开的实施方案可以相当的灵敏 度水平检测DNA和RNA两者,并且可基于单碱基对差异将标靶与非标靶区 分开。此外,本文所公开的实施方案可以冷冻干燥的形式制备,以便于分配和定点护理(POC)应用。此类实施方案可用于人类健康的多种情形,包括例如 病毒检测、细菌菌株分型、灵敏基因分型,和疾病相关无细胞DNA的检测。 为了易于参考,本文所公开的实施方案也可以称为SHERLOCK(特异性高灵 敏度酶促报告子解锁,Specific High-sensitivity Enzymatic Reporter unLOCKing)。
在一个方面,本文所公开的实施方案涉及一种核酸检测系统,所述核酸 检测系统包括CRISPR系统、一种或多种被设计成结合至相应靶分子的向导 RNA、RNA适体,以及任选的用以扩增样品中的靶核酸分子的扩增试剂。一 种或多种检测适体特异性地结合一种或多种靶多肽,并且被配置成使得RNA 聚合酶位点或引物结合位点仅在检测适体与靶肽结合时暴露。RNA聚合酶位 点的暴露有助于使用适体序列作为模板产生触发RNA寡核苷酸。因此,在此 类实施方案中,一种或多种向导RNA被配置成结合至触发RNA。
在另一方面,本文所公开的实施方案涉及一种包括多个个别离散体积的 诊断装置。每一个别离散体积包括CRISPR效应蛋白、一种或多种被设计成 结合至相应靶分子的向导RNA和包含具有酶活性的四链体的RNA适体。在 某些示例性实施方案中,RNA扩增试剂可以预先加载到个别离散体积中或者 在将样品添加到每一个别离散体积的同时或之后添加到个别离散体积中。装 置可以是基于微流体的装置、可穿戴装置或包括在其上限定个别离散体积的 柔性材料衬底的装置。
在另一方面,本文所公开的实施方案涉及一种用于检测样品中的靶核酸 的方法,所述方法包括:将样品或样品组分配到一组个别离散体积中,每一 个别离散体积包括CRISPR效应蛋白、一种或多种被设计成结合至一种靶寡 核苷酸的向导RNA和包含具有酶活性的四链体的RNA适体。随后在足以允 许一种或多种向导RNA与一种或多种靶分子结合的条件下维持样品组。一种 或多种向导RNA与靶核酸的结合进而活化CRISPR效应蛋白。一旦被活化, CRISPR效应蛋白随后使四链体的酶活性灭活。检测到低于阈值的酶活性指示靶分子的存在。
核酸检测系统
在一些实施方案中,本发明提供了一种核酸检测系统,所述核酸检测系 统包括检测CRISPR系统,所述检测CRISPR系统具有效应蛋白和一种或多 种被设计成结合至相应靶分子的向导RNA,以及包含具有酶活性的四链体的 RNA适体。
检测CRISPR系统
一般来说,如本文中和例如WO 2014/093622(PCT/US2013/074667)的文 献中所用的CRISPR-Cas或CRISPR系统共同地涉及CRISPR相关的(“Cas”) 基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码 Cas基因的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分 tracrRNA)、tracr配对序列(在内源CRISPR系统的情形中涵盖“正向重复”和 tracrRNA加工的部分正向重复)、向导序列(在内源CRISPR系统的情形中也 称作“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas,例如Cas9的一种或多种RNA,例如CRISPR RNA和反式活化(tracr)RNA 或单向导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和 转录物。一般来说,CRISPR系统由促进在靶序列的位点处CRISPR复合物形 成的元件表征(在内源CRISPR系统的情形中也称作原间隔区)。当CRISPR蛋 白质是C2c2蛋白质时,不需要tracrRNA。C2c2已描述于Abudayyeh等(2016) “C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector”;Science;DOI:10.1126/science.aaf5573;和Shmakov等(2015) “Discovery and Functional Characterization of Diverse Class 2CRISPR-Cas Systems”,Molecular Cell,DOI:dx.doi.org/10.1016/j.molcel.2015.10.008;所述文献以引用方式整体并入本文。Cas13b已描述于Smargon等(2017)“Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNases Differentially Regulated by AccessoryProteins Csx27 and Csx28,”Molecular Cell.65,1-13; dx.doi.org/10.1016/j.molcel.2016.12.023.,所述文献以全文引用的方式并入 本文中。
1.效应蛋白
在某些实施方案中,原间隔区邻近基序(PAM)或PAM样基序引导如本文 所公开的效应蛋白复合物结合至所关注的靶基因座。在一些实施方案中, PAM可以是5'PAM(即,位于原间隔区的5'端上游)。在其他实施方案中, PAM可以是3'PAM(即,位于原间隔区的5'端下游)。术语“PAM”可以与术语“PFS”或“原间隔区侧接位点”或“原间隔区侧接序列”互换使用。
在优选实施方案中,CRISPR效应蛋白可以识别3'PAM。在某些实施方 案中,CRISPR效应蛋白可识别作为5'H的3'PAM,其中H是A、C或U。 在某些实施方案中,效应蛋白可以是沙氏纤毛菌C2c2p,更优选地是沙氏纤 毛菌DSM 19757C2c2,并且3’PAM为5’H。
在形成CRISPR复合物的情形中,“靶序列”是指向导序列被设计成与其 具有互补性的序列,其中靶序列与向导序列之间的杂交促进CRISPR复合物 的形成。靶序列可以包含RNA多核苷酸。术语“靶RNA”是指作为靶序列或 包含靶序列的RNA多核苷酸。换句话说,靶RNA可以是gRNA的一部分,即,向导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA 的复合物介导的效应功能所针对的RNA多核苷酸或RNA多核苷酸的一部 分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。
编码CRISPR效应蛋白,尤其C2c2的核酸分子有利地是密码子优化的 CRISPR效应蛋白。在这种情况下,密码子优化的序列的一个实例是对于在 真核生物中表达而优化的序列,例如人(即,对于在人中表达而优化),或对于如本文所论述的另一种真核生物、动物或哺乳动物;参见例如WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化的序列。虽然这 是优选的,但将了解,其他实例可能存在,并且对于除人以外的宿主物种的 密码子优化或对于特定器官的密码子优化是已知的。在一些实施方案中,编 码CRISPR效应蛋白的酶编码序列对于在特定细胞,例如真核细胞中表达进 行密码子优化。真核细胞可以是特定生物体的那些或来源于特定生物体,例如植物或哺乳动物,包括但不限于人,或如本文所论述的非人真核生物或动 物或哺乳动物,例如小鼠、大鼠、兔、犬、家畜或非人哺乳动物或灵长类动 物。在一些实施方案中,可以排除有可能不会对人或动物带来任何实质性医学效益的修改人的种系遗传身份的过程和/或修改动物的遗传身份的过程,以 及由此类过程产生的动物。一般来说,密码子优化是指修饰核酸序列用于增 强在所关注的宿主细胞中的表达的过程,这个过程是通过用在宿主细胞的基 因中较频繁或最频繁使用的密码子置换原生序列的至少一个密码子(例如约 或大于约1个、2个、3个、4个、5个、10个、15个、20个、25个、50个 或更多个密码子),同时维持原生氨基酸序列。各个物种对特定氨基酸的某些密码子展现特定偏性。密码子偏性(生物体之间密码子使用的差异)常常与信 使RNA(mRNA)的翻译效率相关,据信所述效率继而尤其取决于所翻译的密 码子的特性和特定转移RNA(tRNA)分子的可用性。细胞中所选tRNA的主导 性一般反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来调整基因用于给定的生物体中最佳基因表达。密码子使用表可容易得到,例 如,在kazusa.orjp/codon/上可得的“密码子使用数据库(Codon UsageDatabase)” 中,并且这些表可以按许多方式进行改编。参见Nakamura,Y.,等“Codon usagetabulated from the international DNA sequence databases:status for theyear2000”Nucl.Acids Res.28:292(2000)。对于在特定宿主细胞中表达对特定序列 进行密码子优化的计算机算法也可得到,例如Gene Forge(Aptagen;Jacobus, PA)也可得到。在一些实施方案中,编码Cas的序列中的一个或多个密码子(例 如1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多 个或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在某些实施方案中,如本文所描述的方法可以包括提供Cas转基因细胞, 尤其C2c2转基因细胞,其中提供或引入编码一种或多种向导RNA的一种或 多种核酸,其在细胞中与包含所关注的一种或多种基因的启动子的调控元件 可操作地连接。如本文所用的术语“Cas转基因细胞”是指细胞,例如真核细 胞,其中Cas基因已经在基因组上整合。细胞的性质、类型或来源根据本发 明并无特别限制。而且,Cas转基因引入细胞中的方式可以有变化并且可以 是如本领域中已知的任何方法。在某些实施方案中,通过将Cas转基因引入 分离的细胞中来获得Cas转基因细胞。在某些其他实施方案中,通过从Cas 转基因生物体中分离细胞来获得Cas转基因细胞。通过实例并且不受限制,如本文所提及的Cas转基因细胞可以来源于Cas转基因真核生物,例如Cas 敲入真核生物。参考WO 2014/093622(PCT/US13/74667),以引用的方式并入 本文中。可以修改针对靶向Rosa基因座的转让给SangamoBioSciences,Inc.的美国专利公布号20120017290和20110265198的方法以利用本发明的CRISPR Cas系统。还可以修改针对靶向Rosa基因座的转让给Cellectis的美 国专利公布号20130236946的方法以利用本发明的CRISPR Cas系统。通过 另一个实例,参考Platt等(Cell;159(2):440-455(2014)),其描述了Cas9敲入 小鼠,以引用的方式并入本文中。Cas转基因还可以包含 Lox-Stop-polyA-Lox(LSL)盒,从而促成由Cre重组酶可诱导的Cas表达。或 者,可以通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。用于 转基因的递送系统在本领域中是众所周知的。通过实例,可以借助于如本文 别处也描述的载体(例如AAV、腺病毒、慢病毒)和/或颗粒和/或纳米颗粒递 送将Cas转基因递送于例如真核细胞中。
技术人员将了解,如本文所提及的细胞,例如Cas转基因细胞除了具有 整合的Cas基因或当与能够将Cas导向靶基因座的RNA复合时由Cas的序列 特异性作用产生的突变以外还可以包含基因组改变。
在某些方面,本发明涉及例如用于将Cas和/或能够将Cas导向靶基因座 的RNA(即,向导RNA)递送至或引入细胞中以及用于繁殖这些组分(例如在 原核细胞中)的载体。如本文所用的“载体”是允许或有助于实体从一种环境转 移至另一种环境的工具。载体是复制子,例如质粒、噬菌体或粘粒,其中可 以插入另一个DNA区段以达成所插入的区段的复制。一般来说,载体当与 适当控制元件相关联时能够复制。一般来说,术语“载体”是指核酸分子,其能够转运已经与其连接的另一个核酸。载体包括但不限于单链、双链或部分 双链的核酸分子;包含一个或多个自由端、无自由端(例如环状)的核酸分子; 包含DNA、RNA或两者的核酸分子;以及本领域中已知的多核苷酸的其他 种类。一种类型的载体是“质粒”,其是指环状双链DNA环,其中可以插入额 外DNA区段,例如通过标准分子克隆技术。另一种类型的载体是病毒载体,其中载体中存在源自病毒的DNA或RNA序列用于包封至病毒(例如逆转录病 毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV)) 中。病毒载体还包括由病毒携带的多核苷酸用于转染至宿主细胞中。某些载 体能够在其所引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载 体,和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入 宿主细胞中之后整合至宿主细胞的基因组中,并且从而连同宿主基因组一起复制。此外,某些载体能够引导其操作性连接的基因的表达。此类载体在本 文中称作“表达载体”。在重组DNA技术中有效用的常用表达载体常常呈质粒 的形式。
重组表达载体可以包含本发明的核酸,其呈适合于在宿主细胞中表达核 酸的形式,这意指重组表达载体包括一个或多个调控元件,其可以在有待用 于表达的宿主细胞的基础上选择,操作性地连接至有待表达的核酸序列。在 重组表达载体内,“可操作地连接”意图指所关注的核苷酸序列以允许核苷酸 序列表达(例如在体外转录/翻译系统中或当将载体引入宿主细胞中时在宿主 细胞中)的方式连接至一个或多个调控元件。关于重组和克隆方法,提及2004 年9月2日以US 2004-0171156A1公布的美国专利申请10/815,730,其内容 以全文引用的方式并入本文中。因此,本文所公开的实施方案还可以包括包 含CRISPR效应系统的转基因细胞。在某些示例性实施方案中,转基因细胞 可以充当个别离散体积。换句话说,可以将包含掩蔽构建体的样品递送至细胞中,例如在适合的递送囊泡中,并且如果递送囊泡中存在标靶,那么活化 CRISPR效应子并且产生可检测信号。
一个或多个载体可以包括一个或多个调控元件,例如一个或多个启动子。 一个或多个载体可以包含Cas编码序列和/或单个,但可能还可以包含至少3 个或8个或16个或32个或48个或50个向导RNA(例如sgRNA)编码序列, 例如1-2个、1-3个、1-4个、1-5个、3-6个、3-7个、3-8个、3-9个、3-10 个、3-8个、3-16个、3-30个、3-32个、3-48个、3-50个RNA(例如sgRNA)。 在单个载体中,可以存在每个RNA(例如sgRNA)的启动子,有利地当存在至 多约16个RNA时;并且当单个载体提供多于16个RNA时,一个或多个启 动子可以驱动多于一个RNA的表达,例如当存在32个RNA时,每个启动 子可以驱动两个RNA的表达,并且当存在48个RNA时,每个启动子可以 驱动三个RNA的表达。通过简单的算术和完善的克隆方案和本公开中的教义,本领域技术人员可以关于适合的例示性载体(例如AAV)的一个或多个 RNA和例如U6启动子的适合启动子来容易地实施本发明。举例来说,AAV 的包封限度为约4.7kb。单个U6-gRNA(加上用于克隆的限制性位点)的长度 为361bp。因此,技术人员可以容易地将约12-16个,例如13个U6-gRNA 盒装配至单个载体中。这可以通过任何适合的方式组装,例如用于TALE组 装的金门策略(genome-engineering.org/taleffectors/)。技术人员还可以使用串联向导策略以使U6-gRNA的数目增加约1.5倍,例如,从12-16个,例如13 个增加至约18-24个,例如约19个U6-gRNA。因此,本领域技术人员可以 在单个载体,例如AAV载体中容易地达到约18-24个,例如约19个启动子-RNA,例如U6-gRNA。用于增加载体中启动子和RNA的数目的进一步方式 是使用单个启动子(例如U6)以表达由可裂解序列分离的RNA阵列。并且, 用于增加载体中启动子-RNA的数目的更进一步方式是在编码序列或基因的 内含子中表达由可裂解序列分离的启动子-RNA阵列;并且在这种情况下, 有利的是使用聚合酶II启动子,其可以具有增加的表达并且能够以组织特异性方式转录长RNA(参见例如nar.oxfordjournals.org/content/34/7/e53.short and nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在有利的实施方案中, AAV可以包封靶向至多约50个基因的U6串联gRNA。因此,从本领域中的 知识和本公开中的教义,技术人员可以容易地制造和使用一个或多个载体, 例如单个载体,其在控制下表达多个RNA或向导或者操作性地或功能性地连 接至一个或多个启动子-尤其关于本文所论述的RNA或向导的数目,而不存 在任何不当实验。
向导RNA编码序列和/或Cas编码序列可以功能性地或操作性地连接至 一个或多个调控元件,并且因此一个或多个调控元件驱动表达。一个或多个 启动子可以是一个或多个组成性启动子和/或一个或多个条件性启动子和/或一个或多个诱导性启动子和/或一个或多个组织特异性启动子。启动子可以选 自由以下组成的组:RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转 录病毒劳斯肉瘤病毒(Rous sarcoma virus)(RSV)LTR启动子、巨细胞病毒 (CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、 磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子U6。
在一些实施方案中,核酸靶向系统的一个或多个元件来源于包含内源 CRISPRRNA靶向系统的特定生物体。在一些实施方案中,CRISPR系统效 应蛋白是靶向RNA的效应蛋白。在某些示例性实施方案中,效应蛋白CRISPR RNA靶向系统包含至少一个HEPN结构域,包括但不限于本文所描述的 HEPN结构域、本领域中已知的HEPN结构域,和通过与共有序列基序相比 而被识别为HEPN结构域的结构域。本文中提供若干此类结构域。在一个非 限制性实例中,共有序列可以来源于本文所提供的C2c2或Cas13b直系同源 物的序列。在某些示例性实施方案中,效应蛋白包含单个HEPN结构域。在 某些其他示例性实施方案中,效应蛋白包含两个HEPN结构域。
在一个示例性实施方案中,效应蛋白包含一个或多个包含RxxxxH基序 序列的HEPN结构域。RxxxxH基序序列可以但不限于来自本文所描述的 HEPN结构域或本领域中已知的HEPN结构域。RxxxxH基序序列还包括通过 组合两个或更多个HEPN结构域的部分而建立的基序序列。正如所指出,共 有序列可以来源于以下文献中所公开的直系同源物的序列:题为"Novel CRISPR Enzymes and Systems"的美国临时专利申请62/432,240,2017年3月 15日提交的题为"Novel Type VI CRISPR Orthologs and Systems"的美国临时 专利申请62/471,710,和以代理人案号47627-05-2133标注并且2017年4月12日提交的题为"Novel Type VI CRISPR Orthologs and Systems"的美国临时专利申请。
在本发明的实施方案中,HEPN结构域包含至少一个包含序列 R{N/H/K}X1X2X3H的RxxxxH基序。在本发明的实施方案中,HEPN结构 域包括包含序列R{N/H}X1X2X3H的RxxxxH基序。在本发明的实施方案中, HEPN结构域包含序列R{N/K}X1X2X3H。在某些实施方案中,X1是R、S、 D、E、Q、N、G、Y或H。在某些实施方案中,X2是I、S、T、V或L,在 某些实施方案中,X3是L、F、N、Y、V、I、S、D、E或A。
根据本发明使用的额外效应子可以通过其与cas1基因的接近性来鉴别, 例如但不限于在距cas1基因的始端20kb和距cas1基因的末端20kb的区域 内。在某些实施方案中,效应蛋白包含至少一个HEPN结构域和至少500个氨基酸,并且其中C2c2效应蛋白天然存在于Cas基因或CRISPR阵列上游或 下游20kb内的原核基因组中。Cas蛋白质的非限制性实例包括Cas1、Cas1B、 Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、 Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、 Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、 Csf1、Csf2、Csf3、Csf4、其同源物或其修饰型式。在某些示例性实施方案中,C2c2效应蛋白天然存在于Cas 1基因上游或下游20kb内的原核基因组中。 术语“直系同源物(orthologue)”(本文中也称作“直系同源物(ortholog)”)和“同 源物(homologue)”(本文中也称作“同源物(homolog)”)在本领域中是众所周知 的。通过进一步指导,如本文所用的蛋白质的“同源物”是与作为其同源物的 蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以但不需要 结构上相关,或仅部分结构上相关。如本文所用的蛋白质的“直系同源物”是 与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。
在特定实施方案中,VI型RNA靶向Cas酶是C2c2。在其他示例性实施 方案中,VI型RNA靶向Cas酶是Cas 13b。在特定实施方案中,如本文所提 及的VI型蛋白质,例如C2c2的同源物或直系同源物与VI型蛋白质,例如 C2c2(例如基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌 MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM10710)C2c2、 鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(Listeria newyorkensis)(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛 菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%, 或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地 至少90%,例如至少95%的序列同源性或同一性。在其他实施方案中,如本 文所提及的VI型蛋白质,例如C2c2的同源物或直系同源物与野生型C2c2(例 如基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM 10710)C2c2、鸡肉杆 菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317) C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(FSL M6-0635) C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌 (R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯 特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少 70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同一性。
在某些其他示例性实施方案中,CRISPR系统效应蛋白是C2c2核酸酶。 C2c2的活性可以取决于两个HEPN结构域的存在。这些已经显示为RNA酶 结构域,即,切割RNA的核酸酶(尤其核酸内切酶)。C2c2 HEPN还可以靶向 DNA,或潜在地DNA和/或RNA。在C2c2的HEPN结构域至少能够结合至RNA并且以其野生型形式切割RNA的基础上,则优选的是C2c2效应蛋白具有RNA酶功能。关于C2c2 CRISPR系统,参考2016年6月17日提交的美国临时案62/351,662和2016年8月17日提交的美国临时案62/376,377。还 参考2016年6约17日提交的美国临时案62/351,803。还参考2016年12月8 日提交的题为"Novel Crispr Enzymes and Systems"的美国临时案,带有博德研究所(Broad Institute)编号10035.PA4和代理人案号47627.03.2133。进一步参 考East-Seletsky等“Two distinct RNase activities ofCRISPR-C2c2 enable guide-RNA processing and RNA detection”Nature doi:10/1038/nature19802和Abudayyeh等“C2c2 is a single-component programmable RNA-guidedRNA targeting CRISPR effector”bioRxiv doi:10.1101/054742。
CRISPR系统中的RNA酶功能是已知的,例如,对于某些III型 CRISPR-Cas系统已经报道mRNA靶向(Hale等,2014,Genes Dev,第28卷, 2432-2443;Hale等,2009,Cell,第139卷,945-956;Peng等,2015,Nucleic acids research,第43卷,406-417)并且提供显著优点。在表皮葡萄球菌 (Staphylococcus epidermis)III-A型系统中,跨标靶的转录使得靶DNA和其转 录物裂解,这是由Cas10-Csm核糖核蛋白效应蛋白复合物内的独立活性位点介导(参见Samai等,2015,Cell,第151卷,1164-1174)。由此提供CRISPR-Cas 系统、组合物或经由本发明效应蛋白靶向RNA的方法。
在实施方案中,Cas蛋白质可以是以下属类的生物体的C2c2直系同源物: 包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、 密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆 菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟 氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。此种属类的生物体的种类可以如本文其他方面所论述。
鉴别CRISPR-Cas系统酶的直系同源物的一些方法可以涉及鉴别所关注 的基因组中的tracr序列。tracr序列的鉴别可以涉及以下步骤:tracr序列的鉴 别可以涉及以下步骤:在数据库中搜索正向重复或tracr配对序列以鉴别包含 CRISPR酶的CRISPR区。在正义与反义方向上侧接CRISPR酶的CRISPR区 中搜索同源序列。寻找转录终止子和二级结构。鉴别不是正向重复或tracr配 对序列,但与正向重复或tracr配对序列具有大于50%同一性的任何序列作为 潜在tracr序列。获取潜在tracr序列并且分析与其相关联的转录终止子序列。
将了解,本文所描述的任何功能性可以工程改造至来自其他直系同源物 的CRISPR酶中,包括包含来自多种直系同源物的片段的嵌合酶。此类直系 同源物的实例在本文别处描述。因此,嵌合酶可以包含以下生物体的CRISPR 酶直系同源物的片段:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、 萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳 杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌 属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝 酸盐裂解菌属、支原体属和弯曲杆菌属。嵌合酶可以包含第一片段和第二片段,并且片段可以是本文所提及的属类或本文所提及的种类的生物体的 CRISPR酶直系同源物的片段;有利地,片段来自不同种类的CRISPR酶直系 同源物。
在实施方案中,如本文所提及的C2c2蛋白质还涵盖C2c2或其同源物或 直系同源物的功能变体。如本文所用的蛋白质的“功能变体”是指此种蛋白质 的变体,其至少部分保留所述蛋白质的活性。功能变体可以包括突变体(其可 以是插入、缺失或置换突变体),包括多形体等。功能变体还包括此种蛋白质 与另一种通常无关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是 天然产生的或可以是人造的。有利的实施方案可以涉及工程改造或非天然产 生的VI型靶向RNA的效应蛋白。
在实施方案中,编码C2c2或其直系同源物或同源物的一个或多个核酸分 子可以对于在真核细胞中表达进行密码子优化。真核生物可以如本文所论述。 一个或多个核酸分子可以是工程改造或非天然产生的。
在实施方案中,C2c2或其直系同源物或同源物可以包含一个或多个突 变,并且因此编码其的一个或多个核酸分子可以具有一个或多个突变。突变 可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突 变。关于Cas9酶的催化结构域的实例可以包括但不限于RuvC I、RuvC II、 RuvC III和HNH结构域。
在实施方案中,C2c2或其直系同源物或同源物可以包含一个或多个突 变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个 或多个突变。关于Cas酶的催化结构域的实例可以包括但不限于HEPN结构 域。
在实施方案中,C2c2或其直系同源物或同源物可以用作与功能结构域融 合或可操作地连接至功能结构域的通用核酸结合蛋白。例示性功能结构域可 以包括但不限于翻译引发剂、翻译活化剂、翻译阻遏剂、核酸酶(尤其核糖核酸酶)、剪接体、珠粒、光可诱导/可控制结构域或化学可诱导/可控制结构域。
在某些示例性实施方案中,C2c2效应蛋白可以来自选自由以下组成的组 的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、 密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆 菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属 和弯曲杆菌属。
在某些实施方案中,效应蛋白可以是李斯特菌属某种(Listeria sp.)C2c2p, 优选斯氏李斯特菌C2c2p,更优选斯氏李斯特菌血清变型1/2b菌株 SLCC3954 C2c2p,并且crRNA序列的长度可以是44至47个核苷酸,其具 有5'29-nt正向重复(DR)和15-nt至18-nt间隔区。
在某些实施方案中,效应蛋白可以是纤毛菌属某种(Leptotrichia sp.) C2c2p,优选沙氏纤毛菌C2c2p,更优选沙氏纤毛菌DSM 19757C2c2p,并且 crRNA序列的长度可以是42至58个核苷酸,其具有至少24nt的5'正向重复, 例如5'24-28-nt正向重复(DR),和至少14nt的间隔区,例如14-nt至28-nt 间隔区,或至少18nt的间隔区,例如19、20、21、22或更多nt,例如18-28、 19-28、20-28、21-28或22-28nt。
在某些示例性实施方案中,效应蛋白可以是纤毛菌属,韦德纤毛菌 F0279,或李斯特菌属,优选纽约李斯特菌FSL M6-0635。
在某些示例性实施方案中,本发明的C2c2效应蛋白包括但不限于以下 21种直系同源物种类(包括多个CRISPR基因座):沙氏纤毛菌;韦德纤毛菌 (Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179; 嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二 CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特 菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细 菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直 肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属某种马赛-P2398;和纤 毛菌属某种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛 螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属某种 TSL5-1;假丁酸弧菌属某种OR37;丁酸弧菌属某种YAB3001;布劳特氏菌属某种马赛-P2398;纤毛菌属某种马赛-P3007;爱华拟杆菌;紫单孢菌科细 菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
在特定实施方案中,C2c2效应蛋白是韦德纤毛菌F0279或韦德纤毛菌 F0279(Lw2)C2c2效应蛋白。
在某些实施方案中,根据本发明的C2c2蛋白质是或来源于如下表中所描 述的直系同源物中的一种,或是如下表中所描述的直系同源物中的两种或更 多种的嵌合蛋白,或是如下表中所描述的直系同源物中的一种的突变体或变 体(或嵌合突变体或变体),包括如本文别处所定义的死C2c2、脱落C2c2、去 稳定C2c2等,其与或不与异源/功能结构域融合。
在某些示例性实施方案中,C2c2效应蛋白选自下表1。
表1
上述种类的野生型蛋白质序列在下表2中列出。在某些实施方案中,提 供了编码C2c2蛋白质的核酸序列。
表2
在本发明的实施方案中,提供了效应蛋白,所述效应蛋白包含与以下细 菌中的任一种的野生型序列具有至少80%序列同源性的氨基酸序列:沙氏纤 毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜 氨梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM4847)C2c2、产丙酸沼杆菌(WB4) C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635) C2c2、纽约李斯特菌(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦 德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2。
在本发明的实施方案中,效应蛋白包含与VI型效应蛋白共有序列具有至 少80%序列同源性的氨基酸序列,所述共有序列包括但不限于本文所描述的 共有序列。
根据本发明,共有序列可以从多种C2c2直系同源物产生,其可以帮助定 位保守氨基酸残基和基序,包括但不限于C2c2直系同源物中介导C2c2功能的催化残基和HEPN基序。使用Geneious比对从上文所提及的33种直系同 源物产生的一种此类共有序列是:
MKISKVXXXVXKKXXXGKLXKXVNERNRXAKRLSNXLBKYIXXIDK IXKKEXXKKFXAXEEITLKLNQXXXBXLXKAXXDLRKDNXYSXJKKILHNEDINXEEXELLINDXLEKLXKIESXKYSYQKXXXNYXMSVQEHSKKSIXRI XESAKRNKEALDKFLKEYAXLDPRMEXLAKLRKLLELYFYFKNDXIXXEE EXNVXXHKXLKENHPDFVEXXXNKENAELNXYAIEXKKJLKYYFPXKXAKNSNDKIFEKQELKKXWIHQJENAVERILLXXGKVXYKLQXGYLAELWKI RINEIFIKYIXVGKAVAXFALRNXXKBENDILGGKIXKKLNGITSFXYEKIKAEEILQREXAVEVAFAANXLYAXDLXXIRXSILQFFGGASNWDXFLFFHFA TSXISDKKWNAELIXXKKJGLVIREKLYSNNVAMFYSKDDLEKLLNXLXXFXLRASQVPSFKKVYVRXBFPQNLLKKFNDEKDDEAYSAXYYLLKEIYYN XFLPYFSANNXFFFXVKNLVLKANKDKFXXAFXDIREMNXGSPIEYLXXTQXNXXNEGRKKEEKEXDFIKFLLQIFXKGFDDYLKNNXXFILKFIPEPTEXI EIXXELQAWYIVGKFLNARKXNLLGXFXSYLKLLDDIELRALRNENIKYQSSNXEKEVLEXCLELIGLLSLDLNDYFBDEXDFAXYJGKXLDFEKKXMKDL AELXPYDQNDGENPIVNRNIXLAKKYGTLNLLEKJXDKVSEKEIKEYYELKKEIEEYXXKGEELHEEWXQXKNRVEXRDILEYXEELXGQIINYNXLXNKV LLYFQLGLHYLLLDILGRLVGYTGIWERDAXLYQIAAMYXNGLPEYIXXKKNDKYKDGQIVGXKINXFKXDKKXLYNAGLELFENXNEHKNIXIRNYIAH FNYLSKAESSLLXYSENLRXLFSYDRKLKNAVXKSLINILLRHGMVLKFKFGTDKKSVXIRSXKKIXHLKSIAKKLYYPEVXVSKEYCKLVKXLLKYK (SEQ ID NO:325)。
在另一个非限制性实例中,用以帮助共有序列产生和保守残基鉴别的序 列比对工具是MUSCLE比对工具(www.ebi.ac.uk/Tools/msa/muscle/)。举例来 说,使用MUSCLE,可以在韦德纤毛菌C2c2中鉴别在C2c2直系同源物当中 保守的以下氨基酸位置:K2;K5;V6;E301;L331;I335;N341;G351; K352;E375;L392;L396;D403;F446;I466;I470;R474(HEPN);H475;H479(HEPN);E508;P556;L561;I595;Y596;F600;Y669;I673;F681; L685;Y761;L676;L779;Y782;L836;D847;Y863;L869;I872;K879; I933;L954;I958;R961;Y965;E970;R971;D972;R1046(HEPN);H1051 (HEPN);Y1075;D1076;K1078;K1080;I1083;I1090。
显示高度保守残基的HEPN结构域的例示性序列比对在图50中示出。
在某些示例性实施方案中,靶向RNA的效应蛋白是VI-B型效应蛋白, 例如Cas13b和第29组或第30组蛋白质。在某些示例性实施方案中,靶向 RNA的效应蛋白包含一个或多个HEPN结构域。在某些示例性实施方案中, 靶向RNA的效应蛋白包含C端HEPN结构域、N端HEPN结构域或这两个 结构域。关于在本发明的情形中可以使用的示例性VI-B型效应蛋白,参考题 为"Novel CRISPR Enzymes and Systems"并且2016年10月21日提交的美国申 请号15/331,792,题为"Novel CRISPR Enzymes and Systems"并且2016年10 月21日提交的国际专利申请号PCT/US2016/058302,和Smargon等"Cas13b is a Type VI-B CRISPR-associated RNA-Guided RNase differentially regulated by accessory proteinsCsx27 and Csx28"Molecular Cell,65,1-13(2017); dx.doi.org/10.1016/j.molcel.2016.12.023,以及2017年3月15日提交的题为"Novel Cas13b OrthologuesCRISPR Enzymes and System"的有待转让的美国临 时申请号。在特定实施方案中,Cas13b酶来源于动物溃疡伯格菌(Bergeyella zoohelcum)。在某些其他示例性实施方案中,效应蛋白是或包含与表3中所 列序列中的任一个具有至少80%序列同源性的氨基酸序列。
表3
在某些示例性实施方案中,Cas13b直系同源物的野生型序列可见于以下 表4或表5。
表4
表5
在某些示例性实施方案中,靶向RNA的效应蛋白是如2017年6月26 日提交的美国临时专利申请号62/525,165和2017年8月16日提交的PCT申 请号US 2017/047193中所公开的Cas13c效应蛋白。Cas13c的示例性野生型 直系同源物序列在下表6中提供。
表6
在某些示例性实施方案中,Cas13蛋白可选自以下任一种。
表7
Cas12蛋白
在某些示例性实施方案中,所述测定可包含多个Cas12直系同源物或与 一个或多个Cas13直系同源物组合的一个或多个直系同源物。在某些示例性 实施方案中,Cas12直系同源物是Cpf1直系同源物。在某些其他示例性实施方案中,Cas12直系同源物是C2c1直系同源物。
Cpf1直系同源物
本发明涵盖来源于被指代为亚型V-A的Cpf1基因座的Cpf1效应蛋白的 用途。在本文中,此类效应蛋白也称为“Cpf1p”,例如Cpf1蛋白(并且这种效 应蛋白或Cpf1蛋白或来源于Cpf1基因座的蛋白也称为“CRISPR酶”)。目前, 亚型V-A基因座包括cas1、cas2(表示为cpf1的独特基因)和CRISPR阵列。Cpf1(CRISPR相关蛋白Cpf1,亚型PREFRAN)是一种大蛋白(约1300个氨基 酸),它含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,Cpf1缺少所有Cas9蛋白中都 存在的HNH核酸酶结构域,而RuvC样结构域在Cpf1序列中是连续的,相 比之下Cas9含有长插入片段,包括HNH结构域。因此,在特定实施方案中, CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
RNA向导的Cpf1的可编程性、特异性和附带活性也使其成为用于核酸 非特异性裂解的理想可切换核酸酶。在一个实施方案中,将Cpf1系统工程改 造以提供并利用RNA的附带非特异性裂解。在另一个实施方案中,将Cpf1 系统工程改造以提供并利用ssDNA的附带非特异性裂解。因此,工程改造的 Cpf1系统提供了用于核酸检测和转录组操纵的平台。Cpf1被开发用作哺乳动 物转录物敲减和结合的工具。当被序列特异性的靶向DNA结合活化时,Cpf1 能够对RNA和ssDNA进行稳健的附带裂解。
术语“直系同源物(orthologue)”(本文中也称作“直系同源物(ortholog)”)和“同源物(homologue)”(本文中也称作“同源物(homolog)”)在本领域中是众所周 知的。通过进一步指导,如本文所用的蛋白质的“同源物”是与作为其同源物 的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以但不需 要结构上相关,或仅部分结构上相关。如本文所用的蛋白质的“直系同源物” 是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。 同源物和直系同源物可以通过同源建模(参见例如Greer,Science第228卷 (1985)1055和Blundell等Eur J Biochem vol 172(1988),513)或“结构BLAST”(Dey F,Cliff Zhang Q,Petrey D,Honig B.Toward a"structural BLAST":using structuralrelationships to infer function.Protein Sci.2013Apr;22(4):359-66.doi:10.1002/pro.2225.)来鉴别。另参见Shmakov等(2015)了解在CRISPR-Cas基因 座领域中的申请。同源蛋白质可以但不需要结构上相关,或仅部分结构上相关。
Cpf1基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4 基因以及CRISPR盒(例如新凶手弗朗西斯菌(Francisella cf.novicida)Fx1的 FNFX1_1431-FNFX1_1428)在同一基因座中。因此,此推定的新颖 CRISPR-Cas系统的布局似乎与II-B型的布局类似。此外,与Cas9类似,Cpf1 蛋白含有与转座子ORF-B同源的易于鉴别的C端区,并且包含活性的RuvC 样核酸酶、富含精氨酸的区和Zn指(不存在于Cas9中)。然而,与Cas9不同, Cpf1还存在于没有CRISPR-Cas环境的若干种基因组中,并且其与ORF-B的 相对较高相似性表明其可能是转座子组分。表明如果此是真正的CRISPR-Cas 系统并且Cpf1是Cas9的功能类似物,则其将是新颖CRISPR-Cas类型,即V 型(参见Annotation andClassification of CRISPR-Cas Systems.Makarova KS,Koonin EV.Methods MolBiol.2015;1311:47-75)。然而,如本文所述,将Cpf1 指代为亚型V-A以将其与C2c1p区分,该C2c1p不具有相同的结构域结构并 且因此被指代为亚型V-B。
在特定实施方案中,效应蛋白是来自包括以下的属的生物体的Cpf1效应 蛋白:链球菌属(Streptococcus)、弯曲杆菌属(Campylobacter)、硝酸盐裂解菌 属(Nitratifractor)、葡萄球菌属(Staphylococcus)、细小棒菌属(Parvibaculum)、 罗氏菌属(Roseburia)、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属 (Gluconacetobacter)、固氮螺菌属(Azospirillum)、单丝壳属(Sphaerochaeta)、乳 杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、棒状杆菌属(Corynebacter)、 肉杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Listeria)、沼 杆菌属(Paludibacter)、梭菌属(Clostridium)、毛螺菌科(Lachnospiraceae)、 Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯菌属、军团菌属(Legionella)、 脂环酸芽孢杆菌属(Alicyclobacillus)、甲烷嗜甲基菌属(Methanomethyophilus)、 卟啉单胞菌属(Porphyromonas)、普雷沃菌属、拟杆菌门(Bacteroidetes)、创伤 球菌属(Helcococcus)、钩端螺旋体属(Leptospira)、脱硫弧菌属(Desulfovibrio)、 脱硫盐碱杆菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、肿块芽孢杆菌属 (Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacilus)、甲基杆 菌属(Methylobacterium)或氨基酸球菌属。
在另外的特定实施方案中,Cpf1效应蛋白来自选自以下的生物体:变异 链球菌(S.mutans)、无乳链球菌(S.agalactiae)、似马链球菌(S.equisimilis)、血 链球菌(S.sanguinis)、肺炎链球菌;空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌(C. coli);N.salsuginis、N.tergarcus;耳葡萄球菌(S.auricularis)、肉葡萄球菌(S. carnosus);脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae);单核细胞增多性李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉 毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭 菌(C.sordellii)。
效应蛋白可包含嵌合效应蛋白,所述嵌合效应蛋白包含来自第一效应蛋 白(例如Cpf1)直系同源物的第一片段和来自第二效应蛋白(例如Cpf1)直系同 源物的第二片段,并且其中第一和第二效应蛋白直系同源物是不同的。第一 效应蛋白和第二效应蛋白(例如Cpf1)直系同源物中的至少一者可以包含来自包括以下的生物体的效应蛋白(例如Cpf1):链球菌属、弯曲杆菌属、硝酸盐 裂解菌属、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌 属、固氮螺菌属、单丝壳属、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤 毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、 卟啉单胞菌属、普雷沃菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽 孢杆菌属、甲基杆菌属或氨基酸球菌属;例如包含第一片段和第二片段的嵌 合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cpf1: 链球菌属、弯曲杆菌属、硝酸盐裂解菌属、葡萄球菌属、细小棒菌属、罗氏 菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、单丝壳属、乳杆菌属、真 杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌 属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西斯菌属、军团菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃菌属、拟杆菌门、 创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿 块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属, 其中第一片段和第二片段并非来自相同细菌;例如,包含第一片段和第二片 段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的 Cpf1:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空 肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡 萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核细胞增多性李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌;土拉弗朗西斯菌1、 易北普雷沃菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌 GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史密斯氏菌 属某种SCADC、氨基酸球菌属某种BV3L6、毛螺菌科细菌MA2020、暂定 种白蚁甲烷枝原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌和猕猴卟啉单胞 菌,其中第一片段和第二片段并非来自相同细菌。
在更优选的实施方案中,Cpf1p来源于选自以下的细菌种类:土拉弗朗 西斯菌1、易北普雷沃菌、毛螺菌科细菌MC2017 1、解蛋白丁酸弧菌、异域菌门细菌GW2011_GWA2_33_10、俭菌超门细菌GW2011_GWC2_44_17、史 密斯氏菌属某种SCADC、氨基酸球菌属某种BV3L6、毛螺菌科细菌MA2020、 暂定种白蚁甲烷枝原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌和猕猴卟啉单胞菌。在某些实施方案中,Cpf1p来源于选自氨基酸球菌属某种BV3L6、毛螺菌科细菌MA2020的细菌种类。在某些实施方案中,效应蛋白来源于土拉 弗朗西斯菌(Francisellatularensis)1的亚种,包括但不限于土拉弗朗西斯菌新 凶手亚种。
在一些实施方案中,Cpf1p来源于来自真杆菌属的生物体。在一些实施 方案中,CRISPR效应蛋白是来源于来自细菌种类直肠真杆菌的生物体的Cpf1蛋白。在一些实施方案中,Cpf1效应蛋白的氨基酸序列对应于NCBI参 考序列WP_055225123.1、NCBI参考序列WP_055237260.1、NCBI参考序列 WP_055272206.1或GenBank ID OLA16049.1。在一些实施方案中,Cpf1效应 蛋白与NCBI参考序列WP_055225123.1、NCBI参考序列WP_055237260.1、 NCBI参考序列WP_055272206.1或GenBank ID OLA16049.1具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少 90%,诸如例如至少95%的序列同源性或序列同一性。技术人员将理解,这 包括Cpf1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。在一 些实施方案中,Cpf1效应蛋白识别TTTN或CTTN的PAM序列。
在特定实施方案中,如本文所提及的Cpf1的同源物或直系同源物与Cpf1 具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少 95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cpf1的 同源物或直系同源物与野生型Cpf1具有至少80%、更优选地至少85%、甚 至更优选地至少90%,诸如例如至少95%的序列同一性。在Cpf1具有一个 或多个突变(是突变的)的情况下,如本文所提及的所述Cpf1的同源物或直系 同源物与突变的Cpf1具有至少80%、更优选地至少85%、甚至更优选地至 少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,Cpf1蛋白可以是包括但不限于以下的属的生物体的 直系同源物:氨基酸球菌属某种、毛螺菌科细菌或牛眼莫拉氏菌;在特定实 施方案中,V型Cas蛋白可以是包括但不限于以下的属的生物体的直系同源 物:氨基酸球菌属某种BV3L6、毛螺菌科细菌ND2006(LbCpf1)或牛眼莫拉 氏菌237。在特定实施方案中,如本文所提及的Cpf1的同源物或直系同源物 与本文所公开的Cpf1序列中的一者或多者具有至少80%、更优选地至少 85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。 在另外的实施方案中,如本文所提及的Cpf的同源物或直系同源物与野生型 FnCpf1、AsCpf1或LbCpf1具有至少80%、更优选地至少85%、甚至更优选 地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的Cpf1蛋白与FnCpf1、AsCpf1或LbCpf1 具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚 至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的 实施方案中,如本文所提及的Cpf1蛋白与野生型AsCpf1或LbCpf1具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优 选地至少90%,诸如例如至少95%的序列同一性。在特定实施方案中,本发明的Cpf1蛋白与FnCpf1具有少于60%的序列同一性。技术人员将理解,这 包括Cpf1蛋白的截短形式,由此在截短形式的长度上确定序列同一性。
在以下项的某些中,Cpf1氨基酸后跟核定位信号(NLS)(斜体)、甘氨酸- 丝氨酸(GS)接头和3x HA标签。1-土拉热弗朗西丝菌新凶手亚种U112 (FnCpf1)(SEQ ID NO:281);3-毛螺菌科细菌MC2017(Lb3Cpf1)(SEQ ID NO:282);4-解蛋白丁酸弧菌(BpCpf1)(SEQ IDNO:283);5-异域菌门细菌 GW2011_GWA_33_10(PeCpf1)(SEQ ID NO:284);6-俭菌超门细菌GWC2011_GWC2_44_17(PbCpf1)(SEQ ID NO:285);7-史密斯氏菌属某种SC_K08D17(SsCpf1)(SEQ ID NO:286);8-氨基酸球菌属某种BV3L6(AsCpf1) (SEQ ID NO:287);9-毛螺菌科细菌MA2020(Lb2Cpf1)(SEQ ID NO:288);10- 暂定种白蚁甲烷支原体(CMtCpf1)(SEQ ID NO:289);11-挑剔真杆菌(EeCpf1) (SEQ ID NO:290);12-牛眼莫拉氏菌237(MbCpf1)(SEQ IDNO:291);13-稻田 钩端螺旋体(LiCpf1)(SEQ ID NO:292);14-毛螺菌科细菌ND2006(LbCpf1)(SEQ ID NO:293);15-狗口腔卟啉单胞菌(PcCpf1)(SEQ ID NO:294);16-解糖 胨普雷沃菌(PdCpf1)(SEQ ID NO:295);17-猕猴卟啉单胞菌(PmCpf1)(SEQ ID NO:296);18-硫微螺菌属某种XS5(TsCpf1)(SEQ ID NO:297);19-牛眼莫拉 氏菌AAX08_00205(Mb2Cpf1)(SEQ ID NO:298);20-牛眼莫拉氏菌AAX11_00205(Mb3Cpf1)(SEQ ID NO:299);和21-丁酸弧菌属某种NC3005(BsCpf1)(SEQ ID NO:300)。
另外的Cpf1直系同源物包括NCBI WP_055225123.1、NCBI WP_055237260.1、NCBIWP_055272206.1和GenBank OLA16049.1。
C2c1直系同源物
本发明涵盖来源于被指代为亚型V-B的C2c1基因座的C2c1效应蛋白的 用途。在本文中,此类效应蛋白也称为“C2c1p”,例如C2c1蛋白(并且这种效 应蛋白或C2c1蛋白或来源于C2c1基因座的蛋白也称为“CRISPR酶”)。目前, 亚型V-B基因座包括cas1-Cas4融合物、cas2(表示为C2c1的独特基因)和 CRISPR阵列。C2c1(CRISPR相关蛋白C2c1)是一种大蛋白(约1100-1300个 氨基酸),它含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,C2c1缺少所有Cas9蛋 白中都存在的HNH核酸酶结构域,而RuvC样结构域在C2c1序列中是连续 的,相比之下Cas9含有长插入片段,包括HNH结构域。因此,在特定实施 方案中,CRISPR-Cas酶仅包含RuvC样核酸酶结构域。
C2c1(也称为Cas12b)蛋白是RNA导向的核酸酶。其裂解依赖于tracr RNA以募集包含向导序列和正向重复的向导RNA,其中所述向导序列与靶 核苷酸序列杂交以形成DNA/RNA异源双链体。基于目前的研究,C2c1核酸酶活性还需要依赖于PAM序列的识别。C2c1 PAM序列是富含T的序列。在 一些实施方案中,PAM序列是5’TTN 3'或5’ATTN 3',其中N是任何核苷 酸。在特定实施方案中,PAM序列是5’TTC 3'。在特定实施方案中,PAM 处于恶性疟原虫的序列之中。
C2c1在靶基因座处产生交错切口,在靶序列的PAM远端侧具有5’突出 端或“粘性末端”。在一些实施方案中,5'突出端为7nt。参见Lewis和Ke,Mol Cell.2017年2月2日;65(3):377-379。
本发明提供了C2c1(V-B型;Cas12b)效应蛋白和直系同源物。术语“直 系同源物(orthologue)”(本文中也称作“直系同源物(ortholog)”)和“同源物 (homologue)”(本文中也称作“同源物(homolog)”)在本领域中是众所周知的。通 过进一步指导,如本文所用的蛋白质的“同源物”是与作为其同源物的蛋白质 发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以但不需要结构上 相关,或仅部分结构上相关。如本文所用的蛋白质的“直系同源物”是与作为 其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。同源物和直系同源物可以通过同源建模(参见例如Greer,Science第228卷(1985) 1055和Blundell等Eur J Biochem vol 172(1988),513)或“结构BLAST”(Dey F, Cliff Zhang Q,Petrey D,Honig B.Toward a"structural BLAST":using structural relationships toinfer function.Protein Sci.2013Apr;22(4):359-66.doi: 10.1002/pro.2225.)来鉴别。另参见Shmakov等(2015)了解在CRISPR-Cas基因 座领域中的申请。同源蛋白质可以但不需要结构上相关,或仅部分结构上相 关。
C2c1基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4 基因以及CRISPR盒在同一基因座中。因此,此推定的新颖CRISPR-Cas系 统的布局似乎与II-B型的布局类似。此外,与Cas9类似,C2c1蛋白含有活 性的RuvC样核酸酶、富含精氨酸的区和Zn指(不存在于Cas9中)。
在特定实施方案中,效应蛋白是来自包括以下的属的生物体的C2c1效应 蛋白:脂环酸芽孢杆菌属(Alicyclobacillus)、脱硫弧菌属(Desulfovibrio)、脱硫 盐碱杆菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、肿块芽孢杆菌属 (Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacillus)、暂定种 (Candidatus)、脱硫杆菌属、柠檬酸杆菌属(Citrobacter)、迷踪菌门 (Elusimicrobia)、甲基杆菌属、杂食菌门(Omnitrophica)、浮霉菌纲 (Phycisphaerae)、浮霉菌门(Planctomycetes)、螺旋体属(Spirochaetes)和疣微菌 科(Verrucomicrobiaceae)。
在另外的特定实施方案中,C2c1效应蛋白来自选自以下的种类:抗酸土 脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)(例如ATCC 49025)、污染脂 环酸芽孢杆菌(Alicyclobacillus contaminans)(例如DSM 17975)、大孢束脂环酸 芽孢杆菌(Alicyclobacillus macrosporangiidus)(例如DSM 17980)、外村尚芽孢 杆菌(Bacillushisashii)菌株C4、暂定种林道菌(Candidatus Lindowbacteria)细菌 RIFCSPLOWO2、非常脱硫弧菌(Desulfovibrio inopinatus)(例如DSM 10711)、 硫歧化酶脱硫碱菌(Desulfonatronum thiodismutans)(例如菌株MLF-1)、迷踪菌 门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌 TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋 体属细菌GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(Tuberibacillus calidus)(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株 B4166)、短芽孢杆菌属某种CF112、芽孢杆菌属某种NSP2.1、食丁酸盐还原 硫酸盐小杆菌(Desulfatirhabdium butyrativorans)(例如DSM 18734)、草脂环酸 芽孢杆菌(Alicyclobacillus herbarius)(例如DSM 13609)、弗氏柠檬酸杆菌(例如 ATCC 8090)、土壤短芽孢杆菌(Brevibacillus agri)(例如BAB-2500)、结瘤甲基 杆菌(Methylobacteriumnodulans)(例如ORS 2060)。
效应蛋白可包含嵌合效应蛋白,所述嵌合效应蛋白包含来自第一效应蛋 白(例如C2c1)直系同源物的第一片段和来自第二效应蛋白(例如C2c1)直系同 源物的第二片段,并且其中第一和第二效应蛋白直系同源物是不同的。第一 效应蛋白和第二效应蛋白(例如,C2c1)直系同源物中的至少一者可包含来自包括以下的生物体的效应蛋白(例如,C2c1):脂环酸芽孢杆菌属、脱硫弧菌 属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆 菌属、暂定种、脱硫杆菌属、柠檬酸杆菌属、迷踪菌门、甲基杆菌属、杂食 菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科;例如,包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包含以下的生 物体的C2c1:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、 肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、暂定种、脱硫杆菌属、迷踪 菌门、柠檬酸杆菌属、甲基杆菌属、杂食菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科,其中第一片段和第二片段不是来自同一细菌;例如包含第 一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自以下 的C2c1:抗酸土脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例 如DSM 17975)、大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌 菌株C4、暂定种林道菌属细菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫碱菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细 菌ST-NAGAB-D1、浮霉菌门细菌RBG_13_46_10、螺旋体属细菌 GWB1_27_13、疣微菌科细菌UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌株B4166)、短芽孢杆菌属某种CF112、芽 孢杆菌属某种NSP2.1、食丁酸盐还原硫酸盐小杆菌(例如DSM 18734)、草脂 环酸芽孢杆菌(例如DSM 13609)、弗氏柠檬酸杆菌(例如ATCC 8090)、土壤 短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060),其中第一片段 和第二片段不是来自同一细菌。
在更优选的实施方案中,C2c1p来源于选自以下的细菌种类:抗酸土脂 环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、 大孢束脂环酸芽孢杆菌(例如DSM 17980)、外村尚芽孢杆菌菌株C4、暂定种 林道菌属细菌RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶 脱硫碱菌(例如菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2 细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、 浮霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌 UBA2429、热生肿块芽胞杆菌(例如DSM 17572)、嗜热淀粉芽孢杆菌(例如菌 株B4166)、短芽孢杆菌属某种CF112、芽孢杆菌属某种NSP2.1、食丁酸盐还 原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM 13609)、 弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤甲基杆菌(例如ORS 2060)。在某些实施方案中,C2c1p来源于选自抗酸土脂环酸芽孢杆菌(例如ATCC 49025)、污染脂环酸芽孢杆菌(例如DSM 17975)的 细菌种类。
在特定实施方案中,如本文所提及的C2c1的同源物或直系同源物与C2c1 具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1的 同源物或直系同源物与野生型C2c1具有至少80%、更优选地至少85%、甚 至更优选地至少90%,诸如例如至少95%的序列同一性。在C2c1具有一个 或多个突变(是突变的)的情况下,如本文所提及的所述C2c1的同源物或直系 同源物与突变的C2c1具有至少80%、更优选地至少85%、甚至更优选地至 少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,C2c1蛋白可以是包括但不限于以下属的生物体的直 系同源物:脂环酸芽孢杆菌属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、 肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、暂定种、脱硫杆菌属、柠檬 酸杆菌属、迷踪菌门、甲基杆菌属、杂食菌门、浮霉菌纲、浮霉菌门、螺旋体属和疣微菌科;在特定实施方案中,V型Cas蛋白可以是包括但不限于以 下的种类的生物体的直系同源物:抗酸土脂环酸芽孢杆菌(例如ATCC49025)、污染脂环酸芽孢杆菌(例如DSM 17975)、大孢束脂环酸芽孢杆菌(例 如DSM 17980)、外村尚芽孢杆菌菌株C4、暂定种林道菌属细菌 RIFCSPLOWO2、非常脱硫弧菌(例如DSM 10711)、硫歧化酶脱硫碱菌(例如 菌株MLF-1)、迷踪菌门细菌RIFOXYA12、杂食菌门WOR_2细菌RIFCSPHIGHO2、丰佑菌科细菌TAV5、浮霉菌纲细菌ST-NAGAB-D1、浮 霉菌门细菌RBG_13_46_10、螺旋体属细菌GWB1_27_13、疣微菌科细菌 UBA2429、热生肿块芽胞杆菌(例如DSM17572)、嗜热淀粉芽孢杆菌(例如菌 株B4166)、短芽孢杆菌属某种CF112、芽孢杆菌属某种NSP2.1、食丁酸盐还 原硫酸盐小杆菌(例如DSM 18734)、草脂环酸芽孢杆菌(例如DSM13609)、 弗氏柠檬酸杆菌(例如ATCC 8090)、土壤短芽孢杆菌(例如BAB-2500)、结瘤 甲基杆菌(例如ORS 2060)。在特定实施方案中,如本文所提及的C2c1的同 源物或直系同源物与本文所公开的一个或多个C2c1序列具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性 或同一性。在另外的实施方案中,如本文所提及的C2c1的同源物或直系同源 物与野生型AacC2c1或BthC2c1具有至少80%、更优选地至少85%、甚至更 优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的C2c1蛋白与AacC2c1或BthC2c1具有至 少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优 选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的C2c1蛋白与野生型AacC2c1具有至少60%,诸如至 少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%, 诸如例如至少95%的序列同一性。在特定实施方案中,本发明的C2c1蛋白与AacC2c1具有少于60%的序列同一性。技术人员将理解,这包括C2c1蛋 白的截短形式,由此在截短形式的长度上确定序列同一性。
在根据本发明的某些方法中,优选地相对于相应的野生型酶使CRISPR-Cas蛋白突变,使得所述突变的CRISPR-Cas蛋白缺乏裂解含有靶序 列的靶基因座的一条或两条DNA链的能力。在特定实施方案中,使C2c1蛋白的一个或多个催化结构域突变以产生仅裂解靶序列的一条DNA链的突变 的Cas蛋白。
在特定实施方案中,可以相对于相应的野生型酶使CRISPR-Cas蛋白突 变,使得所述突变的CRISPR-Cas蛋白基本上缺乏所有的DNA裂解活性。在 一些实施方案中,当突变酶的裂解活性为所述酶的非突变形式的核酸裂解活 性的约不超过25%、10%、5%、1%、0.1%、0.01%或更低时,认为CRISPR-Cas 蛋白基本上缺乏所有的DNA和/或RNA裂解活性;一个实例可以是当突变形 式的核酸裂解活性与非突变形式相比是零或可忽略不计时。
在本文提供的方法的某些实施方案中,CRISPR-Cas蛋白是仅裂解一条 DNA链的突变CRISPR-Cas蛋白,即切口酶。更特别地,在本发明的情形中, 所述切口酶确保在非靶序列(即,在靶序列的相反DNA链上并且是PAM序 列的3’的序列)内的裂解。作为进一步指导且非限制性地,来自脂环酸芽孢杆菌的C2c1的Nuc结构域中的精氨酸至丙氨酸取代(R911A)将C2c1从裂解两 条链的核酸酶转化为切口酶(裂解单条链)。本领域技术人员将理解,在酶不是AacC2c1的情况下,可以在相应位置的残基处形成突变。
在某些实施方案中,C2c1蛋白是无催化活性的C2c1,其在RuvC结构域 中包含突变。在一些实施方案中,无催化活性的C2c1蛋白包含对应于脂环酸 芽孢杆菌C2c1中的氨基酸位置D570、E848或D977的突变。在一些实施方 案中,无催化活性的C2c1蛋白包含对应于脂环酸芽孢杆菌C2c1中的D570A、 E848A或D977A的突变。
RNA向导的C2c1的可编程性、特异性和附带活性也使其成为用于核酸 非特异性裂解的理想可切换核酸酶。在一个实施方案中,将C2c1系统工程改 造以提供并利用RNA的附带非特异性裂解。在另一个实施方案中,将C2c1 系统工程改造以提供并利用ssDNA的附带非特异性裂解。因此,工程改造的 C2c1系统提供了用于核酸检测和转录组操纵以及诱导细胞死亡的平台。C2c1 被开发用作哺乳动物转录物敲减和结合的工具。当被序列特异性的靶向DNA 结合活化时,C2c1能够对RNA和ssDNA进行稳健的附带裂解。
在某些实施方案中,C2c1在体外系统或在细胞中瞬时或稳定地提供或表 达,并被靶向或触发以非特异性地裂解细胞核酸。在一个实施方案中,将C2c1 工程改造以敲减ssDNA,例如病毒ssDNA。在另一个实施方案中,将C2c1 工程改造以敲减RNA。可将所述系统设计成使得敲减依赖于细胞或体外系统中存在的靶DNA,或通过向系统或细胞中添加靶核酸来触发。
在一个实施方案中,将C2c1系统工程改造以非特异性地裂解细胞的亚群 中的RNA,所述细胞的亚群可通过异常DNA序列的存在来区分,举例来说,其中异常DNA的裂解可能是不完全的或无效的。在一个非限制性实例中, 靶向存在于癌细胞中并驱动细胞转化的DNA易位。经历染色体DNA和修复 的细胞亚群可存活,而非特异性的附带核糖核酸酶活性则有利地导致潜在存 活者的细胞死亡。
最近,附带活性被用于称为SHERLOCK的高度灵敏且具特异性的核酸 检测平台,所述平台可用于许多临床诊断(Gootenberg,J.S.等Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017))。
根据本发明,工程改造的C2c1系统被优化用于DNA或RNA核酸内切 酶活性,并且可在哺乳动物细胞中表达并且被靶向以有效地敲减细胞中的报 告分子或转录物。
2.向导RNA
如本文所用的术语“向导序列”、“crRNA”、“向导RNA”或“单向导RNA” 或“gRNA”是指包含与靶核酸序列具有足够互补性的任何多核苷酸序列的多 核苷酸以与靶核酸序列杂交并且引导包含向导序列和CRISPR效应蛋白的靶 向RNA的复合物序列特异性地结合至靶核酸序列。在一些示例性实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、 75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用 于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、 基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒 比对仪(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign (NovocraftTechnologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在 maq.sourceforge.net上可得)。可以通过任何合适的测定来评定向导序列(在核 酸靶向向导RNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的 能力。举例来说,足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分, 包括有待测试的向导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸 如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所描述的Surveyor测定评定靶核酸序列内的优先靶向(例如裂解)。类似地,可以 在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的向导 序列)和不同于测试向导序列的对照向导序列,以及在测试向导序列与对照向 导序列反应之间比较靶序列处的结合或裂解速率来评估靶核酸序列的裂解。其他测定可能存在,并且将为本领域技术人员所想到。可以选择向导序列并 且因此选择核酸靶向向导以靶向任何靶核酸序列。靶序列可以是DNA。靶序 列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成 的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA (rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小 细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编 码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一 些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组 成的组的RNA分子内的序列。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施 方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在一些实施方案中,选择核酸靶向向导以降低核酸靶向向导内的二级结 构程度。在一些实施方案中,当最佳折叠时,核酸靶向向导的约或小于约75%、 50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸参与自 身互补碱基配对。最佳折叠可以通过任何适合的多核苷酸折叠算法来确定。 一些程序是基于计算最小吉布斯自由能(Gibbsfree energy)。一种此类算法的 实例是如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所描述的 mFold。另一个示例性折叠算法是维也纳大学(University ofVienna)的理论化 学研究所(Institute for Theoretical Chemistry)开发的使用质心结构预测算法的在线网络服务器RNAfold(参见例如A.R.Gruber等,2008,Cell 106(1):23-24; 和PA Carr和GM Church,2009,Nature Biotechnology 27(12):1151-62)。
在某些实施方案中,向导RNA或crRNA可以包含正向重复(DR)序列和 向导序列或间隔区序列,基本上由其组成,或由其组成。在某些实施方案中, 向导RNA或crRNA可以包含融合或连接至向导序列或间隔区序列的正向重复序列,基本上由其组成,或由其组成。在某些实施方案中,正向重复序列 可以位于向导序列或间隔区序列上游(即,5')。在其他实施方案中,正向重复 序列可以位于向导序列或间隔区序列下游(即,3')。
在某些实施方案中,crRNA包含茎环,优选单个茎环。在某些实施方案 中,正向重复序列形成茎环,优选单个茎环。
在某些实施方案中,向导RNA的间隔区长度为15至35nt。在某些实施 方案中,向导RNA的间隔区长度为至少15个核苷酸。在某些实施方案中, 间隔区长度为15至17nt,例如15、16或17nt;17至20nt,例如17、18、 19或20nt;20至24nt,例如20、21、22、23或24nt;23至25nt,例如23、 24或25nt;24至27nt,例如24、25、26或27nt;27-30nt,例如27、28、 29或30nt;30-35nt,例如30、31、32、33、34或35nt;或35nt或更长。
一般来讲,CRISPR-Cas、CRISPR-Cas9或CRISPR系统可以如在诸如 WO 2014/093622(PCT/US2013/074667)的前述文献中那样使用并且共同地涉 及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录 物和其他元件,包括编码Cas基因(特别地,在CRISPR-Cas9的情况下为Cas9 基因)的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分 tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序 列”和tracrRNA加工的部分正向重复序列)、向导序列(在内源性CRISPR系统 的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例 如用以导向Cas9的一种或多种RNA,例如CRISPR RNA和反式活化(tracr) RNA或单向导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序 列和转录物。一般来说,CRISPR系统由促进在靶序列的位点处CRISPR复合 物形成的元件表征(在内源CRISPR系统的情形中也称作原间隔区)。在形成 CRISPR复合物的情形中,“靶序列”是指向导序列被设计成与其具有互补性的 序列,其中靶序列与向导序列之间的杂交促进CRISPR复合物的形成。与靶 序列的互补对于裂解活性很重要的向导序列的部分在本文中称为种子序列。 靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方 案中,靶序列位于细胞的细胞核或细胞质中,并且可以包括处于存在于细胞 内的线粒体、细胞器、囊泡、脂质体或粒子中或来自其的核酸。在一些实施 方案中,特别是对于非核用途,NLS不是优选的。在一些实施方案中,CRISPR 系统包含一个或多个核输出信号(NES)。在一些实施方案中,CRISPR系统包 含一个或多个NLS和一个或多个NES。在一些实施方案中,可以通过搜索满 足以下任何或所有条件的重复基序,在计算机上鉴别正向重复序列:1.在II 型CRISPR基因座侧翼的2Kb基因组序列窗口中;2.跨度为20至50bp;和 3.间隔20至50bp。在一些实施方案中,可以使用这些标准中的2个,例如1 和2、2和3或1和3。在一些实施方案中,可以使用所有3个标准。
在本发明的实施方案中,术语向导序列和向导RNA,即,能够将Cas导 向靶基因组基因座的RNA,如前面引用的文献诸如WO 2014/093622 (PCT/US2013/074667)中所述互换使用。一般来说,向导序列是与靶多核苷酸 序列具有足够互补性的任何多核苷酸序列以与靶序列杂交并且引导CRISPR 复合物序列特异性结合至靶序列。在一些实施方案中,当使用适合的比对算 法最佳比对时,向导序列与其相应靶序列之间的互补程度为约或大于约50%、 60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何适合算法来确定,其非限制性实例包括史密斯-沃特 曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴 罗斯-维勒比对仪(BurrowsWheeler Aligner))、ClustalW、Clustal X、BLAT、 Novoalign(Novocraft Technologies;在novocraft.com上可得)、ELAND (Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在 maq.sourceforge.net上可得)。在一些实施方案中,向导序列的长度为约或大 于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多核苷酸。在一些实 施方案中,向导序列的长度小于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。优选地,向导序列长度为10-30个核苷酸。向导序列引导CRISPR复合物序列特异性结合至靶序列的能力可以通过任何适合的测定 来评价。举例来说,足以形成CRISPR复合物的CRISPR系统的组分,包括 有待测试的向导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用 编码CRISPR序列的组分的载体转染,继而诸如通过如本文所描述的Surveyor测定评定靶序列内的优先裂解。类似地,可以在试管中通过提供靶序列、 CRISPR复合物的组分(包括有待测试的向导序列)和不同于测试向导序列的 对照向导序列,以及在测试向导序列与对照向导序列反应之间比较靶序列处 的结合或裂解速率来评估靶多核苷酸序列的裂解。其他测定可能存在,并且 将为本领域技术人员所想到。
在CRISPR-Cas系统的一些实施方案中,向导序列与其相应靶序列之间 的互补程度可以为约或大于约50%、60%、75%、80%、85%、90%、95%、 97.5%、99%或100%;向导或RNA或sgRNA的长度可以为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、35、40、45、50、75个或更多个核苷酸;或者向导或RNA 或sgRNA的长度可以小于约75、50、45、40、35、30、25、20、15、12个 或更少的核苷酸;并且有利地tracr RNA的长度为30或50个核苷酸。然而, 本发明的一个方面是减少脱靶相互作用,例如,减少向导与具有低互补性的 靶序列相互作用。确实,在实例中显示,本发明涉及使得CRISPR-Cas系统 能够区分靶序列与具有大于80%至约95%互补性,例如83%-84%或88-89% 或94-95%互补性的脱靶序列(例如,区分具有18个核苷酸的标靶与具有1个、 2个或3个错配的18个核苷酸的脱靶)的突变。因此,在本发明的情形中,向 导序列与其相应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或 96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97% 或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90% 或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序 列与向导之间的互补性,有利的是,脱靶为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与向导之间的互补性。
向导修饰
在某些实施方案中,本发明的向导包含非天然存在的核酸和/或非天然存 在的核苷酸和/或核苷酸类似物和/或化学修饰。非天然存在的核酸可以包括例 如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类 似物可在核糖、磷酸和/或碱基部分被修饰。在本发明的实施方案中,向导核 酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,向导包含一 种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的实施方案中, 向导包含一种或多种非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷 酸酯键联、硼酸磷酸酯键联的核苷酸、包含在核糖环的2’和4’碳原子之间的 亚甲基桥的锁定核酸(LNA)或桥接核酸(BNA)。修饰的核苷酸的其他实例包括 2'-O-甲基类似物、2'-脱氧类似物、2-硫代尿苷类似物、N6-甲基腺苷类似物或 2'-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、 假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。 向导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入 2'-O-甲基(M)、2'-O-甲基-3’-硫代磷酸酯(MS)、硫代磷酸酯(PS)、S-约束乙基 (cEt),或2'-O-甲基-3’-硫代PACE(MSP)。此类化学修饰的向导与未修饰的向 导相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预 测。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015 年6月29日在线发布;Ragdarm等,0215,PNAS,E7110-E7111;Allerson等,J. Med.Chem.2005,48:901-904;Bramsen等,Front.Genet.,2012,3:154;Deng等, PNAS,2015,112:11870-11875;Sharma等,MedChemComm.,2014, 5:1454-1471;Hendel等,Nat.Biotechnol.(2015)33(9):985-989;Li等,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。在一些 实施方案中,向导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见Kelly等,2016,J. Biotech.233:74-83)。在某些实施方案中,向导在结合至靶DNA的区域中包含 核糖核苷酸,并在结合至Cas9、Cpf1或C2c1的区域中包含一个或多个脱氧 核糖核苷酸和/或核苷酸类似物。在本发明的实施方案中,将脱氧核糖核苷酸 和/或核苷酸类似物并入工程改造的向导结构(诸如但不限于5'端和/或3'端、 茎环区和种子区)中。在某些实施方案中,修饰不在茎环区的5'柄(5’-handle) 中。向导的茎环区的5'柄中的化学修饰可能会废除其功能(参见Li等,NatureBiomedical Engineering,2017,1:0066)。在某些实施方案中,向导的至少1个、 2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13 个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、 24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50 个或75个核苷酸经化学修饰。在一些实施方案中,向导的3’或5’端的3-5 个核苷酸经化学修饰。在一些实施方案中,在种子区中仅引入较小的修饰, 诸如2’-F修饰。在某些实施方案中,在向导的3’端引入2'-F修饰。在某些实 施方案中,向导的5’端和/或3’端的3至5个核苷酸用2'-O-甲基(M)、2'-O- 甲基-3’-硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3’-硫代PACE(MSP) 化学修饰。这样的修饰可以提高基因组编辑效率(参见Hendel等,Nat.Biotechnol.(2015)33(9):985-989)。在某些实施方案中,向导的所有磷酸二酯 键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在某些实施方案中,向导 的5’端和/或3’端的多于5个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)化学 修饰。这种化学修饰的向导可以介导增强的基因破坏水平(参见Ragdarm等, 0215,PNAS,E7110-E7111)。在本发明的一个实施方案中,向导被修饰成在其3’和/或5’端包含化学部分。这样的部分包括但不限于胺、叠氮化物、炔、硫 代基、二苯并环辛炔(DBCO)或若丹明。在某些实施方案中,化学部分通过接头诸如烷基链缀合至向导。在某些实施方案中,修饰的向导的化学部分可用 于将向导附接至另一分子,诸如DNA、RNA、蛋白质或纳米粒子。这种化学 修饰的向导可用于识别或富集一般由CRISPR系统编辑的细胞(参见Lee等, eLife,2017,6:e25312,DOI:10.7554)。
在某些实施方案中,如本文所提供的CRISPR系统可以利用包含向导序 列的crRNA或类似多核苷酸,其中多核苷酸是RNA、DNA或RNA与DNA 的混合物,和/或其中多核苷酸包含一种或多种核苷酸类似物。序列可以包含 任何结构,包括但不限于原生crRNA的结构,例如凸环、发夹或茎环结构。在某些实施方案中,包含向导序列的多核苷酸与可以是RNA或DNA序列的 第二多核苷酸序列形成双链体。
在某些实施方案中,利用化学修饰的向导RNA。向导RNA化学修饰的 实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基 3'硫代磷酸酯(MS),或2'-O-甲基3'硫代PACE(MSP)。此类化学修饰的向导 RNA与未修饰的向导RNA相比可以包含增加的稳定性和增加的活性,不过 中靶对脱靶特异性不可预测。(参见Hendel,2015,NatBiotechnol.33(9):985-9, doi:10.1038/nbt.3290,2015年6月29日在线发布)。化学修饰的向导RNA还包括但不限于具有硫代磷酸酯键的RNA和在核糖环的2'与4'碳之间包含亚甲基桥的锁核酸(LNA)核苷酸。
在一些实施方案中,向导序列的长度为约或大于约5、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 35、40、45、50、75个或更多核苷酸。在一些实施方案中,向导序列的长度 小于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。优选地, 向导序列长度为10至30个核苷酸。向导序列引导CRISPR复合物序列特异 性结合至靶序列的能力可以通过任何适合的测定来评价。举例来说,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的向导序列,可以 提供给具有相应靶序列的宿主细胞,例如通过用编码CRISPR序列的组分的 载体转染,继而评价靶序列内的优先裂解,例如通过Surveyor测定。类似地, 可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的向导 序列)和不同于测试向导序列的对照向导序列,以及在测试与对照向导序列反应之间对靶序列比较结合或裂解速率来评估靶RNA的裂解。其他测定可能存 在,并且将为本领域技术人员所想到。
在一些实施方案中,对向导的修饰是化学修饰、插入、缺失或拆分。在 一些实施方案中,化学修饰包括但不限于并入2'-O-甲基(M)类似物、2'-脱氧 类似物、2-硫代尿苷类似物,N6-甲基腺苷类似物、2'-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、 7-甲基鸟苷、2'-O-甲基-3’-硫代磷酸酯(MS)、S-约束乙基(cEt)、硫代磷酸酯(PS) 或2'-O-甲基-3’-硫代PACE(MSP)。在一些实施方案中,向导包含一种或多种 硫代磷酸酯修饰。在某些实施方案中,向导的至少1个、2个、3个、4个、 5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、 16个、17个、18个、19个、20个或25个核苷酸经化学修饰。在某些实施方案中,种子区中的一个或多个核苷酸经化学修饰。在某些实施方案中,在 3’端的一个或多个核苷酸经化学修饰。在某些实施方案中,5’柄中的核苷酸 均未经化学修饰。在一些实施方案中,种子区中的化学修饰是次要修饰,诸 如并入2’-氟类似物。在具体实施方案中,种子区的一个核苷酸被2’-氟类似 物替代。在一些实施方案中,3’端中的5或10个核苷酸经化学修饰。在Cpf1 CrRNA的3’端处的此类化学修饰提高基因切割效率(参见Li等,Nature Biomedical Engineering,2017,1:0066)。在具体实施方案中,3'端中的5个核苷 酸被2'-氟类似物替代。在具体实施方案中,3'端中的10个核苷酸被2'-氟类 似物替代。在具体实施方案中,3'端中的5个核苷酸被2'-O-甲基(M)类似物替代。
在一些实施方案中,向导的5'柄的环经修饰。在一些实施方案中,向导 的5'柄的环被修饰为具有缺失、插入、裂解或化学修饰。在某些实施方案中, 环包含3个、4个或5个核苷酸。在某些实施方案中,环包含序列UCUU、 UUUU、UAUU或UGUU。
可以选择向导序列并且因此选择核酸靶向向导RNA以靶向任何靶核酸 序列或靶分子。在形成CRISPR复合物的情形中,“靶序列”或“靶分子”是指 向导序列被设计成与其具有互补性的序列或分子,其中靶序列与向导序列之 间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。术语 “靶RNA”是指作为靶序列或包含靶序列的RNA多核苷酸。换句话说,靶RNA 可以是gRNA的一部分,即,向导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的RNA多核苷酸 或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或 细胞质中。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施 方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA (mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA (snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA) 和小细胞质RNA(scRNA)。在一些优选实施方案中,靶序列可以是选自由 mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选 实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子 内的序列。在一些更优选实施方案中,靶序列可以是mRNA分子或前体mRNA 分子内的序列。
在一些实施方案中,靶分子是靶DNA。在一些实施方案中,系统可还包 括结合靶DNA且包含RNA聚合酶启动子的引物。
在某些实施方案中,向导RNA的间隔区长度小于28个核苷酸。在某些 实施方案中,向导RNA的间隔区长度为至少18个核苷酸并且小于28个核苷 酸。在某些实施方案中,向导RNA的间隔区长度在19个与28个核苷酸之间。 在某些实施方案中,向导RNA的间隔区长度在19个与25个核苷酸之间。在 某些实施方案中,向导RNA的间隔区长度为20个核苷酸。在某些实施方案 中,向导RNA的间隔区长度为23个核苷酸。在某些实施方案中,向导RNA 的间隔区长度为25个核苷酸。
在某些实施方案中,可以通过在间隔区序列与靶序列之间,包括沿着间 隔区/标靶的错配位置引入错配,例如1个或多个错配,例如1个或2个错配 来探索裂解效率的调节。举例来说,双重错配越处于中心(即,不是3'或5'), 裂解效率越受影响。因此,通过选择沿着间隔区的错配位置,可以调节裂解 效率。通过实例,如果需要小于100%的标靶裂解(例如在细胞群体中),那么 可以在间隔区序列中引入1个或多个,例如优选2个在间隔区与靶序列之间 的错配。错配位置沿着间隔区越处于中心,裂解百分比越低。
在某些示例性实施方案中,可以探索裂解效率以设计单向导,所述单向 导可以区分两种或更多种因单核苷酸,例如单核苷酸多态性(SNP)、变异或(点) 突变而变化的标靶。CRISPR效应子可能对SNP(或其他单核苷酸变异)具有 降低的灵敏度并且继续以某一效率水平使SNP标靶裂解。因此,对于两种标 靶或一组标靶,向导RNA可以被设计成具有与标靶中的一种,即,中靶SNP 互补的核苷酸序列。向导RNA被进一步设计成具有合成错配。如本文所用的 “合成错配”是指非天然产生的错配,其在天然产生的SNP上游或下游,例如 上游或下游至多5个核苷酸,例如上游或下游4个、3个、2个或1个核苷酸, 优选地上游或下游至多3个核苷酸,更优选地上游或下游至多2个核苷酸, 最优选地上游或下游1个核苷酸(即,邻近SNP)处引入。当CRISPR效应子结合至中靶SNP时,仅单错配将与合成错配一起形成,并且将继续活化 CRISPR效应子并产生可检测信号。当向导RNA杂交至脱靶SNP时,将形成两个错配,来自SNP的错配和合成错配,并且不产生可检测信号。因此,本 文所公开的系统可以被设计成区分群体内的SNP。举例来说,系统可以用于 区分因单个SNP而不同的病原性株系或检测某些疾病特异性SNP,例如但不 限于疾病相关SNP,例如但不限于癌症相关SNP。
在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位 置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27、28、29或30(以5'端为起点)上。在 某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8或9(以5'端为起点)上。在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位置2、3、4、5、6或7(以5'端为起点) 上。在某些实施方案中,向导RNA被设计成使得SNP位于间隔区序列的位 置3、4、5或6(以5'端为起点)上。在某些实施方案中,向导RNA被设计成 使得SNP位于间隔区序列的位置3(以5'端为起点)上。
在某些实施方案中,向导RNA被设计成使得错配(例如合成错配,即, 除SNP以外的额外突变)位于间隔区序列的位置1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29或30(以5'端为起点)上。在某些实施方案中,向导RNA被设计 成使得错配位于间隔区序列的位置1、2、3、4、5、6、7、8或9(以5'端为 起点)上。在某些实施方案中,向导RNA被设计成使得错配位于间隔区序列 的位置4、5、6或7(以5'端为起点)上。在某些实施方案中,向导RNA被设 计成使得错配位于间隔区序列的位置5(以5'端为起点)上。
在某些实施方案中,向导RNA被设计成使得错配位于SNP上游2个核 苷酸(即,一个间插核苷酸)。
在某些实施方案中,向导RNA被设计成使得错配位于SNP下游2个核 苷酸(即,一个间插核苷酸)。
在某些实施方案中,向导RNA被设计成使得错配位于间隔区序列的位置 5(以5'端为起点)上并且SNP位于间隔区序列的位置3(以5'端为起点)上。
在一些实施方案中,一种或多种向导RNA可被设计成检测如本文所描述 的靶RNA或DNA中的单核苷酸多态性,或者其可被设计成检测RNA转录 物的剪接变体。
本文所描述的实施方案涵盖在如本文所论述的真核细胞中(体外,即,在 分离的真核细胞中)诱导一个或多个核苷酸修饰,其包括向细胞递送如本文所 论述的载体。一个或多个突变可以包括经由一个或多个向导RNA在细胞的每 个靶序列处一个或多个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处1-75个核苷酸的引 入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个 细胞的每个靶序列处1、5、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷 酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处5、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个 核苷酸的引入、缺失或取代。突变包括经由一个或多个向导RNA在所述一个 或多个细胞的每个靶序列处10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷 酸的引入、缺失或取代。突变可以包括经由一个或多个向导RNA在所述一个或多个细胞的每个靶序列处20、21、22、23、24、25、26、27、28、29、30、 35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一 个或多个向导RNA在所述一个或多个细胞的每个靶序列处40、45、50、75、 100、200、300、400或500个核苷酸的引入、缺失或取代。
通常,在内源CRISPR系统的情形中,CRISPR复合物(包含杂交至靶序 列并且与一种或多种Cas蛋白质复合的向导序列)的形成使得靶序列中或附近 (例如距其1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对以内) 裂解,但可以取决于例如二级结构,尤其在RNA标靶的情况下。
如本文所用,“掩蔽构建体”是指可通过本文所描述的活化的CRISPR系 统效应蛋白裂解或以其他方式失活的分子。术语“掩蔽构建体”替代地也可称 为“检测构建体”。在某些示例性实施方案中,掩蔽构建体是基于RNA的掩蔽 构建体。基于RNA的掩蔽构建体包含可被CRISPR效应蛋白裂解的RNA元 件。RNA元件的裂解释放剂或产生构象变化,其允许可检测信号产生。下面 描述了证实如何使用RNA元件以阻止或掩盖可检测信号的产生的示例性构建体,并且本发明的实施方式包括其变体。在裂解之前,或当掩蔽构建体处 于“活性”状态时,掩蔽构建体阻断阳性可检测信号的产生或检测。应当理解, 在某些示例性实施方案中,可以在活性RNA掩蔽构建体的存在下产生极小背景信号。阳性可检测信号可以是可使用本领域已知的光学、荧光、化学发光、 电化学或其他检测方法检测的任何信号。术语“阳性可检测信号”用于区分在 掩蔽构建体存在下可检测的其他可检测信号。举例来说,在某些实施方案中, 当存在掩蔽剂时可检测到第一信号(即阴性可检测信号),所述第一信号然后在检测到靶分子且掩蔽剂被活化的CRISPR效应蛋白裂解或失活时转化为第 二信号(例如阳性可检测信号)。
在某些示例性实施方案中,掩蔽构建体可抑制基因产物的产生。基因产 物可以由添加到样品中的报告构建体编码。掩蔽构建体可以是参与RNA干扰 通路的干扰RNA,如短发夹RNA(shRNA)或小干扰RNA(siRNA)。掩蔽构 建体还可包含微小RNA(miRNA)。当存在时,掩蔽构建体抑制基因产物的表 达。基因产物可以是在不存在掩蔽构建体时可被标记的探针、适体或抗体检 测的荧光蛋白或其他RNA转录物或蛋白。在活化效应蛋白后,掩蔽构建体被裂解或以其他方式沉默而允许作为阳性可检测信号的基因产物的表达和检 测。
在某些示例性实施方案中,掩蔽构建体可以螯合产生可检测阳性信号所 需要的一种或多种试剂,使得从掩蔽构建体释放一种或多种试剂导致可检测 阳性信号的产生。一种或多种试剂可以组合以产生比色信号、化学发光信号、 荧光信号或任何其他可检测信号,并且可以包括已知适合于这样的目的的任何试剂。在某些示例性实施方案中,一种或多种试剂被结合所述一种或多种 试剂的RNA适体鳌合。当检测到靶分子效应蛋白而被活化并且RNA适体被 降解时,释放一种或多种试剂。
在某些示例性实施方案中,向导RNA可被设计成结合至一种或多种对疾 病状态具诊断性的靶分子。
在一些实施方案中,疾病可以是癌症。癌症可包括但不限于液体瘤,如 白血病(例如急性白血病、急性淋巴细胞白血病、急性髓细胞白血病、急性成 髓细胞白血病、急性早幼粒细胞白血病、急性骨髓单核细胞白血病、急性单 核细胞白血病、急性红白血病、慢性白血病、慢性髓细胞白血病、慢性淋巴 细胞白血病)、真性红细胞增多症、淋巴瘤(例如霍奇金氏病、非霍奇金氏病)、 沃尔登斯特伦氏巨球蛋白血症(Waldenstrom’smacroglobulinemia)、重链病或多发性骨髓瘤。
癌症可包括但不限于实体瘤,如肉瘤和癌。实体瘤的实例包括但不限于 纤维肉瘤、粘液肉瘤、脂肪肉瘤、软骨肉瘤、骨原性肉瘤、脊索瘤、血管肉 瘤、内皮肉瘤、淋巴管肉瘤、淋巴管内皮肉瘤、滑膜瘤、间皮瘤、尤因氏瘤、 平滑肌肉瘤、横纹肌肉瘤、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂 腺癌、乳头状癌、乳头状腺癌、囊腺癌、髓样癌、上皮癌、支气管癌、肝癌、结直肠癌(例如结肠癌、直肠癌)、肛门癌、胰腺癌(例如胰腺腺癌、胰岛细胞 癌、神经内分泌肿瘤)、乳腺癌(例如导管癌、小叶癌、炎性乳腺癌、透明细 胞癌、粘液癌)、卵巢癌(例如卵巢上皮癌或表面上皮间质瘤,包括浆液性肿 瘤、子宫内膜样肿瘤和粘液性囊腺癌、生殖索间质瘤)、前列腺癌、肝和胆管 癌(例如肝细胞癌、胆管癌、血管瘤)、绒毛膜癌、精原细胞瘤、胚胎癌、肾 癌(例如肾细胞癌、透明细胞癌、威尔姆氏瘤(Wilm's tumor)、肾母细胞瘤)、 宫颈癌、子宫癌(例如子宫内膜腺癌、子宫乳头状浆液性癌、子宫透明细胞癌、 子宫肉瘤和平滑肌肉瘤、苗勒型混合瘤)、睾丸癌、生殖细胞瘤、肺癌(例如 肺腺癌、鳞状细胞癌、大细胞癌、细支气管肺泡癌、非小细胞癌、小细胞癌、 间皮瘤)、膀胱癌、印戒细胞癌、头颈部癌(例如鳞状细胞癌)、食道癌(例如食 道腺癌)、脑部肿瘤(例如神经胶质瘤、成胶质细胞瘤、成神经管细胞瘤、星 形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞 瘤、听神经瘤、少突胶质细胞瘤、神经鞘瘤、脑膜瘤)、成神经细胞瘤、成视 网膜细胞瘤、神经内分泌肿瘤、黑素瘤、胃癌(例如胃腺癌、胃肠道间质瘤) 或类癌。淋巴增生性病症也被视为增生性疾病。
在一些实施方案中,疾病可以是自身免疫疾病,并且可包括但不一定限 于类风湿性关节炎、狼疮、炎性肠病、多发性硬化症、1型糖尿病、格-巴二 氏综合征、格雷夫病或其他自身免疫病症。
在一些实施方案中,疾病可以是感染。感染可包括但不一定限于由病毒、 细菌、真菌、原生动物或寄生虫引起的感染。
在某些示例性实施方案中,本文所公开的系统、装置和方法涉及检测样 品,例如获自受试者的生物样品中一种或多种微生物剂的存在。在某些示例 性实施方案中,微生物可以是细菌、真菌、酵母、原生动物、寄生虫或病毒。 因此,本文所公开的方法可以适应于在其他方法中与其他方法一起(或组合) 使用,所述其他方法需要微生物种类的快速鉴别,监测微生物蛋白质(抗原)、 抗体、抗体基因的存在,检测某些表型(例如细菌抗性),监测疾病进展和/或爆发,以及抗生素筛选。因为此处所公开的实施方案的快速和灵敏诊断能力、 低至单核苷酸差异的微生物种类类型的检测和作为POC装置部署的能力,所 以本文所公开的实施方案可以用于指导治疗方案,例如适当抗生素或抗病毒 剂的选择。本文所公开的实施方案还可以用于针对微生物污染的存在筛选环 境样品(空气、水、表面、食物等)。
公开了一种用以鉴别微生物种类,例如细菌、病毒、真菌、酵母或寄生 虫种类等的方法。本文所公开的特定实施方案描述了将鉴别和区分单个样品 内或跨越多个样品的微生物种类的方法和系统,从而允许识别许多不同微生 物。本发明方法通过检测样品中靶核酸序列的存在而允许检测病原体和区分 生物或环境样品中一种或多种生物体的两个或更多个种类,例如细菌、病毒、酵母、原生动物和真菌或其组合。获自样品的阳性信号指示微生物的存在。 可以使用本发明的方法和系统,通过采取使用多于一种效应蛋白,其中每种 效应蛋白靶向特异性微生物靶序列来同时鉴别多种微生物。以这种方式,对 特定受试者可以进行多水平分析,其中可以一次检测许多微生物。在一些实 施方案中,使用可以鉴别一种或多种微生物种类的一组探针可以进行多种微 生物的同时检测。
样品的多元分析能够进行样品的大规模检测,从而减少分析的时间和成 本。然而,多元分析常常受生物样品的可用性限制。根据本发明,然而,可 以进行多元分析的替代方案以使得可以将多个效应蛋白添加至单个样品中并 且每个掩蔽构建体可以与单独的猝灭剂染料组合。在这种情况下,对于单个 样品中的多个检测可以单独地从每个猝灭剂染料获得阳性信号。
本文公开了区分样品中一种或多种生物体的两个或更多个种类的方法。 所述方法还适用于检测样品中一种或多种生物体的一个或多个种类。
在一些实施方案中,提供了一种用于检测样品中的微生物的方法,所述 方法包括将样品或样品组分配到一个或多个个别离散体积中,所述个别离散 体积包含如本文所描述的CRISPR系统;在足以允许一种或多种向导RNA结合至一种或多种微生物特异性标靶的条件下孵育样品或样品组;经由一种或 多种向导RNA结合至一种或多种靶分子来活化CRISPR效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便产生可检测的阳性信 号;以及检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中一种或多种靶分子的存在。一种或多种靶分子可以是包含靶核苷酸序列的 mRNA、gDNA(编码或非编码)、trRNA或rRNA,其可以用于相互区分两种 或更多种微生物种类/株系。向导RNA可以被设计成检测靶序列。本文所公 开的实施方案还可以利用某些步骤以改善向导RNA与靶RNA序列之间的杂 交。增强核糖核酸杂交的方法在题为"Enhanced Methods ofRibonucleic Acid Hybridization"的WO 2015/085194中公开,其以引用的方式并入本文中。微生物特异性标靶可以是RNA或DNA或蛋白质。如果DNA方法还可以包括 使用引入如本文所描述的RNA聚合酶启动子的DNA引物。如果标靶是蛋白 质,那么方法将利用特定针对本文所描述的蛋白质检测的适体和步骤。
i)病毒
在某些示例性实施方案中,本文所公开的系统、装置和方法涉及检测样 品中的病毒。本文所公开的实施方案可以用于检测病毒感染(例如受试者或植 物的病毒感染),或确定病毒株,包括因单核苷酸多态性而不同的病毒株。病 毒可以是DNA病毒、RNA病毒或逆转录病毒。适用于本发明的病毒的非限制性实例包括但不限于埃博拉、麻疹、SARS、基孔肯雅、肝炎、马尔堡、黄 热病、MERS、登革、拉沙、流感、棒状病毒或HIV。肝炎病毒可以包括甲 型肝炎、乙型肝炎或丙型肝炎。流感病毒可以包括例如甲型流感或乙型流感。 HIV可以包括HIV1或HIV 2。在某些示例性实施方案中,病毒序列可以是 人呼吸道合胞病毒、苏丹埃博拉病毒(Sudan ebola virus)、本迪布焦病毒 (Bundibugyo virus)、大森林埃博拉病毒(TaiForest ebola virus)、雷斯顿埃博拉病毒(Reston ebola virus)、阿基莫塔(Achimota)、伊蚊黄病毒、艾顾凯特病毒 (Aguacate virus)、阿卡班病毒(Akabane virus)、阿德非德瑞塔沙粒病毒 (Alethinophid reptarenavirus)、阿帕华约哺乳类沙粒病毒(Allpahuayomammarenavirus)、阿马帕里沙粒病毒(Amapari mmarenavirus)、安第斯病毒 (Andesvirus)、阿波依病毒(Apoi virus)、阿拉万病毒(Aravan virus)、阿罗阿病 毒(Aroavirus)、阿莫瓦病毒(Arumwot virus)、大西洋鲑鱼副粘病毒(Atlantic salmonparamyxovirus)、澳洲蝙蝠狂犬病病毒(Australian bat lyssavirus)、禽波纳病毒(Avianbornavirus)、禽偏肺病毒(Avian metapneumovirus)、禽副粘病毒 (Avianparamyxoviruses)、企鹅或福克兰群岛病毒(penguin or Falkland Islandsvirus)、BK多瘤病毒、巴加扎病毒(Bagaza virus)、版纳病毒(Banna virus)、 蝙蝠戊型肝炎病毒(Batherpesvirus)、蝙蝠札幌病毒(Bat sapovirus)、熊佳农哺 乳类沙粒病毒(Bear Canonmammarenavirus)、北龙病毒(Beilong virus)、贝塔 康诺病毒(Betacoronavirus)、贝塔乳头瘤病毒1-6(Betapapillomavirus 1-6)、班 杰病毒(Bhanja virus)、博克洛蝙蝠狂犬病病毒(Bokeloh bat lyssavirus)、博尔纳 病病毒、波本病毒(Bourbon virus)、牛丙型肝炎病毒(Bovine hepacivirus)、牛副流感病毒3、牛呼吸道合胞病毒、巴宗病毒(Brazoranvirus)、本雅威病毒(Bunyamwera virus)、杯状病毒科病毒、加利福尼亚脑炎病毒(California encephalitis virus)、坎迪鲁病毒(Candiru virus)、犬瘟热病毒(Caninedistemper virus)、犬肺病毒(Canine pneumovirus)、松湾病毒(Cedar virus)、细胞融合因子 病毒(Cell fusing agent virus)、鲸麻疹病毒(Cetacean morbillivirus)、金迪普拉病 毒(Chandipura virus)、朝阳病毒(Chaoyang virus)、查帕雷哺乳类沙粒病毒(Chapare mammarenavirus)、基孔肯雅病毒、疣猴乳头瘤病毒(Colobus monkeypapillomavirus)、科罗拉多蜱传热病毒(Colorado tick fever virus)、牛痘病毒、克里米亚-刚果出血热病毒、库蚊黄病毒、库皮科斯哺乳类沙粒病毒(Cupixi mammarenavirus)、登革病毒、多布拉瓦-贝尔格莱德病毒(Dobrava-Belgrade virus)、东港病毒(Donggangvirus)、杜贝病毒(Dugbe virus)、杜文海格病毒(Duvenhage virus)、东方马脑炎病毒(Eastern equine encephalitis virus)、恩德培 蝙蝠病毒(Entebbe bat virus)、肠病毒A-D、欧洲蝙蝠狂犬病病毒1-2、依埃契 病毒(Eyach virus)、猫麻疹病毒(Felinemorbillivirus)、矛头蛇副粘病毒(Fer-de-Lance paramyxovirus)、费茨罗伊河病毒(Fitzroy River virus)、黄病毒科 病毒、弗萊克索哺乳类沙粒病毒(Flexalmammarenavirus)、GB病毒C、加伊 若病毒(Gairo virus)、戈麦环状病毒(Gemycircularvirus)、鹅副粘病毒SF02、 大岛病毒(Great Island virus)、瓜纳瑞托哺乳类沙粒病毒(Guanarito mammarenavirus)、汉坦病毒(Hantaan virus)、汉坦病毒Z10、哈特兰德病毒 (Heartland virus)、亨德拉病毒、甲型/乙型/丙型/戊型肝炎、丁型肝炎病毒(Hepatitis delta virus)、人博卡病毒(Human bocavirus)、人冠状病毒、人内源逆 转录病毒K、人肠道冠状病毒、人生殖器相关环状DNA病毒-1、人疱疹病毒 1-8、人免疫缺陷病毒1/2、人哺乳动物腺病毒A-G(Human mastadenovirus A-G)、人乳头瘤病毒、人副流感病毒1-4、人副肠孤病毒(Human paraechovirus)、人小双节RNA病毒(Human picornavirus)、人斯马可病毒(Human smacovirus)、 艾克马狂犬病病毒(Ikoma lyssavirus)、伊列乌斯病毒(Ilheus virus)、甲型-丙型 流感、伊皮哺乳类沙粒病毒(Ippy mammarenavirus)、伊尔库特病毒(Irkut virus)、 J-病毒、JC多瘤病毒、日本脑炎病毒、胡宁哺乳类沙粒病毒(Juninmammarenavirus)、KI多瘤病毒、卡迪皮罗病毒(Kadipiro virus)、卡密河病毒 (KamitiRiver virus)、凯杜古病毒(Kedougou virus)、库贾德病毒(Khujand virus)、 科科贝拉病毒(Kokobera virus)、科萨努尔森林病病毒(Kyasanur forest disease virus)、拉各斯蝙蝠病毒(Lagos bat virus)、兰加特病毒(Langat virus)、拉沙哺乳类沙粒病毒(Lassamammarenavirus)、拉丁哺乳类沙粒病毒(Latino mammarenavirus)、罗帕德山病毒(Leopards Hill virus)、辽宁病毒(Liao ning virus)、永安河病毒(Ljungan virus)、拉洛维病毒(Lloviu virus)、跳跃病病毒 (Louping ill virus)、卢约哺乳类沙粒病毒(Lujomammarenavirus)、卢纳哺乳类沙粒病毒(Luna mammarenavirus)、伦卡病毒(Lunk virus)、淋巴细胞性脉络丛 脑膜炎哺乳类沙粒病毒(Lymphocytic choriomeningitismammarenavirus)、欧泽诺尔狂犬病病毒(Lyssavirus Ozernoe)、MSSI2\.225病毒、马丘波哺乳类沙粒 病毒(Machupo mammarenavirus)、哺乳动物星状病毒1(Mamastrovirus 1)、曼萨尼亚病毒(Manzanilla virus)、马普埃拉病毒(Mapuera virus)、马尔堡病毒、 马雅罗病毒(Mayaro virus)、麻疹病毒、梅南高病毒(Menangle virus)、摩西卡 迪病毒(Mercadeovirus)、梅克尔细胞多瘤病毒(Merkel cell polyomavirus)、中 东呼吸综合征冠状病毒、莫巴拉哺乳类沙粒病毒(Mobala mammarenavirus)、 摩多克病毒(Modoc virus)、莫江病毒(Moijang virus)、莫科洛病毒(Mokolo virus)、猴痘病毒、蒙大拿鼠耳蝙蝠脑白质炎病毒(Montana myotis leukoenchalitis virus)、莫佩亚拉沙病毒重排体29(Mopeia lassavirus reassortant 29)、莫佩亚哺乳类沙粒病毒(Mopeia mammarenavirus)、莫罗戈罗病毒 (Morogoro virus)、莫斯曼病毒(Mossman virus)、腮腺炎病毒、鼠类肺炎病毒、墨累山谷脑炎病毒(Murray Valley encephalitis virus)、纳里瓦病毒(Nariva virus)、新城疫病毒、尼帕病毒、诺瓦克病毒、挪威鼠丙型肝炎病毒(Norway rat hepacivirus)、恩塔亚病毒(Ntaya virus)、奥尼昂-尼昂病毒(O'nyong-nyong virus)、奥利韦罗斯哺乳类沙粒病毒(Oliveros mammarenavirus)、鄂木斯克出血 热病毒(Omsk hemorrhagic fever virus)、奥罗普切病毒(Oropouche virus)、副流 感病毒5、巴拉那哺乳类沙粒病毒(Paranamammarenavirus)、帕拉马塔河病毒 (Parramatta River virus)、小型反刍动物瘟疫病毒(Peste-des-petits-ruminants virus)、毕赤德哺乳类沙粒病毒(Pichandemammarenavirus)、小RNA病毒科病 毒、皮里陶哺乳类沙粒病毒(Piritalmammarenavirus)、鱼戊型肝炎病毒A (Piscihepevirus A)、猪副流感病毒1、猪腮腺炎病毒(porcine rubulavirus)、波 瓦桑病毒(Powassan virus)、灵长类动物T-嗜淋巴细胞病毒1-2、灵长类动物 红系细小病毒1(Primate erythroparvovirus 1)、庞塔托鲁病毒(PuntaToro virus)、普马拉病毒(Puumala virus)、广平病毒(Quang Binh virus)、狂犬病病毒、拉兹丹病毒(Razdan virus)、爬行动物博尔纳病毒(Reptile bornavirus 1)、鼻病 毒A-B、里夫特山谷热病毒(Rift Valley fever virus)、牛瘟病毒、热伯维病毒(Rio Bravovirus)、啮齿动物细环病毒(Rodent Torque Teno virus)、啮齿动物丙型肝 炎病毒(Rodent hepacivirus)、罗斯河病毒、轮状病毒A-I、皇家农场病毒(Royal Farm virus)、风疹病毒、萨比亚哺乳类沙粒病毒(Sabia mammarenavirus)、塞 勒姆病毒(Salem virus)、那不勒斯白蛉热病毒(Sandfly fever Naples virus)、西 西里白蛉热病毒(Sandfly feverSicilian virus)、札幌病毒(Sapporo virus)、萨苏 伯里病毒(Sathuperi virus)、海豹指环病毒(Seal anellovirus)、塞姆利基森林病 毒(Semliki Forest virus)、仙台病毒(Sendai virus)、汉城病毒(Seoul virus)、塞皮克病毒(Sepik virus)、严重急性呼吸综合征相关冠状病毒、严重发热伴血小板 减少综合征病毒、沙门达病毒(Shamonda virus)、希莫尼蝙蝠病毒(Shimoni bat virus)、舒尼病毒(Shuni virus)、西姆布病毒(Simbuvirus)、猿猴细环病毒(Simian torque teno virus)、猿猴病毒40-41、辛诺柏病毒(SinNombre virus)、辛德毕斯病毒、小指环病毒(Small anellovirus)、索素佳病毒(Sosugavirus)、西班牙山羊 脑炎病毒(Spanish goat encephalitis virus)、斯庞德温尼病毒(Spondweni virus)、 圣路易斯脑炎病毒(St.Louis encephalitis virus)、森夏恩病毒(Sunshine virus)、TTV样微小病毒(TTV-like mini virus)、塔卡里伯哺乳类沙粒病毒(Tacaribe mammarenavirus)、台依病毒(Taila virus)、塔玛纳蝙蝠病毒(Tamana batvirus)、 塔米埃米哺乳类沙粒病毒(Tamiami mammarenavirus)、坦布苏病毒(Tembusuvirus)、托高土病毒(Thogoto virus)、索托帕拉雅病毒(Thottapalayam virus)、蜱 传脑炎病毒(Tick-borne encephalitis virus)、刁曼病毒(Tioman virus)、披膜病毒 科病毒、犬细环病毒(Torque teno canis virus)、夜猴细环病毒(Torque teno douroucoulivirus)、猫细环病毒(Torque teno felis virus)、中细环病毒(Torque teno midivirus)、猪细环病毒(Torque teno sus virus)、狨猴细环病毒(Torque teno tamarinvirus)、细环病毒(Torque teno virus)、海狮细环病毒(Torque teno zalophus virus)、吐霍克病毒(Tuhoko virus)、图拉病毒(Tula virus)、树鼩副粘 病毒、乌苏图病毒(Usutuvirus)、尤库尼米病毒(Uukuniemi virus)、痘苗病毒、 天花病毒、委内瑞拉马脑炎病毒(Venezuelan equine encephalitis virus)、印第安纳水泡性口炎病毒(Vesicularstomatitis Indiana virus)、WU多瘤病毒、韦塞尔 斯布朗病毒(Wesselsbron virus)、西高加索蝙蝠病毒(West Caucasian bat virus)、 西尼罗河病毒、西方马脑炎病毒(Westernequine encephalitis virus)、怀特沃特 阿罗约哺乳类沙粒病毒(Whitewater Arroyomammarenavirus)、黄热病病毒、横 须贺病毒(Yokose virus)、尤格波格丹诺夫奇病毒(YugBogdanovac virus)、扎 伊尔埃博拉病毒(Zaire ebolavirus)、寨卡病毒或拜氏接合酵母病毒Z病毒序列 (Zygosaccharomyces bailii virus Z viral sequence)。可以检测的RNA病毒的实 例包括以下一种或多种(或其任何组合):冠状病毒科病毒、小RNA病毒科病 毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒 科、正粘病毒科或丁型病毒。在某些示例性实施方案中,病毒是冠状病毒、 SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西 尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病 毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病 毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸 道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、 流感或丁型肝炎病毒。
在某些示例性实施方案中,病毒可以是选自包括以下的组的植物病毒: 烟草花叶病毒(TMV)、番茄斑萎病毒(TSWV)、黄瓜花叶病毒(CMV)、马铃薯 Y病毒(PVY)、RT病毒花椰菜花叶病毒(CaMV)、李痘病毒(PPV)、雀麦草花 叶病毒(BMV)、马铃薯病毒X(PVX)、柑橘衰退病毒(CTV)、大麦黄矮病毒 (BYDV)、马铃薯卷叶病毒(PLRV)、番茄丛矮病毒(TBSV)、水稻东格鲁球状 病毒(rice tungro spherical virus)(RTSV)、水稻黄斑驳病毒(RYMV)、水稻白叶病毒(RHBV)、玉米雷亚朵非纳病毒(maize rayado fino virus)(MRFV)、玉米矮 花叶病毒(MDMV)、甘蔗花叶病毒(SCMV)、甘薯羽状斑驳病毒(SPFMV)、甘 薯凹脉黄化丝状病毒(sweetpotato sunken vein closterovirus)(SPSVV)、葡萄扇 叶病毒(GFLV)、葡萄病毒A(GVA)、葡萄病毒B(GVB)、葡萄斑点病毒 (GFkV)、葡萄卷叶相关病毒-1、葡萄卷叶相关病毒-2和葡萄卷叶相关病毒-3 (GLRaV-1、GLRaV-2和GLRaV-3)、南芥菜花叶病毒(ArMV)或沙地葡萄茎痘 相关病毒(RSPaV)。在优选实施方案中,靶RNA分子是所述病原体的一部分 或从所述病原体的DNA分子转录。举例来说,靶序列可以包含在RNA病毒 的基因组中。进一步优选的是,如果所述病原体感染或已经感染所述植物, 那么CRISPR效应蛋白水解所述植物中所述病原体的所述靶RNA分子。因此 优选的是,当治疗性地,即,在感染已经发生之后,或预防性地,即,在感 染已经发生之前应用CRISPR系统(或其完成所需的部分)时,CRISPR系统能 够使靶RNA分子从植物病原体裂解。
在某些示例性实施方案中,病毒可以是逆转录病毒。可以使用本文所公 开的实施方案检测的示例性逆转录病毒包括以下病毒中的一种或多种或任何 组合:α逆转录病毒属、β逆转录病毒属、γ逆转录病毒属、δ逆转录病毒属、 ε逆转录病毒属、慢病毒属、泡沫病毒属(Spumavirus),或转座病毒科 (Metaviridae)、假病毒科(Pseudoviridae)和逆转录病毒科(Retroviridae)(包括 HIV)、嗜肝DNA病毒科(Hepadnaviridae)(包括乙型肝炎病毒)和花椰菜花叶 病毒科(Caulimoviridae)(包括花椰菜花叶病毒)。
在某些示例性实施方案中,病毒是DNA病毒。可以使用本文所公开的 实施方案检测的示例性DNA病毒尤其包括来自以下科的病毒中的一种或多 种(或其任何组合):肌病毒科(Myoviridae)、短尾病毒科(Podoviridae)、长尾病 毒科(Siphoviridae)、异疱疹病毒科(Alloherpesviridae)、疱疹病毒科 (Herpesviridae)(包括人疱疹病毒和水痘带状疱疹病毒)、马洛疱疹病毒科 (Malocoherpesviridae)、脂毛病毒科(Lipothrixviridae)、小杆状病毒科 (Rudiviridae)、腺病毒科(Adenoviridae)、瓶状病毒科(Ampullaviridae)、囊泡病毒科(Ascoviridae)、非洲猪瘟病毒科(Asfarviridae)(包括非洲猪瘟病毒)、杆状 病毒科(Baculoviridae)、西坎达病毒科(Cicaudaviridae)、棒状病毒科 (Clavaviridae)、覆盖噬菌体科(Corticoviridae)、微小纺锤形病毒科 (Fuselloviridae)、球状病毒科(Globuloviridae)、滴状病毒科(Guttaviridae)、肥大唾腺炎病毒科(Hytrosaviridae)、虹彩病毒科(Iridoviridae)、马赛病毒科 (Maseilleviridae)、拟菌病毒科(Mimiviridae)、裸病毒科(Nudiviridae)、线形病 毒科(Nimaviridae)、潘多拉病毒科(Pandoraviridae)、乳头瘤病毒科 (Papillomaviridae)、藻类DNA病毒科(Phycodnaviridae)、原质病毒科(Plasmaviridae)、多DNA病毒(Polydnavirus)、多瘤病毒科(Polyomaviridae)(包 括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(Poxviridae)(包括牛痘和天花)、 球脂状病毒科(Sphaerolipoviridae)、复层病毒科(Tectiviridae)、图里病毒科 (Turriviridae)、地诺DNA病毒(Dinodnavirus)、盐末端蛋白病毒(Salterprovirus)、 瑞兹病毒(Rhizidovirus)。在一些实施方案中,一种诊断疑似具有细菌感染的受试者中的种类特异性细菌感染的方法被描述为从受试者获得包含细菌核糖 体核糖核酸的样品;使样品与所描述的探针中的一个或多个接触;以及检测 样品中存在的细菌核糖体核糖核酸序列与探针之间的杂交,其中杂交的检测 指示受试者受以下细菌感染:大肠杆菌、肺炎克雷伯菌、绿脓假单胞菌、金 黄色葡萄球菌、鲍曼不动杆菌(Acinetobacter baumannii)、白色念珠菌、阴沟 肠杆菌、粪肠球菌、屎肠球菌、奇异变形杆菌、无乳葡萄球菌(Staphylococcus agalactiae)或嗜麦芽葡萄球菌(Staphylococcus maltophilia)或它们的组合。
在特定实施方案中,病毒感染可由双链RNA病毒、正义RNA病毒、反 义RNA病毒、逆转录病毒或它们的组合引起。
ii)细菌
以下提供了可能使用本文所公开的实施方案检测的微生物类型的示例性 清单。在某些示例性实施方案中,微生物是细菌。可以根据所公开的方法检 测的细菌的实例包括但不限于以下任何一种或多种(或其任何组合):鲍曼不动杆菌(Acinetobacterbaumanii)、放线杆菌属某种(Actinobacillus sp.)、放线菌 (Actinomycetes)、放线菌属某种(Actinomyces sp.)(例如伊氏放线菌 (Actinomyces israelii)和内氏放线菌(Actinomyces naeslundii))、气单胞菌属某种 (Aeromonas sp.)(例如嗜水气单胞菌(Aeromonas hydrophila)、凡隆气单胞菌温和生物型(Aeromonas veronii biovarsobria)(温和气单胞菌(Aeromonas sobria)) 和豚鼠气单胞菌(Aeromonas caviae))、嗜吞噬细胞无浆体(Anaplasma phagocytophilum)、边缘无浆体(Anaplasma marginale)木糖氧化产碱菌 (Alcaligenes xylosoxidans)、鲍曼不动杆菌、伴放线菌放线杆菌(Actinobacillus actinomycetemcomitans)、芽孢杆菌属某种(Bacillus sp.)(例如炭疽芽孢杆菌 (Bacillus anthracis)、蜡样芽孢杆菌、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)和嗜热脂肪芽孢杆菌(Bacillusstearothermophilus))、拟杆菌属某种(Bacteroides sp.)(例如脆弱拟杆菌(Bacteroides fragilis))、巴尔通体属某种(Bartonella sp.)(例如杆菌状巴尔通体(Bartonella bacilliformis)和汉氏巴尔通体(Bartonella henselae))、双歧杆菌属某种(Bifidobacterium sp.)、博德特氏菌属某种(Bordetella sp.)(例如百日咳博德特氏菌(Bordetella pertussis)、副百日咳博德特氏菌(Bordetella parapertussis)和支 气管炎博德特氏菌(Bordetella bronchiseptica))、疏螺旋体属某种(Borrelia sp.) (例如回归热疏螺旋体(Borrelia recurrentis)和伯氏疏螺旋体(Borrelia burgdorferi))、布鲁氏菌属某种(Brucella sp.)(例如流产布鲁氏菌(Brucella abortus)、犬布鲁氏菌(Brucella canis)、羊布鲁氏菌(Brucella melintensis)和猪布 鲁氏菌(Brucellasuis))、伯克氏菌属某种(Burkholderia sp.)(例如类鼻疽伯克氏 菌(Burkholderiapseudomallei)和洋葱伯克氏菌(Burkholderia cepacia))、弯曲杆 菌属某种(Campylobacter sp.)(例如空肠弯曲杆菌、结肠弯曲杆菌 (Campylobacter coli)、红嘴鸥弯曲杆菌(Campylobacter lari)和胎儿弯曲杆菌 (Campylobacter fetus))、二氧化碳嗜纤维菌属某种(Capnocytophaga sp.)、人心 杆菌(Cardiobacterium hominis)、沙眼衣原体(Chlamydia trachomatis)、肺炎嗜 衣原体(Chlamydophila pneumoniae)、鹦鹉热嗜衣原体(Chlamydophila psittaci)、 柠檬酸杆菌属某种(Citrobacter sp.)、贝氏柯克斯体、棒状杆菌属某种 (Corynebacterium sp.)(例如白喉棒杆菌(Corynebacteriumdiphtheriae)、杰氏棒杆菌(Corynebacterium jeikeum)和棒杆菌(Corynebacterium))、梭菌属某种 (Clostridium sp.)(例如产气荚膜梭菌、艰难梭菌(Clostridium difficile)、肉毒梭 菌(Clostridium botulinum)和破伤风梭菌(Clostridium tetani))、啮蚀艾肯菌(Eikenella corrodens)、肠杆菌属某种(Enterobacter sp.)(例如产气肠杆菌(Enterobacter aerogenes)、聚团肠杆菌(Enterobacter agglomerans)、阴沟肠杆菌(Enterobacter cloacae)和大肠杆菌,包括机会大肠杆菌,例如肠产毒性大肠杆 菌、肠侵袭性大肠杆菌、肠致病性大肠杆菌、肠出血性大肠杆菌、肠聚集性大肠杆菌和尿道致病性大肠杆菌)、肠球菌属某种(Enterococcus sp.)(例如粪肠 球菌(Enterococcus faecalis)和屎肠球菌(Enterococcus faecium))、埃立克体属某种(Ehrlichia sp.)(例如恰菲埃立克体(Ehrlichia chafeensia)和犬埃立克体 (Ehrlichia canis))、絮状表皮癣菌(Epidermophyton floccosum)、红斑丹毒丝菌 (Erysipelothrix rhusiopathiae)、真杆菌属某种(Eubacterium sp.)、土拉弗朗西斯 菌(Francisella tularensis)、具核梭杆菌(Fusobacterium nucleatum)、阴道加德纳菌(Gardnerella vaginalis)、麻疹双球菌(Gemella morbillorum)、嗜血杆菌属某种 (Haemophilus sp.)(例如流感嗜血杆菌(Haemophilus influenzae)、杜克雷嗜血杆 菌(Haemophilus ducreyi)、埃及嗜血杆菌(Haemophilus aegyptius)、副流感嗜血杆菌(Haemophilus parainfluenzae)、溶血嗜血杆菌(Haemophilus haemolyticus) 和副溶血嗜血杆菌(Haemophilus parahaemolyticus))、螺杆菌属某种 (Helicobacter sp.)(例如幽门螺杆菌(Helicobacter pylori)、同性恋螺杆菌 (Helicobacter cinaedi)和芬纳尔螺杆菌(Helicobacter fennelliae))、金氏金氏菌 (Kingella kingii)、克雷伯菌属某种(Klebsiella sp.)(例如肺炎克雷伯菌、肉芽肿克雷伯菌(Klebsiella granulomatis)和产酸克雷伯菌(Klebsiella oxytoca))、乳杆菌属某种(Lactobacillus sp.)、单核细胞增多性李斯特菌、问号钩端螺旋体 (Leptospirainterrogans)、嗜肺军团菌(Legionella pneumophila)、问号钩端螺旋体、消化链球菌属某种(Peptostreptococcus sp.)、溶血性曼氏杆菌(Mannheimia hemolytica)、犬小孢子菌(Microsporum canis)、卡他莫拉菌(Moraxella catarrhalis)、摩根氏菌属某种(Morganella sp.)、动弯杆菌属某种(Mobiluncus sp.)、微球菌属某种(Micrococcussp.)、分枝杆菌属某种(Mycobacterium sp.)(例 如麻风分枝杆菌(Mycobacteriumleprae)、结核分枝杆菌、副结核分枝杆菌 (Mycobacterium paratuberculosis)、胞内分枝杆菌(Mycobacterium intracellulare)、鸟分枝杆菌(Mycobacterium avium)、牛分枝杆菌(Mycobacterium bovis)和海洋分枝杆菌(Mycobacterium marinum))、支原体属某种(Mycoplasm sp.)(例如肺炎支原体(Mycoplasma pneumoniae)、人支原体(Mycoplasmahominis)和生殖支原体(Mycoplasma genitalium))、诺卡氏菌属某种(Nocardia sp.) (例如星形诺卡氏菌(Nocardia asteroides)、奶牛乳房炎性诺卡氏菌(Nocardiacyriacigeorgica)和巴西诺卡氏菌(Nocardia brasiliensis))、奈瑟氏菌属某种(Neisseria sp.)(例如淋病奈瑟氏菌(Neisseria gonorrhoeae)和脑膜炎奈瑟氏菌(Neisseria meningitidis))、多杀巴斯德菌(Pasteurella multocida)、糠秕孢子菌(Pityrosporum orbiculare)(糠秕马拉色菌(Malassezia furfur))、类志贺邻单胞菌、 普雷沃菌属、卟啉单胞菌属、产黑普雷沃菌(Prevotella melaninogenica)、变形 杆菌属某种(Proteus sp.)(例如普通变形杆菌(Proteus vulgaris)和奇异变形杆菌 (Proteusmirabilis))、普罗威登斯菌属某种(Providencia sp.)((例如产碱普罗威登斯菌(Providencia alcalifaciens)、雷氏普罗威登斯菌(Providencia rettgeri)和斯氏 普罗威登斯菌(Providencia stuartii))、绿脓假单胞菌、痤疮丙酸杆菌 (Propionibacteriumacnes)、马红球菌(Rhodococcus equi)、立克次体属某种 (Rickettsia sp.)(例如立氏立克次体(Rickettsia rickettsii)、小蛛立克次体 (Rickettsia akari)和普氏立克次体(Rickettsia prowazekii)、恙虫病东方体 (Orientia tsutsugamushi)(原名:恙虫病立克次体(Rickettsia tsutsugamushi))和伤 寒立克次体(Rickettsia typhi))、红球菌属某种(Rhodococcus sp.)、粘质沙雷氏菌(Serratia marcescens)、嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)、沙 门氏菌属某种(Salmonella sp.)(例如肠沙门氏菌(Salmonella enterica)、伤寒沙门氏菌(Salmonella typhi)、副伤寒沙门氏菌(Salmonella paratyphi)、肠炎沙门氏 菌(Salmonella enteritidis)、猪霍乱沙门氏菌(Salmonella cholerasuis)和鼠伤寒沙门氏菌(Salmonella typhimurium))、沙雷氏菌属某种(Serratia sp.)(例如粘质沙 雷氏菌(Serratia marcesans)和液化沙雷氏菌(Serratia liquifaciens))、志贺氏菌属 某种(Shigella sp.)(例如痢疾志贺氏菌(Shigella dysenteriae)、福氏志贺氏菌 (Shigella flexneri)、鲍氏志贺氏菌(Shigellaboydii)和宋内志贺氏菌(Shigella sonnei))、葡萄球菌属某种(Staphylococcus sp.)(例如金黄色葡萄球菌、表皮葡萄球菌(Staphylococcus epidermidis)、溶血葡萄球菌(Staphylococcus hemolyticus)、腐生葡萄球菌(Staphylococcus saprophyticus))、链球菌属某种 (Streptococcus sp.)(例如肺炎链球菌(Streptococcus pneumoniae)(例如氯霉素 (chloramphenicol)抗性血清型4肺炎链球菌、壮观霉素(spectinomycin)抗性血 清型6B肺炎链球菌、链霉素(streptomycin)抗性血清型9V肺炎链球菌、红霉 素(erythromycin)抗性血清型14肺炎链球菌、奥普托欣(optochin)抗性血清型 14肺炎链球菌、利福平(rifampicin)抗性血清型18C肺炎链球菌、四环素 (tetracycline)抗性血清型19F肺炎链球菌、青霉素(penicillin)抗性血清型19F 肺炎链球菌和甲氧苄啶(trimethoprim)抗性血清型23F肺炎链球菌、氯霉素抗 性血清型4肺炎链球菌、壮观霉素抗性血清型6B肺炎链球菌、链霉素抗性 血清型9V肺炎链球菌、奥普托欣抗性血清型14肺炎链球菌、利福平抗性血 清型18C肺炎链球菌、青霉素抗性血清型19F肺炎链球菌或甲氧苄啶抗性血 清型23F肺炎链球菌))、无乳链球菌(Streptococcus agalactiae)、变异链球菌(Streptococcus mutans)、化脓链球菌(Streptococcus pyogenes)、A群链球菌 (Group Astreptococci)、化脓链球菌、B群链球菌(Group B streptococci)、无乳 链球菌、C群链球菌(Group C streptococci)、咽峡炎链球菌(Streptococcus anginosus)、类马链球菌(Streptococcus equismilis)、D群链球菌(Group D streptococci)、牛链球菌(Streptococcus bovis)、F群链球菌(Group F streptococci) 和咽峡炎链球菌G群链球菌(Group G streptococci))、小螺菌(Spirillum minus)、 念珠状链杆菌(Streptobacillusmoniliformi)、密螺旋体属某种(Treponema sp.) (例如斑点密螺旋体(Treponemacarateum)、细弱密螺旋体(Treponema petenue)、 苍白密螺旋体(Treponema pallidum)和地方性密螺旋体(Treponema endemicum))、红色毛癣菌(Trichophyton rubrum)、须癣毛癣菌(T. mentagrophytes)、惠普尔养障体(Tropheryma whippelii)、解脲脲原体(Ureaplasma urealyticum)、韦荣氏球菌属某种(Veillonella sp.)、弧菌属某种 (Vibriosp.)(例如霍乱弧菌、副溶血弧菌(Vibrio parahemolyticus)、创伤弧菌、副溶血弧菌、创伤弧菌、溶藻弧菌(Vibrio alginolyticus)、拟态弧菌(Vibrio mimicus)、霍利斯弧菌(Vibrio hollisae)、河流孤菌(Vibrio fluvialis)、麦奇尼科 夫氏弧菌(Vibriometchnikovii)、海鱼弧菌(Vibrio damsela)和弗氏弧菌(Vibrio furnisii))、耶尔森菌属某种(Yersinia sp.)(例如小肠结肠炎耶尔森菌、鼠疫耶尔森菌(Yersinia pestis)和假结核耶尔森菌)以及嗜麦芽黄单胞菌(Xanthomonas maltophilia)。
iii)真菌
在某些示例性实施方案中,微生物是真菌或真菌种类。可以根据所公开 的方法检测的真菌的实例包括但不限于以下任何一种或多种(或其任何组 合):曲霉(Aspergillus)、芽生菌(Blastomyces)、念珠菌(Candidiasis)、球孢子 菌(Coccidiodomycosis)、新型隐球菌(Cryptococcus neoformans)、格特隐球菌(Cryptococcus gatti)、组织胞浆菌属某种(sp.Histoplasma sp.)(例如荚膜组织胞 浆菌(Histoplasma capsulatum))、肺孢子菌属某种(Pneumocystis sp.)(例如耶氏 肺孢子菌(Pneumocystis jirovecii))、葡萄穗霉(Stachybotrys)(例如黑葡萄穗霉(Stachybotryschartarum))、毛霉菌病(Mucroymcosis)、孢子丝菌(Sporothrix)、 眼真菌感染环癣、突脐蠕孢(Exserohilum)、枝孢霉(Cladosporium)。
在某些示例性实施方案中,真菌是酵母。可以根据所公开的方法检测的 酵母的实例包括但不限于以下一种或多种(或其任何组合):曲霉属(例如烟曲 霉(Aspergillusfumigatus)、黄曲霉(Aspergillus flavus)和棒曲霉(Aspergillus clavatus))、隐球菌属某种(Cryptococcus sp.)(例如新型隐球菌、格特隐球菌 (Cryptococcus gattii)、罗伦隐球菌(Cryptococcus laurentii)和浅白隐球菌 (Cryptococcus albidus))、地霉(Geotrichum)属、酵母(Saccharomyces)属、汉逊 酵母(Hansenula)属、念珠菌(Candida)属(例如白色念珠菌(Candida albicans))、克鲁维酵母(Kluyveromyces)属、德巴利酵母(Debaryomyces)属、毕赤酵母 (Pichia)属或它们的组合。在某些示例性实施方案中,真菌是霉菌。示例性霉 菌包括但不限于青霉(Penicillium)属、枝孢霉属、丝衣霉(Byssochlamys)属或 它们的组合。
iv)原生动物
在某些示例性实施方案中,微生物是原生动物。可以根据所公开的方法 和装置检测的原生动物的实例包括但不限于以下任何一种或多种(或其任何 组合):眼虫门(Euglenozoa)、异叶足纲(Heterolobosea)、双滴虫目 (Diplomonadida)、变形虫界(Amoebozoa)、芽囊原虫属(Blastocystic)和顶复亚 门(Apicomplexa)。示例性眼虫门包括但不限于克氏锥虫(Trypanosoma cruzi) (查加斯病(Chagas disease))、布氏冈比亚锥虫(T.brucei gambiense)、布氏罗得 西亚锥虫(T.brucei rhodesiense)、巴西利什曼原虫(Leishmania braziliensis)、婴 儿利什曼原虫(L.infantum)、墨西哥利什曼原虫(L.mexicana)、硕大利什曼原 虫(L.major)、热带利什曼原虫(L.tropica)和杜氏利什曼原虫(L.donovani)。示 例性异叶足纲包括但不限于福氏耐格里变形虫(Naegleriafowleri)。示例性双 滴虫目包括但不限于肠贾第虫(Giardia intestinalis)(兰伯氏贾第虫(G. lamblia)、十二指肠贾第虫(G.duodenalis))。示例性变形虫界包括但不限于卡 氏棘阿米巴虫(Acanthamoeba castellanii)、巴氏阿米巴原虫(Balamuthia madrillaris)、溶组织内阿米巴(Entamoeba histolytica)。示例性芽囊原虫属包括但不限于人芽囊原虫(Blastocystic hominis)。示例性顶复亚门包括但不限于田 鼠巴贝虫(Babesiamicroti)、微小隐孢子虫(Cryptosporidium parvum)、卡晏环 孢子虫(Cyclosporacayetanensis)、恶性疟原虫(Plasmodium falciparum)、间日 疟原虫(P.vivax)、卵形疟原虫(P.ovale)、三日疟原虫(P.malariae)和刚地弓形 虫(Toxoplasma gondii)。
v)寄生虫
在某些示例性实施方案中,微生物是寄生虫。可以根据所公开的方法检 测的寄生虫的实例包括但不限于以下一种或多种(或其任何组合):盘尾丝虫 属(Onchocerca)某种和疟原虫属(Plasmodium)某种。
在某些示例性实施方案中,寄生虫的实例包括但不一定限于克氏锥虫(恰 加斯病)、布氏冈比亚锥虫、布氏罗得西亚锥虫、巴西利什曼原虫、婴儿利什 曼原虫、墨西哥利什曼原虫、硕大利什曼原虫、热带利什曼原虫、杜氏利什 曼原虫、福氏耐格里变形虫、肠贾第虫(兰伯氏贾第虫、十二指肠贾第虫)、 卡氏棘阿米巴虫、巴氏阿米巴原虫、溶组织内阿米巴、人芽囊原虫、田鼠巴 贝虫、微小隐孢子虫、卡晏环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫,或它们的组合。
3.RNA适体
在特定实施方案中,向导是受护航的向导。所谓“受护航的”是指将 CRISPR-Cas系统或复合物或向导递送至细胞内的选定时间或位置,从而在空 间或时间上控制CRISPR-Cas系统或复合物或向导的活性。举例来说,可通 过对适体配体(如细胞表面蛋白或其他局部细胞组分)具有结合亲和力的护航 性RNA适体序列控制3CRISPR-Cas系统或复合物或向导的活性和目的地。 或者,护航性适体可例如对细胞上或细胞中的适体效应子作出反应,所述适 体效应子如瞬时效应子,如在特定时间施加至细胞的外部能源。
受护航的CRISPR-Cas系统或复合物具有向导分子,所述向导分子具有 被设计成改善向导分子的结构、架构、稳定性、基因表达或它们的任何组合 的功能结构。这样的结构可包括适体。
适体是可以例如使用一种称为指数富集的配体系统进化(SELEX;Tuerk C,GoldL:“Systematic evolution of ligands by exponential enrichment:RNA ligands tobacteriophage T4 DNA polymerase.”Science 1990,249:505-510)的技 术进行设计或选择以与其他配体紧密结合的生物分子。核酸适体可例如选自随机序列寡核苷库,它们对大范围的生物医学相关标靶具有高结合亲和力和 特异性,这揭示了适体的广泛治疗实用性(Keefe、Anthony D.、Supriya Pai和 Andrew Ellington."Aptamers as therapeutics."Nature Reviews Drug Discovery 9.7(2010):537-550)。这些特征还揭示了适体作为药物递送媒介物的广泛用途 (Levy-Nissenbaum,Etgar等"Nanotechnology and aptamers:applications in drug delivery."Trends in biotechnology 26.8(2008):442-449;以及Hicke BJ,Stephens AW.“Escort aptamers:a delivery service for diagnosis andtherapy.”J Clin Invest 2000,106:923-928.)。还可构建充当分子开关、通过改变特性来响应问询(que) 的适体,如结合荧光团以模拟绿色荧光蛋白活性的RNA适体(Paige、JeremyS.、Karen Y.Wu和Samie R.Jaffrey."RNA mimics of green fluorescent protein."Science 333.6042(2011):642-646)。先前还已提出适体可以用作靶向的siRNA治疗性递送系统的组分,例如靶向细胞表面蛋白(Zhou,Jiehua和John J.Rossi. "Aptamer-targetedcell-specific RNA interference."Silence 1.1(2010):4)。
因此,在特定实施方案中,例如通过一种或多种适体对向导分子进行修 饰,所述一种或多种适体被设计成改善向导分子的递送,包括递送穿过细胞 膜、到达细胞内隔室或进入细胞核。加上所述一种或多种适体或无所述一种 或多种适体,这样的结构可包括一个或多个部分,以便使向导分子可递送、 可诱导或响应于选定的效应子。因此,本发明包括响应于正常或病理生理条件的向导分子,所述生理条件包括但不限于pH、低氧、O2浓度、温度、蛋 白质浓度、酶浓度、脂质结构、曝光、机械破坏(例如超声波)、磁场、电场或电磁辐射。
在特定实施方案中,RNA适体识别赭曲霉毒素A(OTA)。OTA是由若干 种真菌物种产生的霉菌毒素,所述真菌物种包括赭曲霉(Aspergillus ochraceus)、炭黑曲霉(A.carbonarius)、黑曲霉(A.niger)和纯绿青霉(Penicillium verrucosum)。
在某些示例性实施方案中,掩蔽构建体可以以个别离散体积(下文进一步 定义)固定在固体衬底上并且螯合单个试剂。举例来说,试剂可以是包含染料 的珠粒。当被固定的试剂鳌合时,个别珠粒过于扩散而不能产生可检测信号, 但是从掩蔽构建体释放后能够产生可检测信号,例如在溶液浓缩中通过聚集 或简单增加。在某些示例性实施方案中,固定的掩蔽剂是基于RNA的适体, 所述适体可以在检测到靶分子后被活化的效应蛋白裂解。在其他实施方案中, 固定的掩蔽剂是基于ssDNA的适体,其可在检测到靶分子后被活化的效应蛋 白裂解。
在某些其他示例性实施方案中,掩蔽构建体与溶液中的固定的试剂结合, 从而阻断试剂与溶液中游离的单独标记结合配偶体结合的能力。因此,在对 样品施加洗涤步骤时,可以在不存在靶分子的情况下将标记的结合配偶体从 样品中洗掉。然而,如果效应蛋白被活化,则掩蔽构建体被裂解至足以干扰 掩蔽构建体结合试剂的能力的程度,从而允许标记的结合配偶体与固定的试剂结合。因此,标记的结合配偶体在洗涤步骤后保留,表明样品中存在靶分 子。在某些方面,结合固定的试剂的掩蔽构建体是RNA适体。固定的试剂可以是蛋白质,并且标记的结合配偶体可以是标记的抗体。或者,固定的试剂 可以是链霉亲和素,并且标记的结合配偶体可以是标记的生物素。在上述实 施方案中使用的结合配偶体上的标记可以是本领域已知的任何可检测标记。另外,可以根据本文所描述的总体设计使用其他已知的结合配偶体。
在某些示例性实施方案中,掩蔽构建体可以包含核酶。核酶是具有催化 特性的RNA分子。天然核酶和工程改造核酶两者包含可以被本文所公开的效 应蛋白靶向的RNA或由其组成。可以选择或工程改造核酶以催化产生阴性可 检测信号或防止产生阳性对照信号的反应。在活化的效应蛋白使核酶失活后, 产生阴性对照信号或防止产生阳性可检测信号的反应被移除,从而允许阳性 可检测信号产生。在一个示例性实施方案中,核酶可以催化比色反应,使溶液显示为第一颜色。当核酶失活时,溶液然后变成第二颜色,第二颜色是可 检测阳性信号。Zhao等“Signal amplification of glucosamine-6-phosphate basedon ribozyme glmS,”Biosens Bioelectron.2014;16:337-42描述了核酶如何用于 催化比色反应的实例,并提供如何修饰这样的系统以在本文所公开的实施方 案的情形中工作的实例。或者,核酶当存在时可以产生例如RNA转录物的裂 解产物。因此,阳性可检测信号的检测可以包括检测仅在不存在核酶的情况 下产生的未裂解的RNA转录物。
在某些示例性实施方案中,一种或多种试剂是能够促进产生可检测信号, 如比色、化学发光或荧光信号的蛋白,如酶,所述蛋白被抑制或鳌合使得因 一种或多种RNA适体与蛋白的结合,蛋白无法产生可检测信号。在本文所公 开的效应蛋白活化时,RNA适体被裂解或降解到一个程度即它们不再抑制蛋 白产生可检测信号的能力。在某些示例性实施方案中,适体是凝血酶抑制剂 适体。在某些示例性实施方案中,凝血酶抑制剂适体具有GGGAACAAAGCUGAAGUACUUACCC(SEQ ID NO:414)的序列。当该适体 被裂解时,凝血酶将变得具有活性并且将裂解肽比色或荧光底物。在某些示 例性实施方案中,比色底物是与凝血酶的肽底物共价连接的对硝基苯胺 (pNA)。在被凝血酶裂解后,pNA被释放并变成黄色并且容易被眼睛看到。 在某些示例性实施方案中,荧光底物是可以使用荧光检测器检测的7-氨基-4- 甲基香豆素蓝色荧光团。抑制性适体也可用于辣根过氧化物酶(HRP)、β-半乳 糖苷酶或小牛碱性磷酸酶(CAP),并且在上述一般原理内。
在某些实施方案中,用比色法经由酶抑制性适体的裂解检测RNA酶或 DNA酶活性。将DNA酶或RNA酶活性转化为比色信号的一种潜在模式是 将RNA适体或ssDNA适体的裂解与能够产生比色输出的酶的再活化偶联。 在没有RNA或DNA裂解的情况下,完整的适体将与酶标靶结合并抑制其活 性。该读出系统的优点在于酶提供了另外的扩增步骤:一旦经由附带活性(例 如Cpf1或Cas13a附带活性)从适体释放,比色酶将继续产生比色产物,导致 信号的扩增。
有利地,在某些实施方案中,使用抑制具有比色读出的酶的现有适体。 存在多种具有比色读出的适体/酶对,如凝血酶、蛋白C、中性粒细胞弹性蛋 白酶和枯草杆菌蛋白酶。这些蛋白酶具有基于pNA的比色底物,并且可商购 获得。在某些实施方案中,使用靶向共同比色酶的新型适体。常见且稳健的 酶,如β-半乳糖苷酶、辣根过氧化物酶或小牛肠碱性磷酸酶,可以通过由选 择策略(如SELEX)设计的工程改造适体靶向。这样的策略允许快速选择具有 纳摩尔结合效率的适体,并且可以用于开发用于比色读出的另外的酶/适体 对。
在某些实施方案中,用比色法经由RNA拴系的抑制剂的裂解检测RNA 酶活性。许多常见的比色酶具有竞争性的可逆抑制剂:例如,β-半乳糖苷酶 可被半乳糖抑制。这些抑制剂中许多都很弱,但是它们的效果可以通过局部 浓度的增加来增加。通过将局部浓度的抑制剂与RNA酶活性联系起来,比色酶和抑制剂对可以被工程改造至RNA酶传感器中。基于小分子抑制剂的比色 RNA酶传感器涉及三个组分:比色酶、抑制剂,和与抑制剂和酶共价连接以 将抑制剂拴系在酶上的桥接RNA。在未裂解的构型中,酶被增加的局部浓度 的小分子所抑制;当RNA被裂解时(例如通过Cas13a附带裂解),抑制剂将 被释放并且比色酶将被活化。检测比色偏移的能力提供了一种使得能够在可 见波长中易于使用的检测方法。
在某些实施方案中,如实施例8所述,通过比色法经由G-四链体的形成 和/或活化检测RNA酶活性。DNA中的G四链体可与血红素(铁(III)-原卟啉 IX)复合以形成具有过氧化物酶活性的DNA酶。当提供过氧化物酶底物(例如ABTS:(2,2’-氮杂双[3-乙基苯并噻唑啉-6-磺酸]-二铵盐))时,在过氧化氢存在 下G-四链体-血红素复合物使得底物氧化,底物然后在溶液中形成绿色。G 四链体形成DNA序列的实例是:GGGTAGGGCGGGTTGGGA(SEQ.I.D.No.415)。通过将RNA序列与该DNA适体杂交,G四链体结构的形成将受到限 制。在RNA酶附带活化(例如,C2c2-复合物附带活化)后,RNA钉将被裂解, 从而允许G四链体形成并且与血红素结合。该策略特别有吸引力,因为颜色 形成是酶促的,这意味着除了RNA酶活化之外还存在另外的扩增。
在某些实施方案中,如实施例8所述,通过比色法经由G-四链体的形成 和/或活化检测DNA酶活性。DNA中的G四链体可与血红素(铁(III)-原卟啉 IX)复合以形成具有过氧化物酶活性的DNA酶。当提供过氧化物酶底物(例如 ABTS:(2,2’-氮杂双[3-乙基苯并噻唑啉-6-磺酸]-二铵盐))时,在过氧化氢存在 下G-四链体-血红素复合物使得底物氧化,底物然后在溶液中形成绿色。G 四链体形成DNA序列的实例是:GGGTAGGGCGGGTTGGGA(SEQ.I.D.No.415)。通过将ssDNA序列与该DNA适体杂交,G四链体结构的形成将受到 限制。在DNA酶附带活化(例如,Cpf1-复合物附带活化)后,该DNA钉将被 裂解,从而允许G四链体形成并且与血红素结合。该策略特别有吸引力,因为颜色形成是酶促的,这意味着除了DNA酶活化之外还存在另外的扩增。
在一些实施方案中,核酸检测系统包含RNA适体或DNA适体,所述 RNA适体或DNA适体包含具有酶活性的四链体。在特定实施方案中,酶活 性是过氧化物酶活性。在实施方案中,所述方法、系统和测定可利用荧光团 和猝灭剂作为一种或多种靶分子的指示剂。在另一个实施方案中,所述方法、 系统和测定可利用比色偏移作为一种或多种靶分子的指示剂。靶分子可以是 DNA、RNA或它们的组合。
在某些示例性实施方案中,掩蔽构建体可以以个别离散体积(下文进一步 定义)固定在固体衬底上并且螯合单个试剂。举例来说,试剂可以是包含染料 的珠粒。当被固定的试剂鳌合时,个别珠粒过于扩散而不能产生可检测信号, 但是从掩蔽构建体释放后能够产生可检测信号,例如在溶液浓缩中通过聚集 或简单增加。在某些示例性实施方案中,固定的掩蔽剂是基于RNA的适体或 基于ssDNA的适体,所述适体可以在检测到靶分子后被活化的效应蛋白裂解。
在一个示例性实施方案中,掩蔽构建体包含检测剂,所述检测剂根据检 测剂在溶液中聚集或分散而改变颜色。举例来说,某些纳米颗粒,如胶体金, 当它们从聚集体移动到分散的颗粒时,经历可见的紫色到红色的色移。因此, 在某些示例性实施方案中,这样的检测剂可以通过一种或多种桥分子聚集。 参见例如图43。桥分子的至少一部分包含RNA。在本文所公开的效应蛋白活 化后,桥分子的RNA部分被裂解,允许检测剂分散并导致相应的颜色变化。 参见例如图46。在某些示例性实施方案中,桥分子是RNA分子。在其他实 施方案中,桥分子是可与表现出附带ssDNA活性的Cas蛋白一起使用的ssDNA分子。在某些示例性实施方案中,检测剂是胶体金属。胶体金属材料 可以包括水不溶性金属颗粒或分散在液体、水溶胶或金属溶胶中的金属化合 物。胶体金属可选自周期表中IA、IB、IIB和IIIB族的金属,以及过渡金属, 尤其是VIII族的那些金属。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括以下金属它们的各种氧化态:锂、钠、镁、钾、 钪、钛、钒、铬、锰、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂 和钆。金属优选以离子形式提供,衍生自适当的金属化合物,例如A13+、 Ru3+、Zn2+、Fe3+、Ni2+和Ca2+离子。
当RNA桥(或ssDNA桥)被活化的CRISPR效应子切割时,观察到前述的 色移。在某些示例性实施方案中,颗粒是胶体金属。在某些其他示例性实施 方案中,胶体金属是胶体金。在某些示例性实施方案中,胶体纳米颗粒为15 nm金纳米颗粒(AuNP)。由于胶体金纳米颗粒的独特表面特性,当在溶液中 完全分散时在520nm处观察到最大吸光度,并且肉眼看起来呈红色。在AuNP 聚集时,它们表现出最大吸光度的红移并且颜色看起来更暗,最终作为深紫色聚集体从溶液中沉淀出来。在某些示例性实施方案中,纳米颗粒经修饰而 包括从纳米颗粒表面延伸的DNA接头。个别颗粒通过在RNA的每个末端与 DNA接头的至少一部分杂交的单链RNA(ssRNA)桥连接在一起。因此,纳米 颗粒将形成连接的颗粒和聚集体的网状物,呈现为暗沉淀物。在本文所公开 的CRISPR效应子活化后,ssRNA桥将被裂解,从连接网格释放Au NP并产 生可见的红色。下面列出了示例性DNA接头和RNA桥接序列。DNA接头 末端的硫醇接头可用于与AuNP的表面缀合。可以使用其他形式的缀合。在 某些示例性实施方案中,可以产生两个AuNP群,每个DNA接头一个。这 将有助于促进ssRNA桥以正确取向正确结合。在某些示例性实施方案中,第 一DNA接头通过3’端缀合,而第二DNA接头通过5’端缀合。还可根据本文 提供的本公开设计表现出ssDNA附带活性的CRISPR效应蛋白的类似系统。
表8.
在某些其他示例性实施方案中,掩蔽构建体可以包含可检测标记与其连 接的RNA寡核苷酸和该可检测标记的掩蔽剂。这样的可检测标记/掩蔽剂对 的实例是荧光团和荧光团的猝灭剂。由于荧光团与另一荧光团或非荧光分子 之间形成非荧光复合物,可发生荧光团的猝灭。这种机制称为基态复合物形 成、静态猝灭或接触猝灭。因此,可以设计RNA寡核苷酸,使得荧光团和猝灭剂足够接近以发生接触猝灭。荧光团及其关联猝灭剂是本领域已知的,并 且可由本领域普通技术人员为此目的选择。特定的荧光团/猝灭剂在本发明的 情形中并不重要,只要荧光团/猝灭剂对的选择能确保荧光团的掩蔽。在活化 本文所公开的效应蛋白后,RNA寡核苷酸被裂解,从而切断维持接触猝灭效 应所需的荧光团和猝灭剂之间的接近度。因此,荧光团的检测可用于确定样 品中靶分子的存在。
在某些其他示例性实施方案中,掩蔽构建体可以包含一种或多种金属纳 米颗粒如金颗粒附接至其的一种或多种RNA寡核苷酸。在一些实施方案中, 掩蔽构建体包含由形成闭环的多个RNA寡核苷酸交联的多个金属纳米颗粒。 在一个实施方案中,掩蔽构建体包含由形成闭环的三个RNA寡核苷酸交联的 三个金纳米颗粒。在一些实施方案中,CRISPR效应蛋白裂解RNA寡核苷酸 导致由金属纳米颗粒产生的可检测信号。
在某些其他示例性实施方案中,掩蔽构建体可以包含一种或多种量子点 附接至其的一种或多种RNA寡核苷酸。在一些实施方案中,CRISPR效应蛋 白裂解RNA寡核苷酸导致由量子点产生的可检测信号。
在一个示例性实施方案中,掩蔽构建体可以包含量子点。量子点可具有 附接至表面的多个接头分子。接头分子的至少一部分包含RNA。接头分子在 一端附接至量子点,并沿着接头的长度或在接头的末端附接至一种或多种猝 灭剂,使得猝灭剂保持足够接近以发生量子点的猝灭。接头可以是分支的。 如上所述,量子点/猝灭剂对并不重要,只要量子点/猝灭剂对的选择能确保荧光团的掩蔽。量子点及其关联猝灭剂是本领域已知的,并且可以由本领域普 通技术人员为此目的选择。在本文所公开的效应蛋白活化后,接头分子的 RNA部分被裂解,从而消除了维持猝灭效应所需的量子点与一种或多种猝灭 剂之间的接近度。在某些示例性实施方案中,量子点是链霉亲和素缀合的。 RNA经由生物素接头附接并用序列/5Biosg/UCUCGUACGUUC/3IAbRQSp/ (SEQ ID NO.416)或/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(SEQ ID NO.417) 募集猝灭分子,其中/5Biosg/是生物素标签并且/3lAbRQSp/是爱荷华黑猝灭 剂。在被本文所公开的活化的效应子裂解后,量子点将可见地发荧光。
以类似的方式,荧光能量转移(FRET)可用于产生可检测阳性信号。FRET 是非辐射过程,通过该过程,来自能量激发的荧光团(即“供体荧光团”)的光子 将另一分子(即“受体”)中的电子的能态提升到激发单重态的更高振动水平。供 体荧光团返回基态而不发出该荧光团的荧光特征。受体可以是另一荧光团或 非荧光分子。如果受体是荧光团,则转移的能量作为该荧光团的荧光特征发射。如果受体是非荧光分子,则吸收的能量作为热量而损失。因此,在如本 文所公开的实施方案的情形中,荧光团/猝灭剂对被附接至寡核苷酸分子的供 体荧光团/受体对替换。当完整时,如通过受体发射的荧光或热检测到的,掩 蔽构建体产生第一信号(阴性可检测信号)。在本文所公开的效应蛋白活化后, RNA寡核苷酸被裂解并且FRET被破坏,使得现在检测到供体荧光团的荧光 (阳性可检测信号)。
在某些示例性实施方案中,掩蔽构建体包括使用插入染料,所述插入染 料响应于长RNA裂解为短核苷酸而改变它们的吸光度。存在多种这样的染 料。举例来说,焦宁-Y将与RNA复合并形成在572nm处具有吸光度的复合 物。RNA的裂解导致吸光度损失和颜色变化。亚甲蓝可以以类似的方式使用, RNA裂解后亚甲蓝在688nm处的吸光度变化。因此,在某些示例性实施方 案中,掩蔽构建体包含RNA和插入染料复合物,所述复合物在本文所公开的效应蛋白裂解RNA后改变吸光度。
在某些示例性实施方案中,掩蔽构建体可包含用于HCR反应的引发剂。 参见例如Dirks和Pierce.PNAS 101,15275-15728(2004)。HCR反应利用两种 发夹物质中的势能。当具有与发夹之一上的相应区域互补的部分的单链引发 剂被释放到先前稳定的混合物中时,它打开一种物质的发夹。该过程进而暴 露出打开其他物质的发夹的单链区域。该过程进而暴露出与原始引发剂相同的单链区域。所产生的链反应可导致形成带切口的双螺旋,所述带切口的双 螺旋生长直至发夹供应耗尽。所得产物的检测可在凝胶上或用比色法进行。 示例性比色检测方法包括例如在Lu等“Ultra-sensitive colorimetric assaysystem based on the hybridization chain reaction-triggered enzyme cascadeamplification ACS Appl Mater Interfaces,2017,9(1):167-175,Wang等“An enzyme-free colorimetric assay using hybridization chain reaction amplification andsplit aptamers”Analyst 2015,150,7657-7662以及Song等“Non-covalent fluorescentlabeling of hairpin DNA probe coupled with hybridization chain reaction forsensitive DNA detection.”Applied Spectroscopy,70(4):686-694 (2016)中公开的那些。
在某些示例性实施方案中,掩蔽构建体可包含HCR引发剂序列和可裂解 结构元件,如环或发夹,其防止引发剂引发HCR反应。在活化的CRISPR效 应蛋白裂解结构元件后,接着释放引发剂以触发HCR反应,检测到HCR反 应表明样品中存在一种或多种标靶。在某些示例性实施方案中,掩蔽构建体 包含具有RNA环的发夹。当活化的CRISPR效应蛋白切割RNA环时,可以 释放引发剂以触发HCR反应。
标靶扩增
在某些示例性实施方案中,在活化CRISPR效应蛋白之前可以扩增靶 RNA和/或DNA。可以使用任何适合的RNA或DNA扩增技术。在某些示例 性实施方案中,RNA或DNA扩增是等温扩增。在某些示例性实施方案中, 等温扩增可以是基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、 环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)或 切口酶扩增反应(NEAR)。在某些示例性实施方案中,可以使用非等温扩增方 法,包括但不限于PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链 反应(LCR)或分枝扩增方法(RAM)。
在某些示例性实施方案中,RNA或DNA扩增是NASBA,其通过序列特 异性反向引物对靶RNA的逆转录起始以建立RNA/DNA双链体。RNA酶H 然后用于使RNA模板降解,从而允许含有启动子,例如T7启动子的正向引 物结合互补链并起始互补链的延长,产生双链DNA产物。RNA聚合酶启动 子介导的DNA模板转录然后建立靶RNA序列的拷贝。重要的是,新靶RNA中的每一个可以由向导RNA检测,由此进一步增强测定的灵敏度。靶RNA 由向导RNA结合然后使得CRISPR效应蛋白活化并且方法如上文所概述继续 进行。NASBA反应具有能够在适度等温条件下,例如在约41℃下继续进行 的额外优点,使其适合于用于在实地和远离临床实验室的早期和直接检测而 部署的系统和装置。
在某些其他示例性实施方案中,重组酶聚合酶扩增(RPA)反应可以用于扩 增靶核酸。RPA反应采用能够使序列特异性引物与双链体DNA中的同源序 列配对的重组酶。如果存在靶DNA,那么起始DNA扩增并且不需要其他样 品操作,例如热循环或化学熔融。整个RPA扩增系统呈干燥的配方而稳定并 且无需冷冻即可以安全地运输。RPA反应还可以在等温温度下进行,其中最 佳反应温度为37-42℃。序列特异性引物被设计成扩增包含有待检测的靶核酸 序列的序列。在某些示例性实施方案中,将RNA聚合酶启动子,例如T7启 动子添加至引物中的一个。这得到包含靶序列和RNA聚合酶启动子的扩增的 双链DNA产物。在RPA反应之后或期间,添加RNA聚合酶,这将从双链 DNA模板产生RNA。然后继而可以由CRISPR效应系统检测扩增的靶RNA。 以这种方式,可以使用本文所公开的实施方案检测靶DNA。RPA反应还可以 用于扩增靶RNA。首先使用逆转录酶使靶RNA转变成cDNA,继之以第二 链DNA合成,届时RPA反应如上文所概述继续进行。
在本发明的一个实施方案中,切口酶是CRISPR蛋白。因此,将缺口引 入dsDNA可以是可编程的并且是序列特异性的。图112描绘了本发明的一个实施方案,该实施方案以设计成靶向dsDNA标靶的相反链的两个向导开始。 根据本发明,切口酶可以是Cpf1、C2c1、Cas9或裂解或经工程改造以裂解 DNA双链体的单链的任何直系同源物或CRISPR蛋白。然后可以通过聚合酶 使带切口的链延伸。在一个实施方案中,选择切口的位置,使得聚合酶使链 的延伸朝向切口位点之间的靶双链体DNA的中心部分。在某些实施方案中, 反应中包括引物,所述引物能够与延伸链杂交,然后进一步进行引物的聚合 酶延伸以再生两个dsDNA片段:包括第一链Cpf1向导位点或第一链Cpf1 向导位点和第二链Cpf1向导位点两者的第一dsDNA,以及包括第二链Cpf1 向导位点或第一链Cprf向导位点和第二链Cprf向导位点两者的第二dsDNA。 这些片段继续在循环反应中被切刻并延伸,所述循环反应以指数方式扩增切 刻位点之间标靶的区域。
扩增可以是等温的,并针对温度进行选择。在一个实施方案中,扩增以 37度快速进行。在其他实施方案中,可以通过选择可在不同温度下操作的聚 合酶(例如Bsu、Bst、Phi29、klenow片段等)来选择等温扩增的温度。
因此,切刻等温扩增技术使用具有固定序列优先级的切刻酶(例如,在切 刻酶扩增反应或NEAR中),这需要使原始dsDNA标靶变性,以允许引物退 火和延伸,从而将切刻底物添加至标靶末端,而使用CRISPR切口酶可以经 由向导RNA对切刻位点进行编程,这意味着变性步骤不是必需的,从而使整 个反应真正实现等温。这也简化了反应,因为添加切口底物的这些引物与反应后期所使用的引物不同,这意味着NEAR需要两个引物组(即4个引物), 而Cpf1切口扩增仅需要一个引物组(即两个引物)。这使得切口Cpf1扩增变 得更简单,更容易操作,而无需使用复杂的仪器进行变性,然后冷却至等温 温度。
因此,在某些示例性实施方案中,本文所公开的系统可以包括扩增试剂。 本文描述了适用于核酸扩增的不同组分或试剂。举例来说,如本文所描述的 扩增试剂可以包括缓冲剂,例如Tris缓冲剂。Tris缓冲剂可以在适于所需应用或用途的任何浓度下使用,例如包括但不限于1mM、2mM、3mM、4mM、 5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、 14mM、15mM、25mM、50mM、75mM、1M等浓度。本领域技术人员将 能够确定用于本发明的缓冲剂(例如Tris)的适当浓度。
扩增反应,例如PCR中可以包括盐,例如氯化镁(MgCl2)、氯化钾(KCl) 或氯化钠(NaCl),以改善核酸片段的扩增。尽管盐浓度将取决于特定反应和 应用,但在一些实施方案中,特定大小的核酸片段在特定盐浓度下可能产生 最佳结果。较大产物可能需要改变的盐浓度,通常是较低盐,以产生所需结 果,而较小产物的扩增在较高盐浓度下可能产生较佳结果。本领域技术人员 将了解,盐的存在和/或浓度以及盐浓度的改变可以改变生物或化学反应的严 格度,并且因此可以使用为本发明和如本文所描述的反应提供适当条件的任 何盐。
生物或化学反应的其他组分可以包括细胞溶解组分以使细胞破开或溶解 以供分析其中的物质。细胞溶解组分可以包括但不限于洗涤剂;如上文所描 述的盐,例如NaCl、KCl、硫酸铵[(NH4)2SO4];或其他。可以适于本发明的 洗涤剂可以包括Triton X-100、十二烷基硫酸钠(SDS)、CHAPS(3-[(3-胆酰胺 基丙基)二甲铵基]-1-丙磺酸盐)、乙基三甲基溴化铵、壬基苯氧基聚乙氧基乙 醇(NP-40)。洗涤剂的浓度可以取决于特定应用,并且在一些情况下可以特定 针对反应。扩增反应可以包括在适于本发明的任何浓度下使用的dNTP和核 酸引物,例如包括但不限于100nM、150nM、200nM、250nM、300nM、 350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、 750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、 50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、 250mM、300mM、350mM、400mM、450mM、500mM等浓度。同样地, 根据本发明适用的聚合酶可以是本领域中已知并且适用于本发明的任何特异 性或一般聚合酶,包括Taq聚合酶、Q5聚合酶等。
在一些实施方案中,如本文所描述的扩增试剂可以适用于热启动扩增中。 热启动扩增在一些实施方案中可以有益于减少或消除衔接分子或寡核苷酸的二聚,或以其他方式防止不合需要的扩增产物或人造物并且获得所需产物的 最佳扩增。用于扩增中的本文所描述的许多组分也可以用于热启动扩增中。 在一些实施方案中,视情况而定,适用于热启动扩增的试剂或组分可以替代 组成组分中的一种或多种而使用。举例来说,可以使用在特定温度或其他反 应条件下展现所需活性的聚合酶或其他试剂。在一些实施方案中,可以使用 经过设计或优化以用于热启动扩增中的试剂,例如,在转座之后或在达到特定温度之后可以使聚合酶活化。此类聚合酶可以基于抗体或基于适体。如本 文所描述的聚合酶在本领域中是已知的。此类试剂的实例可以包括但不限于 热启动聚合酶、热启动dNTP和光笼化dNTP。此类试剂在本领域中是已知和 可得的。本领域技术人员将能够确定适于个别试剂的最佳温度。
核酸扩增可以使用特定热循环机器或设备进行,并且可以在单个反应中 或成批进行,以便可以同时进行任何所需数目的反应。在一些实施方案中, 扩增可以使用微流体或机器人装置进行,或可以使用温度的手动改变来进行 以达成所需扩增。在一些实施方案中,可以进行优化以获得用于特定应用或 材料的最佳反应条件。本领域技术人员将了解并且能够优化反应条件以获得足够的扩增。
在某些实施方案中,使用本发明的方法或系统的DNA检测需要在检测 之前(扩增的)DNA转录成RNA。
显然,本发明的检测方法可以涉及核酸扩增和检测程序的各种组合。待 检测的核酸可以是任何天然存在的或合成的核酸,包括但不限于DNA和 RNA,核酸可以通过任何合适的方法来扩增以提供可以检测的中间产物。对 中间产物的检测可以通过任何合适的方法来进行,所述方法包括但不限于结 合并活化CRISPR蛋白,所述CRISPR蛋白通过直接或附带活性产生可检测 信号部分。
在某些示例性实施方案中,可引入进一步放大可检测阳性信号的进一步 修改。举例来说,活化的CRISPR效应蛋白附带活化可用于产生二级标靶或 另外的向导序列,或两者。在一个示例性实施方案中,反应溶液将包含以高 浓度加标的二级标靶。二级标靶可不同于一级标靶(即,测定被设计用于检测 的标靶),并且在某些情况下,在所有反应体积中可为共同的。举例来说,用 于二级标靶的二级向导序列可通过二级结构特征如带有RNA环的发夹加以 保护,并且无法结合第二标靶或CRISPR效应蛋白。活化的CRISPR效应蛋 白裂解保护基(即,在与溶液中的一种或多种一级标靶形成复合物后活化), 并在溶液中与游离CRISPR效应蛋白形成复合物,并从加标的第二标靶中活 化。在某些其他示例性实施方案中,在针对二级标靶序列的二级向导序列的情况下,使用类似的概念。二级标靶序列可以受到二级标靶上的结构特征或 保护基的保护。然后使保护基裂解脱离二级标靶允许额外的CRISPR效应蛋 白/二级向导序列/二级靶复合物形成。在又一个示例性实施方案中,所述一种或多种一级标靶对CRISPR效应蛋白的活化可用于裂解受保护的或环化的引 物,然后将所述引物释放以在编码二级向导序列、二级靶序列或两者的模板 上进行等温扩增反应,如本文所公开的那些。对此扩增模板的后续转录将产 生更多的二级向导序列和/或二级靶序列,随后进行额外的CRISPR效应蛋白 附带活化。
RNA向导的Cpf1的可编程性、特异性和附带活性也使其成为用于核酸 非特异性裂解的理想可切换核酸酶。在一个实施方案中,将Cpf1系统工程改 造以提供并利用RNA的附带非特异性裂解。在另一个实施方案中,将Cpf1 系统工程改造以提供并利用ssDNA的附带非特异性裂解。因此,工程改造的 Cpf1系统提供了用于核酸检测和转录组操纵的平台。Cpf1被开发用作哺乳动 物转录物敲减和结合的工具。当因序列特异性的靶向DNA结合而活化时, Cpf1能够对RNA和ssDNA进行稳健的附带裂解。
RNA向导的C2c1的可编程性、特异性和附带活性也使其成为用于核酸 非特异性裂解的理想可切换核酸酶。在一个实施方案中,将C2c1系统工程改 造以提供并利用RNA的附带非特异性裂解。在另一个实施方案中,将C2c1 系统工程改造以提供并利用ssDNA的附带非特异性裂解。因此,工程改造的 C2c1系统提供了用于核酸检测和转录组操纵以及诱导细胞死亡的平台。C2c1 被开发用作哺乳动物转录物敲减和结合的工具。当因序列特异性的靶向DNA 结合而活化时,C2c1能够对RNA和ssDNA进行稳健的附带裂解。
靶RNA/DNA富集
在某些示例性实施方案中,可在检测或扩增靶RNA或DNA之前首先富 集靶RNA或DNA。在某些示例性实施方案中,这种富集可以通过由CRISPR 效应系统结合靶核酸来实现。
目前的靶特异性富集方案在用探针杂交之前需要单链核酸。在各种优点 中,本发明的实施方案可以跳过该步骤并且能够直接靶向双链DNA(部分或 完全双链)。此外,本文所公开的实施方案是酶驱动的靶向方法,该方法提供 允许等温富集的更快的动力学和更容易的工作流程。在某些示例性实施方案 中,富集可以发生在低至20℃-37℃的温度。在某些示例性实施方案中,在 单个测定中使用针对不同靶核酸的向导RNA组,允许检测多个标靶和/或单 个标靶的多个变体。
在某些示例性实施方案中,死亡CRISPR效应蛋白可以结合在溶液中的 靶核酸并且随后从所述溶液中分离。举例来说,可以使用特异性地结合死亡 CRISPR效应蛋白的抗体或其他分子(如适体)从溶液中分离与靶核酸结合的 死亡CRISPR效应蛋白。
在其他示例性实施方案中,死亡CRISPR效应蛋白可以与固体衬底结合。 固定的衬底可以指适合于或可以被修饰以适合多肽或多核苷酸的附接的任何 材料。可能的衬底包括但不限于玻璃和改性的功能化玻璃、塑料(包括丙烯酸树脂、聚苯乙烯及苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、 聚氨酯、TeflonTM等)、多糖、尼龙或硝化纤维素、陶瓷、树脂、二氧化硅 或二氧化硅基材料(包括硅和改性硅)、碳、金属、无机玻璃、塑料、光纤纤 维束、以及各种其他聚合物。在一些实施方案中,固体支持物包含适合于以 有序图案固定分子的图案化表面。在某些实施方案中,图案化表面是指固体 支持物的暴露层中或上的不同区域的排列。在一些实施方案中,固体支持物 在表面中包含孔阵列或凹陷。固体支持物的组成和几何形状可随其用途而变 化。在一些实施方案中,固体支持物是平面结构,如载玻片、芯片、微芯片和/或阵列。这样,衬底的表面可以是平面层的形式。在一些实施方案中,固 体支持物包含流通池的一个或多个表面。如本文所用,术语“流通池”指包含 一种或多种流体试剂可以流动跨越的固体表面的腔室。举例来说,在Bentley 等Nature 456:53-59(2008);WO 04/0918497;U.S.7,057,026;WO 91/06678; WO 07/123744;US 7,329,492;US 7,211,414;US 7,315,019;U.S.7,405,281 和US 2008/0108082中描述了可以容易地在本公开的方法中使用的示例性流 通池和相关的流体系统和检测平台。在一些实施方案中,固体支持物或其表 面是非平面的,如管或容器的内表面或外表面。在一些实施方案中,固体支 持物包括微球或珠粒。“微球”、“珠粒”、“颗粒”旨在表示在固体衬底的上下文中,意指由各种材料制成的小的离散颗粒,所述材料包括但不限于塑料、 陶瓷、玻璃和聚苯乙烯。在某些实施方案中,微球是磁性的微球或珠粒。或 者或另外地,珠粒可以是多孔的。珠粒的尺寸范围从纳米(例如100nm)到毫 米(例如1mm)。
然后可以将含有或怀疑含有靶核酸的样品暴露于衬底以允许靶核酸与结 合的死亡CRISPR效应蛋白结合。然后可以洗去非靶分子。在某些示例性实 施方案中,然后可以使用本文所公开的方法从CRISPR效应蛋白/向导RNA 复合物释放靶核酸用于进一步检测。在某些示例性实施方案中,可以首先如 本文所述扩增靶核酸。
在某些示例性实施方案中,可以用结合标签标记CRISPR效应子。在某 些示例性实施方案中,可以对CRISPR效应子进行化学标签化。举例来说, CRISPR效应子可以是化学生物素化的。在另一个示例性实施方案中,可以 通过向CRISPR效应子添加编码融合体的另外的序列来产生融合体。这样的 融合的一个实例是AviTagTM,它采用在独特的15个氨基酸肽标签上的单个生物素的高度靶向酶促缀合。在某些实施方案中,可以用捕获标签标记CRISPR效应子,所述捕获标签如但不限于GST、Myc、血凝素(HA)、绿色 荧光蛋白(GFP)、flag、His标签、TAP标签和Fc标签。无论是融合体、化学标签还是捕获标签,结合标签一旦已经结合靶核酸,就可以用于拉下CRISPR 效应系统或用于将CRISPR效应系统固定在固体衬底上。
在某些示例性实施方案中,可以用结合标签标记向导RNA。在某些示例 性实施方案中,可以使用引入一种或多种生物素化核苷酸(如生物素化的尿嘧 啶)的体外转录(IVT)标记整个向导RNA。在一些实施方案中,可以将生物素 以化学或酶方式添加至向导RNA,例如将一个或多个生物素基团添加至向导 RNA的3’端。结合标签可用于在结合发生后拉下向导RNA/靶核酸复合物, 例如,通过将向导RNA/靶核酸暴露于链霉亲和素包被的固体衬底。
在特定实施方案中,固体衬底可以是流通池。在某些实施方案中,流通 池可以是用于检测测试样品中分析物的存在或量的装置。流通池装置可以具 有固定的试剂构件,所述固定的试剂构件对可能包含在测试样品中的分析物 产生电或光学可检测的响应。
因此,在某些示例性实施方案中,工程改造或非天然存在的CRISPR效 应子可用于富集目的。在一个实施方案中,修饰可以包括效应蛋白的一个或 多个氨基酸残基的突变。一个或多个突变可以在效应蛋白的一个或多个催化 活性结构域中。效应蛋白与缺乏所述一个或多个突变的效应蛋白相比可具有 降低或消除的核酸酶活性。效应蛋白可能不向导目标靶基因座处RNA链的裂解。在优选的实施方案中,一个或多个突变可包括两个突变。在优选的实施 方案中,一个或多个氨基酸残基在C2c2效应蛋白(例如工程改造或非天然存在的效应蛋白或C2c2)中被修饰。在特定的实施方案中,一个或多个修饰的 突变氨基酸残基是C2c2中对应于R597、H602、R1278和H1283如突变R597A、 H602A、R1278A和H1283A(参考Lsh C2c2氨基酸)的那些中的一个或多个, 或Lsh C2c2直系同源物中相应的氨基酸残基。
在特定的实施方案中,一个或多个修饰的突变氨基酸残基是C2c2中对应 于K2、K39、V40、E479、L514、V518、N524、G534、K535、E580、L597、 V602、D630、F676、L709、I713、R717(HEPN)、N718、H722(HEPN)、E773、 P823、V828、I879、Y880、F884、Y997、L1001、F1009、L1013、Y1093、 L1099、L1111、Y1114、L1203、D1222、Y1244、L1250、L1253、K1261、 I1334、L1355、L1359、R1362、Y1366、E1371、R1372、D1373、R1509(HEPN)、 H1514(HEPN)、Y1543、D1544、K1546、K1548、V1551、I1558(根据C2c2 共同编号)的那些中的一个或多个。在某些实施方案中,一个或多个修饰的突 变的氨基酸残基是C2c2中对应于R717和R1509的那些中的一个或多个。在 某些实施方案中,一个或多个修饰的突变氨基酸残基是C2c2中对应于K2、K39、K535、K1261、R1362、R1372、K1546和K1548的那些中的一个或多 个。在某些实施方案中,所述突变导致蛋白质具有改变或修饰的活性。在某些实施方案中,所述突变导致蛋白质具有降低的活性,如降低的特异性。在 某些实施方案中,所述突变导致蛋白质不具有催化活性(即“死亡的”C2c2)。 在一个实施方案中,所述氨基酸残基对应于Lsh C2c2氨基酸残基,或来自不 同物种的C2c2蛋白的相应氨基酸残基。可以促进这些步骤的装置。在一些实施方案中,为了减小Cas13b效应子和一个或多个功能结构域的融合蛋白的大 小,可以截短Cas13b效应子的C端,同时仍保持其RNA结合功能。举例来 说,至少20个氨基酸、至少50个氨基酸、至少80个氨基酸、或至少100个 氨基酸、或至少150个氨基酸、或至少200个氨基酸、或至少250个氨基酸、 或至少300个氨基酸、或至少350个氨基酸、或至多120个氨基酸、或至多140个氨基酸、或至多160个氨基酸、或至多180个氨基酸、或至多200个 氨基酸、或至多250个氨基酸、或至多300个氨基酸、或至多350个氨基酸、 或最多400个氨基酸可以在Cas13b效应子的C端截短。Cas13b截短的具体 实例包括C端Δ984-1090、C端Δ1026-1090和C端Δ1053-1090、C端 Δ934-1090、C端Δ884-1090、C端Δ834-1090、C端Δ784-1090和C端 Δ734-1090,其中氨基酸位置对应于普雷沃菌属某种P5-125 Cas13b蛋白的氨 基酸位置。
因此,在一些示例性实施方案中,CRISPR系统可包含无催化活性的 CRISPR效应蛋白。在特定实施方案中,无催化活性的CRISPR效应蛋白可以 是无催化活性的C2c2。
上述富集系统也可用于耗尽某些核酸的样品。举例来说,可以设计向导 RNA以结合非靶RNA以从样品中去除非靶RNA。在一个示例性实施方案中, 可以设计向导RNA以结合确实携带特定核酸变异的核酸。举例来说,在给定 样品中可以预期更高拷贝数的非变体核酸。因此,本文所公开的实施方案可 用于从样品中去除非变体核酸,以提高检测CRISPR效应系统可检测给定样品中的靶变体序列的效率。
诊断装置
本文所描述的系统可以在诊断装置上体现。可以使用许多衬底和配置。 装置可能能够在装置内限定多个个别离散体积。如本文所用,“个别离散体积” 是指离散空间,如容器(container)、接收器(receptacle)或可以由防止和/或抑制 靶分子迁移的特性限定的其他限定体积或空间,例如由物理特性如壁,例如 孔、管的壁或液滴的表面(其可以是不可渗透的或半渗透的)限定的体积或空 间,或者由如化学、扩散速率限制、电磁或光照射或它们的任何组合的其他手段限定的可以在限定空间内包含样品的体积或空间。个别离散体积可以通 过分子标签(如核酸条形码)鉴别。“扩散速率限制”(例如扩散限定的体积)是指 由于扩散约束有效地限定了空间或体积而仅某些分子或反应可以接近的空 间,如同其中扩散将限制靶分子从一个流到另一个流的迁移的两个平行层流的情况。“化学”限定的体积或空间是指由于其化学或分子特性(如大小)而仅某 些靶分子可以存在的空间,例如凝胶珠粒例如通过珠粒的表面电荷、基质尺 寸或可允许选择可以进入珠粒内部的种类的其他物理特性,可以排除某些种 类进入而不排除其他种类进入。“电磁”限定的体积或空间是指其中靶分子或其支持物的电磁特性(如电荷或磁性)可用于限定空间中的某些区域(如在磁场内或直接在磁铁上捕获磁性粒子)的空间。“光学”限定的体积是指可以通过用 可见光、紫外线、红外线或其他波长的光照射它来限定的任何空间区域,使 得仅可以标记该限定空间或体积内的靶分子。使用非壁或半透性离散体积的 一个优点是一些试剂,如缓冲液、化学活化剂或其他剂可以通过离散体积,而其他材料如靶分子可以保持在离散体积或空间内。通常,离散体积将包括 在允许标记的条件适合于用可转位核酸标识符标记靶分子的流体介质(例如, 水溶液、油、缓冲液和/或能够支持细胞生长的培养基)。在所公开的方法中有用的示例性离散体积或空间包括液滴(例如,微流体液滴和/或乳液液滴)、水 凝胶珠或其他聚合物结构(例如聚乙二醇二丙烯酸酯珠或琼脂糖珠)、组织载 玻片(例如,具有由化学、光学或物理手段限定的特定区域、体积或空间的固 定福尔马林石蜡包埋的组织载玻片)、具有由以有序阵列或随机图案的沉积试 剂限定的区域的显微镜载玻片、管(如离心管、微量离心管、试管、比色杯、 锥形管等)、瓶子(如玻璃瓶、塑料瓶、陶瓷瓶、锥形瓶、闪烁瓶等)、孔(如板 中的孔)、板、移液管或移液管尖端等。在某些实施方案中,隔室是油包水乳液中的水性液滴。在特定实施方案中,本文所描述的需要精确或均匀体积的 任何应用、方法或系统可以使用声学液体分配器。
在某些示例性实施方案中,个别离散体积被限定在固体衬底上。在某些 实施方案中,个别离散体积是微孔。
在某些示例性实施方案中,装置包括在其上可以限定多个斑点的柔性材 料衬底。适用于诊断和生物传感的柔性衬底材料在本领域中是已知的。柔性 衬底材料可以由植物衍生的纤维(如纤维素纤维)制成,或者可以由柔性聚合 物(如柔性聚酯薄膜和其他聚合物类型)制成。在各个限定的斑点内,将本 文所描述的系统的试剂应用于个别斑点。各个斑点可以含有相同的试剂,除 了不同的向导RNA或向导RNA组,或者在适用的情况下,可以含有不同的检测适体以一次筛选多种标靶。因此,本文的系统和装置可以能够筛选来自 多个来源的样品(例如来自不同个体的多个临床样品)中相同标靶或有限数量 的标靶的存在,或者筛选单个样品的等分试样(或来自相同来源的多个样品) 中样品中多种不同标靶的存在。在某些示例性实施方案中,将本文所描述的 系统的元件冷冻干燥到纸或布衬底上。Pardee等Cell.2016,165(5):1255-66和 Pardee等Cell.2014,159(4):950-54中公开了可用于某些示例性装置的示例性 基于柔性材料的衬底。在Shevkoplyas等的题为“Paperbased diagnostic test”的国际专利申请公布号WO/2013/071301,Siegel等的题为“Paper-based microfluidic systems”的美国专利申请公布号2011/0111517,和Shafiee等 “Paper and Flexible Substrates as Materials for Biosensing Platforms toDetect Multiple Biotargets”Scientific Reports 5:8719(2015)中公开了与生物流体(包括 血液)一起使用的合适的基于柔性材料的衬底。Wang等“Flexible Substrate-BasedDevices for Point-of-Care Diagnostics”Cell 34(11):909-21(2016) 公开了另外的柔性基材料,包括适用于可穿戴诊断装置的那些。另外的柔性 基材料可包括硝化纤维素、聚碳酸酯、甲基乙基纤维素、聚偏二氟乙烯 (PVDF)、聚苯乙烯或玻璃(参见例如US20120238008)。在某些实施方案中, 离散体积被疏水表面,如但不限于蜡、光致抗蚀剂或固体墨水分开。
在特定实施方案中,柔性材料衬底是纸衬底或基于柔性聚合物的衬底。
在一些实施方案中,可以提供用作传感器或指示器的剂量计或徽章,使 得将对某些微生物或其他试剂的暴露通知给穿戴者。举例来说,本文所描述 的系统可用于检测特定病原体。同样地,上文公开的基于适体的实施方案可 用于检测多肽以及特定适体可结合的其他剂(如化学剂)两者。这样的装置可 用于监视士兵或其他军事人员,以及临床医生、研究人员、医院工作人员等, 以便尽快提供与暴露于潜在危险因素有关的信息,例如用于生物或化学战剂检测。在其他实施方案中,这种监视徽章可用于防止免疫受损患者、烧伤患者、接受化疗的患者、儿童或老年人暴露于危险微生物或病原体。
可使用本文所描述的系统和装置进行分析的样品来源包括受试者的生物 样品或环境样品。环境样品可包括表面或流体。生物样品可包括但不限于唾 液、血液、血浆、血清、粪便、尿液、痰液、粘液、淋巴液、滑液、脊髓液、 脑脊髓液、皮肤或粘膜的拭子,或它们的组合。在一个示例性实施方案中, 环境样品取自固体表面,如用于制备食物或其他敏感组合物和材料的表面。
在其他示例性实施方案中,本文所描述的系统的元件可以放置在一次性 使用的衬底上,如用于擦拭表面或样品流体的拭子或布。举例来说,该系统 可用于通过擦拭食品(如水果或蔬菜)的表面来测试食物上病原体的存在。类 似地,一次性使用的衬底可用于擦拭其他表面以检测某些微生物或试剂,如 用于安全性筛选。一次性使用的衬底也可以在取证中具有应用,其中CRISPR 系统被设计用于检测,例如鉴别可用于鉴别嫌疑人的DNA SNP或某些组织 或细胞标志物以确定样品中存在的生物物质的类型。同样地,一次性使用的衬底可用于从患者收集样品-如来自口腔的唾液样品-或皮肤的拭子。在其他 实施方案中,可以从肉制品中取出样品或拭子,以检测在肉制品上或肉制品 内是否存在污染物。
食品、临床、工业和其他环境设置需要近实时微生物诊断(参见例如Lu TK,BowersJ和Koeris MS.,Trends Biotechnol.2013年6月;31(6):325-7)。在某 些实施方案中,本发明用于使用对病原体(例如空肠弯曲杆菌(Campylobacter jejuni)、产气荚膜梭菌(Clostridium perfringens)、沙门氏菌属某种(Salmonella spp.)、大肠杆菌、蜡样芽孢杆菌(Bacillus cereus)、单核细胞增多性李斯特菌 (Listeria monocytogenes)、志贺氏菌属某种(Shigella spp.)、金黄色葡萄球菌、 葡萄球菌性肠炎(Staphylococcalenteritis)、链球菌属、霍乱弧菌(Vibrio cholerae)、副溶血弧菌(Vibrioparahaemolyticus)、创伤弧菌(Vibrio vulnificus)、 小肠结肠炎耶尔森菌(Yersiniaenterocolitica)和假结核耶尔森菌(Yersinia pseudotuberculosis)、布鲁氏菌属某种(Brucella spp.)、溃疡棒杆菌 (Corynebacterium ulcerans)、贝氏柯克斯体(Coxiellaburnetii)或类志贺邻单胞菌 (Plesiomonas shigelloides))具有特异性的向导RNA进行食源性病原体的快速检测。
在一些实施方案中,每一个别离散体积可包括如本文所描述的核酸扩增 试剂。这样,靶分子可以是靶DNA,并且个别离散体积可还包括结合靶DNA 且包含如本文所描述的RNA聚合酶启动子的引物。
在某些实施方案中,装置是流动条或包括流动条。举例来说,侧流条允 许通过颜色检测RNA酶(例如C2c2)。修饰RNA报告子以具有附接至5’端的 第一分子(如例如FITC)和附接至3’端的第二分子(如例如生物素)(反之亦然)。 侧流条被设计成具有两条捕获线,在第一线处杂交的抗第一分子(例如抗 FITC)抗体和在第二下游线处杂交的抗第二分子(例如抗生物素)抗体。当反应 沿着条带向下流动时,未裂解的报告子将在第一捕获线处结合抗第一分子抗体,而裂解的报告子将释放第二分子并允许在第二捕获线处结合第二分子。第二分子夹心抗体,例如与纳米颗粒(如金纳米颗粒)缀合,将在第一线或 第二线处结合任何第二分子并导致强读出/信号(例如颜色)。随着更多的报告 子被裂解,更多的信号将在第二捕获线处累积,并且在第一线处将出现更少 的信号。在某些方面,本发明涉及如本文所描述的流动条用于检测核酸或多 肽的用途。在某些方面,本发明涉及一种用如本文所定义的流动条检测核酸 或多肽的方法,例如(侧)流测试或(侧)流免疫色谱测定。
在某些示例性实施方案中,装置是产生和/或合并不同液滴的微流体装置 (即个别离散体积)。举例来说,可以形成包含待筛选的样品的第一组液滴, 并且形成包含本文所描述的系统的元件的第二组液滴。然后合并第一组液滴 和第二组液滴,然后在合并的液滴组上执行如本文所描述的诊断方法。本文 所公开的微流体装置可以是基于硅酮的芯片并且可以使用多种技术制造,所 述技术包括但不限于热压花、弹性体模制、注射成型、LIGA、软光刻、硅制造和相关的薄膜加工技术。用于制造微流体装置的合适材料包括但不限于环烯烃共聚物(COC)、聚碳酸酯、聚(二甲基硅氧烷)(PDMS)和聚(甲基丙烯酸酯) (PMMA)。在一个实施方案中,PDMS中的软光刻可用于制备微流体装置。 举例来说,可以使用限定基板内流动通道、阀门和过滤器的位置的光刻制造 模具。将衬底材料倒入模具中并使其凝固以形成印模。然后将印模密封到固 体支持物(如但不限于玻璃)上。由于一些聚合物如PDMS吸收一些蛋白质并且可以抑制某些生物过程的疏水性质,钝化剂可以是必要的(Schoffner等Nucleic Acids Research,1996,24:375-379)。合适的钝化剂是本领域已知的,包 括但不限于硅烷、聚对二甲苯、正十二烷基-b-D-甘露糖苷(DDM)、普朗尼克、Tween-20、其他类似表面活性剂、聚乙二醇(PEG)、白蛋白、胶原蛋白和其他 类似的蛋白质和多肽。
在某些示例性实施方案中,系统和/或装置可以适于转换为流式细胞术读 数或在单个实验中允许对数百万个细胞进行所有灵敏和定量测量,并改进现 有的基于流动的方法,如PrimeFlow测定。在某些示例性实施方案中,可以将细胞投到含有未聚合的凝胶单体的液滴中,然后将其投到适于通过流式细 胞术分析的单细胞液滴中。可以将包含荧光可检测标记的检测构建体投到包 含未聚合的凝胶单体的液滴中。在凝胶单体聚合时以在液滴内形成珠粒。因 为凝胶聚合是通过自由基形成而进行的,荧光报告子变得与凝胶共价结合。 可以进一步修饰检测构建体以包含接头,如胺。可在凝胶形成后添加猝灭剂, 并经由接头与报告构建体结合。因此,当报告子被CRISPR效应蛋白裂解时, 猝灭剂不与凝胶结合并且自由扩散。可以通过偶联检测构建体至杂交链反应 (HCR引发剂)来实现液滴中信号的放大。可以将DNA/RNA杂合发夹并入可 包含具有RNA酶敏感结构域的发夹环的凝胶中。通过保护具有RNA酶敏感 结构域的发夹环内的链置换支点,可以在CRISPR效应蛋白裂解发夹环后选择性地去保护HCR引发剂。在经由支点介导的链置换对HCR引发剂进行去 保护后,可以将荧光HCR单体洗涤到凝胶中以使得信号放大,其中引发剂被 去保护。
可以在本发明的情形中使用的微流体装置的实例描述于Hour等“DirectDetection and drug-resistance profiling of bacteremias using inertialmicrofluidics”Lap Chip.15(10):2297-2307(2016)中。
在本文所描述的系统中,可以进一步结合到评估临床环境外的受试者的 生物样品(如生物流体)的可穿戴医疗装置中,并将该测定的结果远程报告给 医疗护理专业人员可访问的中央服务器。该装置可以具有自动采样血液的能 力,例如在Peeters等的题为“Needle-free Blood Draw”的美国专利申请公布号 2015/0342509和Andrew Conrad的题为“Nanoparticle Phoresis”的美国专利申 请公布号2015/0065821中描述的装置。
在某些示例性实施方案中,装置可包括个别孔,如微孔板孔。微孔板孔 的尺寸可以是标准6、24、96、384、1536、33456或9600尺寸孔的尺寸。在 某些示例性实施方案中,可以将本文所描述的系统的元件冷冻干燥并在分配 和使用之前施加到孔的表面。
本文所公开的装置还可包括入口和出口端口,或开口,其又可连接至阀、 管、通道、腔室和注射器和/或泵用于将流体引入装置和从装置中抽出流体。 这些装置可以连接至允许流体在微流体装置内定向移动的流体流动致动器。 示例性致动器包括但不限于注射泵、机械致动的再循环泵、电渗泵、灯泡、 波纹管、隔膜或旨在迫使流体运动的气泡。在某些示例性实施方案中,装置 连接至具有一起工作以使流体移动通过装置的可编程阀的控制器。在某些示 例性实施方案中,装置连接至控制器,所述控制器在下文进一步详细讨论。这些装置可通过终止于金属销中以插入装置上的入口端口的管道连接至流动 致动器、控制器和样品加载装置。
如本文所示的系统的元件当冷冻干燥时是稳定的,因此也考虑不需要支 持装置的实施方案,即系统可被应用到支持本文所公开的反应并且允许用于 检测来自表面或溶液的阳性可检测信号的任何表面或流体。除了冷冻干燥之 外,系统还可以稳定储存并以粒化形式使用。可用于形成合适的粒化形式的 聚合物是本领域已知的。
在某些实施方案中,CRISPR效应蛋白与装置中的各个离散体积结合。 各个离散体积可包含对不同靶分子具有特异性的不同向导RNA。在某些实施 方案中,将样品暴露于包含超过一个离散体积的固体衬底,所述离散体积各自包含对靶分子具有特异性的向导RNA。不受理论束缚,每种向导RNA将 从样品中捕获其靶分子,并且不需要将样品分到单独的测定中。因此,可以 保留有价值的样品。效应蛋白可以是包含亲和标签的融合蛋白。亲和标签是 本领域众所周知的(例如,HA标签、Myc标签、Flag标签、His标签、生物 素)。效应蛋白可以与生物素分子连接,并且离散体积可以包含链霉亲和素。在其他实施方案中,CRISPR效应蛋白由对效应蛋白具有特异性的抗体结合。 先前已经描述了结合CRISPR酶的方法(参见,例如US20140356867A1)。
本文所公开的装置还可以包括本领域中已知的用于通过其他方法分析样 品的定点护理(point of care,POC)装置的元件。参见,例如St John和Price, “Existing andEmerging Technologies for Point-of-Care Testing”(Clin Biochem Rev.2014年8月;35(3):155-167)。
本发明可与无线实验室芯片(LOC)诊断传感器系统一起使用(参见例如, 美国专利号9470699“Diagnostic radio frequency identification sensors andapplications thereof”)。在某些实施方案中,本发明在由无线装置(例如手机、 个人数字助理(PDA)、平板电脑)控制的LOC中执行,并且将结果报告给所述 装置。
射频识别(RFID)标签系统包括RFID标签,所述RFID标签发送数据以供 RFID读取器(也称为询问机)接收。在典型的RFID系统中,个别物体(例如, 商店商品)配备有包含应答器的相对小的标签。应答器具有被赋予独特的电子 产品代码的存储器芯片。RFID读取器通过使用通信协议发出激活标签内的应 答器的信号。因此,RFID读取器能够读取和写入标签的数据。另外,RFID 标签读取器根据RFID标签系统应用处理数据。目前,存在无源和有源型RFID 标签。无源型RFID标签不包含内部电源,而是由从RFID读取器接收的射频 信号供电。或者,有源型RFID标签包含内部电源,这使有源型RFID标签具 有更大的传输范围和存储容量。无源标签与有源标签的使用取决于特定应用。
芯片实验室技术在科学文献中有很充分的描述,由多个微流体通道、输 入或化学孔组成。孔中的反应可以使用射频识别(RFID)标签技术来测量,因 为来自RFID电子芯片的导电引线可以直接连接至每个测试孔。天线可以印 刷或安装在电子芯片的另一层中或直接印刷或安装在装置的背面。此外,引 线、天线和电子芯片可以嵌入LOC芯片中,从而防止电极或电子器件的短路。由于LOC允许复杂的样品分离和分析,因此该技术允许LOC测试独立于复 杂或昂贵的读取器完成。而是可以使用如蜂窝电话或PDA的简单无线装置。 在一个实施方案中,无线装置还控制微流体通道的分离和控制,以进行更复杂的LOC分析。在一个实施方案中,LED和其他电子测量或感测装置包括 在LOC-RFID芯片中。不受理论束缚,这种技术是一次性的,允许在实验室 外进行需要分离和混合的复杂的测试。
在优选的实施方案中,LOC可以是微流体装置。LOC可以是无源芯片, 其中芯片通过无线装置供电和控制。在某些实施方案中,LOC包括用于保持 试剂的微流体通道和用于引入样品的通道。在某些实施方案中,来自无线装 置的信号将功率传递给LOC并激活样品和测定试剂的混合。具体地,在本发明的情况下,系统可包括掩蔽剂、CRISPR效应蛋白和对靶分子具有特异性 的向导RNA。在激活LOC后,微流体装置可以混合样品和测定试剂。在混合后,传感器检测信号并将结果发送到无线装置。在某些实施方案中,去掩 蔽剂是导电RNA分子。导电RNA分子可以附接到导电材料上。导电分子可以是导电纳米颗粒、导电蛋白、附接在蛋白质或乳胶上的金属颗粒或其他导 电珠粒。在某些实施方案中,如果使用DNA或RNA,则导电分子可以直接 附接到匹配的DNA或RNA链。可以在传感器上检测导电分子的释放。该测 定可以是一步过程。
由于可以精确地测量表面区域的电导率,因此可以在一次性无线RFID 电测定中获得定量结果。此外,测试区域可以非常小,允许在给定区域中进 行更多测试,因此节省了成本。在某些实施方案中,使用各自与不同的CRISPR 效应蛋白结合的单独的传感器和固定在传感器上的向导RNA来检测多个靶 分子。不受理论束缚,可以通过无线装置区分不同传感器的激活。
除了本文所描述的导电方法之外,可以使用依赖于RFID或蓝牙作为用 于一次性RFID测定的基础低成本通信和电力平台的其他方法。举例来说, 可以使用光学装置以评估给定靶分子的存在和水平。在某些实施方案中,光 学传感器检测荧光掩蔽剂的去掩蔽。
在某些实施方案中,本发明的装置可包括用于诊断性读取测定的手持便 携式装置(参见例如Vashist等,Commercial Smartphone-Based Devices and SmartApplications for Personalized Healthcare Monitoring and Management,Diagnostics 2014,4(3),104-128;mReader from Mobile Assay;和Holomic RapidDiagnostic Test Reader)。
如本文所指出的,某些实施方案允许通过比色变化的检测,当在POC情 境下和或在获得更复杂的检测设备以读出信号可能受限的资源贫乏的环境中 使用实施方案时,这些实施方案具有某些附带的益处。然而,本文所公开的 便携式实施方案还可以与能够检测可见光范围之外的信号的手持式分光光度 计结合。Das等“Ultra-portable,wirelesssmartphone spectrophotometer for rapid,non-destructive testing of fruitripeness.”Nature Scientific Reports.2016,6:32504, DOI:10.1038/srep32504描述了可以与本发明结合使用的手持式分光光度计装 置的实例。最后,在利用基于量子点的掩蔽构建体的某些实施方案中,由于量子点提供的接近完全的量子产率,可以成功地使用手持UV光或其他合适 的装置来检测信号。
用于检测样品中的靶核酸的方法
本文还提供了一种用于检测样品中的靶核酸的方法,所述方法包括将样 品或样品组分配到一个或多个个别离散体积中,所述个别离散体积包括如本 文所描述的CRISPR系统;在足以允许一种或多种向导RNA与一种或多种靶分子结合的条件下孵育所述样品或样品组;经由所述一种或多种向导RNA与 所述一种或多种靶分子的结合来活化所述CRISPR效应蛋白,其中活化所述 CRISPR效应蛋白引起包含四链体的RNA适体的修饰,使得所述四链体的酶 活性被灭活;以及检测所述酶活性,其中检测到低于阈值指示所述样品中一 种或多种靶分子的存在。
在某些示例性实施方案中,靶分子可以是如本文其他地方所描述的靶 DNA。在某些示例性实施方案中,所述方法可还包括将靶DNA与包含如本 文其他地方所描述的RNA聚合酶位点的引物结合。
在某些示例性实施方案中,所述方法可还包括扩增如本文其他地方所描 述的样品RNA或触发RNA。在一些实施方案中,RNA的扩增包括如本文所 描述的通过NASBA进行的扩增。在一些实施方案中,RNA的扩增包括如本文所描述的通过RPA进行的扩增。
在一些实施方案中,所述样品可以是生物样品或环境样品。环境样品可 包括但不一定限于食物样品(新鲜水果或蔬菜、肉)、饮料样品、纸表面、织 物表面、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、 盐水样品、暴露于大气或其他气体样品,或它们的组合。举例来说,可拭抹 由包括但不限于金属、木材、塑料、橡胶等的任何材料制成的家用/商业/工业 表面并测试污染物。可针对病原性细菌或寄生虫或者其他微生物的存在测试土壤样品,用于环境目的和/或用于人、动物或植物疾病测试。可评估如淡水 样品、废水样品或盐水样品的水样品的清洁度和安全性和/或可饮用性,以检 测例如微小隐孢子虫(Cryptosporidium parvum)、兰伯氏贾第虫(Giardia lamblia) 或其他微生物污染的存在。在其他实施方案中,生物样品可获自以下来源: 包括但不限于组织样品、唾液、血液、血浆、血清、粪便、尿液、痰液、粘液、淋巴、滑液、脑脊髓液、腹水、胸腔积液、血清肿、脓液,或皮肤或粘 膜表面的拭子。在一些特定实施方案中,环境样品或生物样品可以是粗样品 和/或在应用方法之前一种或多种靶分子可能未从样品纯化或扩增。微生物的 鉴别可适用于许多应用和/或为许多应用所需,并且因此可根据本发明使用本 领域技术人员认为适当的来自任何来源的任何类型的样品。
生物样品是获自以下任何活生物体、由其排泄或分泌的任何固体或流体 样品,所述活生物体包括但不限于单细胞生物体,如细菌、酵母、原生动物 和阿米巴虫等;多细胞生物体(如植物或动物,包括来自健康或表观健康人受 试者或受有待诊断或研究的疾患或疾病影响的人患者的样品,所述疾患或疾病如受病原性微生物,如病原性细菌或病毒感染)。举例来说,生物样品可以 是获自以下的生物流体:例如血液、血浆、血清、尿液、粪便、痰液、粘液、 淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液 或玻璃体液,或任何身体分泌物、渗出物、渗出液(例如获自脓肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节或受如类风湿性关节炎、 骨关节炎、痛风或化脓性关节炎等疾病影响的关节)的流体,或皮肤或粘膜表 面的拭子。
样品还可以是获自任何器官或组织的样品(包括活检或尸检样本,如肿瘤 活检体),或可包括细胞(无论是原代细胞还是培养的细胞)或由任何细胞、组 织或器官调节的培养基。示例性样品包括但不限于细胞、细胞溶解产物、血 液涂片、细胞离心制剂、细胞学涂片、体液(例如血液、血浆、血清、唾液、 痰液、尿液、支气管肺泡灌洗液、精液等)、组织活检体(例如肿瘤活检体)、 细针抽吸液,和/或组织切片(例如冷冻组织切片和/或石蜡包埋组织切片)。在 其他实例中,样品包括循环肿瘤细胞(其可由细胞表面标志物鉴别)。在特定实例中,样品直接使用(例如新鲜或冷冻的),或可在使用前例如通过固定(例 如使用福尔马林)和/或包埋于蜡中(如福尔马林固定石蜡包埋(FFPE)组织样品) 来操作。将了解,可利用从受试者获得组织的任何方法,并且所用方法的选 择将取决于各种因素,如组织类型、受试者年龄或从业者可用的程序。用于 获得此类样品的标准技术在本领域中是可用的。参见例如Schluger等,J.Exp.Med.176:1327-33(1992);Bigby等,Am.Rev.Respir.Dis.133:515-18(1986); Kovacs等,NEJM 318:589-93(1988);以及Ognibene等,Am.Rev.Respir.Dis.129:929-32(1984)。
在特定实施方案中,生物样品可以是血液、血浆、血清、尿液、粪便、 痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊 髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液(例如获自脓 肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节或受如类 风湿性关节炎、骨关节炎、痛风或化脓性关节炎等疾病影响的关节)的流体, 或皮肤或粘膜表面的拭子。
在特定实施方案中,环境样品可获自食物样品、纸表面、织物、金属表 面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品,或 它们的组合。
在一些实施方案中,可使用对如本文所描述的靶序列具有特异性并且结 合至所述靶序列的向导RNA检测一种或多种鉴别的靶序列。本发明的系统和 方法甚至可区分在不同微生物种类当中存在的单核苷酸多态性,并且因此根 据本发明的多种向导RNA的使用可进一步扩展或改善可用于区分种类的靶 序列的数目。举例来说,在一些实施方案中,一种或多种向导RNA可在种、 属、族、目、类、门、界或表型或它们的组合上区分微生物。
在一些实施方案中,如本文其他地方所述,一种或多种向导RNA可被设 计成检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。
在一些实施方案中,向导RNA可被设计成结合至一种或多种对疾病状态 具诊断性的靶分子。如本文其他地方所述,疾病状态可以是感染、器官疾病、 血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或 分娩相关疾病、遗传性疾病或环境获得性疾病。
在一些实施方案中,向导RNA可被设计成结合至无细胞核酸。
在一些实施方案中,本发明提供了一种用于检测样品中的靶核酸的方法, 所述方法包括使样品与如本文所描述的核酸检测系统接触以及将所述接触的 样品应用于如本文所描述的侧流免疫色谱测定。
蛋白质的检测
除了检测核酸之外,本文所公开的系统、装置和方法通过掺入特定配置 的多肽检测适体还可以适于检测多肽(或其他分子)。多肽检测适体不同于上 面所讨论的掩蔽构建体适体。首先,适体被设计成特异性地结合一种或多种 靶分子。在一个示例性实施方案中,靶分子是靶多肽。在另一个示例性实施 方案中,靶分子是靶化学化合物,如靶治疗性分子。用于设计和选择对给定 标靶具有特异性的适体的方法,如SELEX,是本领域已知的。除了对给定标 靶的特异性之外,适体还被进一步设计成并入RNA聚合酶启动子结合位点。在某些示例性实施方案中,RNA聚合酶启动子是T7启动子。在将适体结合 至标靶之前,RNA聚合酶位点不能被RNA聚合酶接近或以其他方式识别。然而,适体被配置成使得在标靶结合后,适体的结构经历构象变化,使得RNA 聚合酶启动子随后暴露。RNA聚合酶启动子下游的适体序列充当用于通过 RNA聚合酶产生触发RNA寡核苷酸的模板。因此,适体的模板部分可以进一步并入识别给定适体及其标靶的条形码或其他识别序列。然后可以设计如 上文所描述的向导RNA以识别这些特异性触发寡核苷酸序列。向导RNA与 触发寡核苷酸的结合活化CRISPR效应蛋白,CRISPR效应蛋白继续使掩蔽构 建体失活并产生如前文所描述的阳性可检测信号。
因此,在某些示例性实施方案中,本文所公开的方法包括另外的步骤: 将样品或样品组分配到一组个别离散体积中,每一个别离散体积包含肽检测 适体、CRISPR效应蛋白、一种或多种向导RNA、掩蔽构建体,以及在足以允许检测适体与一种或多种靶分子结合的条件下孵育样品或样品组,其中适 体与相应标靶的结合导致RNA聚合酶启动子结合位点的暴露,使得通过RNA 聚合酶与RNA聚合酶启动子结合位点的结合启动触发RNA的合成。
在另一个示例性实施方案中,适体的结合可以在适体与靶多肽结合后暴 露引物结合位点。举例来说,适体可以暴露RPA引物结合位点。因此,引物 的添加或包含接着将进入扩增反应,如上文概述的RPA反应。
在某些示例性实施方案中,适体可以是构象转换适体,其在结合目标标 靶后可以改变二级结构并暴露单链DNA的新区域。在某些示例性实施方案 中,单链DNA的这些新区域可以用作连接的底物,延伸适体并产生可以使 用本文所公开的实施方案特异性地检测的更长的ssDNA分子。适体设计可以 进一步与三元复合物结合用于检测低表位标靶,如葡萄糖(Yang等2015:http://pubs.acs.org/doi/abs/10.1021/acs.analchem.5b01634)。示例性构象转换适 体和相应的向导RNA(crRNA)显示在下文中。
表9.
凝血酶适体 (SEQ.I.D.No.186)
凝血酶连接探针 (SEQ.I.D.No.187)
凝血酶RPA正向1引物 (SEQ.I.D.No.188)
凝血酶RPA正向2引物 (SEQ.I.D.No.189)
凝血酶RPA反向1引物 (SEQ.I.D.No.190)
凝血酶crRNA 1 (SEQ.I.D.No.191)
凝血酶crRNA 2 (SEQ.I.D.No.192)
凝血酶crRNA 3 (SEQ.I.D.No.193)
PTK7全长扩增子对照物 (SEQ.I.D.No.194)
PTK7适体 (SEQ.I.D.No.195)
PTK7连接探针 (SEQ.I.D.No.196)
PTK7 RPA正向1引物 (SEQ.I.D.No.197)
PTK7 RPA反向1引物 (SEQ.I.D.No.198)
PTK7 crRNA 1 (SEQ.I.D.No.199)
PTK7 crRNA 2 (SEQ.I.D.No.200)
PTK7 crRNA 3 (SEQ.I.D.No.201)
示例性方法和测定
测定平台的低成本和适应性适用于许多应用,包括(i)一般RNA/DNA定 量,(ii)快速、多元化RNA/DNA表达检测,以及(iii)临床样品与环境样品中 靶核酸、肽的灵敏检测。另外,本文所公开的系统可以适应于生物设置,例 如细胞内转录物的检测。给出本文所描述的CRISPR效应子的高度特异性质, 有可能追踪活细胞中转录物或疾病相关突变的等位基因特异性表达。
在某些示例性实施方案中,将对单个标靶具有特异性的单向导序列放置 于单独的体积中。每一体积然后可以接受不同样品或相同样品的等分试样。 在某些示例性实施方案中,可以将各自针对单独标靶的多个向导序列放置于 单个孔中以使得在不同孔中可以筛选多个标靶。为了在单个体积中检测多个 向导RNA,在某些示例性实施方案中,可以使用具有不同特异性的多种效应蛋白。举例来说,可以使用具有不同序列特异性的不同直系同源物。举例来 说,一种直系同源物可以优先切割A,而其他直系同源物优先切割C、G、 U/T。因此,可产生全部是单核苷酸或包含单核苷酸的实质部分的掩蔽构建体, 每个掩蔽构建体具有可在不同波长下检测到的不同荧光团。以这种方式,在 单个个别离散体积中可以筛选至多四种不同标靶。在某些示例性实施方案中, 可使用来自相同类别的CRISPR效应蛋白的不同直系同源物,如两个Cas13a 直系同源物、两个Cas13b直系同源物或两个Cas13c直系同源物。图67示出 了各种Cas13蛋白的核苷酸偏好。在某些其他示例性实施方案中,可使用具有不同核苷酸编辑偏好的不同直系同源物,如Cas13a和Cas13b直系同源物, 或Cas13a和Cas13c直系同源物,或Cas13b直系同源物和Cas13c直系同源 物等。在某些实施例实施方案中,使用具有聚U偏好的Cas13蛋白和具有聚 A偏好的Cas13蛋白。在某些实施例实施方案中,具有聚U偏好的Cas13b 蛋白是中间普雷沃菌(Prevotella intermedia)Cas13,而具有聚A偏好的Cas13 蛋白是普雷沃菌属某种MA2106 Cas13b蛋白(PsmCas13b)。在某些实施例实 施方案中,具有聚U偏好的Cas13蛋白是韦德纤毛菌Cas13a(LwaCas13a)蛋 白,而具有聚A偏好的Cas13蛋白是普雷沃菌属某种MA2106 Cas13b蛋白。在某些示例性实施方案中,具有聚U偏好的Cas13蛋白是犬咬二氧化碳嗜纤 维菌Cas13b蛋白(CcaCas13b)。
除了单碱基编辑偏好之外,还可以基于Cas13直系同源物的其他基序切 割偏好来设计另外的检测构建体。举例来说,Cas13直系同源物可以优先切 割二核苷酸序列、三核苷酸序列或包含4个、5个、6个、7个、8个、9个 或10个核苷酸基序的更复杂的基序。因此,使用本文所公开的实施方案的多 重测定的上限主要受到可区分可检测标记的数目的限制。用于鉴别这样的基序的示例性方法在以下工作实施例中进一步公开。
如本文所展示,CRISPR效应系统能够检测低至渺摩尔浓度的靶分子。 参见例如图13、图14、图19、图22和下文所描述的工作实施例。归因于所 述系统的灵敏度,需要快速和灵敏检测的许多应用可以得益于本文所公开的 实施方案,并且预期处于本发明的范围内。示例性测定和应用在下文进一步详细描述。
基于rRNA序列的检测
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于区 分样品中的多个微生物种类。在某些示例性实施方案中,鉴别可以基于核糖 体RNA序列,包括16S、23S和5S亚单位。鉴别相关rRNA序列的方法在美国专利申请公布号2017/0029872中公开。在某些示例性实施方案中,一组 向导RNA可以被设计成由对于每个种类或株系独特的可变区来区分每个种 类。向导RNA还可以被设计成靶向在属、族、目、类、门或界的水平或它们 的组合上区分微生物的RNA基因。在使用扩增的某些示例性实施方案中,一 组扩增引物可以被设计成侧接核糖体RNA序列的恒定区并且向导RNA被设 计成由可变内区来区分每个种类。在某些示例性实施方案中,引物和向导 RNA可以分别被设计成16S亚单位中的保守区和可变区。同样可以使用跨越 种类或种类的子组,例如RecA基因家族RNA聚合酶β亚单位独特可变的其 他基因或基因组区域。其他适合的系统发生标志和其鉴别方法在例如Wu等arXiv:1307.8690[q-bio.GN]中论述。
在某些示例性实施方案中,方法或诊断被设计成同时跨越多个系统发生 和/或表型水平筛选微生物。举例来说,方法或诊断可以包括使用多个具有不 同向导RNA的CRISPR系统。第一组向导RNA可以区分例如分枝杆菌、革 兰氏阳性细菌和革兰氏阴性细菌。这些一般类别甚至可以进一步细分。举例来说,可以设计向导RNA并且用于区分革兰氏阴性细菌内的肠道菌和非肠道 菌的方法或诊断中。第二组向导RNA可以被设计成在属或种的水平上区分微 生物。因此,可以产生鉴别所有分枝杆菌、革兰氏阳性、革兰氏阴性(进一步 分成肠道菌和非肠道菌)的矩阵,其中在给定样品中鉴别的细菌种类的每个属 属于那些类别之一。前述内容仅用于示例性目的。还涵盖用于归类其他微生 物类型的其他方式并且将遵循上文所描述的一般结构。
抗药性筛选
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于筛 选所关注的微生物基因,例如抗生素和/或抗病毒抗性基因。向导RNA可以 被设计成区分所关注的已知基因。然后可以使用本文所公开的用于检测此类 基因的实施方案筛选样品,包括临床样品。在POC下筛选抗药性的能力将在 选择适当治疗方案中具有巨大的效益。在某些示例性实施方案中,抗生素抗性基因是碳青霉烯酶(carbapenemase),包括KPC、NDM1、CTX-M15、OXA-48。 其他抗生素抗性基因是已知的并且可以在例如综合抗生素抗性数据库(Comprehensive Antibiotic Resistance Database)(Jia等“CARD 2017:expansion andmodel-centric curation of the Comprehensive Antibiotic Resistance Database.”Nucleic Acids Research,45,D566-573)中找到。
病毒唑(ribavirin)是针对许多RNA病毒的有效抗病毒剂。若干临床上重 要的病毒已经演变出病毒唑抗性,包括口蹄疫病毒doi:10.1128/JVI.03594-13; 脊髓灰质炎病毒(Pfeifer和Kirkegaard.PNAS,100(12):7289-7294,2003);以及丙型肝炎病毒(Pfeiffer和Kirkegaard,J.Virol.79(4):2346-2355,2005)。许多其 他持久性RNA病毒,例如肝炎和HIV,已经演变出对现有抗病毒药物的抗性:乙型肝炎病毒(拉米夫定(lamivudine)、替诺福韦(tenofovir)、恩替卡韦 (entecavir))doi:10/1002/hep22900;丙型肝炎病毒(特拉匹韦(telaprevir)、 BILN2061、ITMN-191、SCh6、波普瑞韦(boceprevir)、AG-021541、ACH-806)doi:10.1002/hep.22549;以及HIV(许多抗药性突变)hivb.standford.edu。本文 所公开的实施方案尤其可以用于检测此类变体。
除抗药性以外,存在许多可以用本文所公开的实施方案检测的临床上相 关的突变,例如LCMV中的持久性对急性感染(doi:10.1073/pnas.1019304108), 和增加的埃博拉感染力(Diehl等Cell.2016,167(4):1088-1098。
如本文别处所描述,可以通过在gRNA中引入合成错配来区分密切相关 的微生物种类(例如在给定的靶序列中仅具有单核苷酸差异)。
组覆盖方法(Set Cover Approach)
在特定实施方案中,设计一组向导RNA,其可以鉴别例如一组规定微生 物内的所有微生物种类。在某些示例性实施方案中,可以将如本文所描述的 产生向导RNA的方法与以引用的方式并入本文中的WO 2017/040316中公开 的方法相比较。如WO 2017040316中所描述,组覆盖解决方案可以鉴别覆盖整个靶序列或一组靶序列,例如一组基因组序列所需的最小数目的靶序列探 针或向导RNA。组覆盖方法先前已经用于鉴别引物和/或微阵列探针,通常 在20个至50个碱基对的范围内。参见例如Pearson等, cs.virginia.edu/~robins/papers/primers_dam11_final.pdf.;Jabado等Nucleic Acids Res.2006 34(22):6605-11;Jabado等Nucleic Acids Res.2008,36(1):e3 doi10.1093/nar/gkm1106;Duitama等Nucleic Acids Res.2009,37(8):2483-2492; Phillippy等BMCBioinformatics.2009,10:293doi:10.1186/1471-2105-10-293。然而,此类方法一般涉及将每个引物/探针处理成k-mer以及搜索精确匹配或 允许使用后缀阵列搜索不精确匹配。另外,方法一般采用二元方法以通过选 择引物或探针以使得每个输入序列仅需要由一个引物或探针结合并且这个结 合沿着序列的位置是无关的来检测杂交。替代性方法可以将靶基因组分成预定义窗口并且在二元方法下将每个窗口有效处理成单独的输入序列-即,其 确定给定的探针或向导RNA是否在每个窗口内结合并且是否需要所有窗口 都由某个探针或向导RNA结合。有效地,这些方法将组覆盖问题中“通用” 的每个元件处理成整个输入序列或输入序列的预定义窗口,并且如果探针或 向导RNA的起点在元件内结合,那么每个元件被视为“覆盖的”。这些方法限制了允许不同探针或向导RNA设计覆盖给定的靶序列的流动性。
相比之下,本文所公开的实施方案涉及检测更长的探针或向导RNA长 度,例如在70bp至200bp的范围内,其适合于杂交体选择测序。另外,可 以应用本文WO 2017/040316所公开的方法以采用能够定义探针或向导RNA 组的泛靶序列方法,所述探针或向导RNA组可以鉴别和促进大型和/或可变 靶序列组中所有种类和/或株系序列的检测测序。举例来说,本文所公开的方法可以用于在单个测定中鉴别给定病毒或多个不同病毒的所有变体。此外, 本文所公开的方法将组覆盖问题中“通用”的每个元件处理成靶序列的核苷 酸,并且每个元件被视为“覆盖的”,只要探针或向导RNA结合至包括元件的 靶基因组的某个区段即可。这些类型的组覆盖方法可以替代先前方法的二元 方法使用,本文所公开的方法将探针或向导RNA可以如何杂交至靶序列较好 地建模。胜过仅询问给定的向导RNA序列是否结合至给定的窗口,此类方法 可以用于检测杂交模式-即,在给定的探针或向导RNA结合至一个或多个靶序列的情况下-然后从那些杂交模式确定覆盖靶序列组至足以能够从样 品富集并且对任何和所有靶序列进行测序的程度所需的最小数目的探针或向 导RNA。这些杂交模式可以通过定义某些参数来确定,所述参数使损失功能 降至最低,从而能够以允许参数对于每个种类有变化,例如以反映每个种类的多样性的方式,以及以使用组覆盖解决方案的简单应用,例如在探针或向 导RNA设计情形中先前应用的那些无法达成的计算有效方式鉴别最小探针 或向导RNA组。
检测多个转录物丰度的能力可以允许产生指示特定表型的独特微生物标 识。各种机器学习技术可以用于导出基因标识。因此,CRISPR系统的向导 RNA可以用于鉴别和/或定量由基因标识定义的生物标志的相对水平以检测 某些表型。在某些示例性实施方案中,基因标识指示对抗生素的易感性、对 抗生素的抗性,或它们的组合。
在本发明的一个方面,方法包括检测一种或多种病原体。以这种方式, 可以获得个别微生物对受试者的感染之间的区别。在一些实施方案中,此种 区别能够由临床医师检测或诊断特定疾病,例如疾病的不同变体。优选地, 病原体序列是病原体的基因组或其片段。方法还可以包括确定病原体的演变。 确定病原体的演变可以包括鉴别病原体突变,例如核苷酸缺失、核苷酸插入、核苷酸取代。在后者当中,存在非同义、同义和非编码取代。突变在爆发期 间更频繁地是非同义的。方法还可以包括确定如上文所描述而分析的两个病原体序列之间的取代率。突变是有害的还是甚至适应性的将需要功能性分析,然而,非同义突变率表明这种流行病的持续进展可能为病原体适应提供机会, 强调了快速遏制的需要。因此,方法还可以包括评价病毒适应的风险,其中 确定非同义突变的数目(Gire等,Science 345,1369,2014)。
监测微生物爆发
在一些实施方案中,如本文所描述的CRISPR系统或其使用方法可以用 于确定病原体爆发的演变。方法可以包括检测来自一个或多个受试者的多个 样品的一个或多个靶序列,其中靶序列是来自引起爆发的微生物的序列。此 种方法还可以包括确定病原体传播的模式,或由病原体引起的疾病爆发中所涉及的机制。
病原体传播的模式可以包括从病原体的天然储库的持续新传播或在从天 然储库的单个传播之后受试者与受试者之间的传播(例如人与人之间的传 播),或两种的混合情况。在一个实施方案中,病原体传播可以是细菌或病毒 传播,在此种情况下,靶序列优选地是微生物基因组或其片段。在一个实施 方案中,病原体传播的模式是病原体传播的早期模式,即,在病原体爆发开 始时。在爆发开始时确定病原体传播的模式增加了在最早可能的时间阻止爆发的可能性,从而降低本地和国际蔓延的可能性。
确定病原体传播的模式可以包括根据本文所描述的方法检测病原体序 列。确定病原体传播的模式还可以包括检测受试者之间的病原体序列的共享 宿主内变异以及确定共享宿主内变异是否显示时序模式。所观测的宿主内和 宿主间变异中的模式提供了关于传播和流行病学的重要见解(Gire等,2014)。
显示时序模式的在受试者之间的共享宿主内变异的检测是受试者之间 (特别是人之间)的传播链路的指示,这是因为其可以由来自多个来源的受试 者感染(超感染)、样品污染重现性突变(在存在或不存在平衡选择以加强突变 的情况下)或在传播链中较早由突变产生的略有分歧病毒的共传播来解释 (Park等,Cell 161(7):1516-1526,2015)。受试者之间的共享宿主内变异的检测 可以包括位于共同单核苷酸多态性(SNP)位置处的宿主内变体的检测。位于共 同(SNP)位置处的宿主内变体的阳性检测指示超感染和污染作为关于宿主内变体的主要解释。超感染和污染可以在作为宿主间变体出现的SNP频率的基 础上分开(Park等,2015)。其他方式的超感染和污染可以排除在外。在这种后 者的情况下,受试者之间的共享宿主内变异的检测还可以包括评价同义和非 同义变体的频率以及相互比较同义和非同义变体的频率。非同义突变是改变 蛋白质的氨基酸的突变,这可能引起经受自然选择的微生物中的生物变化。 同义取代不改变氨基酸序列。同义和非同义变体的同等频率指示中性演变的宿主内变体。如果同义和非同义变体的频率有分歧,那么宿主内变体可能通 过平衡选择来维持。如果同义和非同义变体的频率很低,那么这指示重现性 突变。如果同义和非同义变体的频率很高,那么这指示共传播(Park等,2015)。
如同埃博拉病毒一样,拉沙病毒(LASV)可以导致具有高病例致死率的出 血热。Andersen等生成了来自临床和啮齿动物储库样品的将近200个LASV 序列的基因组目录(Andersen等,Cell第162卷,第4期,第738-750页,2015 年8月13日)。Andersen等显示,尽管2013-2015年EVD流行病由人与人之 间的传播推动,但LASV感染主要由储库与人之间的感染引起。Andersen等 阐明LASV跨越西非的扩散并且显示这种迁移伴有LASV基因组丰度、致死 率、密码子适应和翻译效率的变化。方法还可以包括在系统发生上比较第一 病原体序列与第二病原体序列,以及确定第一病原体序列与第二病原体序列之间是否存在系统发生关联。第二病原体序列可以是较早参考序列。如果存 在系统发生关联,那么方法还可以包括针对第二病原体序列追溯第一病原体 序列的系统发生的根源。因此,有可能构建第一病原体序列的谱系。(Park等,2015)。
方法还可以包括确定突变是有害的还是适应性的。有害突变指示传播受 损病毒和终端感染,因此通常仅在个别受试者中存在。一个个别受试者独有 的突变是系统发生树的外枝上出现的那些,而内枝突变是多个样品中(即,多 个受试者中)存在的那些。较高非同义取代率是系统发生树的外枝的特征(Park 等,2015)。
在系统发生树的内枝中,选择已经有更多机会来滤除有害突变体。根据 定义,内枝已经产生多个派生谱系并且因此不太可能包括具有适合度代价的 突变。因此,较低非同义取代率指示内枝(Park等,2015)。
可能对适合度具有较少影响的同义突变在内枝和外枝上以更可比的频率 出现(Park等,2015)。
通过分析测序的靶序列,例如病毒基因组,有可能发现造成例如在2014 年埃博拉爆发期间流行病发作的严重性的机制。举例来说,Gire等作出2014 年爆发的基因组与来自较早爆发的全部20种基因组的系统发生比较,表明 2014年西非病毒可能在过去十年内从中非扩散。使用与其他埃博拉病毒基因 组的分歧追溯系统发生的根源是成问题的(6、13)。然而,追溯树的最早爆发 的根源揭示样品日期与根部至尖端距离之间的强相关性,其中每年每个地点 的取代率为8×10-4(13)。这表明三次最新爆发的谱系全部在大致相同的时间,即,2004年左右从共同祖先分出,这提出了以下假设:每次爆发表示来 自天然储库中的相同遗传多样性病毒群体的独立人畜共患事件。还发现,2014 年EBOV爆发可能由从天然储库的单个传播引起,继而在爆发期间在人与人 之间传播。其结果还表明,塞拉利昂的流行病发作可能起源于大约在相同时 间从几内亚引入两种遗传上截然不同的病毒(Gire等,2014)。
还已经有可能确定拉沙病毒如何从其起源点扩散开,尤其归功于人与人 之间的传播并且甚至回溯到400年前这种扩散的历史(Andersen等,Cell 162(4):738-50,2015)。
与在2013-2015年EBOV爆发期间所需的工作和在爆发地点医疗人员所 遭遇的困难相关,并且更一般来说,本发明的方法使得有可能使用较少选择 的探针进行测序以便可以加速测序,由此缩短从获取样品至取得结果所需的 时间。此外,试剂盒和系统可以被设计成实地可用以便可以容易地进行患者 的诊断而无需将样品发送或运送至国家或世界的另一个地区。
在上文所描述的任何方法中,对靶序列或其片段进行测序可以使用上文 所描述的测序过程中的任一种。此外,对靶序列或其片段进行测序可以是近 实时测序。对靶序列或其片段进行测序可以根据先前所描述的方法进行 (Experimental Procedures:Matranga等,2014;以及Gire等,2014)。对靶序列或 其片段进行测序可以包括多个靶序列的平行测序。对靶序列或其片段进行测 序可以包括Illumina测序。
分析杂交至所选探针中的一个或多个的靶序列或其片段可以是鉴别分 析,其中所选探针杂交至靶序列或其片段指示样品内靶序列的存在。
当前,主要诊断是基于患者所具有的症状。然而,各种疾病可能共享相 同的症状,使得诊断太依赖于统计。举例来说,疟疾触发类流感症状:头痛、 发热、寒颤、关节疼痛、呕吐、溶血性贫血、黄疸、尿液中的血红蛋白、视 网膜损伤和惊厥。这些症状对于败血病、胃肠炎和病毒性疾病也是常见的。 在后者当中,埃博拉出血热具有以下症状:发热、咽喉痛、肌肉疼痛、头痛、呕吐、腹泻、皮疹、肝和肾功能下降、内出血和外出血。
当将患者递交给医疗单位时,例如在热带非洲,基础诊断将推断为疟疾, 这是因为在统计上,疟疾是在非洲的那个地区内最可能的疾病。因此针对疟 疾治疗患者,不过患者可能实际上并未染上这种疾病并且患者未得到正确治 疗而死亡。正确治疗的这种缺乏可能是威胁生命的,尤其当患者所染上的疾 病呈现出快速演变时。在医疗人员认识到给予患者的治疗是无效的并且获得正确诊断并向患者施用足够的治疗之前可能为时已晚。
本发明的方法提供了这种情况的解决方案。确实,因为向导RNA的数目 可以显著减少,所以这使得有可能在单个芯片上提供分成组的所选探针,每 组对一种疾病具有特异性,以便可以同时诊断多种疾病,例如病毒感染。归 功于本发明,在单个芯片上可以同时诊断多于3种疾病,优选地多于4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种疾病,优选 地在给定的地理区域的群体内最常出现的疾病。因为每组所选探针对诊断的 疾病中的一种具有特异性,所以可以进行更准确诊断,由此减少向患者施用错误治疗的风险。
在其他情况下,例如病毒感染的疾病可能在无任何症状下发生,或已经 引起症状,但在将患者递交给医疗人员之前症状消散。在此类情况下,患者 不寻求任何医疗救助或在递交当天归因于症状的缺乏而使诊断变得复杂。
本发明还可以与诊断疾病、鉴别病原体以及基于核酸,例如未纯化粗样 品中的mRNA的检测优化治疗的其他方法相配合使用。
本发明的方法还提供了一种用以处理这种情况的强有力工具。确实,因 为在单个诊断内包括多组所选向导RNA,每组对在给定区域的群体内出现的 最常见疾病具有特异性,所以医疗人员仅需要使获自患者的生物样品与芯片 接触。读取芯片揭示患者已染上的疾病。
在一些情况下,将患者递交给医疗人员用于特定症状的诊断。本发明的 方法使得有可能不仅鉴别哪种疾病引起这些症状,而且同时确定患者是否罹 患其未察觉的另一种疾病。
当探索爆发的机制时,这种信息可能至关重要。确实,具有相同病毒的 患者组还显示时序模式,表明受试者与受试者之间的传播链路。
筛选微生物遗传扰动
在某些示例性实施方案中,本文所公开的CRISPR系统可以用于筛选微 生物遗传扰动。此类方法可以适用于例如制定出微生物途径和功能网络。可 以对微生物细胞进行遗传修饰,然后在不同实验条件下筛选。如上文所描述, 本文所公开的实施方案可以按多元方式筛选单个样品中的多个靶分子或单个 个别离散体积中的单个标靶。可以对遗传修饰的微生物进行修饰以包括鉴别 由特定微生物细胞或微生物细胞群体携带的特定遗传修饰的核酸条形码序列。条形码是用作标识符的核苷酸(例如DNA、RNA或它们的组合)的短序列。核酸条形码可以具有4-100个核苷酸的长度并且是单链或双链的。用条形码 鉴别细胞的方法在本领域中是已知的。因此,本文所描述的CRISPR效应系 统的向导RNA可以用于检测条形码。检测到阳性可检测信号指示样品中特定 遗传修饰的存在。本文所公开的方法可以与检测互补基因型或表型读出的其 他方法组合,指示在所测试的实验条件下遗传修饰的作用。有待筛选的遗传 修饰可以包括但不限于基因敲入、基因敲除、倒位、易位、转座,或一个或多个核苷酸插入、缺失、取代、突变,或具有功能结果的编码表位的核酸的 添加,所述功能结果例如改变蛋白质稳定性或检测。以类似方式,本文所描 述的方法可以用于合成生物学应用中以筛选基因调控元件和基因表达模块的 特定排列的功能性。
在某些示例性实施方案中,方法可以用于筛选亚等位基因。亚等位基因 的产生和其鉴别关键细菌功能性基因的用途以及新抗生素治疗剂的鉴别如 2016年11月4日提交的题为"Multiplex High-Resolution Detection of Micro-organism Strains,RelatedKits,Diagnostic Methods and Screening Assays"的PCT/US2016/060730中公开,其以引用的方式并入本文中。
不同实验条件可以包括微生物细胞暴露于不同化学剂、化学剂组合、不 同浓度的化学剂或化学剂组合、暴露于化学剂或化学剂组合的不同持续时间、 不同物理参数,或两者。在某些示例性实施方案中,化学剂是抗生素或抗病 毒剂。有待筛选的不同物理参数可以包括不同温度、大气压、不同大气气体 和非大气气体浓度、不同pH水平、不同培养基组成,或它们的组合。
筛选环境样品
本文所公开的方法还可以用于通过检测靶核酸或多肽的存在针对污染物 筛选环境样品。举例来说,在一些实施方案中,本发明提供了一种用于检测 微生物的方法,所述方法包括:使如本文所描述的CRISPR系统暴露于样品; 经由一种或多种向导RNA结合至一种或多种微生物特异性靶RNA或一种或 多种触发RNA来活化RNA效应蛋白以便产生可检测的阳性信号。可以检测 阳性信号并且指示样品中一种或多种微生物的存在。在一些实施方案中, CRISPR系统可以在如本文所描述的衬底上,并且衬底可以暴露于样品。在 其他实施方案中,可以将相同CRISPR系统和/或不同CRISPR系统施加至衬底上的多个离散位置。在其他实施方案中,不同CRISPR系统可以检测每个 位置处的不同微生物。如上文进一步详细描述,衬底可以是柔性材料衬底, 例如包括但不限于纸衬底、织物衬底或基于柔性聚合物的衬底。
根据本发明,通过将衬底短暂浸入有待取样的流体中,通过将有待测试 的流体施加至衬底,或通过使有待测试的表面与衬底接触,可以使衬底被动 暴露于样品。视情况而定,可以使用将样品引入衬底的任何方式。
如本文所描述,用于本发明的样品可以是生物或环境样品,例如食物样 品(新鲜水果或蔬菜、肉)、饮料样品、纸表面、织物表面、金属表面、木材 表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品、暴露于大气 或其他气体样品,或它们的组合。举例来说,可以拭抹由包括但不限于金属、 木材、塑料、橡胶等的任何材料制成的家用/商业/工业表面并测试污染物。可 以针对病原性细菌或寄生虫或者其他微生物的存在测试土壤样品,用于环境 目的和/或用于人、动物或植物疾病测试。可以评估例如淡水样品、废水样品 或盐水样品的水样品的清洁度和安全性和/或可饮用性,以检测例如微小隐孢 子虫(Cryptosporidium parvum)、兰伯氏贾第虫(Giardia lamblia)或其他微生物 污染的存在。在其他实施方案中,生物样品可以获自以下来源:包括但不限 于组织样品、唾液、血液、血浆、血清、粪便、尿液、痰液、粘液、淋巴、 滑液、脑脊髓液、腹水、胸腔积液、血清肿、脓液,或皮肤或粘膜表面的拭 子。在一些特定实施方案中,环境样品或生物样品可以是粗样品和/或在应用 方法之前一种或多种靶分子可能未从样品纯化或扩增。微生物的鉴别可以适用于许多应用和/或为许多应用所需,并且因此可以根据本发明使用本领域技 术人员认为适当的来自任何来源的任何类型的样品。
在一些实施方案中,在餐馆或其他食物提供方、食物表面检查细菌,例 如大肠杆菌对食物的污染;测试水的病原体,如沙门氏菌属、弯曲杆菌属或 大肠杆菌;以及为制造商和监管方检查食物质量以确定肉源的纯净度;鉴别 受病原体,例如军团菌属的空气污染;检查啤酒是否受病原体,如片球菌属 (Pediococcus)和乳杆菌属污染或腐败;在制造期间细菌或真菌对巴式灭菌或 未巴式灭菌的奶酪的污染。
根据本发明的微生物可以是病原性微生物或者引起食物或可消耗产品腐 败的微生物。病原性微生物可能对于人、动物或植物是病原性的或以其他方 式不合乎需要。对于人或动物来说,微生物可以引起疾病或导致疾患。本发 明的动物或兽医应用可以鉴别受微生物感染的动物。举例来说,本发明的方 法和系统可以鉴别具有病原体,包括但不限于犬窝咳、狂犬病病毒和犬恶丝虫的伴侣动物。在其他实施方案中,本发明的方法和系统可以出于育种目的 用于亲缘测试。植物微生物可以导致对植物的伤害或疾病、产量减少,或改 变性状,例如颜色、口味、稠度、气味,对于食物或可消耗的污染来说,微 生物可以不利地影响食物或可消耗产品的口味、气味、颜色、稠度或其他商 业特性。在某些示例性实施方案中,微生物是细菌种类。细菌可以是兼性嗜 冷菌(psychrotroph)、大肠菌、乳酸菌或形成芽孢的细菌。在某些示例性实施 方案中,细菌可以是引起疾病或疾患,或以其他方式导致不合需要的产物或性状的任何细菌种类。根据本发明的细菌可能对于人、动物或植物是病原性。
样品类型
用于本文所公开的方法中的适当样品包括获自生物体或其一部分,例如 植物、动物、细菌等的任何常规生物样品。在特定实施方案中,生物样品获 自动物受试者,例如人受试者。生物样品是获自以下任何活生物体、由其排 泄或分泌的任何固体或流体样品:包括但不限于单细胞生物体,尤其例如细 菌、酵母、原生动物和阿米巴虫;多细胞生物体(例如植物或动物,包括来自 健康或表观健康人受试者或受有待诊断或研究的状况或疾病影响的人患者的 样品,所述状况或疾病例如受病原性微生物,例如病原性细菌或病毒感染)。举例来说,生物样品可以是获自以下的生物流体:例如血液、血浆、血清、 尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液(例 如获自脓肿或任何其他感染或发炎部位的流体),或获自关节(例如正常关节 或受例如类风湿性关节炎、骨关节炎、痛风或化脓性关节炎等疾病影响的关 节)的流体,或皮肤或粘膜表面的拭子。
样品还可以是获自任何器官或组织的样品(包括活检或尸检样本,例如肿 瘤活检体),或可以包括细胞(无论是初级细胞还是培养的细胞)或由任何细胞、 组织或器官调节的培养基。示例性样品包括但不限于细胞、细胞溶解产物、 血液涂片、细胞离心制剂、细胞学涂片、体液(例如血液、血浆、血清、唾液、 痰液、尿液、支气管肺泡灌洗液、精液等)、组织活检体(例如肿瘤活检体)、细针抽吸液,和/或组织切片(例如冷冻组织切片和/或石蜡包埋组织切片)。在 其他实例中,样品包括循环肿瘤细胞(其可以由细胞表面标志鉴别)。在特定实例中,样品直接使用(例如新鲜或冷冻的),或可以在使用前例如通过固定(例 如使用福尔马林)和/或包埋于蜡中(例如福尔马林固定石蜡包埋(FFPE)组织样 品)来操作。将了解,可以利用从受试者获得组织的任何方法,并且所用方法 的选择将取决于各种因素,例如组织类型、受试者年龄或从业者可用的程序。 用于获得此类样品的标准技术在本领域中是可用的。参见例如Schluger等,J.Exp.Med.176:1327-33(1992);Bigby等,Am.Rev.Respir.Dis.133:515-18 (1986);Kovacs等,NEJM 318:589-93(1988);以及Ognibene等,Am.Rev.Respir. Dis.129:929-32(1984)。
在其他实施方案中,样品可以是环境样品,例如水、土壤或表面,例如 工业或医学表面。在一些实施方案中,例如美国专利公布号2013/0190196中 所公开的那些的方法可以应用于在高度灵敏度和特异性下检测直接来自粗细 胞样品的核酸标识,特别是RNA水平。对所关注的每个病原体具有特异性的 序列可以通过由BLAST软件比较来自所关注的病原体的编码序列与其他生 物体中的所有编码序列来鉴别或选择。
本公开的若干实施方案涉及使用本领域中已知的程序和方法以将临床血 液样品成功分级。参见例如以下文献中所描述的程序:Han Wei Hour等, Microfluidic Devicesfor Blood Fractionation,Micromachines 2011,2,319-343; Ali Asgar S.Bhagat等,Dean Flow Fractionation(DFF)Isolation of Circulating Tumor Cells(CTCs)fromBlood,15th International Conference on Miniaturized Systems for Chemistry andLife Sciences,2011年10月2日-6日,Seattle,WA; 以及国际专利公布号WO2011109762,其公开内容以全文引用的方式并入本文中。血液样品通常在培养物中扩充以增加用于测试目的的样品大小。在本 发明的一些实施方案中,血液或其他生物样品可以用于如本文所描述的方法 中而无需在培养物中扩充。
此外,本公开的若干实施方案涉及使用本领域中已知的程序和方法以使 用螺旋形微通道从全血中成功分离病原体,如Han Wei Hour等,Pathogen Isolation from WholeBlood Using Spiral Microchannel,案号15995JR, Massachusetts Institute ofTechnology(原稿在准备中)所描述,其公开内容以全 文引用的方式并入本文中。
归因于本文所公开的实施方案的灵敏度增加,在某些示例性实施方案中, 测定和方法可以在粗样品或有待检测的靶分子未从样品进一步分级或纯化的 样品上运作。
疟疾检测和监测
疟疾是由疟原虫寄生虫引起的蚊传病状。寄生虫经由受感染的雌性疟蚊(Anopheles)的叮咬传播给人。五种疟原虫种类引起人的疟疾:恶性疟原虫、 间日疟原虫(Plasmodium vivax)、卵形疟原虫(Plasmodium ovale)、三日疟原虫 (Plasmodiummalariae)和诺氏疟原虫(Plasmodium knowlesi)。在这些当中,根 据世界卫生组织(WorldHealth Organization)(WHO),恶性疟原虫和间日疟原虫造成最大威胁。恶性疟原虫(P.falciparum)是非洲大陆最普遍存在的疟疾寄生虫并且造成全球大多数疟疾相关死亡。间日疟原虫是在撒哈拉以南非洲外 的大多数国家的主要疟疾寄生虫。
在2015年,91个国家和地区具有持续的疟疾传播。根据最近的WHO 估计,在2015年存在2.12亿疟疾病例和429000例死亡。在疟疾高度传播的 地区,5岁以下儿童尤其易受感染、疾患和死亡;所有疟疾死亡中超过三分 之二(70%)在这个年龄组中发生。在2010年与2015年之间,全球5岁以下疟 疾死亡率下降29%。然而,疟疾仍然是五岁以下儿童的主要杀手,每两分钟夺走一名儿童的生命。
如WHO所描述,疟疾是急性发热疾患。在非免疫个体中,症状在感染 性蚊叮咬后7天或更长时间出现。首发症状-发热、头痛、寒冷和呕吐-可 能是轻微的并且难以识别为疟疾,然而,如果在24小时内未治疗,那么恶性疟原虫疟疾可以进展至严重疾患,常常导致死亡。
患有严重疟疾的儿童频繁发展出以下症状中的一种或多种:严重贫血、 与代谢性酸中毒相关的呼吸窘迫,或脑型疟疾。在成人中,多器官受累也频 繁出现。在疟疾流行区,人可能发展出部分免疫,从而允许无症状感染发生。
快速和有效诊断测试的发展与公共卫生高度相关。确实,疟疾的早期诊 断和治疗不仅减轻疾病并防止死亡,而且有助于减少疟疾传播。根据WHO 推荐,疑似疟疾的所有病例在施用治疗之前应使用基于寄生虫的诊断测试(特 别是使用快速诊断测试)来确认(参见"WHO Guidelines for the treatment of malaria",第三版,2015年4月公布)。
对抗疟疾疗法的抗性表现出关键的健康问题,这大大减少了治疗策略。 确实,如WHO网站所报道,恶性疟原虫对前代药物,例如氯喹(chloroquine) 和磺胺多辛/乙胺嘧啶(sulfadoxine/pyrimethamine)(SP)的抗性在1950年代和 1960年代变得普遍存在,削弱了疟疾控制的努力并且逆转了儿童存活率的增 加。因此,WHO推荐抗疟疾药抗性的常规监测。确实,准确诊断可以避免 非适当治疗并且限制对抗疟疾药物的抗性的扩展。
在这种情形中,2016-2030年WHO全球疟疾技术策略-在2015年5月 由世界卫生大会(World Health Assembly)正式通过-提供了对于所有疟疾流 行国家的技术框架。其意图指导和支持致力于疟疾控制和消除的地区和国家 规划。策略设定了宏大的但可达成的全球目标,包括:
·截至2030年使疟疾病例发病率降低至少90%。
·截至2030年使疟疾死亡率降低至少90%。
·截至2030年消除至少35个国家的疟疾。
·防止无疟疾的所有国家的疟疾再起。
这种策略是跨越2年并且涉及来自70个成员国的超过400名技术专家的 参与的广泛协商过程的结果。这是基于3个关键轴:
·确保全面普及疟疾预防、诊断和治疗;
·加速对消除和达到无疟疾状态的努力;以及
·将疟疾监视转变成核心干预。
对疟原虫的治疗包括芳基-氨基醇,例如奎宁(quinine)或奎宁衍生物,例 如氯喹、阿莫地喹(amodiaquine)、甲氟喹(mefloquine)、哌喹(piperaquine)、苯 芴醇(lumefantrine)、伯氨喹(primaquine);亲脂性羟基萘醌类似物,例如阿托 伐醌(atovaquone);抗叶酸药物,例如磺胺类药物磺胺多辛、氨苯砜(dapsone)和乙胺嘧啶;氯胍(proguanil);阿托伐醌/氯胍的组合;青蒿素(atemisins)药物; 以及它们的组合。
作为蚊传病原体存在的诊断的靶序列包括作为疟原虫,特别是影响人的 疟原虫(Plasmodia)种类,例如恶性疟原虫、间日疟原虫、卵形疟原虫、三日 疟原虫和诺氏疟原虫存在的诊断的序列,包括来自其基因组的序列。
作为监测对疟原虫,特别是影响人的疟原虫种类,例如恶性疟原虫、间 日疟原虫、卵形疟原虫、三日疟原虫和诺氏疟原虫的治疗的抗药性的诊断的 靶序列。
其他靶序列包括序列,所述序列包括编码以下蛋白质的靶分子/核酸分 子:疟原虫寄生虫的基本生物过程中所涉及的蛋白质并且特别是转运蛋白, 例如来自药物/代谢物转运子家族的蛋白质;底物易位中所涉及的ATP结合 盒(ABC)蛋白质,例如ABC转运子C亚家族或Na+/H+交换子、膜谷胱甘肽 S-转移酶;叶酸途径中所涉及的蛋白质,例如二氢蝶酸合成酶、二氢叶酸还 原酶活性或二氢叶酸还原酶-胸苷酸合成酶;以及跨越线粒体内膜的质子易位 中所涉及的蛋白质并且特别是细胞色素b复合物。额外标靶还可以包括编码 亚铁血红素聚合酶的一个或多个基因。
其他靶序列包括编码基本生物过程中所涉及的蛋白质的靶分子/核酸分 子,其可以选自恶性疟原虫氯喹抗性转运基因(pfcrt)、恶性疟原虫多抗药性转 运子1(pfmdr1)、恶性疟原虫多抗药性相关蛋白基因(Pfmrp)、恶性疟原虫 Na+/H+交换基因(pfnhe)、编码恶性疟原虫输出蛋白1的基因、恶性疟原虫 Ca2+转运ATPase 6(pfatp6);恶性疟原虫二氢蝶酸合成酶(pfdhps)、二氢叶酸 还原酶活性(pfdhpr)和二氢叶酸还原酶-胸苷酸合成酶(pfdhfr)基因、细胞色素b 基因、GTP环化水解酶和Kelch13(K13)基因,以及其在其他疟原虫种类中的功能性异源基因。
许多突变,特别是单点突变,已经在作为当前治疗的标靶并且与特异性 抗性表型相关联的蛋白质中鉴别到。因此,本发明允许检测蚊传寄生虫,例 如疟原虫的各种抗性表型。
本发明允许检测靶核酸/分子中的一个或多个突变并且特别是一个或多 个单核苷酸多态性。因此,以下任一个突变或它们的组合可以用作抗药性标 志并且可以根据本发明检测。
恶性疟原虫K13中的单点突变包括以下位置处的单点突变:252、441、 446、449、458、493、539、543、553、561、568、574、578、580、675、476、 469、481、522、537、538、579、584和719,并且特别是突变E252Q、P441L、 F446I、G449A、N458Y、Y493H、R539T、I543T、P553L、R561H、V568G、 P574L、A578S、C580Y、A675V、M476I、C469Y、A481V、S522C、N537I、 N537D、G538V、M579I、D584V和H719N。这些突变一般与青蒿素药物抗 性表型相关联(Artemisininand artemisinin-based combination therapy resistance, 2016年4月WHO/HTM/GMP/2016.5)。
在恶性疟原虫二氢叶酸还原酶(DHFR)(PfDHFR-TS,PFD0830w)中,重 要的多态性包括位置108、51、59和164处的突变,特别是调节对乙胺嘧啶 的抗性的108D、164L、51I和59R。其他多态性还包括与对磺胺多辛的抗性 相关联的437G、581G、540E、436A和613S。额外观测的突变包括Ser108Asn、 Asn51Ile、Cys59Arg、Ile164Leu、Cys50Arg、Ile164Leu、Asn188Lys、Ser189Arg 和Val213Ala、Ser108Thr和Ala16Val。突变Ser108Asn、Asn51Ile、Cys59Arg、 Ile164Leu、Cys50Arg、Ile164Leu与基于乙胺嘧啶的疗法和/或氯鸟嘌呤-氨苯砜组合疗法抗性显著相关联。环氯胍(Cycloguanil)抗性似乎与双重突变 Ser108Thr和Ala16Val相关联。dhfr的扩增也可能与疗法抗性,特别是乙胺 嘧啶抗性高度相关。
在恶性疟原虫二氢蝶酸合成酶(DHPS)(PfDHPS,PF08_0095)中,重要的 多态性包括位置436、437、581和613处的突变Ser436Ala/Phe、Ala437Gly、 Lys540Glu、Ala581Gly和Ala613Thr/Ser。位置581和/或613处的多态性还 已经与对磺胺多辛-乙胺嘧啶基础疗法的抗性相关联。
在恶性疟原虫氯喹抗性转运子(PfCRT)中,位置76处的多态性,特别是 突变Lys76Thr,与对氯喹的抗性相关联。其他多态性包括可能与氯喹抗性相 关联的Cys72Ser、Met74Ile、Asn75Glu、Ala220Ser、Gln271Glu、Asn326Ser、 Ile356Thr和Arg371Ile。PfCRT也在残基S33、S411和T416处磷酸化,这可 以调控蛋白质的转运活性或特异性。
在恶性疟原虫多抗药性转运子1(PfMDR1)(PFE1150w)中,位置86、184、 1034、1042处的多态性,特别是Asn86Tyr、Tyr184-Phe、Ser1034Cys、Asn1042Asp和Asp1246Tyr已经被鉴别和报道为影响对苯芴醇、青蒿素、奎 宁、甲氟喹(mefloquine)、卤泛群(halofantrine)和氯喹的易感性。另外,PfMDR1 的扩增与对苯芴醇、青蒿素、奎宁、甲氟喹和卤泛群的易感性降低相关联, 并且PfMDR1的解除扩增(deamplification)导致氯喹抗性的增加。还可以检测 到pfmdr1的扩增。PfMDR1的磷酸化状态也高度相关。
在恶性疟原虫多抗药性相关蛋白(PfMRP)(基因参照PFA0590w)中,已经 鉴别到位置191和/或437处的多态性,例如Y191H和A437S并且与氯喹抗 性表型相关联。
在恶性疟原虫NA+/H+交换子(PfNHE)(参照PF13_0019)中,微卫星 ms4670中DNNND的重复增加可以是奎宁抗性的标志。
改变由细胞色素be基因(cytb,mal_mito_3)编码的细胞色素b蛋白的泛 醇结合位点的突变与阿托伐醌抗性相关联。位置26、268、276、133和280 处的突变并且特别是Tyr26Asn、Tyr268Ser、M1331和G280D可能与阿托伐 醌抗性相关联。
举例来说,在间日疟原虫中,Pf MDR1的同源物PvMDR1中的突变已经 与氯喹抗性相关联,特别是位置976处的多态性,诸如突变Y976F。
上述突变是依据蛋白质序列来定义。然而,技术人员能够确定有待鉴别 为核酸靶序列的相应突变,包括SNP。
其他所鉴别的抗药性标志在本领域中是已知的,例如以下文献中所描述: "Susceptibility of Plasmodium falciparum to antimalarial drugs(1996-2004)";WHO;Artemisinin and artemisinin-based combination therapy resistance(2016年 4月WHO/HTM/GMP/2016.5);"Drug-resistant malaria:molecular mechanisms andimplications for public health"FEBS Lett.2011年6月6日;585(11):1551-62. doi:10.1016/j.febslet.2011.04.042.Epub 2011年4月23日.Review.PubMed PMID:21530510;其内容以引用的方式并入于此。
关于可以根据本发明检测的多肽,本文所提及的所有基因的基因产物都 可以用作标靶。相应地,预期此类多肽可以用于抗药性的种类鉴别、分型和/ 或检测。
在某些示例性实施方案中,本文所公开的系统、装置和方法涉及检测样 品,例如获自受试者的生物样品中一种或多种蚊传寄生虫的存在。在某些示 例性实施方案中,寄生虫可以选自以下种类:恶性疟原虫、间日疟原虫、卵 形疟原虫、三日疟原虫或诺氏疟原虫。因此,本文所公开的方法可以适应于 在其他方法中与其他方法一起(或组合)使用,所述其他方法需要寄生虫种类 的快速鉴别,监测寄生虫和寄生虫形式的存在(例如对应于感染和寄生虫生命 周期的各个阶段,例如红细胞外期、红细胞内期、孢子生殖期;寄生虫形式包括裂殖子、子孢子、分裂体、配子体);某些表型(例如病原体抗药性)的检 测,疾病进展和/或爆发的监测,以及治疗(药物)筛选。此外,在疟疾的情况 下,在感染性叮咬之后可能流逝很长时间,即,长孵育时段,在此期间患者 不显示出症状。类似地,预防性治疗可以延迟症状的出现,并且在复发之前 还可以观测到很长的无症状时段。此类延迟可以容易引起误诊或延迟诊断, 并且因此削弱治疗的有效性。
因为此处所公开的实施方案的快速和灵敏诊断能力、低至单核苷酸差异 的寄生虫类型的检测和作为POC装置部署的能力,所以本文所公开的实施方 案可以用于指导治疗方案,例如适当疗程的选择。本文所公开的实施方案还 可以用于针对寄生虫的存在和分型筛选环境样品(蚊群等)。还可以修改实施 方案以同时检测蚊传寄生虫和其他蚊传病原体。在一些情况下,疟疾和其他 蚊传病原体可能最初呈现出类似的症状。因此,快速区分感染类型的能力可 以指导重要的治疗决策。可以与疟疾共同检测的其他蚊传病原体包括登革、西尼罗河病毒、基孔肯雅、黄热病、丝虫病、日本脑炎、圣路易斯脑炎、西方马脑炎、东方马脑炎、委内瑞拉马脑炎、拉克罗斯脑炎(La Crosse encephalitis) 和寨卡。
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于区 分样品中的多个蚊传寄生虫种类。在某些示例性实施方案中,鉴别可以基于 核糖体RNA序列,包括18S、16S、23S和5S亚单位。在某些示例性实施方案中,鉴别可以基于基因组中的多个拷贝中所存在的基因的序列,例如线粒 体基因,如CYTB。在某些示例性实施方案中,鉴别可以基于高度表达和/或 高度保守的基因的序列,例如GAPDH、组蛋白H2B、烯醇酶或LDH。鉴别 相关rRNA序列的方法在美国专利申请公布号2017/0029872中公开。在某些 示例性实施方案中,一组向导RNA可以被设计成由对于每个种类或株系独特 的可变区来区分每个种类。向导RNA还可以被设计成靶向在属、族、目、类、 门、界的水平或它们的组合上区分微生物的RNA基因。在使用扩增的某些示 例性实施方案中,一组扩增引物可以被设计成侧接核糖体RNA序列的恒定区并且向导RNA被设计成由可变内区来区分每个种类。在某些示例性实施方案中,引物和向导RNA可以分别被设计成16S亚单位中的保守区和可变区。 同样可以使用跨越种类或种类的子组,例如RecA基因家族RNA聚合酶β亚 单位独特可变的其他基因或基因组区域。其他适合的系统发生标志和其鉴别 方法在例如Wu等arXiv:1307.8690[q-bio.GN]中论述。
在某些示例性实施方案中,种类鉴别可以基于基因组中的多个拷贝中所 存在的基因,例如线粒体基因,如CYTB来进行。在某些示例性实施方案中, 种类鉴别可以基于高度表达和/或高度保守基因,例如GAPDH、组蛋白H2B、 烯醇酶或LDH来进行。
在某些示例性实施方案中,方法或诊断被设计成同时跨越多个系统发生 和/或表型水平筛选蚊传寄生虫。举例来说,方法或诊断可以包括使用多个具 有不同向导RNA的CRISPR系统。第一组向导RNA可以区分例如恶性疟原 虫或间日疟原虫。这些一般类别甚至可以进一步细分。举例来说,可以设计 向导RNA并且用于一般性地或关于特定药物或药物组合来区分抗药性株系 的方法或诊断中。第二组向导RNA可以被设计成在种类的水平上区分微生 物。因此,可以产生鉴别所有蚊传寄生虫种类或亚种的矩阵,根据抗药性进 一步划分。前述内容仅用于示例性目的。还涵盖用于归类其他蚊传寄生虫类型的其他方式并且将遵循上文所描述的一般结构。
在某些示例性实施方案中,本文所公开的装置、系统和方法可以用于筛 选所关注的蚊传寄生虫基因,例如抗药性基因。向导RNA可以被设计成区分 所关注的已知基因。然后可以使用本文所公开的用于检测一个或多个此类基 因的实施方案筛选样品,包括临床样品。在POC下筛选抗药性的能力将在选 择适当治疗方案中具有巨大的效益。在某些示例性实施方案中,抗药性基因 是编码以下蛋白质的基因:例如转运蛋白,例如来自药物/代谢物转运子家族 的蛋白质;底物易位中所涉及的ATP结合盒(ABC)蛋白质,例如ABC转运 子C亚家族或Na+/H+交换子;叶酸途径中所涉及的蛋白质,例如二氢蝶酸合 成酶、二氢叶酸还原酶活性或二氢叶酸还原酶-胸苷酸合成酶;以及跨越线粒 体内膜的质子易位中所涉及的蛋白质并且特别是细胞色素b复合物。额外标 靶还可以包括编码亚铁血红素聚合酶的一个或多个基因。在某些示例性实施 方案中,抗药性基因选自恶性疟原虫氯喹抗性转运基因(pfcrt)、恶性疟原虫多抗药性转运子1(pfmdr1)、恶性疟原虫多抗药性相关蛋白基因(Pfmrp)、恶性 疟原虫Na+/H+交换基因(pfnhe)、恶性疟原虫Ca2+转运ATPase 6(pfatp6)、恶 性疟原虫二氢蝶酸合成酶(pfdhps)、二氢叶酸还原酶活性(pfdhpr)和二氢叶酸 还原酶-胸苷酸合成酶(pfdhfr)基因、细胞色素b基因、GTP环化水解酶和Kelch13(K13)基因,以及其在其他疟原虫种类中的功能性异源基因。其他所 鉴别的抗药性标志在本领域中是已知的,例如以下文献中所描述: "Susceptibility of Plasmodium falciparum toantimalarial drugs(1996-2004)"; WHO;Artemisinin and artemisinin-basedcombination therapy resistance(2016年 4月WHO/HTM/GMP/2016.5);"Drug-resistantmalaria:molecular mechanisms and implications for public health"FEBSLett.2011年6月6日;585(11):1551-62. doi:10.1016/j.febslet.2011.04.042.Epub2011年4月23日.Review.PubMed PMID:21530510;其内容以引用的方式并入于此。
在一些实施方案中,如本文所描述的CRISPR系统、检测系统或其使用 方法可以用于确定蚊传寄生虫爆发的演变。方法可以包括检测来自一个或多 个受试者的多个样品的一个或多个靶序列,其中靶序列是来自蚊传寄生虫扩 散或引起爆发的序列。此种方法还可以包括确定蚊传寄生虫传播的模式,或由蚊传寄生虫引起的疾病爆发中所涉及的机制。样品可以来源于一个或多个 人,和/或来源于一个或多个蚊。
病原体传播的模式可以包括从蚊传寄生虫的天然储库的持续新传播或在 从天然储库的单个传播之后的其他传播(例如在蚊之间),或两种的混合情况。 在一个实施方案中,靶序列优选地是蚊传寄生虫基因组内的序列或其片段。 在一个实施方案中,蚊传寄生虫传播的模式是蚊传寄生虫传播的早期模式, 即,在蚊传寄生虫爆发开始时。在爆发开始时确定蚊传寄生虫传播的模式增 加了在最早可能的时间阻止爆发的可能性,从而降低本地和国际蔓延的可能性。
确定蚊传寄生虫传播的模式可以包括根据本文所描述的方法检测蚊传寄 生虫序列。确定病原体传播的模式还可以包括检测受试者之间的蚊传寄生虫 序列的共享宿主内变异以及确定共享宿主内变异是否显示时序模式。所观测 的宿主内和宿主间变异中的模式提供了关于传播和流行病学的重要见解(Gire 等,2014)。
除了本文所公开的其他样品类型以外,样品可以来源于一个或多个蚊, 例如,样品可以包括蚊唾液。
生物标志检测
在某些示例性实施方案中,本文所公开的系统、装置和方法可以用于生 物标志检测。举例来说,本文所公开的系统、装置和方法可以用于SNP检测 和/或基因分型。本文所公开的系统、装置和方法还可以用于由异常基因表达 表征的任何疾病病况或病症的检测。异常基因表达包括所表达的基因、表达 的位置和表达的水平中的异常。可以检测与心血管、免疫病症和癌症以及其 他疾病相关的多个转录物或蛋白质标志。在某些示例性实施方案中,本文所公开的实施方案可以用于涉及溶解的疾病,例如肝纤维化和限制性/阻塞性肺病的无细胞DNA检测。在某些示例性实施方案中,实施方案可以用于无细 胞DNA的产前测试的更快速和更便携检测。本文所公开的实施方案可以用 于筛选尤其与心血管健康、脂质/代谢标识、种族鉴别、父权匹配、人ID(例如匹配嫌疑犯与SNP标识的罪犯数据库)相关联的不同SNP的板块。本文所 公开的实施方案还可以用于与癌症肿瘤相关并且从癌症肿瘤释放的突变的无 细胞DNA检测。本文所公开的实施方案还可以用于肉质量的检测,例如, 通过提供给定的肉产品中不同动物来源的快速检测。本文所公开的实施方案 还可以用于与DNA相关的GMO或基因编辑的检测。如本文别处所描述,可以通过在gRNA中引入合成错配来区分密切相关的基因型/等位基因或生物 标志(例如在给定的靶序列中仅具有单核苷酸差异)。
在一个方面,本发明涉及一种用于检测样品中的靶核酸的方法,所述方 法包括:
a.将样品或样品组分配到一个或多个个别离散体积中,所述个别离散体 积包含如本文所描述的根据本发明的CRISPR系统;
b.在足以允许一种或多种向导RNA结合至一种或多种靶分子的条件下 孵育样品或样品组;
c.经由一种或多种向导RNA结合至一种或多种靶分子来活化CRISPR 效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便 产生可检测的阳性信号;以及
d.检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中一 种或多种靶分子的存在。
生物标志样品类型
本文所描述的测定的灵敏度非常适合于多种生物样品类型,包括靶核酸 是稀释的或样品材料受限制的样品类型中靶核酸的检测。生物标志筛选可以 对许多样品类型进行,包括但不限于唾液、尿液、血液、粪便、痰液和脑脊 髓液。本文所公开的实施方案还可以用于检测基因的上调和/或下调。举例来说,可以连续稀释样品以使得仅过度表达的基因保持高于测定的检测限临界 值。
在某些实施方案中,本发明提供了获得生物流体(例如尿液、血液血浆或 血清、痰液、脑脊髓液)的样品以及提取DNA的步骤。有待检测的突变体核 苷酸序列可以是较大分子的一部分或可以最初作为离散分子存在。
在某些实施方案中,从癌症患者的血浆/血清中分离DNA。为作比较, 从赘生组织中分离DNA样品,并且可以从来自同一患者的非赘生组织中分 离第二样品,例如淋巴细胞。非赘生组织可以与赘生组织类型相同或来自不 同器官来源。在某些实施方案中,收集血液样品并且立即通过离心从血液细 胞中分离血浆。可以将血清过滤并冷冻储存直至DNA提取。
在某些示例性实施方案中,检测直接来自粗的或未加工的样品,例如血 液、血清、唾液、脑脊髓液、痰液或尿液的靶核酸。在某些示例性实施方案中,靶核酸是无细胞DNA。
循环肿瘤细胞
在一个实施方案中,可以用本发明测定循环细胞(例如循环肿瘤细胞 (CTC))。可以进行用于本文所描述的任何方法中的循环肿瘤细胞(CTC)的分 离。可以用于本发明中的达成循环细胞的特异性和灵敏检测和捕获的例示性 技术已有描述(Mostert B等,Circulating tumor cells(CTCs):detection methods and their clinical relevancein breast cancer.Cancer Treat Rev.2009;35:463-474; 以及Talasaz AH等,Isolatinghighly enriched populations of circulating epithelial cells and other rarecells from blood using a magnetic sweeper device.Proc Natl Acad Sci U SA.2009;106:3970-3975)。在105-106个外周血单核细胞的背景 下可以发现少至一个CTC(Ross A A等,Detection and viability of tumor cells in peripheral blood stemcell collections from breast cancer patients using immunocytochemical andclonogenic assay techniques.Blood.1993,82:2605-2610)。平台使用免疫磁性珠粒,所述珠粒涂布有针 对上皮细胞粘附分子(EpCAM)的抗体以富集表达EPCAM的上皮细胞,继之以免疫染色以确认细胞角蛋白染色的存在和白细胞标志CD45的不存在来确认所捕获的细胞是上皮肿瘤细胞(Momburg F等,Immunohistochemical study of theexpression of a Mr 34,000human epithelium-specific surface glycoprotein innormal and malignant tissues.Cancer Res.1987;47:2883-2891;以及Allard WJ 等,Tumor cells circulate in the peripheral blood of all major carcinomas but notin healthy subjects or patients with nonmalignant diseases.Clin CancerRes.2004; 10:6897-6904)。所捕获的细胞数目已经预期地展示对患有晚期疾病的乳癌、结肠直肠癌和前列腺癌患者的预后意义(Cohen SJ等,J Clin Oncol. 2008;26:3213-3221;Cristofanilli M等,N Engl J Med.2004;351:781-791; Cristofanilli M等,JClin Oncol.2005;23:1420-1430;以及de Bono JS等,Clin Cancer Res.2008;14:6302-6309)。
本发明还提供了用CTC-芯片技术分离CTC。CTC-芯片是基于微流体的 CTC捕获装置,其中血液流过腔室,所述腔室含有数千个涂布有CTC所结合 的抗EpCAM抗体的微柱(Nagrath S等,Isolation of rare circulating tumour cells in cancer patients bymicrochip technology.Nature.2007;450:1235-1239)。CTC- 芯片与系统相比提供CTC计数和纯度的显著增加(Maheswaran S 等,Detection of mutations in EGFRin circulating lung-cancer cells,N Engl J Med. 2008;359:366-377),这两个平台均可以用于下游分子分析。
无细胞染色质
在某些实施方案中,根据本发明分离和分析无细胞染色质片段。可以在 健康个体(Stroun等,Annals of the New York Academy of Sciences 906:161-168 (2000))以及患有疾病病况的个体的血清中检测核小体。此外,核小体的血清 浓度在罹患良性和恶性疾病,例如癌症和自身免疫疾病的患者中明显较高 (Holdenrieder等(2001)Int J Cancer95,1 14-120;Trejo-Becerril等(2003)Int J Cancer 104,663-668;Kuroi等1999BreastCancer 6,361-364;Kuroi等(2001) Int j Oncology 19,143-148;Amoura等(1997)ArthRheum 40,2217-2225;Williams等(2001)J Rheumatol 28,81-94)。不受理论束缚,带有肿瘤的患者 中核小体的高浓度来源于在增生性肿瘤中自发发生的凋亡。在血液中循环的 核小体含有独特修饰的组蛋白。举例来说,美国专利公布号2005/0069931(2005年3月31日)涉及使用针对特异性组蛋白N端修饰的抗体作为疾病的 诊断指示剂,采用此类组蛋白特异性抗体从患者的血液或血清样品中分离核 小体以促进伴随DNA的纯化和分析用于诊断/筛选目的。因此,本发明可以 使用染色质结合的DNA以检测和监测例如肿瘤突变。与修饰的组蛋白相关 联的DNA的鉴别可以充当疾病和先天性缺陷的诊断标志。
因此,在另一个实施方案中,分离的染色质片段来源于循环染色质,优 选循环单核小体和寡核小体。分离的染色质片段可以来源于生物样品。生物 样品可以来自有需要的受试者或患者。生物样品可以是血清、血浆、淋巴、 血液、血液部分、尿液、滑液、脊髓液、唾液、循环肿瘤细胞或粘液。
无细胞DNA(cfDNA)
在某些实施方案中,本发明可以用于检测无细胞DNA(cfDNA)。血浆或 血清中的无细胞DNA可以用作非侵入性诊断工具。举例来说,已经研究和 优化无细胞胎儿DNA用于对相容RhD因子的测试、X连锁遗传病症的性别 确定、单基因病症的测试、子痫前期的鉴别。举例来说,对母体血浆中cfDNA的胎儿细胞部分进行测序是检测与胎儿染色体非整倍性相关联的拷贝数的可 靠方法。另举一例,从癌症患者中分离的cfDNA已经用于检测与治疗决策相关的关键基因中的突变。
在某些示例性实施方案中,本公开提供了检测直接来自患者样品的 cfDNA。在某一其他示例性实施方案中,本公开提供了使用上文所公开的富 集实施方案并且在检测靶cfDNA之前富集cfDNA。
核外体
在一个实施方案中,可以用本发明测定核外体。核外体是已经显示含有 RNA的小细胞外囊泡。通过超离心、过滤、化学沉淀、尺寸排阻色谱法和微 流体分离核外体在本领域中是已知的。在一个实施方案中,使用核外体生物 标志纯化核外体。核外体从生物样品中的分离和纯化可以通过任何已知方法 进行(参见例如WO2016172598A1)。
SNP检测和基因分型
在某些实施方案中,如本文所述,本发明可以用于检测生物样品中单核 苷酸多态性(SNP)的存在。SNP可以与产科测试相关(例如性别确定、胎儿缺 陷)。SNP可以与刑事侦查相关。在一个实施方案中,可以由本发明鉴别刑事 侦查中的嫌疑犯。不受理论束缚,基于核酸的法庭证据可能需要可用于检测 嫌疑犯或受害者的遗传物质的最灵敏测定,这是因为所测试的样品可能有限。
在其他实施方案中,本发明涵盖与疾病相关联的SNP。与疾病相关联的 SNP在本领域中是众所周知的,并且本领域技术人员可以应用本发明方法来 设计适合的向导RNA(参见例如www.ncbi.nlm.nih.gov/clinvar?term=human%5Borgn%5D)。
在一个方面,本发明涉及一种用于基因分型,例如SNP基因分型的方法, 所述方法包括:
a)将样品或样品组分配到一个或多个个别离散体积中,所述个别离散体 积包含如本文所描述的根据本发明的CRISPR系统;
b)在足以允许一种或多种向导RNA结合至一种或多种靶分子的条件下 孵育样品或样品组;
c)经由一种或多种向导RNA结合至一种或多种靶分子来活化CRISPR 效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便 产生可检测的阳性信号;以及
d)检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中对于特定基因型所特有的一种或多种靶分子的存在。
在某些实施方案中,将可检测信号与一种或多种标准信号,优选合成标 准信号相比较(例如通过比较信号强度),例如,图60的示例性实施方案中所 说明。在某些实施方案中,标准是特定基因型或对应于特定基因型。在某些 实施方案中,标准包含特定SNP或其他(单)核苷酸变异。在某些实施方案中, 标准是(PCR扩增的)基因型标准。在某些实施方案中,标准是DNA或包含 DNA。在某些实施方案中,标准是RNA或包含RNA。在某些实施方案中,标准是从DNA转录的RNA或包含从DNA转录的RNA。在某些实施方案中, 标准是从RNA逆转录的DNA或包含从RNA逆转录的DNA。在某些实施方案中,将可检测信号与一种或多种标准相比较,所述标准中的每一种对应于 已知的基因型,例如SNP或其他(单)核苷酸变异。在某些实施方案中,将可 检测信号与一种或多种标准信号相比较并且比较包括统计分析,例如通过参 数和非参数统计分析,例如通过单因素或两因素ANOVA等。在某些实施方 案中,将可检测信号与一种或多种标准信号相比较,并且当可检测信号并不 (统计上)显著偏离标准时,将基因型确定为对应于所述标准的基因型。
在其他实施方案中,本发明允许用于急诊药物基因组学的快速基因分型。 在一个实施方案中,单点护理测定可以用于对进入急诊室的患者进行基因分 型。患者可能疑似具有血液凝块并且急诊医师需要决定血液稀释剂施用的剂 量。在例示性实施方案中,本发明可以在心肌梗塞或中风治疗期间基于例如 VKORC1、CYP2C9和CYP2C19的标志的基因分型来提供关于施用血液稀释剂的指导。在一个实施方案中,血液稀释剂是抗凝血剂华法林(warfarin) (Holford,NH(1986年12月)."Clinical Pharmacokinetics andPharmacodynamics of Warfarin Understanding the Dose-Effect Relationship".Clinical Pharmacokinetics.Springer International Publishing.11(6):483-504)。与血液凝 结相关联的基因在本领域中是已知的(参见例如US20060166239A1;Litin SC,Gastineau DA(1995)"Current concepts in anticoagulant therapy".Mayo Clin.Proc.70(3):266-72;以及Rusdiana等,Responsiveness to low-dose warfarinassociated with genetic variants of VKORC1,CYP2C9,CYP2C19,and CYP4F2 in anIndonesian population.Eur J Clin Pharmacol.2013年3月;69(3):395-405)。 具体地说,在VKORC1 1639(或3673)单核苷酸多态性中,常见(“野生型”)G 等位基因由A等位基因置换。具有A等位基因(或“A单体型”)的人相比具有 G等位基因(或“非A单体型”)的那些人产生较少VKORC1。这些变体的流行率也因种族而异,其中37%的高加索人和14%的非洲人携带A等位基因。最 终结果是凝结因子的数目减少并且因此凝结的能力降低。
在某些示例性实施方案中,用于检测患者中的SNP的遗传物质的可用性 允许在DNA或RNA样品无扩增的情况下检测SNP。在基因分型的情况下, 容易获得所测试的生物样品。在某些示例性实施方案中,可以缩短本发明的 孵育时间。可以在酶促反应发生所需的时间段内进行测定。本领域技术人员 可以在5分钟内进行生物化学反应(例如5分钟接合)。本发明可以使用自动 化DNA提取装置以从血液获得DNA。然后可以将DNA添加至产生效应蛋白的靶分子的反应中。在产生靶分子后立即可以切断掩蔽剂并且检测信号。在例示性实施方案中,本发明允许POC快速诊断用于在施用药物(例如血液 稀释剂)之前确定基因型。在使用扩增步骤的情况下,所有反应都在一步过程 中在同一反应中发生。在优选实施方案中,可以在小于一小时,优选10分钟、 20分钟、30分钟、40分钟或50分钟内进行POC测定。
在某些实施方案中,本文所公开的系统、装置和方法可以用于检测长非 编码RNA(lncRNA)的存在或表达水平。某些lncRNA的表达与疾病病况和/ 或抗药性相关联。特别地,某些lncRNA(例如TCONS_00011252、NR_034078、 TCONS_00010506、TCONS_00026344、TCONS_00015940、TCONS_00028298、 TCONS_00026380、TCONS_0009861、TCONS_00026521、TCONS_00016127、 NR_125939、NR_033834、TCONS_00021026、TCONS_00006579、NR_109890 和NR_026873)与以下相关联:对癌症治疗的抗性,例如,对用于治疗黑素瘤 (例如结节性黑素瘤、恶性雀斑样痣、恶性雀斑样痣黑素瘤、肢端雀斑样痣性 黑素瘤、浅表扩散性黑素瘤、粘膜黑素瘤、息肉状黑素瘤、促结缔组织增生 性黑素瘤、无黑色素性黑素瘤和软组织黑素瘤)的一种或多种BRAF抑制剂(例 如威罗菲尼、达拉菲尼(Dabrafenib)、索拉非尼(Sorafenib)、GDC-0879、 PLX-4720和LGX818)的抗性。使用本文所描述的各种实施方案检测lncRNA 可以有助于疾病诊断和/或治疗选项的选择。
在一个实施方案中,本发明可以向导DNA或RNA靶向的疗法(例如 CRISPR、TALE、锌指蛋白、RNAi),特别是在疗法的快速施用对治疗结果 很重要的设置中。
LOH检测
癌细胞当与正常细胞相比时经历遗传物质(DNA)的损失。几乎所有(如果 并非全部)癌症所经历的这种遗传物质缺失被称作“杂合性损失”(LOH)。杂合 性损失(LOH)是引起整个基因和周围染色体区的损失的总染色体事件。杂合 性损失在癌症中常发生,在此其可以指示损失的区域中不存在功能性肿瘤抑 制基因。然而,损失可能是沉默的,这是因为仍然有一个功能性基因保留在 染色体对的另一个染色体上。肿瘤抑制基因的剩余拷贝可以通过点突变而灭 活,导致肿瘤抑制基因的损失。遗传物质从癌细胞损失可以引起在染色体上特定基因座处对于细胞存活力或细胞生长至关重要的基因的两个或更多个等 位基因中的一个的选择性损失。
“LOH标志”是来自微卫星基因座的DNA,当与正常细胞相比时,其中的 缺失、改变或扩增与癌症或其他疾病相关联。LOH标志常常与肿瘤抑制基因 或另一个通常是肿瘤相关基因的损失相关联。
术语“微卫星”是指广泛分布于人基因组中的DNA的短重复序列。微卫星 是少量串联重复(即,邻近)的DNA基序,其长度在两个至五个核苷酸的范围 内,并且通常重复5-50次。举例来说,序列TATATATATA(SEQ.I.D.No.418) 是二核苷酸微卫星,并且GTCGTCGTCGTCGTC(SEQ.I.D.No.419)是三核苷 酸微卫星(其中A是腺嘌呤,G是鸟嘌呤,C是胞嘧啶,并且T是胸腺嘧啶)。 此类微卫星的重复长度的体细胞改变已经显示出代表肿瘤的特有特征。向导 RNA可以被设计成检测此类微卫星。此外,本发明可以用于检测重复长度的改变,以及基于可检测信号的定量的扩增和缺失。某些微卫星位于基因的调 控性侧接或内含子区中,或直接在基因的密码子中。微卫星突变在此类情况 下可以导致表型变化和疾病,特别是三联体扩张疾病,例如脆性X综合征和亨廷顿氏病。
特定染色体区上的频繁杂合性损失(LOH)已经在许多种类的恶性病中有 报道。特定染色体区上的等位基因损失是在多种恶性病中观测到的最常见的 遗传改变,因此,微卫星分析已经应用于检测来自体液,例如肺癌的痰液和 膀胱癌的尿液的样本中的癌细胞的DNA。(Rouleau等Nature 363,515-521(1993);和Latif等Science 260,1317-1320(1993))。此外,已经确立了在患有癌症和一些其他疾病的个体的血浆中存在浓度明显增加的可溶性DNA,指示 无细胞血清或血浆可以用于检测具有微卫星异常的癌症DNA。(Kamp等 Science264,436-440(1994);以及Steck等Nat Genet.15(4),356-362(1997))。 两个小组已经报道了患有小细胞肺癌或头颈癌的有限数目的患者的血浆或血清中的微卫星改变。(Hahn等Science 271,350-353(1996);以及Miozzo等 Cancer Res.56,2285-2288(1996))。先前也已经显示了黑素瘤患者的肿瘤和血 清中杂合性损失的检测(参见例如美国专利号US6465177B1)。
因此,有利的是检测罹患癌症或处于癌症风险下的受试者中的LOH标 志。本发明可以用于检测肿瘤细胞中的LOH。在一个实施方案中,循环肿瘤 细胞可以用作生物样品。在优选实施方案中,获自血清或血浆的无细胞DNA 用于非侵入性地检测和/或监测LOH。在其他实施方案中,生物样品可以是本 文所描述的任何样品(例如膀胱癌的尿液样品)。不受理论束缚,本发明可以 用于在与任何先前方法相比改善的灵敏度下检测LOH标志,由此提供了突变 事件的早期检测。在一个实施方案中,在生物流体中检测LOH,其中LOH 的存在与癌症的发生相关联。本文所描述的方法和系统通过提供用于检测与 癌症相关联的特异性等位基因的LOH的非侵入性、快速和准确方法而表现出 优于先前技术,例如PCR或组织活检的重大进步。因此,本发明提供了可以用于筛选高风险群体和监测经历化学预防、化学疗法、免疫疗法或其他治疗 的高风险患者的方法和系统。
因为本发明的方法仅需要从例如血液的体液中提取DNA,所以其可以在 任何时间和对单个患者重复进行。可以在手术之前或之后;在治疗,例如化 学疗法、放射疗法、基因疗法或免疫疗法之前、期间和之后;或在治疗之后 对疾病进展、稳定性或复发进行跟踪检查期间获取血液并监测LOH。不受理 论束缚,本发明的方法还可以用于使用对那个患者具有特异性的LOH标志检 测亚临床疾病的存在或复发,这是因为LOH标志对个别患者的肿瘤具有特异性。方法还可以使用肿瘤特异性LOH标志检测多发性转移是否可能存在。
表观遗传修饰的检测
指示癌症或癌症进展的组蛋白变体、DNA修饰和组蛋白修饰可以用于本 发明中。举例来说,美国专利公布20140206014描述了癌症样品与健康受试 者相比具有提高的核小体H2AZ、macroH2A1.1、5-甲基胞嘧啶、 P-H2AX(Ser139)水平。个体中癌细胞的存在由于癌细胞的凋亡增加可以产生 血液中较高水平的无细胞核小体。在一个实施方案中,针对与凋亡相关联的标志,例如H2B Ser 14(P)的抗体可以用于鉴别已经从凋亡性赘生细胞中释放的单个核小体。因此,可以根据本发明在高灵敏度和准确度下有利地分析由 肿瘤细胞产生的DNA。
产前筛选
在某些实施方案中,本发明的方法和系统可以用于产前筛选中。在某些 实施方案中,无细胞DNA用于产前筛选的方法中。在某些实施方案中,可 以用本发明检测与单个核小体或寡核小体相关联的DNA。在优选实施方案 中,与单个核小体或寡核小体相关联的DNA的检测用于产前筛选。在某些 实施方案中,无细胞染色质片段用于产前筛选的方法中。
产前诊断或产前筛选是指测试在出生之前胎儿或胚胎的疾病或状况。目 的是检测出生缺陷,例如神经管缺陷、唐氏综合征、染色体异常、遗传病症 和其他状况,例如脊柱裂、颚裂、泰萨氏病(Tay Sachs disease)、镰状细胞性 贫血、地中海贫血、囊性纤维化、肌营养不良和脆性X综合征。筛选还可以 用于产前性别甄别。常用测试程序包括羊膜穿刺、超声波检查(包括颈半透明 度超声波)、血清标志测试或遗传筛选。在一些情况下,施用测试以确定胎儿 是否将被流产,不过医师和患者还发现其适用于早期诊断高风险妊娠以便可以在三级护理医院安排分娩,在此婴儿可以接受适当护理。
已经认识到母亲的血液中存在胎儿细胞,并且这些细胞提供用于产前基 于DNA的诊断的胎儿染色体的潜在来源。另外,胎儿DNA在母体血液中的 总DNA的约2-10%的范围内。当前可用的产前遗传测试通常涉及侵入性程 序。举例来说,对妊娠约10-12周的孕妇进行的绒毛膜绒毛取样(CVS)和约 14-16周进行的羊膜穿刺全部含有侵入性程序以获得样品用于测试胎儿中的 染色体异常。经由这些取样程序获得的胎儿细胞通常使用细胞遗传学或荧光 原位杂交(FISH)分析来测试染色体异常。无细胞胎儿DNA已经显示早在孕六周就存在于孕妇的血浆和血清中,在妊娠期间浓度升高并且在分娩之前达到 峰值。因为这些细胞在妊娠很早期出现,所以其可以构成准确、非侵入性、 孕早期测试的基础。不受理论束缚,本发明在检测少量的胎儿DNA中提供 前所未有的灵敏度。不受理论束缚,大量的母体DNA一般与所关注的胎儿 DNA一起伴随地发现,由此降低胎儿DNA定量和突变检测的灵敏度。本发明由出乎意料的高测定灵敏度克服了此类问题。
组蛋白的H3类别由四种不同蛋白质类型组成:主要类型H3.1和H3.2; 替换类型H3.3;以及睾丸特异性变体H3t。尽管H3.1和H3.2密切相关,仅 在Ser96处不同,但H3.1在至少5个氨基酸位置处不同于H3.3。此外,H3.1与其在包括肝、肾和心的成人组织中的存在相比在胎儿的肝中高度富集。在 成人组织中,H3.3变体比H3.1变体更丰富,而对于胎儿的肝正相反。本发 明可以使用这些差异以检测包含胎儿与母体细胞和/或胎儿核酸的母体生物样品中的胎儿核小体和胎儿核酸。
在一个实施方案中,胎儿核小体可以获自血液。在其他实施方案中,胎 儿核小体获自宫颈粘液样品。在某些实施方案中,在妊娠的孕中期早期或孕 早期后期通过对孕妇拭抹或灌洗来获得宫颈粘液样品。可以将样品放置在孵 育箱中以释放截留于粘液中的DNA。孵育箱可以设定为37℃。可以将样品 摇晃约15至30分钟。可以用粘蛋白酶进一步溶解粘液用于达成释放DNA 的目的。样品还可以经受如本领域中众所周知的条件,例如化学处理等,以 诱导凋亡来释放胎儿核小体。因此,可以用诱导凋亡剂处理宫颈粘液样品,借此释放胎儿核小体。关于循环胎儿DNA的富集,参考美国专利公布号 20070243549和20100240054。当将方法和系统应用于仅小部分的核小体或 DNA可能源于胎儿的产前筛选时,本发明尤其有利。
根据本发明的产前筛选可以用于以下疾病:包括但不限于三体型13、三 体型16、三体型18、克氏综合征(47,XXY)、(47,XYY)和(47,XXX)、特 纳综合征、唐氏综合征(三体型21)、囊性纤维化、亨廷顿氏病、β型地中海贫血、肌强直性营养不良、镰状细胞性贫血、卟啉症、脆性X综合征、罗伯 逊易位、安格尔曼综合征、迪乔治综合征和沃尔夫-赫斯霍恩综合征。
本发明的若干其他方面涉及诊断、预后和/或治疗与大范围的遗传疾病相 关联的缺陷,所述遗传疾病在国家卫生研究院的网站上在主题分部遗传病症 (GeneticDisorders)下进一步描述(网站health.nih.gov/topic/Genetic Disorders)。
癌症和癌症抗药性检测
在某些实施方案中,本发明可以用于检测与癌症相关联的基因和突变。 在某些实施方案中,检测与抗性相关联的突变。在肿瘤细胞的克隆群体中抗 性肿瘤细胞的扩增或抗性突变的出现在治疗期间可能会发生(参见例如Burger JA等,Clonal evolution inpatients with chronic lymphocytic leukaemia developing resistance to BTKinhibition.Nat Commun.2016年5月20 日;7:11589;Landau DA等,Mutations drivingCLL and their evolution in progression and relapse.Nature.2015年10月22日;526(7574):525-30;Landau DA等,Clonal evolution in hematological malignancies andtherapeutic implications.Leukemia.2014年1月;28(1):34-43;以及Landau DA等,Evolution and impact of subclonal mutations in chronic lymphocyticleukemia.Cell.2013年 2月14日;152(4):714-26)。因此,检测此类突变需要高度灵敏测定并且监测 需要重复活检。重复活检是不便利的、侵入性的和高成本的。使用本领域中 已知的先前方法可能难以在血液样品或其他非侵入性收集的生物样品(例如 血液、唾液、尿液)中检测抗性突变。抗性突变可以指与对化学疗法、靶向疗法或免疫疗法的抗性相关联的突变。
在某些实施方案中,突变在个别癌症中出现,其可以用于检测癌症进展。 在一个实施方案中,与针对肿瘤的T细胞细胞溶解活性相关的突变已经得到 表征并且可以由本发明检测(参见例如Rooney等,Molecular and genetic properties of tumors associatedwith local immune cytolytic activity,Cell.2015年 1月15日;160(1-2):48-61)。可以基于这些突变的检测开发用于患者的个性化疗法(参见例如WO2016100975A1)。在某些实施方案中,与细胞溶解活性相 关联的癌症特异性突变可以是选自由以下组成的组的基因中的突变:CASP8、B2M、PIK3CA、SMC1A、ARID5B、TET2、ALPK2、COL5A1、TP53、DNER、 NCOR1、MORC4、CIC、IRF6、MYOCD、ANKLE1、CNKSR1、NF1、SOS1、 ARID2、CUL4B、DDX3X、FUBP1、TCP11L2、HLA-A、B或C、CSNK2A1、 MET、ASXL1、PD-L1、PD-L2、IDO1、IDO2、ALOX12B和ALOX15B,或 拷贝数增加,不包括影响以下染色体带中的任一个的全染色体事件:6q16.1-q21、6q22.31-q24.1、6q25.1-q26、7p11.2-q11.1、8p23.1、8p11.23-p11.21 (含有IDO1、IDO2)、9p24.2-p23(含有PDL1、PDL2)、10p15.3、10p15.1-p13、 11p14.1、12p13.32-p13.2、17p13.1(含有ALOX12B、ALOX15B)和 22q11.1-q11.21。
在某些实施方案中,本发明用于在疗程期间和在治疗完成之后检测癌症 突变(例如抗性突变)。本发明的灵敏度可以允许在治疗期间出现的克隆突变 的非侵入性检测并且可以用于检测疾病的复发。
在某些示例性实施方案中,差异表达的微小RNA(miRNA)的miRNA和/ 或miRNA标识的检测可以用于检测或监测癌症的进展和/或检测对癌症疗法 的抗药性。举例来说,Nadal等(Nature Scientific Reports,(2015) doi:10.1038/srep12464)描述了可以用于检测非小细胞肺癌(NSCLC)的mRNA 标识。
在某些示例性实施方案中,细胞的克隆亚群中抗性突变的存在可以用于 确定治疗方案。在其他实施方案中,可以基于常见肿瘤突变施用用于治疗患 者的个性化疗法。在某些实施方案中,常见突变对治疗作出反应而产生并且 导致抗药性。在某些实施方案中,本发明可以用于针对获得突变的细胞或带 有此类抗药性突变的细胞的扩增来监测患者。
用各种化学治疗剂,尤其用例如酪氨酸激酶抑制剂的靶向疗法治疗频繁 导致靶分子中抵抗治疗剂活性的新突变。用以克服这种抗性的多种策略正在 评估中,包括不受这些突变影响的第二代疗法的开发和用多种剂,包括作用 于抗性突变下游的那些剂的治疗。在例示性实施方案中,针对依鲁替尼,一 种靶向布鲁顿氏酪氨酸激酶(BTK)并且用于CLL和某些淋巴瘤的分子的常见 突变是在位置481处的半胱氨酸至丝氨酸变化(BTK/C481S)。靶向表皮生长 因子受体(EGFR)的酪氨酸激酶结构域的埃罗替尼通常用于肺癌治疗,并且在疗法之后总是发展出抗性肿瘤。抗性克隆体中发现的常见突变是在位置790 处的苏氨酸至甲硫氨酸突变。
在癌症患者的群体之间共享的非沉默突变和可以用本发明检测的常见抗 性突变在本领域中是已知的(参见例如WO/2016/187508)。在某些实施方案中, 可以通过用依鲁替尼、埃罗替尼、伊马替尼、吉非替尼、克唑替尼、曲妥珠 单抗、威罗菲尼、RAF/MEK、检查点阻断疗法或抗雌激素疗法治疗来诱导抗 药性突变。在某些实施方案中,癌症特异性突变存在于一种或多种编码选自由以下组成的组的蛋白质的基因中:程序性死亡配体1(PD-L1)、雄激素受体 (AR)、布鲁顿氏酪氨酸激酶(BTK)、表皮生长因子受体(EGFR)、BCR-Abl、 c-kit、PIK3CA、HER2、EML4-ALK、KRAS、ALK、ROS1、AKT1、BRAF、 MEK1、MEK2、NRAS、RAC1和ESR1。
免疫检查点是减慢或阻止免疫反应的抑制性途径并且防止因免疫细胞的 不受控活性所致的过度组织损伤。在某些实施方案中,所靶向的免疫检查点 是程序性死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施方案中,所靶向 的免疫检查点是细胞毒性T-淋巴细胞相关抗原(CTLA-4)。在额外实施方案 中,所靶向的免疫检查点是CD28和CTLA4 Ig超家族的另一个成员,例如 BTLA、LAG3、ICOS、PDL1或KIR。在其他额外实施方案中,所靶向的免 疫检查点是TNFR超家族的成员,例如CD40、OX40、CD137、GITR、CD27 或TIM-3。
最近,已经在单细胞水平上表征肿瘤和其微环境中的基因表达(参见例如 Tirosh等Dissecting the multicellular ecosystem of metastatic melanoma by singlecell RNA-seq.Science 352,189-196,doi:10.1126/science.aad0501(2016));Tirosh等,Single-cell RNA-seq supports a developmental hierarchy in humanoligodendroglioma.Nature.2016年11月10日;539(7628):309-313.doi: 10.1038/nature20123.Epub 2016年11月2日;以及国际专利公布序列号WO 2017004153A1)。在某些实施方案中,可以使用本发明检测基因标识。在一个实施方案中,在肿瘤微环境中监测或检测补体基因。在一个实施方案中, 监测或检测MITF和AXL程序。在一个实施方案中,检测肿瘤特异性干细胞 或祖细胞标识。此类标识指示了免疫反应的状态和肿瘤的状态。在某些实施 方案中,可以在增殖、对治疗的抗性和免疫细胞的丰度方面检测肿瘤的状态。
因此,在某些实施方案中,本发明提供了用于循环DNA,例如肿瘤DNA 的低成本、快速、多元化癌症检测板块,尤其用于监测疾病复发或常见抗性 突变的发展。
免疫疗法应用
本文所公开的实施方案还可以适用于其他免疫疗法情形。举例来说,在 一些实施方案中,对受试者中的免疫反应进行诊断、预后和/或分段的方法包 括检测一种或多种生物标志的表达、活性和/或功能的第一水平以及将所检测 的水平与对照水平相比较,其中所检测的水平与对照水平的差异指示受试者 中免疫反应的存在。
在某些实施方案中,本发明可以用于确定肿瘤浸润性淋巴细胞(TIL)的功 能障碍或活化。可以使用已知方法从肿瘤中分离TIL。可以分析TIL以确定 其是否应该用于过继细胞转移疗法中。另外,嵌合抗原受体T细胞(CAR T 细胞)在施用于受试者之前可以针对功能障碍或活化的标识进行分析。功能障碍和活化的T细胞的例示性标识已有描述(参见例如Singer M等,A Distinct Gene Module for Dysfunction Uncoupled from Activationin Tumor-Infiltrating T Cells.Cell.2016年9月8日;166(6):1500-1511.e9.doi:10.1016/j.cell.2016.08.052)。
在一些实施方案中,C2c2用于评估免疫细胞,例如T细胞(例如CD8+ 和/或CD4+T细胞)的状态。特别地,可以例如基于与一种或多种T细胞状态 相关联的基因或基因标识来确定T细胞活化和/或功能障碍。以这种方式,c2c2 可以用于确定T细胞的一个或多个亚群的存在。
在一些实施方案中,C2c2可以用于诊断测定中或可以用作确定患者是否 适合于施用免疫疗法或另一种类型的疗法的方法。举例来说,可以经由c2c2 进行基因或生物标志标识的检测以确定患者是否对给定的治疗有反应,或如果患者无反应,那么这可能归因于T细胞功能障碍。此种检测提供关于患者 最适于接受的疗法类型的信息。举例来说,患者是否应该接受免疫疗法。
在一些实施方案中,本文所公开的系统和测定可以允许临床医师鉴别患 者对疗法(例如过继细胞转移(ACT)疗法)的反应是否归因于细胞功能障碍,并 且如果是这样的话,跨越生物标志标识的上调和下调的水平将允许解决问题。 举例来说,如果接受ACT的患者是无反应的,那么可以通过本文所公开的测定来测定作为ACT的一部分施用的细胞以确定已知与细胞活化和/或功能障 碍状态相关联的生物标志标识的相对表达水平。如果特定抑制性受体或分子 在ACT细胞中上调,那么可以用受体或分子的抑制剂治疗患者。如果特定刺激性受体或分子在ACT细胞中下调,那么可以用受体或分子的激动剂治疗患 者。
在某些示例性实施方案中,本文所描述的系统、方法和装置可以用于筛 选鉴别特定细胞类型、细胞表型或细胞状态的基因标识。同样地,经由使用 例如压缩传感的方法,本文所公开的实施方案可以用于检测转录组。基因表 达数据是高度结构化的,使得一些基因的表达水平预测其他基因的表达水平。 基因表达数据是高度结构化的认知允许假设系统中的自由度数是很小的,这允许假设相对基因丰度的计算基础是稀疏的。有可能作出若干生物学上推动 的假设,其允许申请者在欠取样下恢复非线性相互作用项而无需具有基因可 能相互作用的任何特定认知。特别地,如果申请者假设遗传相互作用是低秩 的、稀疏的或这些的组合,那么真正的自由度数相对于完全组合扩展是很小 的,这使申请者能够推断具有相对小的扰动数的完整非线性景观。围绕这些 假设工作,矩阵补全和压缩传感的分析理论可以用于设计欠取样的组合扰动实验。另外,核学习框架可以用于通过创建组合扰动的预测功能而不直接学 习任何个别相互作用系数来采用欠取样压缩传感提供了用以鉴别有待检测的 靶转录物的最小数目的方式以获得综合基因表达型态。压缩传感的方法在2016年10月27日提交的PCT/US2016/059230"Systems and Methods for DeterminingRelative Abundances of Biomolecules"中公开,其以引用的方式并入本文中。使用如压缩传感的方法鉴别最小转录物标靶组,然后可以设计一 组相应的向导RNA以检测所述转录物。因此,在某些示例性实施方案中,获 得细胞的基因表达型态的方法包括使用本文所公开的实施方案检测提供细胞 或细胞群体的基因表达型态的最小转录物组。
检测基因编辑和/或脱靶效应
本文所公开的实施方案可以与其他基因编辑工具组合使用,以确认一个 或多个期望的基因编辑是成功的和/或检测任何脱靶效应的存在。可以使用针 对一个或多个靶基因座的一种或多种向导筛选已编辑的细胞。由于本文所公 开的实施方案利用CRISPR系统,因此也设想了治疗诊断应用。举例来说, 本文所公开的基因分型实施方案可用于选择适当的靶基因座或鉴别需要标靶 编辑的细胞或细胞群。然后可以使用相同或单独的系统来确定编辑效率。如 下文的工作实施例中所述,本文所公开的实施方案可用于在短至一周内设计 流线型治疗诊断途径。
检测核酸标记的项目
或者,本文所描述的实施方案可以用于检测核酸标识符。核酸标识符是 可以用于鉴别特定物品的非编码核酸。示例性核酸标识符,例如DNA水印, 在Heider和Barnekow.“DNA watermarks:A proof of concept"BMC Molecular Biology 9:40(2008)中描述。核酸标识符还可以是核酸条形码。基于核酸的条 形码是核苷酸(例如DNA、RNA或它们的组合)的短序列,其用作相关分子,例如靶分子和/或靶核酸的标识符。核酸条形码可以具有至少例如4、5、6、7、 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、35、40、45、50、60、70、80、90或100个核苷 酸的长度,并且可以呈单链或双链形式。一个或多个核酸条形码可以附接或 “标记”至靶分子和/或靶核酸。这种附接可以是直接的(例如条形码与靶分子的共价或非共价结合)或间接的(例如经由额外分子,例如特异性结合剂,例如 抗体(或其他蛋白质),或条形码接收衔接子(或其他核酸分子))。靶分子和/或靶核酸可以用多个核酸条形码以组合方式,例如核酸条形码多联体作标记。 通常,核酸条形码用于将靶分子和/或靶核酸鉴别为来自特定区室(例如离散体 积),具有特定物理特性(例如亲和力、长度、序列等),或已经经受某些治疗 条件。靶分子和/或靶核酸可以与多个核酸条形码相关联以提供关于所有这些 特征(和更多特征)的信息。产生核酸条形码的方法在例如国际专利申请公布号WO/2014/047561中公开。
本申请进一步提供了展示稳固活性的C2c2直系同源物,使其特别适合于 RNA裂解和检测的不同应用。这些应用包括但不限于本文所描述的那些。更 特别地,展示比所测试的其他具有更强活性的直系同源物是从生物体韦德纤 毛菌(LwC2c2)鉴别的C2c2直系同源物。本申请因此提供了修饰所关注的靶基因座的方法,所述方法包括向所述基因座递送非天然产生的或工程改造的 组合物,所述组合物包含C2c2效应蛋白,更特别是如本文所描述的具有增加 的活性的C2c2效应蛋白和一种或多种核酸组分,其中至少一种或多种核酸组分经过工程改造,一种或多种核酸组分将复合物引导至所关注的标靶,并且 效应蛋白与一种或多种核酸组分形成复合物并且所述复合物结合至所关注的 靶基因座。在特定实施方案中,所关注的靶基因座包含RNA。本申请进一步 提供了在RNA序列特异性干扰、RNA序列特异性基因调控、RNA或RNA产物或lincRNA或非编码RNA或细胞核RNA或mRNA的筛选、诱变、荧光原位杂交或育种中使用具有增加的活性的Cc2效应蛋白。
在以下实施例中进一步描述了本发明,这些实施例不限制权利要求中所 描述的本发明的范围。
工作实施例
实施例1-一般方案
提供两种方式来进行DNA和RNA的C2c2诊断测试。在递送检测适体 之后,这种方案还可以与蛋白质检测变体一起使用。第一种是两步反应,其 中扩增和C2c2检测独立地完成。第二种是所有物质组合在一个反应中并且这 被称为两步反应。重要的是谨记扩增对于较高浓度样品可能不是必需的,所以很好的是具有单独的C2c2方案,其并不内嵌有扩增。
表10.仅CRISPR效应子-无扩增:
反应缓冲液是:40mM Tris-HCl、60mM NaCl,pH 7.3
在37℃下进行这个反应20分钟至3小时。在激发:485nm/20nm,发射: 528nm/20nm下读出。可以在20分钟开始检测单分子灵敏度的信号,但过程 灵敏度的信号对于较长反应时间是较高的。
两步反应:
表11.RPA扩增混合物
将这种反应物混合在一起,然后再悬浮于冷冻干燥的酶混合物的两个至 三个管中。将5μL 280mM MgAc添加至混合物中以开始反应。进行反应10-20 分钟。每个反应是20μL,因此这足够用于至多五个反应。
表12.C2c2检测混合物
反应缓冲液是:40mM Tris-HCl、60mM NaCl,pH 7.3
进行这个反应20分钟至3小时。最小检测时间为约20分钟以观察单分 子灵敏度。进行反应更长时间仅增强灵敏度。
表13.一锅式反应:
所提及的NEB试剂盒是HighScribe T7高产量试剂盒。为使缓冲液再悬 浮,使用1.5x浓度:使59μL缓冲液再悬浮于冷冻干燥底物的三个管中并且 使用上述混合物。每个反应是20μL,因此这足够用于5个反应。早在30-40 分钟就观测到这个反应的单分子灵敏度。
实施例2-来自韦德纤毛菌的C2C2介导DNA和RNA的高度灵敏和特 异性检测
快速、便宜和灵敏的核酸检测可以帮助定点护理病原体检测、基因分型 和疾病监测。RNA导向的RNA靶向CRISPR效应子Cas13a(先前称为C2c2) 在标靶识别后展现混杂RNA酶活性的“附带效应”。申请人将Cas13a的附带 效应与等温扩增组合以确立基于CRISPR的诊断(CRISPR-Dx),从而提供具有 渺摩尔级灵敏度和单碱基错配特异性的快速DNA或RNA检测。申请人使用 这个基于Cas13a的分子检测平台,称为SHERLOCK(特异性高灵敏度酶促报告子解锁(Specific High Sensitivity Enzymatic Reporter UnLOCKing)),以检测 寨卡和登革病毒的特异性株系、区分病原性细菌、对人DNA进行基因分型 以及鉴别无细胞肿瘤DNA突变。此外,为了不依赖于冷链和长期储存可以 冻干SHERLOCK反应试剂,并且易于在纸上复原用于实地应用。
在便携平台上在高灵敏度和单碱基特异性下快速检测核酸的能力可以帮 助诊断和监测、流行病学和一般实验室任务。尽管方法是用于检测核酸(1-6), 但其在灵敏度、特异性、简易性、成本和速度当中有所权衡。微生物成簇的 规律间隔的短回文重复(CRISPR)和CRISPR相关(CRISPR-Cas)适应性免疫系 统含有可编程的核酸内切酶,其可以支持用于基于CRISPR的诊断(CRISPR-Dx)。虽然一些Cas酶靶向DNA(7、8),但单效应RNA导向的RNA酶,例如Cas13a(先前称为C2c2)(8)可以用CRISPR RNA(crRNA)重新编程 (9-11)以提供用于特异性RNA传感的平台。在识别其RNA标靶后,活化的 Cas13a参与附近非靶向的RNA的“附带”裂解(10)。这种crRNA编程的附带 裂解活性允许Cas13a在体内通过触发程序性细胞死亡(10)或体外通过标记的 RNA的非特异性降解(10、12)来检测特异性RNA的存在。此处,申请人描述 了SHERLOCK(特异性高灵敏度酶促报告子解锁)、基于核酸扩增的具有渺摩 尔级灵敏度的体外核酸检测平台和3Cas13a介导的商业报告子RNA的附带 裂解(12),从而允许标靶的实时检测(图17)。
方法
克隆用于表达的C2c2基因座和蛋白质
对于细菌体内效率测定,将来自韦德纤毛菌F0279和沙氏纤毛菌的C2c2 蛋白质预定为用于哺乳动物表达的密码子优化的基因(Genscript,Jiangsu, China),并且与侧接β-内酰胺酶靶向或非靶向间隔区的相应正向重复一起克 隆至pACYC184骨架中。由J23119启动子驱动间隔区表达。
对于蛋白质纯化,将哺乳动物密码子优化的C2c2蛋白质克隆至用于蛋白 质纯化的细菌表达载体(6x His/Twin Strep SUMO,从Ilya Finkelstein作为馈赠 接受的基于pET的表达载体)中。
细菌体内C2c2效率测定
将LwC2c2和LshC2c2体内效率质粒和先前描述的β-内酰胺酶质粒 (Abudayyeh2016)分别以90ng和25ng共转化至NovaBlue Singles感受态细 胞(Millipore)中。转化之后,将细胞的稀释液涂于氨苄西林和氯霉素LB-琼脂 板上并且在37C下孵育过夜。次日对菌落进行计数。
核酸标靶和crRNA制备
用KAPA Hifi热启动器(Kapa Biosystems)对核酸标靶进行PCR扩增,使 用MinElute凝胶提取试剂盒(Qiagen)进行凝胶提取和纯化。使用HiScribe T7 快速高产量RNA合成试剂盒(New England Biolabs)在30℃下将纯化的dsDNA 与T7聚合酶一起孵育过夜,并且用MEGAclear转录清洁试剂盒(Thermo Fisher)纯化RNA。
对于crRNA制备,将构建体预定为具有附加T7启动子序列的DNA (Integrated DNATechnologies)。将crRNA DNA粘接至短T7引物(最终浓度 10uM),并且使用HiScribe T7快速高产量RNA合成试剂盒(New England Biolabs)在37℃下与T7聚合酶一起孵育过夜。使用RNAXP清洁珠粒(Beckman Coulter)以珠粒与反应体积的2x比率纯化crRNA,额外补充1.8x异丙醇(Sigma)。
NASBA等温扩增
NASBA反应的细节在[Pardee 2016]中描述。对于20μL总反应体积,在 4℃下组装6.7μL反应缓冲液(Life Sciences,NECB-24)、3.3μL核苷酸混合物(Life Sciences,NECN-24)、0.5μL不含核酸酶的水、0.4μL 12.5μM NASBA 引物、0.1uL RNA酶抑制剂(Roche,03335402001)和4μL RNA扩增子(或水用 于阴性对照),并且在65℃下孵育2分钟,然后在41℃下孵育10分钟。将5μL 酶混合物(Life Sciences,NEC-1-24)添加至每个反应中,并且在41℃下孵育反 应混合物2小时。所使用的NASBA引物是 5'-AATTCTAATACGACTCACTATAGGGGGATCCTCTAGAAATATGGATT-3'(SEQ ID NO.16)和5'-CTCGTATGTTGTGTGGAATTGT-3'(SEQ IDNO. 17),并且加下划线部分指示T7启动子序列。
重组酶聚合酶扩增
使用NCBI Primer blast(Ye等,BMC Bioinformaics 13,134(2012),除了扩 增子大小(在100nt与140nt之间)、引物熔融温度(在54C与67C之间)和引 物大小(在30nt与35nt之间)以外使用默认参数来设计用于RPA的引物。然 后将引物预定为DNA(Integrated DNATechnologies)。
除了在输入模板之前添加280mM MgAc以外,分别如Basic 或Basic RT(TwistDx)所指示来运作RPA和RT-RPA反应。除非 另有描述,否则在37C下用1uL输入运作反应2小时。
LwC2c2蛋白质纯化
将C2c2细菌表达载体转化至RosettaTM2(DE3)pLysS Singles感受态细胞(Millipore)中。使16mL起子培养物在特级肉汤4生长培养基(12g/L胰蛋白 胨、24g/L酵母提取物、9.4g/L K2HPO、2.2g/L KH2PO4,Sigma)(TB)中生 长,用于接种4L TB,将其在37C、300RPM下孵育直至OD600达到0.6。 此时,通过用IPTG(Sigma)补充至500uM最终浓度来诱导蛋白质表达,将细 胞冷却至18C持续16小时用于蛋白质表达。然后在4C下将细胞以5200g离心15分钟。收集细胞团块并且储存于-80C下用于稍后纯化。
在4C下进行蛋白质纯化的所有后续步骤。将细胞团块压碎并且再悬浮 于补充有蛋白酶抑制剂(Complete Ultra无EDTA片剂)、溶菌酶和全能核酸酶 (benzonase)的溶解缓冲液(20mM Tris-Hcl、500mM NaCl、1mM DTT,pH 8.0) 中,继之以超声波处理(Sonifier450,Branson,Danbury,CT),使用以下条件: 1秒上和2秒下的振幅100,超声波处理总时间10分钟。通过在4C下以10,000g 离心1小时使溶解产物变洁净,并且经Stericup 0.22微米过滤器(EMD Millipore)过滤上清液。将过滤的上清液施加至StrepTactin琼脂糖(GE)并且在 旋转下孵育1小时,继而将蛋白质结合的StrepTactin树脂在溶解缓冲液中洗 涤三次。使树脂与250个单位的SUMO蛋白酶(ThermoFisher)一起再悬浮于 SUMO消化缓冲液(30mMTris-HCl、500mM NaCl、1mM DTT、0.15%Igepal (NP-40),pH 8.0)中并且在4C下在旋转下孵育过夜。通过SDS-PAGE和考马 斯蓝(Commassie Blue)染色确认消化,并且通过使树脂快速离心来分离蛋白质 洗脱物。经由FPLC(AKTA PURE,GE Healthcare Life Sciences)将蛋白质加载至5mL HiTrap SP HP阳离子交换柱(GE Healthcare Life Sciences)上,并且在洗脱缓冲液(20mM Tris-HCl、1mM DTT、5%甘油,pH 8.0)中在130mM至 2M NaCl的盐梯度上洗脱。通过SDS-PAGE针对LwC2c2的存在测试所得部 分,并且汇集含有蛋白质的部分,并且经由离心过滤器单元在S200缓冲液(10 mM HEPES、1M NaCl、5mM MgCl2、2mM DTT,pH 7.0)中浓缩至1mL。 经由FPLC将浓缩的蛋白质加载至凝胶过滤柱(200Increase10/300 GL,GE Healthcare Life Sciences)上。通过SDS-PAGE分析来自凝胶过滤的所得部分,并且汇集含有LwC2c2的部分,并且将缓冲液换成储存缓冲液(600 mM NaCl、50mM Tris-HCl pH 7.5、5%甘油、2mM DTT)并在-80C下冷冻以供储存。
LwC2c2附带检测
除非另有指示,否则在核酸酶测定缓冲液(40mM Tris-HCl、60mM NaCl、 6mMMgCl2,pH 7.3)中用45nM纯化的LwC2c2、22.5nM crRNA、125nM 底物报告子(ThermoScientific RNAse Alert v2)、2μL鼠类RNA酶抑制剂、100 ng背景总RNA和不同量的输入核酸标靶进行检测测定。如果输入是来自RPA 反应的包括T7启动子的扩增DNA,那么修改上述C2c2反应以包括1mM ATP、1mM GTP、1mM UTP、1mM CTP和0.6μL T7聚合酶混合物(NEB)。 在荧光板读取器(BioTek)上在37℃下使反应进行1-3小时(除非另有指示),每 5分钟测量荧光动力学。
通过将上述反应条件与RPA扩增混合物整合来进行组合RPA-DNA扩 增、DNA至RNA的T7聚合酶转变和C2c2检测的一锅式反应。简单地说, 50μL一锅式测定由以下组成:0.48μM正向引物、0.48μM反向引物、1x RPA 再水合缓冲液、不同量的DNA输入、45nM LwC2c2重组蛋白质、22.5nM crRNA、250ng背景总RNA、200nM底物报告子(RNase alert v2)、4uL RNA 酶抑制剂、2mM ATP、2mM GTP、2mM UTP、2mM CTP、1μL T7聚合酶 混合物、5mM MgCl2和14mMMgAc。
使用TaqMan探针的定量PCR(qPCR)分析
为比较SHERLOCK定量与其他已确立的方法,对ssDNA 1的稀释系列 进行qPCR。针对ssDNA 1设计TaqMan探针和引物组(序列如下)并且用IDT 合成。使用TaqMan快速高级主混合物(Thermo Fisher)进行测定并且在Roche LightCycler 480上测量。
表14.qPCR引物/探针序列.
使用SYBR Green II的实时RPA
为比较SHERLOCK定量与其他已确立的方法,申请人对ssDNA 1的稀 释系列进行RPA。为实时定量DNA的积累,申请人将1x SYBR Green II (Thermo Fisher)添加至上文所描述的典型RPA反应混合物中,这提供了与核 酸的量相关的荧光信号。在荧光板读取器(BioTek)上在37℃下使反应进行1 小时,每5分钟测量荧光动力学。
慢病毒制备和加工
慢病毒制备和加工是基于先前已知的方法。简单地说,使用HeBS-CaCl2 方法将10μg包括寨卡或登革RNA片段的pSB700衍生物、7.5μg psPAX2 和2.5μg pMD2.G转染至HEK293FT细胞(Life Technologies,R7007)。更换补 充有10%FBS、1%青霉素-链霉素和4mM GlutaMAX(ThermoFisher Scientific)的DMEM培养基之后28小时,使用0.45μm针筒式过滤器过滤上清液。 ViralBind慢病毒纯化试剂盒(Cell Biolabs,VPK-104)和Lenti-X浓缩器 (Clontech,631231)用于从上清液纯化和制备慢病毒。使用QuickTiter慢病毒 试剂盒(Cell Biolabs,VPK-112)定量病毒浓度。将病毒样品外加至7%人血清 (Sigma,H4522)中,加热至95℃持续2分钟并且用作RPA的输入。
寨卡人血清样品的分离和cDNA纯化
用AVL缓冲液(Qiagen)使可疑寨卡阳性人血清或尿液样品灭活,并且用 QIAamp病毒RNA小型试剂盒(Qiagen)达成RNA的分离。通过混合随机引物、 dNTP和样品RNA,继而在70℃下热变性7分钟使分离的RNA转变成cDNA。 然后与Superscript III(Invitrogen)一起在22-25℃下孵育10分钟,在50℃下孵 育45分钟,在55℃下孵育15分钟并且在80℃下孵育10分钟来逆转录变性 的RNA。然后在37℃下将cDNA与RNA酶H(New England Biolabs)一起孵育20分钟以破坏RNA:cDNA杂交体中的RNA。
从人唾液中提取基因组DNA
从收集前30分钟限制消耗食物或饮料的志愿者收集2mL唾液。然后如 试剂盒方案所推荐,使用DNA血液小型试剂盒(Qiagen)加工样品。 对于煮沸的唾液样品,将400μL磷酸盐缓冲盐水(Sigma)添加至100μL志愿 者唾液中并且以1800g离心5分钟。倾析上清液并且使团块与0.2%Triton X-100(Sigma)一起再悬浮于磷酸盐缓冲盐水中,随后在95℃下孵育5分钟。 1μL样品用作RPA反应的直接输入。
冷冻干燥和纸沉积
将玻璃纤维滤纸(Whatman,1827-021)用高压釜处理90分钟(ConsolidatedStills and Sterilizers,MKII)并且在5%不含核酸酶的BSA(EMD Millipore, 126609-10GM)中阻断过夜。用不含核酸酶的水(Life technologies,AM9932)将 纸冲洗一次后,在60℃下将其与4%RNAsecureTM(Life technologies,AM7006)一起孵育20分钟,并且用不含核酸酶的水再冲洗三次。使用前,在80℃下 在热板(Cole-Parmer,IKA C-Mag HS7)上将处理的纸干燥20分钟。将1.8μL 如早先所指示的C2c2反应混合物置于放置在黑色透明底384孔板(Corning, 3544)中的圆盘(2mm)上。对于冷冻干燥的测试,将含有反应混合物圆盘的板在液氮中急速冷冻,并且如Pardee等(2)所描述冷冻干燥过夜。将RPA样品 在不含核酸酶的水中以1:10稀释,并且将1.8μL混合物加载至纸圆盘上,并 且使用板读取器(BioTekNeo)在37℃下孵育。
细菌基因组DNA提取
对于涉及CRE检测的实验,使细菌培养物在溶菌肉汤(LB)中生长至对数 中期,然后成团并且视情况而定,使用制造商用于革兰氏阴性或革兰氏阳性 细菌的方案,使用Qiagen DNeasy血液和组织试剂盒进行gDNA提取和纯化。 通过Quant-It dsDNA测定在Qubit荧光计上定量gDNA,并且经由200-300nm 吸收光谱在Nanodrop分光光度计上评价其质量。
对于辨别大肠杆菌与绿脓假单胞菌的实验,使细菌培养物在鲁里亚-贝塔 尼(Luria-Bertani,LB)肉汤中生长至静止期早期。使用便携的PureLyse细菌 gDNA提取试剂盒(Claremont BioSolutions)加工1.0mL大肠杆菌与绿脓假单 胞菌。将1X结合缓冲液添加至细菌培养物中,随后穿过电池供电的溶解筒 持续三分钟。含0.5X结合缓冲液的水用作洗涤溶液,随后用150μL水洗脱。
数字微滴PCR定量
为确认图1C中所用的ssDNA 1和ssRNA 1标准稀释液的浓度,申请人 进行数字微滴PCR(ddPCR)。对于DNA定量,使用被设计成靶向ssDNA 1 序列的PrimeTime qPCR探针/引物测定,使用用于探针的ddPCR超级混合物 (无dUTP)制成微滴。对于RNA定量,使用被设计成靶向ssRNA 1序列的 PrimeTime qPCR探针/引物测定,使用用于探针的一步RT-ddPCR试剂盒制成 微滴。在任一种情况下使用QX200微滴产生器(BioRad)产生微滴并且转移至 PCR板。如试剂盒的方案中所描述在热循环仪上进行基于微滴的扩增,随后 经由在QX200微滴读取器上测量来确定核酸浓度。
用于人基因分型的合成标准
为建立用于人样品基因型的准确调用的标准,我们围绕SNP标靶设计引 物以扩增来自人基因组DNA的约200bp区域,其代表两个纯合基因型中的 每一个。然后通过将纯合标准以1:1比率混合来制成杂合标准。然后将这些 标准稀释至等效基因组浓度(约0.56fg/μL)并且与真正的人样品一起用作 SHERLOCK的输入。
肿瘤突变体无细胞DNA(cfDNA)的检测
模拟实际患者cfDNA样品的仿制cfDNA标准购自商业销售商(Horizon DiscoveryGroup)。这些标准对于BRAF V600E与EGFR L858R突变体以四个 等位基因分数(100%WT以及0.1%、1%和5%突变体)提供。将3μL这些标 准作为输入提供给SHERLOCK。
荧光数据的分析
为计算背景扣除荧光数据,扣除样品的初始荧光以允许在不同条件之间 比较。从样品扣除背景条件(无输入或无crRNA条件)的荧光以产生背景扣除 荧光。
通过用每种向导除以向导值的和来计算用于SNP或株系辨别的向导比 率,以调整样品与样品之间的总体变化。如下计算用于SNP或株系辨别的 crRNA比率以调整样品与样品之间的总体变化:
其中Ai和Bi分别是指对于给定的个体,传感等位基因A或等位基因B 的crRNA的技术性重复i的SHERLOCK强度值。因为测定通常每种crRNA 具有四个技术性重复,所以m和n等于4并且分母等效于对于给定的SNP 基因座和个体的全部八个crRNA SHERLOCK强度值的和。因为存在两种 crRNA,所以对于个体跨越crRNA中的每一种的crRNA比率平均值将始终和 是2。因此,在纯合性的理想情况下,阳性等位基因crRNA的平均crRNA比 率将是2并且阴性等位基因crRNA的平均crRNA比率将是0。在杂合性的理 想情况下,两种crRNA的每一种的平均crRNA比率将是1。
LwCas13a裂解需求的表征.
原间隔区侧接位点(PFS)是对于Cas13a的稳固核糖核酸酶活性所需的在 靶位点附近存在的特异性基序。PFS位于靶位点的3'端并且先前由我们的小 组对LshCas13a表征为H(不是G)(1)。尽管这个基序类似于原间隔区邻近基 序(PAM),一种用于DNA靶向2类系统的序列限制,但这个基序功能上是不 同的,这是因为其并不涉及于防止内源系统中的CRISPR基因座的自靶向。Cas13a的未来结构研究将可能阐明PFS对Cas13a:crRNA靶复合物形成和裂 解活性的重要性。
申请人从大肠杆菌纯化重组LwCas13a蛋白质(图2D-E)并且测定其使具 有每个可能的原间隔区侧接位点(PFS)核苷酸(A、U、C或G)的173-nt ssRNA 裂解的能力(图2F)。类似于LshCas13a,LwCas13a可以使具有A、U或C PFS 的标靶稳固地裂解,对具有G PFS的ssRNA的活性较小。尽管我们观察到对 具有G PFS的ssRNA 1的活性较弱,但申请人仍然观察到对于具有G PFS基 序的两个靶位点(表3;rs601338crRNA和寨卡靶向crRNA 2)的稳固检测。有可能在每种情况下不需要H PFS并且在许多情况下用G PFS可以达成强裂解 或附带活性。
重组酶聚合酶扩增(RPA)和其他等温扩增策略的论述.
重组酶聚合酶扩增(RPA)是由以下三种基本酶组成的等温扩增技术:重组 酶、单链DNA结合蛋白(SSB)和链置换聚合酶。RPA克服了其他扩增策略, 尤其聚合酶链反应(PCR)中存在的许多技术困难,这是因为酶全部在约37℃ 的恒定温度下操作,所以不需要温度调控。RPA将用于双链模板的总熔融和引物粘接的温度循环替换为由体内DNA复制和修复启示的酶促方法。重组 酶-引物复合物扫描双链DNA并且有助于在互补位点处的链交换。链交换由 SSB稳定,从而允许引物保持结合。重组酶的自发解体在其ADP结合状态中 发生,从而允许链置换聚合酶侵入并延长引物,允许在定点护理和实地设置 中不可用的复杂仪器不存在的情况下扩增。在37-42℃的温度范围内这个过程 的循环重复引起指数性DNA扩增。所公布的原始配方使用枯草芽孢杆菌Pol I(Bsu)作为链置换聚合酶,T4 uvsX作为重组酶,以及T4 gp32作为单链DNA 结合蛋白(2),不过尚不明确哪些组分在本研究中所用的由TwistDx出售的当 前配方中。
另外,RPA具有许多限制:
1)尽管Cas13a检测是定量的(图15),但实时RPA定量可能有困难,这 是因为当重组酶使用所有可用的ATP时其快速饱和。虽然实时PCR由于其 循环扩增的能力是定量的,但RPA不具有严密控制扩增速率的机制。可以作出某些调整以减小扩增速度,例如减小可用的镁或引物浓度,降低反应温度, 或设计无效引物。尽管观察到定量SHERLOCK的一些情况,例如在图31、 32和52中,但情况并不总是如此并且可能取决于模板。
2)RPA效率可能对引物设计是灵敏的。制造商通常推荐设计较长引入以 确保在平均GC含量(40-60%)下的有效重组酶结合并且筛选至多100个引物 对以发现高度灵敏引物对。申请人在SHERLOCK下已经发现,仅必须设计 两个引物对来达成具有单分子灵敏度的渺摩尔级测试。这种稳固性可能是归 因于由组成上活性的Cas13a附带活性对信号的额外扩增,这抵消了扩增子扩 增中的任何无效性。这种质量对于图34中我们的细菌病原体鉴别尤为重要。扩增高度结构化区域,例如细菌基因组中的16S rRNA基因位点经历了问题, 这是因为不存在RPA中所涉及的熔融步骤。因此,引物中的二级结构变成问 题,限制了扩增效率并且因此限制灵敏度。尽管有这些RPA特定的问题,但 由于来自Cas13a的额外信号扩增,因而相信本文所公开的实施方案是成功 的。
3)扩增序列长度对于有效RPA必须是短的(100-200bp)。对于大多数应 用,这并不是重大问题并且甚至可能是有利的(例如,平均片段大小是160bp 的cfDNA检测)。有时,大扩增子长度是重要的,例如当需要通用引物用于 细菌检测并且用于辨别的SNP散布在大片区域上时。
SHERLOCK的模块性允许在T7转录和Cas13a检测之前使用任何扩增技 术,甚至是非等温方法。这种模块性能够由单个反应中T7和Cas13a步骤的 相容性来达成,从而允许对具有T7启动子的任何扩增的DNA输入进行检测。 在使用RPA之前,尝试基于核酸序列的扩增(NASBA)(3、4)用于我们的检测 测定(图10)。然而,NASBA并不大大改善Cas13a的灵敏度(图11和53)。在 检测之前可以采用的其他扩增技术包括PCR、环介导的等温扩增(LAMP)(5)、链置换扩增(SDA)(6)、解旋酶依赖性扩增(HDA)(7)和切口酶扩增反应(NEAR) (8)。互换任何等温技术的能力允许SHERLOCK克服任一种扩增技术的特定 限制。
工程改造的错配的设计.
申请人证明,当标靶:crRNA双链体中存在两个或更多个错配时LshCas13a标靶裂解减少,但相对不受单错配影响,这是申请人确认LwCas13a 附带裂解的观测结果(图36A)。申请人假定,通过将额外突变引入crRNA间 隔区序列中,申请人将使针对具有额外错配(总共两个错配)的标靶的附带裂 解不稳定,同时保留仅在单错配的情况下将存在的中靶附带裂解。为测试工 程改造增加的特异性的可能性,申请人设计了多个靶向ssRNA 1的crRNA并且在crRNA的长度上包括错配(图36A)以优化中靶附带裂解并且使因单错配 而不同的标靶的附带裂解降至最低。申请人观测到这些错配并不减少ssRNA 1的附带裂解,但显著减小包括额外错配的标靶(ssRNA 2)的信号。最好地区 分ssRNA 1和2的所设计的crRNA包括接近于ssRNA 2错配的合成错配,实际上在杂交的RNA中形成“气泡”或变形。由标靶中存在的合成错配和额外错 配的配合(即,双重错配)引起的灵敏度损失与LshCas13a和LwCas13a对连续 或附近的双重错配的灵敏度一致,并且提出了能够实现单核苷酸区别的 crRNA的合理设计的基础(图36B)。
对于ZIKV和DENV株系的错配检测,我们的全长crRNA含有两个错配 (图37A、B)。归因于株系之间的高序列分歧,申请人不能发现在两个基因组 之间仅具有单核苷酸差异的28nt连续段。然而,申请人预测较短crRNA将仍然是功能性的,并且设计针对两个ZIKV株系中的标靶的较短23nt crRNA, 所述株系包括间隔区序列中的合成错配和靶序列中的仅一个错配。这些 crRNA仍然可以区分ZIKV的非洲和美洲株系(图36C)。23nt和20nt crRNA 的后续测试显示,间隔区长度的减小降低活性,但维持或增强辨别单错配的能力(图57A-G)。为了更好地理解可以如何引入合成错配以有助于单核苷酸 突变的辨别,申请人跨越间隔区的最初七个位置在以下三种不同间隔区长度 下拼贴合成错配:28nt、23nt和20nt(图57A)。在第三个位置处具有突变的标靶上,当合成错配在间隔区的位置5处时LwCas13a显示最大特异性,在 较短间隔区长度下具有改善的特异性,但具有较低水平的中靶活性(图57B-G)。申请人还使靶突变跨越位置3-6偏移并且拼贴间隔区中围绕突变的 合成错配(图58)。
通过SHERLOCK使用合成标准的基因分型.
从SNP基因座的PCR扩增建立的合成标准的评估允许基因型的准确鉴 别(图60A、B)。通过在个体的样品与合成标准的SHERLOCK结果之间计算 所有比较(ANOVA),可以通过发现具有最相似的SHERLOCK检测强度的合 成标准来鉴别每个个体的基因型(图60C、D)。这种SHERLOCK基因分型方 法可普及至任何SNP基因座(图60E)。
SHERLOCK是可负担的、可适应的CRISPR-Dx平台.
对于SHERLOCK的成本分析,省略确定成本可忽略不计的试剂,包括 用于crRNA合成的DNA模板、RPA中所用的引物、常用缓冲液(MgCl2、Tris HCl、甘油、NaCl、DTT)、玻璃微纤维滤纸和RNAsecure试剂。对于DNA 模板,来自IDT的超聚体(ultramer)合成提供了用于40个体外转录反应的物 质(每个足够用于约10,000个反应),花费约70美元,这为crRNA合成增添 可忽略不计的成本。对于RPA引物,花费约10美元可以购买25nmol IDT 合成的30ntDNA引物,提供了足够用于5000个SHERLOCK反应的物质。 花费0.50美元/张可得到玻璃微纤维纸,这足以用于数千个SHERLOCK反应。 4%RNAsecure试剂成本是7.20美元/毫升,这足以用于500个测试。
另外,对于所有实验,除了基于纸的测定外,使用384孔板(Corning 3544), 成本是0.036美元/反应。由于可忽略不计的成本,这不包括于总成本分析中。 另外,SHERLOCK-POC不需要使用塑料容器,这是因为其可以在纸上容易 地进行。本文所用的SHERLOCK的读出方法是配备有过滤器组或单色器的 板读取器。作为资本投资,读取器的成本不包括于计算中,这是因为成本随 着更多反应在仪器上运作而急剧降低并且可忽略不计。对于POC应用,可以使用更便宜和便携的替代品,例如手持式分光光度计(9)或便携电子读取器 (4),这使仪器的成本降至<200美元。虽然这些更便携的解决方案与更庞大的 仪器相比将降低读出的速度和简易性,但其允许更广泛的使用。
结果
本文所描述的测定和系统一般可以包括扩增和检测的两步过程。在第一 步期间,例如通过等温扩增来扩增核酸样品RNA或DNA。在第二步期间, 将扩增的DNA转录至RNA中,随后与CRISPR效应子,例如C2c2一起孵 育,并且对crRNA进行编程以检测靶核酸序列的存在。为能够进行检测,将 已经用猝灭的荧光团作标记的报告子RNA添加至反应中。报告子RNA的附 带裂解引起荧光团的解猝灭(un-quenching)并且允许核酸标靶的实时检测(图17A)。
为达成稳固的信号检测,从生物体韦德纤毛菌(LwC2c2)鉴别并评估C2c2 的直系同源物。通过将LwC2c2蛋白质与合成CRISPR阵列一起在大肠杆菌 中表达并且对其进行编程以使β-内酰胺酶mRNA内的靶位点裂解,使得在氨 苄西林选择下细菌死亡来评估所述蛋白质的活性(图2B)。LwC2c2基因座相比LshC2c2基因座观测到较少存活的大肠杆菌菌落,展示LwC2c2直系同源 物的较高裂解活性(图2C)。然后从大肠杆菌纯化人密码子优化的LwC2c2蛋 白质(图2D-E),并且使用不同原间隔区侧接位点(PFS)核苷酸测定其使173-ntssRNA裂解的能力(图2F)。LwC2c2能够使可能四个PFS标靶中的每一个裂 解,对具有G PFS的ssRNA的活性略小。
使用可商购的RNA荧光板读取器测量LwC2c2 RNA酶附带活性的实时 测量(图17A)。为确定LwC2c2活性的基线灵敏度,将LwC2c2与ssRNA标 靶1(ssRNA 1)和与ssRNA标靶内的位点互补的crRNA以及RNA传感器探 针一起孵育(图18)。这得到约50fM的灵敏度(图27A),尽管这比其他新近核 酸检测技术(Pardee等,2014)更灵敏,但对于需要亚飞摩尔检测性能的许多诊 断应用不够灵敏(Barletta等,2004;Emmadi等,2011;Rissin等,2010;Song 等,2013)。
为增加灵敏度,在与LwC2c2一起孵育之前增添等温扩增步骤。将 LwC2c2介导的检测与先前所用的等温扩增方法,例如基于核酸序列的扩增 (NASBA)(Compton,1991;Pardee等,2016)相结合在一定程度上改善灵敏度 (图11)。测试替代性等温扩增方法重组酶聚合酶扩增(RPA)(Piepenburg等, 2006),其可以用于在不足两小时内以指数方式扩增DNA。通过将T7 RNA 聚合酶启动子添加至RPA引物上,可以使扩增的DNA转变成RNA用于由 LwC2c2进行后续检测(图17)。因此,在某些示例性实施方案中,测定包括通过RPA扩增、DNA至RNA的T7 RNA聚合酶转变和通过来自猝灭的报告子 的荧光的C2c2解锁对RNA的后续检测的组合。
对ssRNA 1的合成的DNA型式使用示例性方法,有可能达成在每个反 应1-10个分子的范围内的渺摩尔级灵敏度(图27B,左侧)。为验证检测的准 确度,使用数字微滴PCR限定输入DNA的浓度并且确认最低可检测的标靶浓度(2aM)是每微升的单分子浓度。通过添加逆转录步骤,RPA还可以将RNA 扩增成dsDNA形式,允许达成对ssRNA 1的渺摩尔级灵敏度(27B,右侧)。 类似地,通过数字微滴PCR确认RNA标靶的浓度。为评估示例性方法用作 POC诊断测试的可行性,测试所有组分-RPA、T7聚合酶扩增和LwC2c2检 测-在单个反应中起作用的能力并且发现一锅式测定型式的渺摩尔级灵敏 度(图22)。
测定能够在液体中或在纸上进行灵敏病毒检测
接下来确定测定是否将在需要高灵敏度并且可以得益于便携诊断的传染 病应用中有效。为测试模型系统中的检测,产生带有寨卡病毒基因组和相关 黄病毒登革的RNA片段的慢病毒(Dejnirattisai等,2016)并且定量病毒颗粒的 数目(图31A)。所检测的仿制病毒的水平低至2aM。同时,还有可能在含有 寨卡和登革RNA片段的这些代理病毒之间显示出明确的辨别(图31B)。为确 定测定是否将与冷冻干燥相容以消除对用于分配的冷链的依赖性,将反应组分冷冻干燥。使用样品再水合冻干的组分之后,检测20fM ssRNA 1(图33A)。因为资源贫乏和POC设置将得益于易于可用的纸测试,所以还评估在玻璃纤 维纸上C2c2检测的活性并且发现纸上点斑的C2c2反应能够靶向检测(图 33B)。以组合形式,对C2c2检测反应进行冷冻干燥和纸上点斑促成ssRNA 1 的灵敏检测(图33C)。在溶液中的LwC2c2与冷冻干燥的LwC2c2之间对于合 成寨卡病毒RNA片段的检测也观测到类似水平的灵敏度,展示冷冻干燥的 SHERLOCK的稳固性和快速POC寨卡病毒诊断的潜力(图33D-E)。为此目的,对测定的POC变体的能力进行测试以确定辨别寨卡RNA与登革RNA的能 力(图31C)。虽然纸上点斑和冻干略微降低读出的绝对信号,但与具有登革对 照序列的仿制病毒的检测相比,测定仍然显著检测到浓度低至20aM的仿制 寨卡病毒(图31D)。
已经报道了人中的寨卡病毒RNA水平低至患者唾液中的3x106个拷贝/ 毫升(4.9fM)和患者血清中的7.2x105个拷贝/毫升(1.2fM)(Barzon等,2016; Gourinat等,2015;Lanciotti等,2008)。从所获得的患者样品,观测到低至1.25 x103个拷贝/毫升(2.1aM)的浓度。为评估测定是否能够进行低滴度临床分离 株的寨卡病毒检测,从患者中提取病毒RNA并且进行逆转录,并且所得cDNA 用作测定的输入(图32A)。在低至1.25个拷贝/微升(2.1aM)的浓度下观测到 对寨卡人血清样品的显著检测(图32B)。此外,来自患者样品的信号预测寨卡 病毒RNA拷贝数并且可以用于预测病毒负荷(图31F)。为测试对于核酸纯化 不可用的疾病情况的广泛应用性,测试外加至人血清中的ssRNA 1的检测, 并且确定测定在低于2%的血清水平下活化(图33G)。
细菌病原体区别和基因区别
为确定测定是否可以用于区分细菌病原体,选择16S V3区作为初始标 靶,这是因为保守侧接区允许跨越细菌种类使用通用RPA引物,并且可变内 区允许区别种类。设计一组5个可能的靶向crRNA用于病原性株系以及分离的大肠杆菌和绿脓假单胞菌gDNA(图34A)。测定能够区分大肠杆菌或绿脓 假单胞菌gDNA并且对于其他种类的crRNA显示出低背景信号(图34A、B)。
测定还可以适应于快速检测和区分所关注的细菌基因,例如抗生素抗性 基因。碳青霉烯抗性肠道菌(CRE)是重大的新兴公共卫生挑战(Gupta等, 2011)。评估测定用以检测碳青霉烯抗性基因的能力,以及测试是否可以区分 不同碳青霉烯抗性基因。从带有肺炎克雷伯菌碳青霉烯酶(KPC)或新德里金属 -β-内酰胺酶1(NDM-1)抗性基因的临床分离株获得肺炎克雷伯菌,并且设计 crRNA以区分基因。所有CRE具有比缺乏这些抗性基因的细菌显著的信号(图 35A),并且我们可以显著区分KPC与NDM-1抗性株系(图35B)。
CRISPR RNA导向的RNA酶的单碱基错配特异性
已经显示,某些CRISPR RNA导向的RNA酶直系同源物,例如LshC2c2 并不容易区分单碱基错配(Abudayyeh等,2016)。如本文所展示,LwC2c2也 共享这种特征(图37A)。为增加LwC2c2裂解的特异性,开发用于将合成错配 引入crRNA:标靶双链体中的系统,其增加对错配的总灵敏度并且能够实现单 碱基错配灵敏度。设计标靶1的多个crRNA并且在crRNA的长度上包括错 配(图37A)以优化中靶裂解并且使因单错配而不同的标靶的裂解降至最低。这些错配并不降低ssRNA标靶1的裂解效率,但显著减小包括额外错配的标 靶(ssRNA标靶2)的信号。最好地区分标靶1和2的所设计的crRNA包括接近于标靶2错配的合成错配,实际上形成“气泡”。由标靶中存在的合成错配 和额外错配的配合(即,双重错配)引起的灵敏度损失与LshC2c2对连续或附 近的双重错配的灵敏度一致(Abudayyeh等,2016),并且提出了能够实现单核苷酸区别的crRNA的合理设计的格局(图37B)。
在已经展示可以工程改造C2c2以识别单碱基错配下,确定这种工程改造 的特异性是否可以用于区分密切相关的病毒病原体。多个crRNA被设计成检 测寨卡病毒的非洲或美洲株系(图37A)和登革病毒的株系1或3(图37C)。这 些crRNA包括间隔区序列中的合成错配,当与中靶株系呈双链体时归因于合 成错配而导致单个气泡形成。然而,当合成错配间隔区与脱靶株系呈双链体 时,归因于合成错配和SNP错配而形成两个气泡。合成错配crRNA以显著 高于脱靶株系的信号检测其相应株系,从而允许稳固的株系区别(图37B、 37D)。归因于株系之间的显著序列相似性,不可能发现在两个基因组之间仅具有单核苷酸差异的28nt连续段以展示真正的单核苷酸株系区别。然而,预 测较短crRNA将仍然是功能性的,这是因为其与LshC2c2一起(Abudayyeh 等,2016),并且因此设计针对两个寨卡株系中的标靶的较短23-nt crRNA,所 述株系包括间隔区序列中的合成错配和靶序列中的仅一个错配。这些crRNA 仍然能够在高灵敏度下区分寨卡的非洲和美洲株系(图36C)。
使用从唾液纯化的DNA的快速基因分型
从人唾液的快速基因分型可以适用于急诊药物基因组学情况或用于家庭 诊断。为展示本文所公开的实施方案用于基因分型的潜力,选择五个基因座 以使用23andMe基因分型数据作为黄金标准为C2c2检测定基准(Eriksson等, 2010)(图38A)。五个基因座横跨大范围的功能性关联,包括对例如抑制素(statin)或醋氨酚(acetaminophen)的药物的敏感度、诺如病毒易感性以及心脏病 风险(表15)。
表15:所测试的SNP变体
从四名人受试者收集唾液,并且使用简单的商业试剂盒在小于一小时内 纯化基因组DNA。四名受试者具有跨越五个基因座的一组多样的基因型,对 此提供了足够宽的取样空间以为用于基因分型的测定定基准。对于五个SNP 基因座中的每一个,使用RPA用适当引物扩增受试者的基因组DNA,继而 用LwC2c2检测,并且设计crRNA对以特异性地检测两个可能等位基因之一 (图38B)。测定特定地足以在高显著性下区分等位基因并且推断纯合与杂合基 因型。因为在检测之前对唾液进行DNA提取方案,所以测试测定以确定是 否可以更适用于通过使用加热至95℃持续5分钟的唾液而无需任何进一步提 取的POC基因分型。测定能够对唾液仅经受加热持续5分钟,然后进行后续 扩增和C2c2检测的两名患者正确地进行基因分型(图40B)。
在低等位基因分数下cfDNA中的癌性突变的检测
因为测定对标靶中的单核苷酸差异具有高度特异性,所以设计测试以确 定测定是否足够灵敏来检测无细胞DNA(cfDNA)中的癌症突变。cfDNA片段 是小百分比(0.1%至5%)的野生型cfDNA片段(Bettegowda等,2014;Newman 等,2014;Olmedillas Lopez等,2016;Qin等,2016)。在cfDNA领域中的重大 挑战是检测这些突变,这是因为在给出血液的背景中所发现的高水平的非突 变DNA下通常难以发现这些突变(Bettegowda等,2014;Newman等,2014; Qin等,2016)。POC cfDNA癌症测试还将适用于癌症存在的定期筛选,尤其对于处于缓解期的风险下患者。
通过在crRNA靶位点中具有单突变的ssDNA1的背景中稀释dsDNA标 靶1来确定测定用以检测野生型背景中的突变体DNA的能力(图41A-B)。 LwC2c2能够传感dsDNA 1达到低至背景dsDNA的0.1%和dsDNA 1的渺摩 尔浓度内的水平。这个结果显示,背景突变体dsDNA1的LwC2c2裂解足够低以允许在0.1%等位基因分数下稳固检测中靶dsDNA。在低于0.1%的水平 下,背景活性可能成问题,这阻止正确标靶的任何进一步显著检测。
因为测定可以在临床相关范围内的等分基因分数下传感合成标靶,所以 评估测定是否能够检测cfDNA中的癌症突变。设计针对两种不同癌症突变 EGFR L858R和BRAFV600E的RPA引物,并且在类似于实际人cfDNA样 品的5%、1%和0.1%的等位基因分数下使用商业cfDNA标准以供测试。使 用一对可以区分突变体等位基因与野生型等位基因的crRNA(图38C),达成 对两种突变体基因座的0.1%等位基因分数的检测(图39A-B)。
论述
通过组合C2c2的天然特性与等温扩增和猝灭的荧光探针,本文所公开的 测定和系统已经展示为通用的稳固方法来检测RNA和DNA,并且适合于多 种快速诊断,包括传染病应用和快速基因分型。本文所公开的测定和系统的 主要优点是在数天之内花费低至0.6美元/测试可以重新设计并合成新的POC测试。
因为许多人疾病应用需要检测单错配的能力,所以开发合理的方法以通 过将合成错配引入crRNA的间隔区序列中使crRNA工程改造成对靶序列中 的单错配具有高度特异性。用CRISPR效应子达成特异性的其他方法依靠在 许多向导设计上基于筛选的方法(Chavez等,2016)。使用设计的错配crRNA, 展示因单错配而不同的位点中的寨卡和登革病毒株的辨别、来自人唾液 gDNA的SNP的快速基因分型以及cfDNA样品中的癌症突变的检测。
测定平台的低成本和适应性适用于其他应用,包括(i)代替特异性qPCR 测定,例如Taqman的一般RNA/DNA定量经验,(ii)类似于微阵列的快速、 多元化RNA表达检测,以及(iii)其他灵敏检测应用,例如来自食物中的其他 来源的核酸污染的检测。另外,C2c2可以潜在地用于生物设置内,例如细胞 中的转录物的检测,并且在给出C2c2检测的高度特异性性质下,有可能追踪 活细胞中的转录物或疾病相关突变的等位基因特异性表达。在适体的广泛可 用性下,还有可能通过将适体对蛋白质的检测与揭露RPA的隐蔽扩增位点继之以C2c2检测相结合来传感蛋白质。
使用CRISPR-Cas13a/C2c2的核酸检测:渺摩尔级灵敏度和单核苷酸特 异性
为达成稳固的信号检测,申请人从韦德纤毛菌(LwCas13a)鉴别Cas13a的 直系同源物,其相对于沙氏纤毛菌Cas13a(LshCas13a)展现较高的RNA导向 的RNA酶活性(10)(图2,还参见上文“LwCas13a裂解需求的表征”)。与ssRNA 标靶1(ssRNA 1)、crRNA和报告子(猝灭的荧光RNA)一起孵育的LwCas13a(图18)(13)得到约50fM的检测灵敏度(图51、15),这对于许多诊断应用不 够灵敏(12、14-16)。申请人因此探索了将基于Cas13a的检测与不同等温扩增 步骤组合(图10、11、53、16)(17、18)。在探索的方法当中,重组酶聚合酶 扩增(RPA)(18)得到最高灵敏度并且可以与T7转录相结合以使扩增的DNA 转变成RNA用于由LwCas13a进行后续检测(还参见上文“重组酶聚合酶扩增 (RPA)和其他等温扩增策略的论述”)。申请人涉及了通过RPA扩增、扩增的DNA至RNA的T7 RNA聚合酶转录和通过Cas13a附带RNA裂解介导的报 告子信号作为SHERLOCK释放对靶RNA检测的这种组合。
申请人首先确定SHERLOCK用于检测RNA(当与逆转录相结合时)或 DNA标靶的灵敏度。如通过数字微滴PCR(ddPCR)验证,申请人达成了RNA 与DNA的单分子灵敏度(图27、51、54A、B)。当在单个反应中组合所有 SHERLOCK组分时维持渺摩尔级灵敏度,从而展示这个平台作为定点护理(POC)诊断的可行性(图54C)。SHERLOCK具有与两种已确立的灵敏核酸检测方法ddPCR和定量PCR(qPCR)类似水平的灵敏度,而单独的RPA对于检 测低水平的标靶不够灵敏(图55A-D)。此外,如由跨越重复的变异系数来测 量,SHERLOCK相比ddPCR、qPCR和RPA显示较小的变异(图55E-F)。
申请人接下来检查SHERLOCK是否将在需要高灵敏度的传染病应用中 有效。申请人产生了带有寨卡病毒(ZIKV)或相关黄病毒登革(DENV)的基因组片段的慢病毒(19)(图31A)。SHERLOCK检测低至2aM的病毒颗粒并且可以 辨别ZIKV与DENV(图31B)。为了探索SHERLOCK在实地中的潜在用途, 申请人首先展示了冻干并随后再水合的Cas13acrRNA复合物(20)可以检测20 fM非扩增的ssRNA 1(图33A)并且标靶检测也可能在玻璃纤维纸上进行(图 33B)。SHERLOCK的其他组分也适用于冷冻干燥:RPA在环境温度下作为 冻干的试剂提供,并且申请人先前展示了T7聚合酶耐受冷冻干燥(2)。以组 合形式,对Cas13a检测反应进行冷冻干燥和纸上点斑促成与水性反应可比水 平的ssRNA 1的灵敏检测(图33C-E)。尽管纸上点斑和冻干略微降低读出的 绝对信号,但SHERLOCK(图31C)在低至20aM的浓度下可以容易地检测仿 制ZIKV病毒(图31D)。SHERLOCK还能够检测临床分离株(血清、尿液或唾 液)中的ZIKV,其中滴度可以低至2x103个拷贝/毫升(3.2aM)(21)。如通过qPCR验证(图32F和52B),从患者血清或尿液样品中提取并逆转录成cDNA 的ZIKV RNA(图32E和52A)可以在低至1.25x103个拷贝/毫升(2.1aM)的浓 度下检测。此外,来自患者样品的信号预测ZIKV RNA拷贝数并且可以用于 预测病毒负荷(图33F)。为模拟样品检测而无需核酸纯化,申请人测量了外加 至人血清中的ssRNA 1的检测,并且发现Cas13a可以检测含有至多2%血清 的反应中的RNA(图33G)。本文所公开的实施方案的另一个重要的流行病学应用是细菌病原体的鉴别和特异性细菌基因的检测。申请人靶向16S rRNA 基因V3区,其中保守侧接区允许跨越细菌种类使用通用RPA引物,并且可 变内区允许区别种类。在用于不同病原性株系以及从大肠杆菌和绿脓假单胞 菌分离的gDNA的一组五个可能的靶向crRNA中(图34A),SHERLOCK对株系正确地进行基因分型并且显示低交叉反应性(图34B)。另外,申请人能够 使用SHERLOCK区分具有以下两种不同抗性基因的肺炎克雷伯菌的临床分 离株:肺炎克雷伯菌碳青霉烯酶(KPC)和新德里金属-β-内酰胺酶1(NDM-1) (22)(图56)。
为增加SHERLOCK的特异性,申请人将合成错配引入crRNA:标靶双链 体中,这使得LwCas13a能够辨别因单碱基错配而不同的标靶(图36A、B; 还参见上文“工程改造的错配的设计”)。申请人设计了在间隔区序列中具有合 成错配的多个crRNA以检测ZIKV的非洲或美洲株系(图37A)和DENV的株 系1或3(图37C)。合成错配crRNA以显著高于脱靶株系的信号(双尾司徒登 t检验;p<0.01)检测其相应株系,从而允许基于单错配的稳固的株系辨别(图37B、D,36C)。进一步表征揭示,当突变在间隔区的位置3处并且合成错配 在位置5处时,Cas13a检测达成最大特异性同时维持中靶灵敏度(图57和58)。 检测单碱基差异的能力开辟了使用SHERLOCK用于快速人基因分型的机会。 申请人选择横跨一系列健康相关的单核苷酸多态性(SNP)(表1)的五个基因座 并且在这些SNP处使用23andMe基因分型数据作为黄金标准为SHERLOCK 检测定基准(23)(图38A)。申请人从跨越所关注的基因座具有多样化基因型的 四名人受试者收集唾液,并且经由商业柱纯化或直接加热五分钟来提取基因 组DNA(20)。SHERLOCK以高显著性和足够的特异性区分等位基因来推断 纯合与杂合基因型(图38B、40、59、60;还参见上文“通过SHERLOCK使用 合成标准的基因分型”)。最后,申请人试图确定SHERLOCK是否可以检测无 细胞(cf)DNA片段中的低频癌症突变,这由于患者血液中高水平的野生型 DNA而有挑战性(24-26)。申请人首先发现SHERLOCK可以检测在基因组DNA的背景中稀释的渺摩尔浓度的ssDNA 1(图61)。接下来,申请人发现 SHERLOCK还能够在低至背景DNA的0.1%的水平下检测含单核苷酸多态性 (SNP)的等位基因(图41A、B),所述水平处于临床相关范围内。申请人然后 展示SHERLOCK可以检测具有低至0.1%的等位基因分数的仿制cfDNA样品 中的两种不同癌症突变EGFR L858R和BRAF V600E(图38、39)(20)。
SHERLOCK平台适用于其他应用,包括(i)代替特异性qPCR测定,例如 TaqMan的一般RNA/DNA定量,(ii)快速、多元化RNA表达检测,以及(iii) 其他灵敏检测应用,例如核酸污染的检测。另外,Cas13a可以潜在地检测生 物设置内的转录物并且追踪活细胞中转录物或疾病相关突变的等位基因特异 性表达。SHERLOCK是用以检测RNA和DNA的通用的稳固方法,其适合于包括传染病应用和灵敏基因分型的快速诊断。很有信心在数天之内花费低 至0.61美元/测试可以重新设计并合成SHERLOCK纸测试(还参见上文 “SHERLOCK是可负担的、可适应的CRISPR-Dx平台”),这是因为所测试的 几乎每个crRNA促成高灵敏度和特异性。这些质量突出了CRISPR-Dx的能 力并且开辟了生物分子的快速、稳固和灵敏检测的新途径。
表16:所使用的RPA引物
表17:所使用的crRNA序列
表18:本实施例中所使用的RNA和DNA标靶
表19:本实施例中所使用的质粒
实施例3–具有正交碱基偏好的Cas13b直系同源物的表征
申请人以生物化学方式表征了最近定义的RNA导向的RNA靶向酶的 VI型CRISPR-Cas13b家族的十四个直系同源物来寻找用于改善SHERLOCK 检测技术的新候选者(图83A和图85)。申请人能够在大肠杆菌中异源表达十 四个Cas13b直系同源物并且纯化蛋白质用于体外RNA酶活性测定(图86)。 因为不同的Cas13直系同源物可能具有不同的碱基偏好以获得最佳的裂解活 性,申请人生成由5个A、G、C或U组成的荧光RNA酶均聚物传感器以估 计正交裂解偏好。申请人将每个直系同源物与其靶向合成的173nt ssRNA 1 的同源crRNA一起孵育,并使用均聚物荧光传感器测量附带裂解活性(图83B 和图87)。
实施例4–用文库进行基序发现筛选
为了进一步探索各种Cas13a和Cas13b直系同源物的裂解偏好的多样性, 申请人开发了基于文库的方法以表征响应于附带活性的核酸内切酶活性偏好 的基序。申请人使用了侧接恒定DNA柄的简并6聚体RNA报告子,这允许 扩增和读出未裂解的序列(图83C)。孵育该文库与附带活化的Cas13酶导致可 检测的裂解并依赖于靶RNA的添加(图88)。对耗尽的基序的测序揭示了在消 化时间内的文库的偏态的增加(图89A),指示碱基偏好,并且选择高于阈值 比率的序列产生了与酶的裂解相对应的富集序列(图89B)。来自富集基序的序列标志再现了对LwaCas13a和CcaCas13b观察到的U偏好和PsmCas13b的A 偏好(图89C)。申请人还确定了显示仅一个直系同源物的裂解但不显示其他直 系同源物的裂解的多个序列以允许独立的读出(图89D)。
为了理解酶偏好的特定子基序,申请人分析了耗尽的基序的单碱基偏好 (图90A)(其与测试的均聚物基序一致),以及对于两碱基基序的偏好(图83C 和90B)。这些两碱基基序揭示了更复杂的偏好,特别是对于LwaCas13a和 PsmCas13b,其偏好TA、GA和AT双碱基序列。更高阶的基序还揭示另外 的偏好(图91和图92)。
申请人利用标靶的体外裂解确认了LwaCas13a、PsmCas13b和CcaCas13b 的附带偏好(图93)。为了改善PsmCas13b的弱消化,申请人优化了缓冲液组 成和酶浓度(图94A、图94B)。在PsmCas13b和Cas13b直系同源物上测试的 其他双阳离子不具有大的效应(图95A-图95F)。申请人还就两个RNA标靶比 较了PsmCas13b与先前表征的A偏好Cas13家族成员,并且发现相当的或改 善的灵敏度(图96A、图96B)。根据这些结果,申请人在具有独立报告子的单独反应中比较了LwaCas13a和PsmCas13b的动力学,并发现两个通道之间的 低水平串扰(图83D)。
实施例5–用LwaCas13a、PsmCas13b和CcaCas13b进行单分子检测
SHERLOCK技术的关键特征是它使得能够通过LwaCas13a附带RNA酶 活性进行单分子检测(2aM或1分子/μL)。为了表征Cas13b酶的灵敏度,申 请人用PsmCas13b和CcaCas13b执行SHERLOCK,CcaCas13b是另一种具有 尿苷偏好的高活性Cas13b酶(图83E)。申请人发现LwaCas13a、PsmCas13b 和CcaCas13b能够实现两种不同的RNA标靶即ssRNA 1和合成寨卡sRNA 的2aM检测(图83E;图97和图98)。为了调查用这三种酶靶向的稳健性, 申请人设计了在ssRNA 1中均匀间隔的十一个不同的crRNA,并且发现 LwaCas13a最一致地实现信号检测,而CcaCas13b和Psmcas13b两者均显示 了在crRNA之间的检测中多得多的变异性(图99)。为了鉴别用于检测的最佳crRNA,申请人从34nt到12nt变化PsmCas13b和CcaCas13b的间隔区长度, 并且发现PsmCas13b在间隔区长度为30时具有峰值灵敏度,而CcaCas13b 在间隔区长度高于28nt时具有等同的灵敏度(图100)。申请人还测试了是否 可以推动检测限超过2aM,允许更大的样品体积输入到SHERLOCK中。通 过放大预扩增RPA步骤,申请人发现LwaCas13a和PsmCas13b两者都可以 为200、20和2zM的输入样品给出显著的检测信号,并允许250μL和540μL 的体积输入。
实施例6-采用RPA的定量SHERLOCK
由于SHERLOCK依赖于指数式扩增,因此准确定量核酸可以是困难的。 申请人假设降低RPA步骤的效率可以改善在输入量与SHERLOCK反应的信号之间的相关性。申请人观察到,SHERLOCK检测的动力学在一系列样品浓 度中对引物浓度非常敏感(图101A-图101D)。申请人稀释了引物浓度,这增 加了信号和定量准确度两者(图83G和图101E)。该观察结果可以是由于引物 二聚体形成的减少,允许更有效的扩增,同时防止饱和。120nM的引物浓度表现出在信号与输入之间的最大相关性(图101F)。该准确度在低至渺摩尔范 围的大范围浓度中是可持续的(图83H和图101G)。
实施例7-用正交Cas13直系同源物进行双颜色多重化
核酸诊断的有利特征是同时检测多个样品输入的能力,允许多重检测组 或样品内对照。Cas13酶的正交碱基偏好提供具有多重SHERLOCK的机会。 申请人可以通过具有不同碱基特性和荧光团颜色的荧光均聚物传感器测定同 一反应中的不同Cas13酶的附带活性,使得能够同时测量多个标靶(图84A)。 为了证实该概念,申请人设计了针对寨卡病毒ssRNA的LwaCas13a crRNA 和针对登革热病毒ssRNA的PsmCas13b crRNA。申请人发现在同一反应中具 有这两组Cas13-crRNA复合物的该测定能够鉴别反应中是否存在寨卡或登革热RNA或两者(图84B)。申请人还发现,由于CcaCas13b与PsmCas13b之间 的正交偏好,这两种酶也可以用于寨卡和登革热标靶的多重检测(图102)。申 请人成功地能够将这个概念向含有多重RPA引物和Cas13-crRNA复合物两 者的整个SHERLOCK反应拓展。申请人设计了针对铜绿假单胞菌的 LwaCas13a crRNA和针对金黄色葡萄球菌的PsmCas13b crRNA并且能够检测低至渺摩尔范围的这两个DNA标靶(图84C)。类似地,使用PsmCas13b和LwaCas13a两者,申请人能够使用SHERLOCK实现寨卡和登革热RNA的渺 摩尔级多重检测(图103)。
申请人已经显示LwaCas13a使得能够进行单核苷酸变体检测,并且这可 以应用于从人类唾液进行快速基因分型,但检测需要两个单独的反应:每个 等位基因感测crRNA一个。为了使得能够进行单反应SHERLOCK基因分型, 申请人设计了针对rs601338SNP(与诺如病毒抗性相关的α(1,2)-岩藻糖基转 移酶FUT2基因中的变体)的G等位基因的LwaCas13acrRNA和针对rs601338 SNP的A等位基因的PsmCas13b crRNA。使用这种单样品多重化方法,申请人能够成功地使用四位不同人类受试者的唾液对他们进行基因分型,并且准 确鉴别他们是纯合的还是杂合的。
为了进一步展示Cas13酶家族的多功能性,申请人模拟了涉及Cas13作 为伴随诊断和疗法自身两者的治疗方法。申请人最近开发了PspCas13b用于 转录物的可编程RNA编辑,其可用于使用称为用于可编程A至I替换的RNA 编辑(REPAIR)的系统,校正遗传疾病中的突变。由于诊断可以在与疗法配对以指导治疗决策或监测治疗结果时非常有用,因此申请人认为SHERLOCK 可用于基因分型以指导REPAIR治疗,也可作为对已编辑RNA的读出来追踪疗法的编辑效率(图84E)。申请人选择证实这个治疗诊断概念以校正在家族 性腺瘤性息肉病1(涉及大肠和直肠中的癌症的遗传性疾病)中的APC突变 (APC:c.1262G>A)。申请人设计了APC基因的健康和突变cDNA并将这些转 染到HEK293FT细胞中。申请人能够从这些细胞中收获DNA并使用具有 LwaCas13a和PsmCas13b的单样品多重SHERLOCK对正确样品成功地进行 基因分型(图84F)。同时,申请人为REPAIR系统设计并克隆了向导RNA, 并用向导RNA和dPspCas13b-ADAR2dd(E488Q)REPAIR系统转染具有病变 基因型的细胞。48小时后,申请人收获了RNA,申请人将其分开以输入到 SHERLOCK中以检测编辑结果并进行下一代测序(NGS)分析以确认编辑率。测序揭示申请人用REPAIR系统实现了43%编辑(图84G)并且能够用 SHERLOCK检测到此编辑,因为健康感测crRNA显示比非靶向向导对照状 态更高的信号,而疾病感测crRNA显示信号降低(图84H和图104)。总体而言,用于该测定的试剂的设计和合成花费了3天,基因分型花费了1天,并 且使用REPAIR进行校正和感测编辑率花费了3天,产生了持续仅7天的总 体治疗诊断途径。
申请人已经证实了使用来自韦德纤毛菌的VI型RNA导向的RNA靶向 CRISPR-Cas13a直系同源物对核酸的高度灵敏和特异的检测。申请人已经进 一步显示,Cas13b酶家族在生物化学上是具有活性的并且具有使得它们适合 于通过SHERLOCK对核酸进行多重检测的独特特性。通过表征Cas13b酶的 正交碱基偏好,申请人发现PsmCas13b识别而LwaCas13a不识别的荧光RNA 传感器的特定序列。申请人能够利用这些碱基偏好以使得对两个不同标靶进 行样品内多重检测成为可能,并显示该特征用于区分病毒株和基因分型个体 的实用性。另外,通过预扩增步骤的工程改造,可以使SHERLOCK定量, 允许对输入核酸浓度求近似值或者定量。申请人已经另外显示正交PsmCas13b能够进行单分子检测,并且通过放大体积,申请人可以进行上至 约0.5毫升和下至2zM浓度的样品的检测。
通过在空间上进行多个反应,采用SHERLOCK进行多重检测是可能的, 但凭借正交碱基偏好进行样品内多重化允许大规模检测许多标靶且成本更便 宜。虽然申请人已经此处显示两输入多重化,但裂解基序筛选使得能够设计 另外的正交裂解传感器(图90)。LwaCas13a和CcaCas13b都裂解相同的尿苷 均聚物并因此不是如通过均聚物传感器测量的正交的(图83B),通过基序筛选 显示非常独特的裂解偏好(图90)。通过筛选另外的Cas13a、Cas13b和Cas13c 直系同源物,很可能许多直系同源物都将揭示独特的6聚体基序偏好,这可以理论上允许仅受到光谱独特荧光传感器的数量限制的高度多重化 SHERLOCK。高度多重化SHERLOCK使得能够进行许多技术应用,特别是 涉及复杂输入感测和逻辑运算的那些。
基于Cas13的检测的可视的、更灵敏的和多重的读出的这些另外的改进 使得核酸检测的应用增加,尤其是必需便携式和无仪器分析的环境中。快速 多重基因分型可以为药物基因组学决策提供信息,测试田间多种作物性状, 或评估共存病原体的存在。快速、等温读出增加了这种用于电源或便携式读取器不可得,甚至是对于稀有物质如循环DNA的环境的检测的可及性。改 进的基于CRISPR的核酸测试使得更容易了解核酸在农业、病原体检测和慢 性疾病中的存在。
实施例8–SHERLOCK比色检测
DNA四链体可用于生物分子分析物检测(图107)。在一种情况下,OTA- 适体(蓝色)识别OTA,引起构象变化,使四链体(红色)暴露而结合血红素。 血红素-四链体复合物具有过氧化物酶活性,其然后可以将TMB底物氧化成 有色形式(在溶液中一般为蓝色)。申请人已经创建了这些四链体的的RNA形 式,这些形式可以由Cas13作为本文所描述的附带活性的一部分降解。在核 酸标靶存在下,降解导致RNA适体的损失,以及由此颜色信号的损失。下文 示出了两种示例性设计。
1)rUrGrGrGrUrUrGrGrGrUrUrGrGrGrUrUrGrGrGrA
2)rUrGrGrGrUrUrUrGrGrGrUrUrUrGrGrGrUrUrUrGrGrGrA
鸟嘌呤形成关键碱基对,产生四链体结构,该四链体结构然后结合血红 素分子。申请人将鸟嘌呤的组与尿苷(以粗体显示)隔开,以允许Cas13降解 四链体,因为二核苷酸数据显示鸟嘌呤降解不佳。
申请人以两种不同的浓度测试了两种适体设计(图108)。较低的100nM 浓度不足以形成颜色。400nM条件形成颜色。还定量了用于该分析的经匹配 的吸光度数据(图109)。具体地,设计1的b9结果最佳,而设计2的Lwa结 果最佳。
申请人进一步测试了比色变化的稳定性(图110)。1小时后,Cas13比色 变化稳定。LwaCas13a比色信号在1小时内保持稳定,而Cas13b9色差则较 不稳定。申请人观察到,现在即使是100nM的适体条件也适用于Cas13b9, 因为一个小时后,由于底物的氧化,颜色会出现,并且可以观察到色差。
申请人将比色检测与荧光检测进行了比较(图111)。采用两种系统均可检 测到2aM的浓度,但是,荧光在背景上的增加小于比色检测在背景上的减少。 这指示比色测定可提供更灵敏的结果。
比色测定可用作本文所描述的诊断测定。在一个实施方案中,将四链体 与测试样品和Cas13 SHERLOCK系统一起孵育。在允许Cas13鉴别靶序列并 通过附带活性降解适体的孵育期后,可添加底物。然后可测量吸光度。在其 他实施方案中,将底物于四链体和Cas13SHERLOCK系统一起包括在测定中。
***
在不脱离本发明的范围和精神的情况下,本发明所描述的方法、药物 组合物和药盒的各种修改和变型对于本领域技术人员而言是显而易见的。 尽管已结合具体实施方案描述了本发明,但是应当理解,本发明能够进行 进一步修改,并且所要求保护的本发明不应该不当地受到这些具体实施方 案的限制。实际上,对于本领域技术人员而言显而易见的用于实施本发明的所述模式的各种变型旨在落入本发明的范围内。本申请旨在覆盖本发明的任何变型、用途或改型,这些变型、用途或改型总体遵循本发明的原理 且包括在本发明所属领域内已知习惯性实践内的与本公开内容有所偏离 的内容,并且可以在陈述之前应用于本文的基本特征。

Claims (79)

1.一种核酸检测系统,所述核酸检测系统包括:
检测CRISPR系统,所述检测CRISPR系统包含具有附带裂解活性的效应蛋白和被设计成结合至相应靶分子的一种或多种向导RNA,其中所述一种或多种向导RNA与相应靶分子的结合活化所述效应蛋白;
包含四链体的核酸适体,所述四链体具有酶活性并且包含非靶序列,所述非靶序列被设计成由活化的效应蛋白附带裂解从而使所述四链体的酶活性被灭活,和
探针,所述探针能够在所述四链体的酶活性存在下产生可检测信号,其中所述可检测信号的损失指示所述四链体的酶活性的损失,并且因此指示样品中一种或多种靶分子的存在。
2.如权利要求1所述的系统,其中所述酶活性是过氧化物酶活性。
3.如权利要求1所述的系统,所述系统还包括核酸扩增试剂。
4.如权利要求1所述的系统,其中所述靶分子是靶DNA,并且所述系统还包括结合所述靶DNA且包含RNA聚合酶启动子的引物。
5.如权利要求1至4中任一项所述的系统,其中所述CRISPR系统效应蛋白是靶向RNA的效应蛋白。
6.如权利要求5所述的系统,其中所述靶向RNA的效应蛋白包含一个或多个HEPN结构域。
7.如权利要求6所述的系统,其中所述一个或多个HEPN结构域包含RxxxxH基序序列。
8.如权利要求7所述的系统,其中所述RxxxxH基序包含R{N/H/K}X1X2X3H序列。
9.如权利要求8所述的系统,其中X1是R、S、D、E、Q、N、G或Y,并且X2独立地是I、S、T、V或L,并且X3独立地是L、F、N、Y、V、I、S、D、E或A。
10.如权利要求5所述的系统,其中所述靶向RNA的CRISPR效应蛋白是C2c2。
11.如权利要求6所述的系统,其中所述靶向RNA的CRISPR效应蛋白是C2c2。
12.如权利要求11所述的系统,其中所述C2c2在Cas 1基因的20kb内。
13.如权利要求12所述的系统,其中所述C2c2效应蛋白来自选自由以下组成的组的属的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、弯曲杆菌属和毛螺菌属。
14.如权利要求13所述的系统,其中所述C2c2或Cas13b效应蛋白来自选自由以下组成的组的生物体:沙氏纤毛菌;韦德纤毛菌;斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨梭菌DSM 10710;鸡肉杆菌DSM 4847;第二CRISPR基因座;产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠真杆菌;真杆菌科细菌CHKCI004;布劳特氏菌属某种马赛-P2398;纤毛菌属某种口腔分类群879菌株F0557;毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属某种TSL5-1;假丁酸弧菌属某种OR37;丁酸弧菌属某种YAB3001;纤毛菌属某种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
15.如权利要求14所述的系统,其中所述C2c2效应蛋白是韦德纤毛菌F0279 C2c2效应蛋白。
16.如权利要求1至4中任一项所述的系统,其中所述核酸适体识别赭曲毒素A。
17.根据权利要求1至4中任一项所述的系统,其中所述一种或多种被设计成结合至相应靶分子的向导RNA包含错配。
18.根据权利要求17所述的系统,其中所述错配在所述靶分子中的SNP或其他单核苷酸变异的上游或下游。
19.如权利要求1至4中任一项所述的系统,其中所述一种或多种向导RNA被设计成检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。
20.如权利要求1至4中任一项所述的系统,其中所述一种或多种向导RNA被设计成结合至一种或多种对疾病状态具诊断性的靶分子。
21.如权利要求20所述的系统,其中所述疾病状态是癌症。
22.如权利要求21所述的系统,其中所述疾病状态是自身免疫疾病。
23.如权利要求20所述的系统,其中所述疾病状态是感染。
24.如权利要求23所述的系统,其中所述感染由病毒、细菌、真菌、原生动物或寄生虫引起。
25.如权利要求24所述的系统,其中所述感染是病毒感染。
26.如权利要求25所述的系统,其中所述病毒感染由DNA病毒引起。
27.如权利要求26所述的系统,其中所述DNA病毒是肌病毒科、短尾病毒科、长尾病毒科、异疱疹病毒科、疱疹病毒科、马洛疱疹病毒科、脂毛病毒科、小杆状病毒科、腺病毒科、瓶状病毒科、囊泡病毒科、非洲猪瘟病毒科、杆状病毒科、西坎达病毒科、棒状病毒科、覆盖噬菌体科、小纺锤形噬菌体科、球状病毒科、滴状病毒科、唾液腺肥大病毒科、虹彩病毒科、马赛病毒科、拟菌病毒科、裸病毒科、线头病毒科、潘多拉病毒科、乳头瘤病毒科、藻类DNA病毒科、芽生噬菌体科、多DNA病毒、多瘤病毒科、痘病毒科、球脂状病毒科、复层噬菌体科、图里病毒科、甲藻DNA病毒、盐末端蛋白病毒、瑞兹病毒。
28.如权利要求25所述的系统,其中所述病毒感染由双链RNA病毒、正义RNA病毒、反义RNA病毒、逆转录病毒或它们的组合引起。
29.如权利要求28所述的系统,其中所述病毒感染由冠状病毒科病毒、小RNA病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、玻那病毒科、丝状病毒科、副粘病毒科、肺泡病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或丁型病毒引起。
30.如权利要求29所述的系统,其中所述病毒感染由冠状病毒、SARS、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺瓦克病毒、黄热病病毒、西尼罗河病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨德拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感或丁型肝炎病毒引起。
31.如权利要求24所述的系统,其中所述感染是细菌感染。
32.如权利要求31所述的系统,其中引起所述细菌感染的细菌是不动杆菌属某种、放线杆菌属某种、放线菌某种、放线菌属某种、气球菌属某种、气单胞菌属某种、红孢子虫属某种、产碱杆菌属某种、芽孢杆菌属某种、拟杆菌属某种、巴尔通体属某种、双歧杆菌属某种、博德特氏菌属某种、包柔氏螺旋体属某种、布鲁氏菌属某种、伯克氏菌属某种、弯曲杆菌属某种、嗜二氧化碳噬细胞菌属某种、衣原体属某种、柠檬酸杆菌属某种、柯克斯体属某种、棒状杆菌属某种、梭菌属某种、艾肯菌属某种、肠杆菌属某种、埃希氏菌属某种、肠球菌属某种、埃立克体属某种、表皮癣菌属某种、丹毒丝菌属某种、真杆菌属某种、弗朗西斯菌属某种、梭杆菌属某种、加德纳菌属某种、孪生球菌属某种、嗜血杆菌属某种、螺杆菌属某种、金氏菌属某种、克雷伯菌属某种、乳杆菌属某种、乳球菌属某种、李斯特菌属某种、钩端螺旋体属某种、军团菌属某种、明串珠菌属某种、曼氏杆菌属某种、小孢子菌属某种、微球菌属某种、莫拉菌属某种、摩根氏菌属某种、动弯杆菌属某种、分枝杆菌属某种、支原体属某种、诺卡氏菌属某种、奈瑟氏菌属某种、巴斯德菌属某种、片球菌属某种、消化链球菌属某种、糠疹癣菌属某种、邻单胞菌属某种、普雷沃菌属某种、卟啉单胞菌属某种、变形杆菌属某种、普罗威登斯菌属某种、假单胞菌属某种、丙酸杆菌属某种、红球菌属某种、立克次体属某种、沙雷氏菌属某种、寡养单胞菌属某种、沙门氏菌属某种、志贺氏菌属某种、葡萄球菌属某种、链球菌属某种、螺菌属某种、链杆菌属某种、密螺旋体属某种、养障体属某种、毛癣菌属某种、脲原体属某种、韦荣氏球菌属某种、弧菌属某种、耶尔森菌属某种、黄单胞菌属某种,或它们的组合。
33.如权利要求24所述的系统,其中所述感染由真菌引起。
34.如权利要求33所述的系统,其中所述真菌是曲霉属、芽生菌属、念珠菌属、球孢子菌属、新型隐球菌、格特隐球菌、某种组织胞浆菌属某种、肺孢子菌属某种、葡萄穗霉属、毛霉菌病、孢子丝菌属、真菌性眼睛感染癣、突脐蠕孢属、枝孢属、地霉属、酵母属、汉逊酵母属某种、假丝酵母属某种、克鲁维酵母属某种、德巴利酵母属某种、毕赤酵母属某种、青霉菌属某种、枝孢属某种、丝衣霉属某种,或它们的组合。
35.如权利要求24所述的系统,其中所述感染由原生动物引起。
36.如权利要求35所述的系统,其中所述原生动物是眼虫门、异叶足纲、双滴虫目、变形虫界、芽囊原虫属、顶复亚门,或它们的组合。
37.如权利要求24所述的系统,其中所述感染由寄生虫引起。
38.如权利要求37所述的系统,其中所述寄生虫是克氏锥虫、布氏冈比亚锥虫、布氏罗得西亚锥虫、巴西利什曼原虫、婴儿利什曼原虫、墨西哥利什曼原虫、硕大利什曼原虫、热带利什曼原虫、杜氏利什曼原虫、福氏耐格里变形虫、肠贾第虫、卡氏棘阿米巴虫、巴氏阿米巴原虫、溶组织内阿米巴、人芽囊原虫、田鼠巴贝虫、微小隐孢子虫、卡晏环孢子虫、恶性疟原虫、间日疟原虫、卵形疟原虫、三日疟原虫和刚地弓形虫,或它们的组合。
39.如权利要求1至4中任一项所述的系统,其中试剂用于扩增靶RNA分子包括基于核酸序列的扩增、重组酶聚合酶扩增、环介导等温扩增、链置换扩增、解旋酶依赖性扩增、切口酶扩增反应、PCR、多重置换扩增、滚环扩增、连接酶链反应或分枝扩增法。
40.如权利要求1所述的系统,所述系统还包括富集CRISPR系统,其中所述富集CRISPR系统被设计成在通过所述检测CRISPR系统进行检测之前结合所述相应靶分子。
41.如权利要求40所述的系统,其中所述富集CRISPR系统包含无催化活性的CRISPR效应蛋白。
42.如权利要求41所述的系统,其中无催化活性的CRISPR效应蛋白是无催化活性的C2c2。
43.如权利要求40至42中任一项所述的系统,其中所述富集CRISPR系统的CRISPR效应蛋白还包含标签,其中所述标签用于拉下所述富集CRISPR系统,或将所述富集CRISPR系统结合至固体衬底。
44.如权利要求43所述的系统,其中所述固体衬底是流通池。
45.如权利要求1所述的系统,其中所述非靶序列包含插入在所述包含四链体的核酸适体的鸟嘌呤序列之间的二核苷酸或三核苷酸切割基序,其中所述二核苷酸或三核苷酸切割基序通过所述效应蛋白的附带裂解活性裂解。
46.如权利要求26所述的系统,其中所述DNA病毒是人疱疹病毒或水痘带状疱疹病毒。
47.如权利要求26所述的系统,其中所述DNA病毒是非洲猪瘟病毒。
48.如权利要求26所述的系统,其中所述DNA病毒是猿猴病毒40、JC病毒或BK病毒。
49.如权利要求26所述的系统,其中所述DNA病毒是牛痘或天花病毒。
50.如权利要求33所述的系统,其中所述真菌是荚膜组织胞浆菌。
51.如权利要求33所述的系统,其中所述真菌是耶氏肺孢子菌。
52.如权利要求33所述的系统,其中所述真菌是纸葡萄穗霉。
53.如权利要求37所述的系统,其中所述寄生虫是兰伯氏贾第虫或十二指肠贾第虫。
54.一种诊断装置,所述诊断装置包括一个或多个个别离散体积,每一个别离散体积包括如权利要求1至44中任一项所述的核酸检测系统。
55.如权利要求54所述的装置,其中所述个别离散体积是液滴。
56.如权利要求54至55中任一项所述的装置,其中所述个别离散体积被限定在固体衬底上。
57.如权利要求56所述的装置,其中所述个别离散体积是微孔。
58.如权利要求54所述的诊断装置,其中所述个别离散体积是限定在衬底上的斑点。
59.如权利要求58所述的装置,其中所述衬底是柔性材料衬底。
60.如权利要求59所述的装置,其中所述柔性材料衬底是纸衬底或基于柔性聚合物的衬底。
61.一种用于检测样品中的靶核酸的方法,所述方法包括:
将样品或样品组分配到一个或多个个别离散体积中,所述个别离散体积包括如权利要求1至44中任一项所述的核酸检测系统;
在足以允许所述一种或多种向导RNA与一种或多种靶分子结合的条件下孵育所述样品或样品组;
经由所述一种或多种向导RNA与所述一种或多种靶分子的结合来活化所述效应蛋白,其中活化所述效应蛋白引起所述包含四链体的核酸适体的非靶序列的附带裂解,使得所述四链体的所述酶活性被灭活;以及
检测所述可检测信号的探针,其中所述可检测信号的损失指示所述酶活性的损失,并且因此指示所述样品中一种或多种靶分子的存在,
其中所述方法不是用于疾病的治疗或诊断的方法。
62.如权利要求61所述的方法,其中所述靶分子是靶DNA,并且所述方法还包括将所述靶DNA与包含RNA聚合酶位点的引物结合。
63.如权利要求61至62中任一项所述的方法,所述方法还包括扩增所述样品RNA。
64.如权利要求63所述的方法,其中扩增RNA包括通过基于核酸序列的扩增进行扩增。
65.如权利要求63所述的方法,其中扩增RNA包括通过重组酶聚合酶扩增进行扩增。
66.如权利要求61至62中任一项所述的方法,其中所述样品是生物样品或环境样品。
67.如权利要求66所述的方法,其中所述生物样品是血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液,获自关节的流体,或皮肤或粘膜表面的拭子。
68.如权利要求66所述的方法,其中所述环境样品获自食物样品、纸表面、织物、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品,或它们的组合。
69.如权利要求61至62中任一项所述的方法,其中所述一种或多种向导RNA被设计成检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。
70.如权利要求61至62中任一项所述的方法,其中所述一种或多种向导RNA被设计成结合至一种或多种对疾病状态具诊断性的靶分子。
71.如权利要求61至62中任一项所述的方法,其中所述一种或多种向导RNA被设计成结合至无细胞核酸。
72.如权利要求70所述的方法,其中所述疾病状态是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病或环境获得性疾病。
73.如权利要求66所述的方法,其中所述生物样品是获自感染或发炎部位的渗出液。
74.如权利要求66所述的方法,其中所述生物样品是获自脓肿的渗出液。
75.如权利要求66所述的方法,其中所述生物样品是获自正常关节的流体。
76.如权利要求66所述的方法,其中所述生物样品是获自受类风湿性关节炎、骨关节炎、痛风或化脓性关节炎影响的关节的流体。
77.如权利要求61所述的方法,其中所述四链体的所述酶活性在所述样品中产生颜色信号。
78.如权利要求77所述的方法,其中所述四链体的所述酶活性的灭活产生颜色信号的损失,所述颜色信号的损失指示所述样品中一种或多种靶分子的存在。
79.一种用于检测样品中的靶核酸的方法,所述方法包括:
使样品与根据权利要求1至44中任一项所述的核酸检测系统接触;以及
将所述接触的样品应用于侧流免疫色谱测定,
其中所述方法不是用于疾病的治疗或诊断的方法。
CN201980019789.6A 2018-01-29 2019-01-29 基于crispr效应系统的诊断 Active CN112020562B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862623531P 2018-01-29 2018-01-29
US62/623,531 2018-01-29
PCT/US2019/015726 WO2019148206A1 (en) 2018-01-29 2019-01-29 Crispr effector system based diagnostics

Publications (2)

Publication Number Publication Date
CN112020562A CN112020562A (zh) 2020-12-01
CN112020562B true CN112020562B (zh) 2024-09-13

Family

ID=65409619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980019789.6A Active CN112020562B (zh) 2018-01-29 2019-01-29 基于crispr效应系统的诊断

Country Status (13)

Country Link
US (1) US20210371926A1 (zh)
EP (1) EP3746568B1 (zh)
JP (2) JP7527961B2 (zh)
KR (1) KR20200127168A (zh)
CN (1) CN112020562B (zh)
AU (1) AU2019213047A1 (zh)
BR (1) BR112020015093A2 (zh)
CA (1) CA3087362A1 (zh)
DK (1) DK3746568T5 (zh)
FI (1) FI3746568T3 (zh)
IL (1) IL276349A (zh)
RU (1) RU2020128413A (zh)
WO (1) WO2019148206A1 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010101628A2 (en) 2009-03-02 2010-09-10 Massachusetts Institute Of Technology Methods and products for in vivo enzyme profiling
ES2881535T3 (es) 2011-03-15 2021-11-29 Massachusetts Inst Technology Detección multiplexada con indicadores codificados con isótopos
US10527619B2 (en) 2013-06-07 2020-01-07 Massachusetts Institute Of Technology Affinity-based detection of ligand-encoded synthetic biomarkers
CA3020324A1 (en) 2016-04-08 2017-10-12 Massachusetts Institute Of Technology Methods to specifically profile protease activity at lymph nodes
CA3022928A1 (en) 2016-05-05 2017-11-09 Massachusetts Institute Of Technology Methods and uses for remotely triggered protease activity measurements
CA3059358A1 (en) 2017-04-07 2018-10-11 Massachusetts Institute Of Technology Methods to spatially profile protease activity in tissue and sections
EP4442836A2 (en) 2018-08-01 2024-10-09 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP3911753A1 (en) 2019-01-17 2021-11-24 Massachusetts Institute of Technology Sensors for detecting and imaging of cancer metastasis
US11591634B1 (en) * 2019-04-03 2023-02-28 The Trustees Of Boston College Forecasting bacterial survival-success and adaptive evolution through multiomics stress-response mapping and machine learning
KR102452590B1 (ko) * 2019-08-01 2022-10-12 기초과학연구원 CRISPR/Cas9 매개 체세포 핵 이식에 의한 개 디스트로핀병증 모델 생성 및 이의 용도
CN110548134A (zh) * 2019-09-10 2019-12-10 中国医学科学院病原生物学研究所 Cas13a在拮抗病毒中的应用
CN110894557A (zh) * 2019-09-20 2020-03-20 武汉大学 基于CRISPR方式检测非洲猪瘟病毒的crRNA及试剂盒
NL2024019B1 (en) * 2019-10-15 2021-06-17 Univ Delft Tech Detection of a target polynucleotide
WO2021159020A2 (en) * 2020-02-06 2021-08-12 Mammoth Biosciences, Inc. Compositions and methods for detection of coronavirus
US20210262025A1 (en) 2020-02-18 2021-08-26 Massachusetts Institute Of Technology Multiplexed in vivo disease sensing with nucleic acid-barcoded reporters
EP3875602A1 (en) 2020-03-05 2021-09-08 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk Onderzoek TNO Nucleic acid fluorescence detection
CN111575299A (zh) * 2020-05-11 2020-08-25 吉林农业大学 牛荚膜a型多杀性巴氏杆菌免疫磁珠的制备方法
WO2022080343A1 (ja) * 2020-10-13 2022-04-21 キヤノン株式会社 核酸検出装置および核酸の検出方法
CN113308451B (zh) * 2020-12-07 2023-07-25 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
CN112782138B (zh) * 2020-12-24 2021-10-29 生物岛实验室 用于检测细胞外囊泡的试剂盒及其应用
CN112831544B (zh) * 2020-12-31 2024-06-14 华南农业大学 一种基于CRISPR/Cas12a系统的生物检测方法和生物检测装置
CN113234795B (zh) * 2021-04-15 2023-02-24 山东舜丰生物科技有限公司 利用Cas蛋白进行核酸检测的方法
CN113186253B (zh) * 2021-04-27 2022-06-21 福州大学 一种用于检测路易体病标志物的Cas12a-DNAzyme传感器及其制备方法
CN113373170A (zh) * 2021-04-29 2021-09-10 江西农业大学 一种pFnCpfAb/pCrAb双质粒系统及其应用
CN113373264B (zh) * 2021-06-10 2022-04-12 安徽医科大学 一种基于CRISPR/Cas系统的新型冠状病毒双靶标快速检测方法及试剂盒
CN113552103B (zh) * 2021-07-20 2022-12-30 济南大学 一种基于CRISPR-Cas系统的检测外泌体的荧光生物传感器
EP4373963A2 (en) 2021-07-21 2024-05-29 Montana State University Nucleic acid detection using type iii crispr complex
CN114487045B (zh) * 2022-01-26 2023-05-09 军事科学院军事医学研究院环境医学与作业医学研究所 一种检测T2毒素的CRISPR-Cas14a响应型光电化学传感检测方法和试剂盒
KR20240083163A (ko) * 2022-10-26 2024-06-11 가천대학교 산학협력단 유전자가위 기반 쯔쯔가무시증의 신속 진단 방법

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
ATE341621T1 (de) 1997-10-24 2006-10-15 Invitrogen Corp Rekombinatorisches klonieren unter verwendung von nukleinsaüren mit rekombinationsstellen
US6465177B1 (en) 1998-10-26 2002-10-15 John Wayne Cancer Institute Detection of loss of heterozygosity in tumor and serum of melanoma patients
US20030064366A1 (en) 2000-07-07 2003-04-03 Susan Hardin Real-time sequence determination
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
CA2476835A1 (en) 2002-02-20 2003-08-28 University Of Virginia Patent Foundation A non-invasive diagnostic test utilizing histone modification markers
SI3363809T1 (sl) 2002-08-23 2020-08-31 Illumina Cambridge Limited Modificirani nukleotidi za polinukleotidno sekvenciranje
CA2554007C (en) 2004-01-27 2013-03-26 Altivera L.L.C. Diagnostic radio frequency identification sensors and applications thereof
WO2006044078A2 (en) 2004-09-17 2006-04-27 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
EP1831402B1 (en) 2004-12-21 2010-06-09 Academia Sinica Genetic variants of vkorc1 predicting warfarin sensitivity
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CA2648149A1 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
WO2007121276A2 (en) 2006-04-12 2007-10-25 Biocept, Inc. Enrichment of circulating fetal dna
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
US8921118B2 (en) 2008-03-27 2014-12-30 President And Fellows Of Harvard College Paper-based microfluidic systems
US20100240054A1 (en) 2008-09-22 2010-09-23 Biocept, Inc. Identification and isolation of fetal cells and nucleic acid
AU2011220736C1 (en) 2010-02-24 2014-12-18 The Broad Institute, Inc Methods of diagnosing infectious disease pathogens and their drug sensitivity
CN102884170A (zh) 2010-03-04 2013-01-16 新加坡国立大学 检测和分离细胞的微流体分选器
US8771985B2 (en) 2010-04-26 2014-07-08 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using zinc-finger nucleases
WO2012125781A2 (en) 2011-03-15 2012-09-20 Colorado State University Research Foundation Rapid detection of pathogens using paper devices
GB201115098D0 (en) 2011-09-01 2011-10-19 Belgian Volition Sa Method for detecting nucleosomes containing histone variants
US20140295472A1 (en) 2011-11-10 2014-10-02 The Administrators Of The Tulane Educational Fund Paper Based Diagnostic Test
WO2014047561A1 (en) 2012-09-21 2014-03-27 The Broad Institute Inc. Compositions and methods for labeling of agents
SG11201504523UA (en) 2012-12-12 2015-07-30 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
US11441196B2 (en) 2013-03-15 2022-09-13 The Broad Institute, Inc. Ribosomal ribonucleic acid hybridization for organism identification
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
US20150065821A1 (en) 2013-09-05 2015-03-05 Google Inc. Nanoparticle Phoresis
US10253353B2 (en) 2013-12-06 2019-04-09 The Broad Institute, Inc. Enhanced methods of ribonucleic acid hybridization
US9737251B2 (en) 2014-05-28 2017-08-22 Verily Life Sciences Llc Needle-free blood draw
WO2016094867A1 (en) * 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
WO2016100975A1 (en) 2014-12-19 2016-06-23 Massachsetts Institute Ot Technology Molecular biomarkers for cancer immunotherapy
WO2016172598A1 (en) 2015-04-22 2016-10-27 The Broad Institute Inc. Exosomes and uses thereof
WO2016183402A2 (en) * 2015-05-13 2016-11-17 President And Fellows Of Harvard College Methods of making and using guide rna for use with cas9 systems
EP3297660A2 (en) 2015-05-20 2018-03-28 The Broad Institute Inc. Shared neoantigens
EP3314020A1 (en) 2015-06-29 2018-05-02 The Broad Institute Inc. Tumor and microenvironment gene expression, compositions of matter and methods of use thereof
US11332783B2 (en) 2015-08-28 2022-05-17 The Broad Institute, Inc. Sample analysis, presence determination of a target sequence
CN111286526B (zh) * 2016-03-03 2023-12-15 湖北中医药大学 一种荧光检测信号放大体系
WO2017188426A1 (ja) 2016-04-28 2017-11-02 国立大学法人東京農工大学 ペルオキシダーゼ活性増大アプタマー
WO2017219027A1 (en) 2016-06-17 2017-12-21 The Broad Institute Inc. Type vi crispr orthologs and systems
DK3551753T3 (da) * 2016-12-09 2022-09-05 Broad Inst Inc Diagnostik baseret på crispr-effektorsystem
JP2020511141A (ja) * 2017-03-15 2020-04-16 ザ・ブロード・インスティテュート・インコーポレイテッド 新規Cas13bオルソログCRISPR酵素及び系
CN107462570B (zh) * 2017-08-03 2020-05-05 南京师范大学 基于DNAzyme–aptamer化学发光法检测OTA的光子晶体修饰微球及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nucleic acid detection with CRISPR-Cas13a/C2c2;Jonathan S. Gootenberg等;《Science》;第356卷(第6336期);第1-12页 *
Two Distinct RNase Activities of CRISPR-C2c2 Enable Guide RNA Processing and RNA Detection;Alexandra East-Seletsky等;《Nature》;第538卷(第7624期);第3-6页,图4-5,Extended Data Figure 1b *

Also Published As

Publication number Publication date
JP7527961B2 (ja) 2024-08-05
WO2019148206A1 (en) 2019-08-01
EP3746568B1 (en) 2023-11-15
FI3746568T3 (fi) 2023-12-12
IL276349A (en) 2020-09-30
BR112020015093A2 (pt) 2020-12-08
JP2021511795A (ja) 2021-05-13
CA3087362A1 (en) 2019-08-01
CN112020562A (zh) 2020-12-01
DK3746568T3 (da) 2023-12-18
JP2024065113A (ja) 2024-05-14
EP3746568A1 (en) 2020-12-09
KR20200127168A (ko) 2020-11-10
AU2019213047A1 (en) 2020-07-16
RU2020128413A (ru) 2022-04-01
DK3746568T5 (da) 2024-08-26
US20210371926A1 (en) 2021-12-02

Similar Documents

Publication Publication Date Title
CN112020562B (zh) 基于crispr效应系统的诊断
US12037639B2 (en) CRISPR effector system based diagnostics
US20220025463A1 (en) Crispr effector system based diagnostics
US20220090178A1 (en) Devices for crispr effector system based diagnostics
US11618928B2 (en) CRISPR effector system based diagnostics for malaria detection
US20210108267A1 (en) Crispr effector system based multiplex diagnostics
KR20190140918A (ko) 바이러스 검출을 위한 crispr 이펙터 시스템 기반 진단

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant