CN113302312A - 使用sherlock检测方法对高度进化的病毒变体进行多重化 - Google Patents

使用sherlock检测方法对高度进化的病毒变体进行多重化 Download PDF

Info

Publication number
CN113302312A
CN113302312A CN201980088945.4A CN201980088945A CN113302312A CN 113302312 A CN113302312 A CN 113302312A CN 201980088945 A CN201980088945 A CN 201980088945A CN 113302312 A CN113302312 A CN 113302312A
Authority
CN
China
Prior art keywords
target
rna
sequence
droplets
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980088945.4A
Other languages
English (en)
Inventor
C·A·弗雷杰
H·梅特斯基
P·萨贝蒂
C·梅尔沃德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Publication of CN113302312A publication Critical patent/CN113302312A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

提供了产生用于分析可能包含病原体靶序列的样品的引物和/或探针的方法,所述方法包括鉴定引物和/或探针的泛病毒组。

Description

使用SHERLOCK检测方法对高度进化的病毒变体进行多重化
相关申请的交叉引用
本申请要求2018年11月14日提交的美国临时申请号62/767,076的权益。以上确认的申请的全部内容特此以引用方式完全并入本文。
电子序列表引用
电子序列表(BROD_3820WP_ST25.txt;大小为6687字节,创建日期为2019年11月14日)的内容以引用方式整体并入本文。
技术领域
本文所公开的主题大体上关于用于分析可能包含病原体靶序列的样品的引物和/或探针及其产生方法。
背景技术
在短时间内针对大量样品以高灵敏度和单碱基特异性快速检测核酸的能力具有彻底改革许多疾病的诊断和监测的潜力,提供有价值的流行病学信息,并作为普遍的科学工具。使用能够一次测试大量样品的平台,利用少量样品将提供优于当前技术水平的明显优势。举例来说,qPCR方法灵敏但昂贵,并且依赖于复杂仪器,限制了对于在实验室环境中训练有素的操作员的可用性。其他方法,诸如将等温核酸扩增与便携式平台相结合的新方法(Du等人,2017;Pardee等人,2016),在护理点(POC)环境中提供了高检测特异性,但由于灵敏度低而应用有些局限。随着核酸诊断变得与各种医疗保健应用越来越相关,能够以低成本实现高特异性和灵敏度的大规模多重化的检测技术在临床和基础研究环境两者中将具有很大的实用性,最终允许对样品进行泛病毒、泛细菌或泛病原体检测。
发明内容
在某些示例性实施方式中,提供了产生用于分析可能包含病原体靶序列的样品的引物和/或探针的方法,所述方法包括鉴定引物和/或探针的泛病毒组。所述探针可以有利地用于如本文所述的检测系统和方法中。
用于开发针对病原体的探针和引物的方法,包括:向一个或多个靶病原体提供输入基因组序列组;向所述靶序列组应用组覆盖求解过程以鉴定一个或多个靶扩增序列,其中所述一个或多个靶扩增序列是所述靶病原体的所述输入基因组序列组之间共享的高度保守的靶序列;以及基于所述一个或多个靶扩增序列产生一个或多个引物、一个或多个探针、或引物对和探针组合。在一些实施方案中,所述输入基因组序列组代表来自10种或更多种病毒的组的基因组序列。在多个实施方案中,以58℃至60℃的靶标解链温度鉴定所述引物组。在多个实施方案中,推定扩增子是同时设计的扩增子引物和指导序列。
在多个实施方案中,使所述一个或多个靶扩增序列经受诊断设计指导以产生一个或多个引物、一个或多个探针、或引物对和探针组合。所述输入基因组序列组代表来自两种或多种病毒病原体的基因组序列。所产生的一个或多个引物、一个或多个探针、或引物对和探针组合可以包含用于检测五种或更多种病毒的序列。在多个实施方案中,所述方法允许进行泛病毒检测。
一种用于检测样品中的病毒的方法,包括:使样品与引物对和具有可检测标签的探针接触,其中一个或多个引物和/或探针各自被配置成检测病毒种或亚种。在多个实施方案中,一个或多个探针包含一种或多种被设计成结合至相应靶分子的指导RNA。在多个实施方案中,所述一种或多种指导RNA被设计成检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。在多个实施方案中,所述一种或多种指导RNA被设计成结合至一种或多种对疾病状态具诊断性的靶分子。在多个实施方案中,所述一种或多种指导RNA被设计成区分一种或多种病毒株。在多个实施方案中,所述一种或多种指导RNA包括至少90种指导RNA。
结合以下对所说明的示例性实施方案的详细说明,示例性实施方案的这些和其他方面、目的、特征和优点对于本领域普通技术人员而言将变得显而易见。
附图说明
通过参考阐述了其中可能利用了本发明原理的说明性实施方案的以下详细说明及其附图,将获得对本发明的特征和优点的理解:
图1提供了示例性液滴检测方法的示意图。通过在带有微孔阵列的芯片上进行液滴检测,可以大规模地多重化SHERLOCK病原体检测。扩增反应(使用RPA或PCR)可以在标准管或微孔中进行。然后将检测和扩增混合物排列在微孔中。可以将由不同比率的荧光染料组成的独特荧光条形码添加至各检测混合物和各靶标中。在油中乳化条形码化试剂,并且将来自乳液的液滴汇集在一个管中。将液滴汇集物加载到带有微孔阵列的PDMS芯片上。每个微孔容纳两个液滴,随机产生所有汇集液滴的成对组合。将微孔夹持在玻璃上,隔离每个孔的内容物,并使用荧光显微镜法读取所有液滴的条形码并确定每个微孔的内容物。成像之后,在电场中合并液滴,将检测混合物和靶标组合并开始检测反应。对芯片进行孵育以允许反应进行,并使用荧光显微镜法监测SHERLOCK(特异性高灵敏度酶促报告子解锁)反应的进展。
图2包括的图像显示,检测试剂和靶标可以稳定地乳化为油中的液滴。左图:靶标在油中乳化的水溶液的白光图像。右图:加载有检测试剂和靶标文库的微孔芯片的荧光图像,检测试剂和靶标各自带有独特荧光条形码。每个孔的内容物可以根据荧光条形码确定。
图3包括的图表显示,SHERLOCK在板中和在液滴中的表现同样良好。左图:板中SHERLOCK对寨卡病毒的灵敏度曲线。右图:液滴中同一SHERLOCK测定对寨卡病毒的灵敏度曲线。左图的误差条指示一个标准偏差;右图的误差条是S.E.M.
图4提供的图表显示,SHERLOCK在板中和在液滴中同样能很好地辨别单核苷酸多态性(SNP)。左图:对在寨卡病毒传播到美国时出现的SNP的SHERLOCK辨别。右图:相同SNP的液滴SHERLOCK检测。左图的误差条指示一个标准偏差;右图的误差条是S.E.M.
图5包括的热图显示,流感亚型可以通过在微孔阵列中在液滴中的SHERLOCK检测来辨别。该热图中指示了crRNA汇集物的背景扣除后的倍数开启。
图6包括流感H亚型多重检测的热图结果。基于自2008年以来保藏的序列,设计41个crRNA靶向流感的H区段。方框指示针对各亚型设计的一组crRNA,星号指示与各亚型的多数共有序列对齐的crRNA,有0或1个错配。指示了针对H4、H8和H12的对照crRNA汇集物。
图7示出了流感H亚型多重检测的第二种设计的热图。基于自2008年以来保藏的序列,设计28个crRNA靶向流感的H区段,优先考虑更近期的序列。方框指示针对各亚型设计的一组crRNA,星号指示与各亚型的多数共有序列对齐的crRNA,有0或1个错配。指示了针对H4、H8和H12的对照crRNA汇集物。
图8包括流感N亚型的多重检测的热图。基于自2008年以来保藏的序列,设计35个crRNA靶向流感的H区段,优先考虑更近期的序列。方框指示针对各亚型设计的一组crRNA,星号指示与各亚型的多数共有序列对齐的crRNA,有0或1个错配。“crRNA36”指示未添加crRNA的阴性对照。
图9包括使用液滴SHERLOCK对HIV逆转录酶中6个突变的多重检测。示出了使用祖先型和衍生型序列的合成靶标,靶向祖先型和衍生型等位基因的crRNA的指定突变在不同时间点的荧光。合成靶标(104cp/μl)使用多重PCR扩增并使用液滴SHERLOCK检测。误差条:S.E.M.
图10描绘了HIV衍生型v0和祖先型v1测试的工作方式,并有可能一起使用。
图11包括使用液滴SHERLOCK对TB中的药物抗性突变进行多重检测的结果。示出了30分钟后两个等位基因(参照和药物抗性)的背景扣除荧光。
图12的图表明,将SHERLOCK和微孔阵列芯片技术相结合提供了迄今为止最高的多重检测通量。
图13示出了扩大条形码数量和芯片大小如何实现大规模多重化。(左图)使用3种荧光染料,已将当前的64个条形码组扩展到105个条形码。与我们的现有系统相比,添加第四种染料的可能性已得到小规模证明且不会降低编码准确度,并且可以很容易地扩展到数百个条形码;(右图)现有芯片的尺寸可以扩大四倍,测定开发所需的芯片数量可以减少四倍。
图14包括的图表显示,如所指出的那样,通过实施额外的条形码和扩大的芯片尺寸,可以同时检测约20个样品的所有人类相关病毒。
本文中的附图仅用于说明目的,而不一定按比例绘制。
具体实施方式
一般定义
除非另有规定,否则本文所用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。在分子生物学中常用的术语和技术的定义可以在以下文献中找到:Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook、Fritsch和Maniatis);Molecular Cloning:ALaboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等人编辑);the seriesMethods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson、B.D.Hames和G.R.Taylor编辑):Antibodies,A Laboratory Manual(1988)(Harlow和Lane编辑):Antibodies A Laboratory Manual,第2版2013(E.A.Greenfield编辑);Animal Cell Culture(1987)(R.I.Freshney编辑);BenjaminLewin,Genes IX,Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等人(编辑),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994(ISBN0632021829);Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,VCH Publishers,Inc.出版,1995(ISBN9780471185710);Singleton等人,Dictionaryof Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),三月,Advanced Organic ChemistryReactions,Mechanisms and Structure第4版,John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker和Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
除非上下文另有明确指示,否则如本文所用的单数形式“一个”、“一种”和“所述”包括单数和复数指示物。
术语“任选的”或“任选地”意指后续描述的事件、情形或替代物可能发生或可能不发生,并且该描述包括事件或情形发生的情况和不发生的情况。
通过端点表述的数值范围包括在对应范围内的所有数值和分数,以及所表述的端点。
如本文所用的术语“约”或“近似”当涉及诸如参数、量、时距等可测量的值时,有意涵盖指定值的变化和从指定值的变化,诸如指定值和从指定值+/-10%或更小、+/-5%或更小、+/-1%或更小和+/-0.1%或更小的变化,只要此类变化适于在所公开的发明中执行即可。应当理解,修饰语“约”或“近似”所涉及的值本身也是具体地且优选地公开的。
在本说明书通篇提及“一个实施方案”、“实施方案”、“示例性实施方案”意指结合实施方案描述的特定特征、结构或特性包括于本发明的至少一个实施方案中。因此,在本说明书通篇各处出现短语“在一个实施方案中”、“在实施方案中”或“示例性实施方案”不一定全部指代同一实施方案,但也有可能如此。此外,如本领域技术人员从本公开将明显了解的,在一个或多个实施方案中,特定特征、结构或特性可以按任何适合的方式组合。此外,虽然本文所述的一些实施方案包括其他实施方案中所包括的一些特征而非其他特征,但不同实施方案的特征的组合有意处于本发明的范围内。例如,在所附权利要求中,任何所要求保护的实施方案可以按任何组合使用。
现在将“C2c2”称为“Cas13a”,除非另有说明,否则这些术语在本文中可互换使用。
本文所引用的所有公布、公布的专利文献和专利申请特此以引用方式并入,如同每个单独公布、公布的专利文献或专利申请被确切地且单独地指明为以引用方式整体并入。
综述
本文所公开的实施方案利用靶向RNA的效应子,通过在液滴中进行检测提供用于大规模多重应用的稳健的基于CRISPR的诊断。本文所公开的实施方案可以相当的灵敏度水平检测DNA和RNA两者,并且可以纳升体积基于单碱基对差异将靶标与非靶标区分开。此类实施方案可用于人类健康的多种情形,包括例如病毒检测、细菌菌株分型、灵敏基因分型、多重SNP检测、多重株系辨别,和疾病相关无细胞DNA的检测。为了便于参考,本文所公开的实施方案也可以称为SHERLOCK(特异性高灵敏度酶促报告子解锁),在一些实施方案中其在可多重化的液滴中进行,有利地允许以小体积进行灵敏检测。
当前公开的主题利用可编程的核酸内切酶,包括单效应RNA指导的RNA酶(Shmakov等人,2015;Abudayyeh等人,2016;Smargon等人,2017),包括C2c2,以提供用于特定RNA感测的平台。来自微生物成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(CRISPR-Cas)适应性免疫系统的RNA指导的RNA核酸内切酶可使用CRISPR RNA(crRNA)轻松且方便地进行重新编程以切割靶RNA。RNA指导的RNA酶(如C2c2)在切割其RNA靶标后保持活性,引起附近的非靶向RNA的“附带”切割(Abudayyeh等人,2016)。这种crRNA编程的附带RNA切割活性使得有机会使用RNA指导的RNA酶通过触发可以充当读出的体内程序性细胞死亡或体外非特异性RNA降解来检测特异性RNA的存在(Abudayyeh等人,2016;East-Seletsky等人,2016)。当前公开的主题在液滴应用中利用切割活性来实现与小体积样品的多重反应。
在一方面,提供了一种多重检测系统,所述多重检测系统包括检测CRISPR系统;用于一种或多种靶分子的光学条形码;以及微流体装置。在一些实施方案中,检测CRISPR系统包含靶向RNA的效应蛋白、一种或多种被设计成结合至相应靶分子的指导RNA、基于RNA的掩蔽构建体和光学条形码。在一些实施方案中,微流体装置包括微孔阵列和在微孔下方的至少一个流动通道,微孔的尺寸被设定成捕获至少两个液滴。所述系统可作为试剂盒提供。
在一方面,本文所公开的实施方案涉及用于检测样品中的靶核酸的方法。在一些实施方案中,本文所公开的方法可以包括以下步骤:产生第一组液滴,所述第一组液滴中的每个液滴包含至少一个靶分子和光学条形码;产生第二组液滴,所述第二组液滴中的每个液滴包含检测CRISPR系统,所述检测CRISPR系统包含靶向RNA的效应蛋白和一种或多种被设计成结合至相应靶分子的指导RNA、基于RNA的掩蔽构建体和光学条形码;将所述第一组液滴和所述第二组液滴组合成液滴汇集物,并使所述组合的液滴汇集物流到微流体装置上,所述装置包括微孔阵列和在微孔下方的至少一个流动通道,所述微孔的尺寸被设定成捕获至少两个液滴;将液滴捕获于所述微孔中并检测在每个微孔中捕获的液滴的光学条形码;将在每个微孔中捕获的液滴合并以在每个微孔中形成合并液滴,所述合并液滴的至少一个子组包含检测CRISPR系统和靶序列;启动检测反应。然后将合并的液滴保持在足以允许一种或多种指导RNA与一种或多种靶分子结合的条件下。一种或多种指导RNA与靶核酸的结合进而激活CRISPR效应蛋白。一旦被激活,CRISPR效应蛋白随后使掩蔽构建体失活,例如,通过切割掩蔽构建体以使得可检测阳性信号被揭露、释放或产生。可以在一个或多个时间段检测和测量每个合并液滴的可检测信号,当例如存在阳性可检测信号时指示靶分子的存在。
多重检测系统
公开了多重系统,所述多重系统包括:检测CRISPR系统,所述检测CRISPR系统包含靶向RNA的效应蛋白和一种或多种被设计成结合至相应靶分子的指导RNA、基于RNA的掩蔽构建体和光学条形码;一种或多种靶分子光学条形码;以及微流体装置,所述微流体装置包括微孔阵列和在微孔下方的至少一个流动通道。在多个实施方案中,微孔的尺寸被设定成捕获至少两个液滴。
一般来讲,如本文中和诸如WO 2014/093622(PCT/US2013/074667)的文献中所用的CRISPR-Cas或CRISPR系统共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”和tracrRNA加工的部分正向重复序列)、指导序列(在内源性CRISPR系统的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas诸如Cas9的一种或多种RNA,例如CRISPR RNA和反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来讲,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源性CRISPR系统的情形中也称为原间隔区)。
靶向RNA的蛋白
当CRISPR蛋白是C2c2蛋白时,不需要tracrRNA。C2c2已描述于Abudayyeh等人(2016)“C2c2 is a single-component programmable RNA-guided RNA-targetingCRISPR effector”;Science;DOI:10.1126/science.aaf5573;以及Shmakov等人(2015)“Discovery and Functional Characterization of Diverse Class 2CRISPR-CasSystems”,Molecular Cell,DOI:dx.doi.org/10.1016/j.molcel.2015.10.008;所述文献以引用方式整体并入本文。Cas13b已描述于Smargon等人(2017)“Cas13b Is a Type VI-BCRISPR-Associated RNA-Guided RNases Differentially Regulated by AccessoryProteins Csx27 and Csx28,”Molecular Cell.65,1-13;dx.doi.org/10.1016/j.molcel.2016.12.023.,所述文献以引用方式整体并入本文。国际申请号PCT/US2017/065477,表1至表6,第40-52页中描述的CRISPR效应蛋白可用于当前公开的方法、系统和装置中,并且以引用方式具体并入本文。
在某些实施方案中,原间隔区相邻基序(PAM)或PAM样基序引导如本文所公开的效应蛋白复合物结合至目标靶基因座。在一些实施方案中,PAM可以是5'PAM(即,位于原间隔区的5’末端上游)。在其他实施方案中,PAM可以是3'PAM(即,位于原间隔区的5’末端下游)。术语“PAM”可以与术语“PFS”或“原间隔区侧接位点”或“原间隔区侧接序列”互换使用。
在优选实施方案中,CRISPR效应蛋白可以识别3’PAM。在某些实施方案中,CRISPR效应蛋白可以识别作为5'H的3'PAM,其中H是A、C或U。在某些实施方案中,效应蛋白可以是沙氏纤毛菌C2c2p,更优选地是沙氏纤毛菌DSM 19757C2c2,并且3’PAM为5’H。
在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。术语“靶RNA”是指是或包含靶序列的RNA多核苷酸。换句话说,靶RNA可以是gRNA的一部分,即,指导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的RNA多核苷酸或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。
编码CRISPR效应蛋白,特别是C2c2的核酸分子有利地是密码子优化的CRISPR效应蛋白。在这种情况下,密码子优化的序列的实例是对于在真核生物,例如人类中表达而优化(即,对于在人类中表达而优化),或对于如本文所论述的另一种真核生物、动物或哺乳动物中表达而优化的序列;参见例如WO 2014/093622(PCT/US2013/074667)中的SaCas9人类密码子优化的序列。虽然这是优选的,但将了解,其他实例可能存在,并且对于除人类以外的宿主物种的密码子优化或对于特定器官的密码子优化是已知的。在一些实施方案中,编码CRISPR效应蛋白的酶编码序列对于在特定细胞,诸如真核细胞中表达进行密码子优化。真核细胞可以是特定生物体的那些或来源于特定生物体的那些,所述生物体诸如植物或哺乳动物,包括但不限于人类,或如本文所论述的非人类真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、犬、家畜或非人类哺乳动物或灵长类动物。在一些实施方案中,可以排除有可能不会对人或动物带来任何实质性医学益处的修改人类的种系遗传身份的过程和/或修改动物的遗传身份的过程,以及由此类过程产生的动物。一般来讲,密码子优化是指修饰核酸序列用于增强在目标宿主细胞中的表达的过程,这个过程是通过用在宿主细胞的基因中较频繁或最频繁使用的密码子替代原生序列的至少一个密码子(例如约或大于约1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时维持原生氨基酸序列。不同种类对特定氨基酸的某些密码子展现特定偏性。密码子偏性(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关,据信所述效率继而尤其取决于所翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。细胞中所选tRNA的主导性一般反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来调整基因用于给定的生物体中最佳基因表达。密码子使用表可容易得到,例如,在kazusa.orjp/codon/上可得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按许多方式进行改编。参见Nakamura,Y.,等人“Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000”Nucl.Acids Res.28:292(2000)。对于在特定宿主细胞中表达对特定序列进行密码子优化的计算机算法也可得到,诸如Gene Forge(Aptagen;Jacobus,PA)也可得到。在一些实施方案中,编码Cas的序列中的一个或多个密码子(例如1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在某些实施方案中,如本文所述的方法可以包括提供Cas转基因细胞,尤其C2c2转基因细胞,在所述细胞中提供或引入编码一种或多种指导RNA的一种或多种核酸,所述一种或多种核酸在细胞中与包含一种或多种目标基因的启动子的调控元件可操作地连接。如本文所用,术语“Cas转基因细胞”是指细胞,诸如真核细胞,其中Cas基因已经在基因组上整合。细胞的性质、类型或来源根据本发明并无特别限制。而且,Cas转基因引入细胞中的方式可以有变化并且可以是如本领域中已知的任何方法。在某些实施方案中,通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。在某些其他实施方案中,通过从Cas转基因生物体中分离细胞来获得Cas转基因细胞。通过实例并且不受限制,如本文所提及的Cas转基因细胞可以来源于Cas转基因真核生物,诸如Cas敲入真核生物。参考WO 2014/093622(PCT/US13/74667),以引用的方式并入本文中。可以修改针对靶向Rosa基因座的转让给SangamoBioSciences,Inc.的美国专利公布号20120017290和20110265198的方法以利用本发明的CRISPR Cas系统。还可以修改针对靶向Rosa基因座的转让给Cellectis的美国专利公布号20130236946的方法以利用本发明的CRISPR Cas系统。通过另一个实例,参考Platt等人(Cell;159(2):440-455(2014)),所述文献描述了Cas9敲入小鼠,以引用的方式并入本文中。Cas转基因还可以包含Lox-Stop-polyA-Lox(LSL)盒,从而促成由Cre重组酶可诱导的Cas表达。或者,可以通过将Cas转基因引入分离的细胞中来获得Cas转基因细胞。用于转基因的递送系统在本领域中是众所周知的。通过实例,可以借助于如本文别处也描述的载体(例如AAV、腺病毒、慢病毒)和/或粒子和/或纳米粒子递送将Cas转基因递送于例如真核细胞中。
技术人员将了解,如本文所提及的细胞,诸如Cas转基因细胞除了具有整合的Cas基因或当与能够将Cas导向靶基因座的RNA复合时由Cas的序列特异性作用产生的突变以外还可以包含基因组改变。
在某些方面,本发明涉及例如用于将Cas和/或能够将Cas导向靶基因座的RNA(即,指导RNA)递送至或引入细胞中以及用于繁殖这些组分(例如在原核细胞中)的载体。如本文所用,“载体”是允许或有助于实体从一种环境转移至另一种环境的工具。载体是复制子,诸如质粒、噬菌体或粘粒,可以向该复制子中插入另一个DNA区段以便使得该插入的区段复制。一般来讲,载体当与适当控制元件相关联时能够复制。一般来讲,术语“载体”是指能够转运它所连接的另一个核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离端、不包含游离端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域中已知的多核苷酸的其他种类。一种类型的载体是“质粒”,其是指环状双链DNA环,可以诸如通过标准分子克隆技术向该环中插入另外的DNA区段。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于包装到病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))中的载体中。病毒载体还包括由转染到宿主细胞中的病毒携带的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入到宿主细胞中之后被整合到宿主细胞的基因组中,并且因此随着宿主基因组一起复制。此外,某些载体能够引导它们可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。在重组DNA技术中有效用的常用表达载体常常呈质粒的形式。
重组表达载体可以包含处于适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含一个或多个调控元件,这些调控元件可以基于用于表达的宿主细胞来选择,可操作地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在意指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调控元件。关于重组和克隆方法,提及2004年9月2日以US 2004-0171156 A1公布的美国专利申请10/815,730,该专利的内容以引用方式整体并入本文。因此,本文所公开的实施方案还可以包括包含CRISPR效应系统的转基因细胞。在某些示例性实施方案中,转基因细胞可以充当个别离散体积。换句话说,可以将包含掩蔽构建体的样品例如在合适的递送囊泡中递送至细胞,并且如果靶标存在于递送囊泡中,则CRISPR效应子被激活并且生成可检测信号。
一个或多个载体可以包括一个或多个调控元件,例如一个或多个启动子。一个或多个载体可以包含Cas编码序列和/或单个,但可能还可以包含至少3个或8个或16个或32个或48个或50个指导RNA(例如sgRNA)编码序列,诸如1-2个、1-3个、1-4个、1-5个、3-6个、3-7个、3-8个、3-9个、3-10个、3-16个、3-30个、3-32个、3-48个、3-50个RNA(例如sgRNA)。在单个载体中,可以存在每个RNA(例如sgRNA)的启动子,有利地当存在至多约16个RNA时;并且当单个载体提供多于16个RNA时,一个或多个启动子可以驱动多于一个RNA的表达,例如当存在32个RNA时,每个启动子可以驱动两个RNA的表达,并且当存在48个RNA时,每个启动子可以驱动三个RNA的表达。通过简单的算术和完善的克隆方案和本公开中的教义,本领域技术人员可以关于适合的示例性载体(诸如AAV)的一个或多个RNA和诸如U6启动子的适合启动子来容易地实施本发明。举例来说,AAV的包封限度为约4.7kb。单个U6-gRNA(加上用于克隆的限制性位点)的长度为361bp。因此,技术人员可以容易地将约12-16个,例如13个U6-gRNA盒装配至单个载体中。这可以通过任何适合的手段,诸如用于TALE组装的金门策略来组装(genome-engineering.org/taleffectors/)。技术人员还可以使用串联指导策略以使U6-gRNA的数目增加约1.5倍,例如,从12-16个,例如13个增加至约18-24个,例如约19个U6-gRNA。因此,本领域技术人员可以在单个载体,例如AAV载体中容易地达到约18-24个,例如约19个启动子-RNA,例如U6-gRNA。用于增加载体中启动子和RNA的数目的进一步方式是使用单个启动子(例如U6)以表达由可切割序列分离的RNA阵列。并且,用于增加载体中启动子-RNA的数目的更进一步方式是在编码序列或基因的内含子中表达由可切割序列分离的启动子-RNA阵列;并且在这种情况下,有利的是使用聚合酶II启动子,其可以具有增加的表达并且能够以组织特异性方式转录长RNA。(参见例如nar.oxfordjournals.org/content/34/7/e53.short and nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在有利的实施方案中,AAV可以包封靶向至多约50个基因的U6串联gRNA。因此,根据本领域中的知识和本公开中的教义,无需过度实验技术人员可以容易地制备和使用一个或多个载体,例如单个载体,所述载体表达多个RNA或指导物,所述个RNA或指导物处于一个或多个启动子控制下或者操作性地或功能性地连接至一个或多个启动子—尤其是本文所论述的数目的RNA或指导物。
指导RNA编码序列和/或Cas编码序列可以功能性地或操作性地连接至一个或多个调控元件,并且因此所述一个或多个调控元件驱动表达。一个或多个启动子可以是一个或多个组成型启动子和/或一个或多个条件型启动子和/或一个或多个诱导型启动子和/或一个或多个组织特异性启动子。启动子可以选自由以下组成的组:RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒劳斯肉瘤病毒(Rous sarcoma virus)(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子U6。
在一些实施方案中,靶向核酸的系统的一个或多个元件来源于包含靶向RNA的内源CRISPR系统的特定生物体。在某些示例性实施方案中,靶向RNA的效应蛋白CRISPR系统包含至少一个HEPN结构域,包括但不限于本文所述的HEPN结构域、本领域中已知的HEPN结构域,和通过与共有序列基序相比而被识别为HEPN结构域的结构域。本文中提供若干此类结构域。在一个非限制性实例中,共有序列可以来源于本文所提供的C2c2或Cas13b直系同源物的序列。在某些示例性实施方案中,效应蛋白包含单个HEPN结构域。在某些其他示例性实施方案中,效应蛋白包含两个HEPN结构域。
在一个示例性实施方案中,效应蛋白包含一个或多个包含RxxxxH基序序列的HEPN结构域。RxxxxH基序序列可以是但不限于来自本文所述的HEPN结构域或本领域中已知的HEPN结构域。RxxxxH基序序列还包括通过组合两个或更多个HEPN结构域的部分而建立的基序序列。如所指出的,共有序列可以来源于以下文献中公开的直系同源物的序列:题为“新颖的VI型CRISPR直系同源物和系统(Novel Type VI CRISPR Orthologs and Systems)”的PCT/US2017/038154的例如第256-264和285-336页、题为“新颖的CRISPR酶和系统(NovelCRISPR Enzymes and Systems)”的美国临时专利申请62/432,240、2017年3月15日提交的题为“新颖的VI型CRISPR直系同源物和系统(Novel Type VI CRISPR Orthologs andSystems)”的美国临时专利申请62/471,710和2017年4月12日提交的题为“新颖的VI型CRISPR直系同源物和系统(Novel Type VI CRISPR Orthologs and Systems)”的美国临时专利申请62/484,786。
在本发明的实施方案中,HEPN结构域包含至少一个包含序列R{N/H/K}X1X2X3H的RxxxxH基序。在本发明的实施方案中,HEPN结构域包括包含序列R{N/H}X1X2X3H的RxxxxH基序。在本发明的实施方案中,HEPN结构域包含序列R{N/K}X1X2X3H。在某些实施方案中,X1是R、S、D、E、Q、N、G、Y或H。在某些实施方案中,X2是I、S、T、V或L。在某些实施方案中,X3是L、F、N、Y、V、I、S、D、E或A。
根据本发明使用的额外效应子可以通过其与cas1基因的接近性来鉴定,例如但不限于在距cas1基因的始端20kb和距cas1基因的末端20kb的区域内。在某些实施方案中,效应蛋白包含至少一个HEPN结构域和至少500个氨基酸,并且其中C2c2效应蛋白天然存在于Cas基因或CRISPR阵列上游或下游20kb内的原核基因组中。Cas蛋白质的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同系物或其修饰型式。在某些示例性实施方案中,C2c2效应蛋白天然存在于Cas 1基因上游或下游20kb内的原核基因组中。术语“直系同源物(orthologue)”(在本文中也称为“直系同源物(ortholog)”)和“同系物(homologue)”(本文中也称为“同系物(homolog)”)在本领域中是众所周知的。作为进一步指导,如本文所用的蛋白质的“同系物”是与作为其同系物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。
在特定实施方案中,靶向RNA的VI型Cas酶是C2c2。在其他示例性实施方案中,靶向RNA的VI型Cas酶是Cas 13b。在特定实施方案中,如本文所提及的VI型蛋白质,诸如C2c2的同系物或直系同源物与VI型蛋白质,诸如C2c2(例如,基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSLR9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(Listerianewyorkensis)(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的VI型蛋白质,诸如C2c2的同系物或直系同源物与野生型C2c2(例如,基于以下任一种的野生型序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、韦氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或斯氏李斯特菌C2c2)具有至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,更优选地至少85%,甚至更优选地至少90%,例如至少95%的序列同一性。
在某些其他示例性实施方案中,CRISPR系统效应蛋白是C2c2核酸酶。C2c2的活性可以取决于两个HEPN结构域的存在。这些已经显示为RNA酶结构域,即,切割RNA的核酸酶(特别是核酸内切酶)。C2c2 HEPN还可以靶向DNA,或潜在地DNA和/或RNA。在C2c2的HEPN结构域至少能够结合至RNA并且以其野生型形式切割RNA的基础上,则优选的是C2c2效应蛋白具有RNA酶功能。关于C2c2 CRISPR系统,参考题为“VI型CRISPR直系同源物和系统(TYPE VICRISPR ORTHOLOGS AND SYSTEMS)”的国际专利公布WO/2017/219027、2016年6月17日提交的美国临时申请62/351,662和2016年8月17日提交的美国临时申请62/376,377。还参考2016年6约17日提交的美国临时案62/351,803。还参考2016年12月8日提交的题为“新颖的Crispr酶和系统(Novel Crispr Enzymes and Systems)”的美国临时案,带有博德研究所(Broad Institute)编号10035.PA4和代理人案号47627.03.2133。进一步参考East-Seletsky等人“Two distinct RNase activities of CRISPR-C2c2enable guide-RNAprocessing and RNA detection”Nature doi:10/1038/nature19802和Abudayyeh等人“C2c2 is a single-component programmable RNA-guided RNA targeting CRISPReffector”bioRxiv doi:10.1101/054742。
CRISPR系统中的RNA酶功能是已知的,举例来说,对于某些III型CRISPR-Cas系统已经报道mRNA靶向(Hale等人,2014,Genes Dev,第28卷,2432-2443;Hale等人,2009,Cell,第139卷,945-956;Peng等人,2015,Nucleic acids research,第43卷,406-417)并且提供显著优点。在表皮葡萄球菌(Staphylococcus epidermis)III-A型系统中,跨靶标的转录切割靶DNA和其转录物,这是由Cas10-Csm核糖核蛋白效应蛋白复合物内的独立活性位点介导(参见Samai等人,2015,Cell,第151卷,1164-1174)。由此提供CRISPR-Cas系统、组合物或经由本发明效应蛋白靶向RNA的方法。
在一个实施方案中,Cas蛋白质可以是以下属的生物体的C2c2直系同源物:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属、弯曲杆菌属和毛螺菌属。这种属的生物体的种类可以如本文其他方面所论述。
在某些示例性实施方案中,本发明的C2c2效应蛋白包括但不限于以下21种直系同源物种类(包括多个CRISPR基因座):沙氏纤毛菌;韦德纤毛菌(Lw2);斯氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨[梭菌]DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二CRISPR基因座);产丙酸沼杆菌WB4;韦氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;解半纤维素赫氏菌;直肠[真杆菌];真杆菌科细菌CHKCI004;布劳特氏菌属种马赛-P2398;和纤毛菌属种口腔分类群879菌株F0557。另外十二(12)种非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌;桔红色去甲基醌菌;海旋菌属种TSL5-1;假丁酸弧菌属种OR37;丁酸弧菌属种YAB3001;布劳特氏菌属种马赛-P2398;纤毛菌属种马赛-P3007;爱华拟杆菌;紫单孢菌科细菌KH3CP3RA;崖李斯特菌;和陌生非适应螺菌。
鉴定CRISPR-Cas系统酶的直系同源物的一些方法可以涉及鉴定目标基因组中的tracr序列。tracr序列的鉴定可以涉及以下步骤:在数据库中搜索正向重复序列或tracr配对序列以鉴定包含CRISPR酶的CRISPR区。在正义与反义方向上侧接CRISPR酶的CRISPR区中搜索同源序列。寻找转录终止子和二级结构。鉴定不是正向重复序列或tracr配对序列,但与正向重复序列或tracr配对序列具有大于50%同一性的任何序列作为潜在tracr序列。获取潜在tracr序列并且分析与其相关联的转录终止子序列。
应当理解,本文所述的任何功能性可以工程化至来自其他直系同源物的CRISPR酶中,包括包含来自多种直系同源物的片段的嵌合酶。此类直系同源物的实例在本文别处描述。因此,嵌合酶可以包含以下生物体的CRISPR酶直系同源物的片段:包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。嵌合酶可以包含第一片段和第二片段,并且所述片段可以是本文所提及的属类或本文所提及的种类的生物体的CRISPR酶直系同源物的片段;有利地,所述片段来自不同种类的CRISPR酶直系同源物。
在多个实施方案中,如本文所提及的C2c2蛋白质还涵盖C2c2或其同系物或直系同源物的功能变体。如本文所用的蛋白质的“功能变体”是指这种蛋白质的变体,其至少部分保留所述蛋白质的活性。功能变体可以包括突变体(其可以是插入、缺失或置换突变体),包括多形体等。功能变体还包括这种蛋白质与另一种通常无关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。有利的实施方案可以涉及工程化的或非天然存在的靶向RNA的VI型效应蛋白。
在一个实施方案中,编码C2c2或其直系同源物或同系物的一个或多个核酸分子可以对于在真核细胞中表达进行密码子优化。真核生物可以如本文所论述。一个或多个核酸分子可以是工程化的或非天然存在的。
在一个实施方案中,C2c2或其直系同源物或同系物可以包含一个或多个突变,并且因此编码其的一个或多个核酸分子可以具有一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。关于Cas9酶的催化结构域的实例可以包括但不限于RuvC I、RuvC II、RuvC III和HNH结构域。
在一个实施方案中,C2c2或其直系同源物或同系物可以包含一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。关于Cas酶的催化结构域的实例可以包括但不限于HEPN结构域。
在一个实施方案中,C2c2或其直系同源物或同系物可以用作与功能结构域融合或可操作地连接至功能结构域的通用核酸结合蛋白。示例性功能结构域可以包括但不限于翻译引发剂、翻译激活剂、翻译阻遏剂、核酸酶(尤其核糖核酸酶)、剪接体、珠粒、光可诱导/可控制结构域或化学可诱导/可控制结构域。
在某些示例性实施方案中,C2c2效应蛋白可以来自选自由以下组成的组的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、弗维菌属、黄杆菌属、单丝壳属、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、硝酸盐裂解菌属、支原体属和弯曲杆菌属。
在某些实施方案中,效应蛋白可以是李斯特菌属种C2c2p,优选地是斯氏李斯特菌C2c2p,更优选地是斯氏李斯特菌血清变型1/2b菌株SLCC3954C2c2p,并且crRNA序列的长度可以是44至47个核苷酸,其具有5'29nt正向重复序列(DR)和15nt至18nt间隔区。
在某些实施方案中,效应蛋白可以是纤毛菌属种C2c2p,优选地是沙氏纤毛菌C2c2p,更优选地是沙氏纤毛菌DSM 19757C2c2p,并且crRNA序列的长度可以是42至58个核苷酸,其具有至少24nt的5'正向重复序列,诸如5'24-28nt正向重复序列(DR),和至少14nt的间隔区,诸如14nt至28nt间隔区,或至少18nt的间隔区,诸如19、20、21、22或更多nt,诸如18-28、19-28、20-28、21-28或22-28nt。
在某些示例性实施方案中,效应蛋白可以是纤毛菌属种,韦德纤毛菌F0279;或李斯特菌属种,优选地是纽约李斯特菌FSL M6-0635。
在某些实施方案中,根据本发明的C2c2蛋白是或来源于所述直系同源物中的一种,或是如本申请中所描述的直系同源物中的两种或更多种的嵌合蛋白,或是所述直系同源物中的一种的突变体或变体(或嵌合突变体或变体),包括如本文别处所定义的死亡C2c2、脱落C2c2、去稳定C2c2等,其与或不与异源/功能结构域融合。
在某些示例性实施方案中,靶向RNA的效应蛋白是VI-B型效应蛋白,诸如Cas13b和第29组或第30组蛋白质。在某些示例性实施方案中,靶向RNA的效应蛋白包含一个或多个HEPN结构域。在某些示例性实施方案中,靶向RNA的效应蛋白包含C端HEPN结构域、N端HEPN结构域或这两个结构域。关于在本发明的情形中可以使用的示例性VI-B型效应蛋白,参考题为"新颖的CRISPR酶和系统(Novel CRISPR Enzymes and Systems)"并且2016年10月21日提交的美国申请号15/331,792,题为"新颖的CRISPR酶和系统(Novel CRISPR Enzymesand Systems)"并且2016年10月21日提交的国际专利申请号PCT/US2016/058302,和Smargon等人"Cas13b is a Type VI-BCRISPR-associated RNA-Guided RNasedifferentially regulated by accessory proteins Csx27 and Csx28"MolecularCell,65,1-13(2017);dx.doi.org/10.1016/j.molcel.2016.12.023,以及2017年3月15日提交的题为“新颖的Cas13b直系同源物CRISPR酶和系统(Novel Cas13b OrthologuesCRISPR Enzymes and System)”的有待转让的美国临时申请号。在某些示例性实施方案中,可使用来自相同类别的CRISPR效应蛋白的不同直系同源物,诸如两个Cas13a直系同源物、两个Cas13b直系同源物或两个Cas13c直系同源物,国际申请号PCT/US2017/065477,表1至表6,第40-52页中描述了这些直系同源物并且以引用方式并入本文。在某些其他示例性实施方案中,可使用具有不同核苷酸编辑偏好的不同直系同源物,诸如Cas13a和Cas13b直系同源物,或Cas13a和Cas13c直系同源物,或Cas13b直系同源物和Cas13c直系同源物等。
在一些实施方案中,靶向RNA的效应蛋白可包含一个或多个HEPN结构域,所述结构域可任选地包含RxxxxH基序序列。在一些情况下,RxxxH基序包含R{N/H/K]X1X2X3H序列,其在一些实施方案中X1是R、S、D、E、Q、N、G或Y,并且X2独立地是I、S、T、V或L,并且X3独立地是L、F、N、Y、V、I、S、D、E或A。在一些特定实施方案中,靶向RNA的CRISPR效应蛋白是C2c2。
指导物
本文所公开的方法可以用于设计一种或多种指导RNA以区分一种或多种病毒株。在多个实施方案中,所述方法设计了10、20、30、40、50、60、70、80、90、100种或更多种指导RNA以区分病毒株。所述方法允许将输入基因组序列组添加至鉴定一个或多个靶扩增序列的一个或多个靶病原体。在多个实施方案中,所述方法可以用于产生一个或多个指导序列,其可以是至少90个指导序列。
如本文所用,术语“指导序列”、“crRNA”、“指导RNA”或“单指导RNA”或“gRNA”是指包含与靶核酸序列具有足够互补性的任何多核苷酸序列的多核苷酸以与靶核酸序列杂交并且引导包含指导序列和CRISPR效应蛋白的靶向RNA的复合物序列特异性地结合至靶核酸序列。在一些示例性实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。可以通过任何合适的测定来评定指导序列(在核酸靶向指导RNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的能力。举例来说,足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶核酸序列内的优先靶向(例如切割)。类似地,可以在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶核酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择指导序列并且因此选择核酸靶向指导以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在一些实施方案中,选择核酸靶向指导物以降低核酸靶向指导物内的二级结构程度。在一些实施方案中,当最佳折叠时,核酸靶向指导物的约或小于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸参与自身互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能(Gibbs free energy)。一种此类算法的实例是如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所描述的mFold。另一个示例性折叠算法是维也纳大学(University ofVienna)的理论化学研究所(Institute for Theoretical Chemistry)开发的使用质心结构预测算法的在线网络服务器RNAfold(参见例如A.R.Gruber等人,2008,Cell106(1):23-24;以及PA Carr和GM Church,2009,Nature Biotechnology 27(12):1151-62)。用于综合杂交的靶标的紧密聚集(Compact Aggregation of Targets for ComprehensiveHybridization,CATCH)可以用于设计实现多样性全覆盖,参见例如Metsky等人,Capturingdiverse microbial sequence with comprehensive and scalable probe design,DOIhttps://doi.org/10.1101/279570。如本文所述的诊断-指导-设计方法可以在软件工具中实现。就病毒序列(或其他所需的靶序列)而言,利用病毒序列比对输入,其目标是找到一组指导序列,所有序列都在某个指定的扩增子长度内,这些指导序列将检测到某一期望分数(例如95%)的可容忍指导物与靶标之间某一错配数目(通常为1)的输入序列。对于亚型分型(或任何差异化识别)至关重要的是,它设计了不同的指导物集合,确保每个集合特定于一个亚型。这种特殊的方法可以允许使用诊断-指导-设计(“d-g-d”)以及其他工具和方法同时设计扩增子引物和指导序列进行物种鉴定,所述方法包括如PCT/US2017/0488744(例如[0056]-[0131])和PCT/US2017/048479中描述的那些,所述文献以引用方式并入本文。
在某些实施方案中,指导RNA或crRNA可以包含正向重复(DR)序列和指导序列或间隔区序列,基本上由其组成,或由其组成。在某些实施方案中,指导RNA或crRNA可以包含融合或连接至指导序列或间隔区序列的正向重复序列,基本上由其组成,或由其组成。在某些实施方案中,正向重复序列可以位于指导序列或间隔区序列上游(即,5')。在其他实施方案中,正向重复序列可以位于指导序列或间隔区序列下游(即3')。
在某些实施方案中,crRNA包含茎环,优选单个茎环。在某些实施方案中,正向重复序列形成茎环,优选单个茎环。
在某些实施方案中,指导RNA的间隔区长度为15至35nt。在某些实施方案中,指导RNA的间隔区长度为至少15个核苷酸。在某些实施方案中,间隔区长度为15至17nt,例如15、16或17nt;17至20nt,例如17、18、19或20nt;20至24nt,例如20、21、22、23或24nt;23至25nt,例如23、24或25nt;24至27nt,例如24、25、26或27nt;27-30nt,例如27、28、29或30nt;30-35nt,例如30、31、32、33、34或35nt;或35nt或更长。
一般来讲,CRISPR-Cas、CRISPR-Cas9或CRISPR系统可以如在诸如WO 2014/093622(PCT/US2013/074667)的前述文献中那样使用并且共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因(特别地,在CRISPR-Cas9的情况下为Cas9基因)的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”和tracrRNA加工的部分正向重复序列)、指导序列(在内源性CRISPR系统的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas9的一种或多种RNA,例如CRISPR RNA和反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来讲,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源性CRISPR系统的情形中也称为原间隔区)。在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。与靶序列的互补对于切割活性很重要的指导序列的部分在本文中称为种子序列。靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中,并且可以包括处于存在于细胞内的线粒体、细胞器、囊泡、脂质体或粒子中或来自其的核酸。在一些实施方案中,特别是对于非核用途,NLS不是优选的。在一些实施方案中,CRISPR系统包含一个或多个核输出信号(NES)。在一些实施方案中,CRISPR系统包含一个或多个NLS和一个或多个NES。在一些实施方案中,可以通过搜索满足以下任何或所有条件的重复基序,在计算机上鉴定正向重复序列:1.在II型CRISPR基因座侧翼的2Kb基因组序列窗口中;2.跨度为20至50bp;和3.间隔20至50bp。在一些实施方案中,可以使用这些标准中的2个,例如1和2、2和3或1和3。在一些实施方案中,可以使用所有3个标准。
在本发明的实施方案中,术语指导序列和指导RNA,即,能够将Cas导向靶基因组基因座的RNA,如前面引用的文献诸如WO 2014/093622(PCT/US2013/074667)中所述互换使用。一般来讲,指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导CRISPR复合物序列特异性地结合至靶序列的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法最佳比对时,指导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Watermanalgorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。
在一些实施方案中,指导序列的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方案中,指导序列的长度小于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。优选地,指导序列长度为10 30个核苷酸。可以通过任何适合的测定来评定指导序列引导CRISPR复合物序列特异性地结合至靶序列的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶序列内的优先切割。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶多核苷酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。
在CRISPR-Cas系统的一些实施方案中,指导序列与其相应靶序列之间的互补程度可以为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;指导物或RNA或sgRNA的长度可以为约或大于约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸;或者指导物或RNA或sgRNA的长度可以小于约75个、50个、45个、40个、35个、30个、25个、20个、15个、12个或更少个核苷酸;并且有利地tracr RNA的长度为30或50个核苷酸。然而,本发明的一个方面是减少脱靶相互作用,例如,减少指导物与具有低互补性的靶序列相互作用。实际上,在实施例中显示,本发明涉及使得CRISPR-Cas系统能够区分靶序列与具有大于80%至约95%互补性,例如83%-84%或88-89%或94-95%互补性的脱靶序列(例如,区分具有18个核苷酸的靶标与具有1个、2个或3个错配的18个核苷酸的脱靶)的突变。因此,在本发明的情形中,指导序列与其相应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序列与指导物之间的互补性,有利的是,脱靶为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与指导物之间的互补性。
指导物修饰
在某些实施方案中,本发明的指导物包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物和/或化学修饰。非天然存在的核酸可以包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸和/或碱基部分被修饰。在本发明的实施方案中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,指导物包含一种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的实施方案中,指导物包含一种或多种非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键联、硼酸磷酸酯键联的核苷酸、包含在核糖环的2’和4’碳原子之间的亚甲基桥的锁定核酸(LNA),或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物、2-硫代尿苷类似物、N6-甲基腺苷类似物或2'-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷和7-甲基鸟苷。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基-3'-硫代磷酸酯(MS)、硫代磷酸酯(PS)、S-约束乙基(cEt)或2'-O-甲基-3'-硫代PACE(MSP)。此类化学修饰的指导物与未修饰的指导物相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布;Ragdarm等人,2015,PNAS,E7110-E7111;Allerson等人,J.Med.Chem.2005,48:901-904;Bramsen等人,Front.Genet.,2012,3:154;Deng等人,PNAS,2015,112:11870-11875;Sharma等人,MedChemComm.,2014,5:1454-1471;Hendel等人,Nat.Biotechnol.(2015)33(9):985-989;Li等人,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。在一些实施方案中,指导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见Kelly等人,2016,J.Biotech.233:74-83)。在某些实施方案中,指导物在结合至靶DNA的区域中包含核糖核苷酸,并在结合至Cas9、Cpf1或C2c1的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程化的指导结构(诸如但不限于5'端和/或3'端、茎环区和种子区)中。在某些实施方案中,修饰不在茎环区的5'柄(5’-handle)中。指导物的茎环区的5'柄中的化学修饰可能会废除其功能(参见Li等人,Nature Biomedical Engineering,2017,1:0066)。在某些实施方案中,指导物的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸经化学修饰。在一些实施方案中,指导物的3’或5’端的3-5个核苷酸经化学修饰。在一些实施方案中,在种子区中仅引入较小的修饰,诸如2’-F修饰。在一些实施方案中,在指导物的3’端引入2'-F修饰。在某些实施方案中,指导物的5’端和/或3’端的3至5个核苷酸用2'-O-甲基(M)、2'-O-甲基-3'-硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3'-硫代PACE(MSP)进行化学修饰。这样的修饰可以提高基因组编辑效率(参见Hendel等人,Nat.Biotechnol.(2015)33(9):985-989)。在某些实施方案中,指导物的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在某些实施方案中,指导物的5’和/3’端的多于5个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)化学修饰。这种化学修饰的指导物可以介导增强的基因破坏水平(参见Ragdarm等人,0215,PNAS,E7110-E7111)。在本发明的一个实施方案中,指导物被修饰成在其3’和/或5’端包含化学部分。这样的部分包括但不限于胺、叠氮化物、炔、硫代基、二苯并环辛炔(DBCO)或若丹明。在某些实施方案中,化学部分通过接头诸如烷基链缀合至指导物。在某些实施方案中,修饰的指导物的化学部分可用于将指导物附接至另一分子,诸如DNA、RNA、蛋白质或纳米粒子。这种化学修饰的指导物可用于识别或富集一般由CRISPR系统编辑的细胞(参见Lee等人,eLife,2017,6:e25312,DOI:10.7554)。
在某些实施方案中,如本文所提供的CRISPR系统可以利用包含指导序列的crRNA或类似多核苷酸,其中多核苷酸是RNA、DNA或RNA与DNA的混合物,并且/或者其中多核苷酸包含一种或多种核苷酸类似物。序列可以包含任何结构,包括但不限于原生crRNA的结构,诸如凸环、发夹或茎环结构。在某些实施方案中,包含指导序列的多核苷酸与可以是RNA或DNA序列的第二多核苷酸序列形成双链体。
在一些实施方案中,对指导物的修饰是化学修饰、插入、缺失或拆分。在一些实施方案中,化学修饰包括但不限于并入2'-O-甲基(M)类似物、2'-脱氧类似物、2-硫代尿苷类似物,N6-甲基腺苷类似物、2'-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2'-O-甲基-3’-硫代磷酸酯(MS)、S-约束乙基(cEt)、硫代磷酸酯(PS)或2'-O-甲基-3’-硫代PACE(MSP)。在一些实施方案中,指导物包含一种或多种硫代磷酸酯修饰。在某些实施方案中,指导物的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或25个核苷酸经化学修饰。在某些实施方案中,种子区中的一个或多个核苷酸经化学修饰。在某些实施方案中,在3’端的一个或多个核苷酸经化学修饰。在某些实施方案中,5’柄中的核苷酸均未经化学修饰。在一些实施方案中,种子区中的化学修饰是次要修饰,诸如并入2’-氟类似物。在具体实施方案中,种子区的一个核苷酸被2’-氟类似物替代。在一些实施方案中,3’端中的5或10个核苷酸经化学修饰。在Cpf1 CrRNA的3’端处的此类化学修饰提高基因切割效率(参见Li等人,Nature Biomedical Engineering,2017,1:0066)。在具体实施方案中,3'端中的5个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的10个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的5个核苷酸被2'-O-甲基(M)类似物替代。
在一些实施方案中,指导物的5'柄的环经修饰。在一些实施方案中,指导物的5'柄的环被修饰为具有缺失、插入、拆分或化学修饰。在某些实施方案中,环包含3、4或5个核苷酸。在某些实施方案中,环包含序列UCUU、UUUU、UAUU或UGUU。
可以选择指导序列并且因此选择靶向核酸的指导RNA以靶向任何靶核酸序列。在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。术语“靶RNA”是指是或包含靶序列的RNA多核苷酸。换句话说,靶RNA可以是gRNA的一部分,即,指导序列被设计成与其具有互补性并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应功能所针对的RNA多核苷酸或RNA多核苷酸的一部分。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。
靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。在某些实施方案中,一种或多种指导RNA被设计成检测靶RNA或DNA中的单核苷酸多态性、转录物的剪接变体或移码突变,如本文更详细地描述的。
在某些实施方案中,指导RNA的间隔区长度小于28个核苷酸。在某些实施方案中,指导RNA的间隔区长度为至少18个核苷酸并且小于28个核苷酸。在某些实施方案中,指导RNA的间隔区长度在19个与28个核苷酸之间。在某些实施方案中,指导RNA的间隔区长度在19个与25个核苷酸之间。在某些实施方案中,指导RNA的间隔区长度为20个核苷酸。在某些实施方案中,指导RNA的间隔区长度为23个核苷酸。在某些实施方案中,指导RNA的间隔区长度为25个核苷酸。
在某些实施方案中,可以通过在间隔区序列与靶序列之间,包括沿着间隔区/靶标的错配位置引入错配,例如1个或多个错配,诸如1个或2个错配来探索切割效率的调节。举例来说,双重错配越处于中心(即,不是3'或5'),切割效率越受影响。因此,通过选择沿着间隔区的错配位置,可以调节切割效率。作为实例,如果需要小于100%的靶标切割(例如在细胞群体中),那么可以在间隔区序列中引入1个或多个,诸如优选2个在间隔区与靶序列之间的错配。错配位置沿着间隔区越处于中心,切割百分比越低。
在某些示例性实施方案中,可以探索切割效率以设计单指导物,所述单指导物可以区分两种或更多种因单核苷酸,诸如单核苷酸多态性(SNP)、变异或(点)突变而变化的靶标。CRISPR效应子可能对SNP(或其他单核苷酸变异)的灵敏度降低并且继续以某一效率水平切割SNP靶标。因此,对于两种靶标或一组靶标,指导RNA可以被设计成具有与靶标中的一种,即,中靶SNP互补的核苷酸序列。指导RNA被进一步设计成具有合成错配。如本文所用,“合成错配”是指在天然存在的SNP上游或下游,诸如上游或下游至多5个核苷酸,例如上游或下游4个、3个、2个或1个核苷酸,优选地上游或下游至多3个核苷酸,更优选地上游或下游至多2个核苷酸,最优选地上游或下游1个核苷酸(即,邻近SNP)处引入的非天然存在的错配。当CRISPR效应子结合至中靶SNP时,仅单错配将与合成错配一起形成,并且将继续激活CRISPR效应子并产生可检测信号。当指导RNA与脱靶SNP杂交时,将形成两个错配,即来自SNP的错配和合成错配,并且不产生可检测信号。因此,本文所公开的系统可以被设计成区分群体内的SNP。举例来说,所述系统可以用于区分因单个SNP而不同的病原性株系或检测某些疾病特异性SNP,诸如但不限于疾病相关SNP,诸如但不限于癌症相关SNP。
在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置1、2、3、4、5、6、7、8或9上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置2、3、4、5、6或7上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置3、4、5或6上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得SNP位于间隔区序列的位置3上(以5'端为起点)。
在某些实施方案中,指导RNA被设计成使得错配(例如合成错配,即,除SNP以外的其他突变)位于间隔区序列的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置1、2、3、4、5、6、7、8或9上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置4、5、6或7上(以5'端为起点)。在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置5上(以5'端为起点)。
在某些实施方案中,指导RNA被设计成使得错配位于SNP上游2个核苷酸(即,一个间插核苷酸)。
在某些实施方案中,指导RNA被设计成使得错配位于SNP下游2个核苷酸(即,一个间插核苷酸)。
在某些实施方案中,指导RNA被设计成使得错配位于间隔区序列的位置5上(以5'端为起点)并且SNP位于间隔区序列的位置3上(以5'端为起点)。
本文所述的实施方案涵盖如本文所论述的在真核细胞中(在体外,即,在分离的真核细胞中)诱导一个或多个核苷酸修饰,包括向细胞递送如本文所论述的载体。一个或多个突变可以包括经由一个或多个指导RNA在细胞的每个靶序列处一个或多个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处1-75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处1个、5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA在所述一个或多个细胞的每个靶序列处40个、45个、50个、75个、100个、200个、300个、400个或500个核苷酸的引入、缺失或取代。
通常,在内源CRISPR系统的情形中,CRISPR复合物(包含杂交至靶序列并且与一种或多种Cas蛋白质复合的指导序列)的形成使得靶序列中或附近(例如距其1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个或更多个碱基对以内)切割,但可以取决于例如二级结构,特别是在RNA靶标的情况下。
在一方面,本文所公开的实施方案涉及一种核酸检测系统,所述核酸检测系统包括两个或更多个CRISPR系统、一种或多种被设计成结合至相应靶分子的指导RNA、掩蔽构建体,以及任选的用以扩增样品中的靶核酸分子的扩增试剂。在某些示例性实施方案中,所述系统还可包括一种或多种检测适体。一种或多种检测适体可包含RNA聚合酶位点或引物结合位点。一种或多种检测适体特异性地结合一种或多种靶多肽,并且被配置成使得RNA聚合酶位点或引物结合位点仅在检测适体与靶肽结合时暴露。RNA聚合酶位点的暴露有助于使用适体序列作为模板产生触发RNA寡核苷酸。因此,在此类实施方案中,一种或多种指导RNA被配置成结合至触发RNA。
在另一方面,本文所公开的实施方案涉及一种包括多个个别离散体积的诊断装置。每一个别离散体积包含CRISPR系统,所述CRISPR系统包含CRISPR效应蛋白、一种或多种被设计成结合至相应靶分子的指导RNA和掩蔽构建体。个别离散体积还可以包含光学条形码、靶分子和/或扩增试剂。提供的个别离散体积可以包含具有光学条形码的CRISPR系统;提供的其他个别离散体积可以包含光学条形码,任选地具有靶分子和/或扩增试剂。在某些示例性实施方案中,RNA扩增试剂可以预先加载到个别离散体积中或者在将样品或靶分子添加到个别离散体积的同时、之前或之后添加到个别离散体积中。在一方面,合并个别离散体积(诸如液滴)影响将特定试剂添加到合并的个别离散体积中。装置可以是基于微流体的装置、可穿戴装置或包括在其上限定或提供个别离散体积的柔性材料衬底的装置。
在另一方面,本文所公开的实施方案涉及一种用于检测样品中的靶核酸的方法,所述方法包括:将样品或样品组(其可包含于它们自己个别离散体积中)分配到个别离散体积的组中,每一个别离散体积包含CRISPR效应蛋白、一种或多种被设计成结合至一种靶寡核苷酸的指导RNA和掩蔽构建体。在特别优选的实施例中,这种分配优选地是随机液滴分配。随后在足以允许一种或多种指导RNA与一种或多种靶分子结合的条件下维持样品组。一种或多种指导RNA与靶核酸的结合进而激活CRISPR效应蛋白。一旦被激活,CRISPR效应蛋白随后使掩蔽构建体失活,例如,通过切割掩蔽构建体以使得可检测阳性信号被揭露、释放或产生。个别离散体积中的阳性可检测信号的检测指示靶分子的存在。
在另一方面,本文所公开的实施方案涉及一种用于检测多肽的方法。用于检测多肽的方法类似于上文所述用于检测靶核酸的方法。然而,还包括肽检测适体。肽检测适体如上文所述起作用,并且在与靶多肽结合后促进触发寡核苷酸的产生。指导RNA被设计成识别触发寡核苷酸,从而激活CRISPR效应蛋白。激活的CRISPR效应蛋白使掩蔽构建体失活导致可检测阳性信号的揭露、释放或产生。
在一方面,本文所公开的实施方案涉及一种核酸检测系统,所述核酸检测系统包括两个或更多个CRISPR系统、一种或多种被设计成结合至相应靶分子的指导RNA、掩蔽构建体,以及任选的用以扩增样品中的靶核酸分子的扩增试剂。在某些示例性实施方案中,所述系统还可包括一种或多种检测适体。一种或多种检测适体可包含RNA聚合酶位点或引物结合位点。一种或多种检测适体特异性地结合一种或多种靶多肽,并且被配置成使得RNA聚合酶位点或引物结合位点仅在检测适体与靶肽结合时暴露。RNA聚合酶位点的暴露有助于使用适体序列作为模板产生触发RNA寡核苷酸。因此,在此类实施方案中,一种或多种指导RNA被配置成结合至触发RNA。
在另一方面,本文所公开的实施方案涉及一种包括多个个别离散体积的诊断装置。每一个别离散体积包含CRISPR系统,所述CRISPR系统包含CRISPR效应蛋白、一种或多种被设计成结合至相应靶分子的指导RNA和掩蔽构建体。个别离散体积还可以包含光学条形码、靶分子和/或扩增试剂。提供的个别离散体积可以包含具有光学条形码的CRISPR系统;提供的其他个别离散体积可以包含光学条形码,任选地具有靶分子和/或扩增试剂。在某些示例性实施方案中,RNA扩增试剂可以预先加载到个别离散体积中或者在将样品或靶分子添加到个别离散体积的同时、之前或之后添加到个别离散体积中。在一方面,合并个别离散体积(诸如液滴)影响将特定试剂添加到合并的个别离散体积中。装置可以是基于微流体的装置、可穿戴装置或包括在其上限定或提供个别离散体积的柔性材料衬底的装置。
在另一方面,本文所公开的实施方案涉及一种用于检测样品中的靶核酸的方法,所述方法包括:将样品或样品组(其可包含于它们自己个别离散体积中)分配到个别离散体积的组中,每一个别离散体积包含CRISPR效应蛋白、一种或多种被设计成结合至一种靶寡核苷酸的指导RNA和掩蔽构建体。在特别优选的实施例中,这种分配优选地是随机液滴分配。随后在足以允许一种或多种指导RNA与一种或多种靶分子结合的条件下维持样品组。一种或多种指导RNA与靶核酸的结合进而激活CRISPR效应蛋白。一旦被激活,CRISPR效应蛋白随后使掩蔽构建体失活,例如,通过切割掩蔽构建体以使得可检测阳性信号被揭露、释放或产生。个别离散体积中的阳性可检测信号的检测指示靶分子的存在。
在另一方面,本文所公开的实施方案涉及一种用于检测多肽的方法。用于检测多肽的方法类似于上文所述用于检测靶核酸的方法。然而,还包括肽检测适体。肽检测适体如上文所述起作用,并且在与靶多肽结合后促进触发寡核苷酸的产生。指导RNA被设计成识别触发寡核苷酸,从而激活CRISPR效应蛋白。激活的CRISPR效应蛋白使掩蔽构建体失活导致可检测阳性信号的揭露、释放或产生。
组覆盖方法(SetCover Approach)
在特定实施方案中,设计引物和/或探针,其可例如鉴定一组确定病毒和微生物内的所有病毒和/或微生物种类。特别有利的方法允许设计针对快速进化的病毒(诸如流感)引物和/或探针。此类方法描述于在某些示例性实施方案中。组覆盖求解可以鉴定覆盖整个靶序列或一组靶序列,例如一组基因组序列所需的最小数目的靶序列探针或引物。组覆盖方法先前已经用于鉴定引物和/或微阵列探针,通常在20个至50个碱基对的范围内。参见例如Pearson等人,cs.virginia.edu/~robins/papers/primers_dam11_fmal.pdf.;Jabado等人Nucleic Acids Res.2006 34(22):6605-11;Jabado等人Nucleic Acids Res.2008,36(1):e3 doi10.1093/nar/gkm1106;Duitama等人Nucleic Acids Res.2009,37(8):2483-2492;Phillippy等人BMC Bioinformatics.2009,10:293doi:10.1186/1471-2105-10-293。此类方法一般涉及将每个引物/探针处理成k-mer以及搜索精确匹配或允许使用后缀阵列搜索不精确匹配。另外,方法一般采用二元方法以通过选择引物或探针以使得每个输入序列仅需要由一个引物或探针结合并且这个结合沿着序列的位置是无关的来检测杂交。替代性方法可以将靶基因组分成预定义窗口并且在二元方法下将每个窗口有效处理成单独的输入序列-即,其确定给定的探针或指导RNA是否在每个窗口内结合并且是否需要所有窗口都由某些探针或探针结合。有效地,这些方法将组覆盖问题中“通用”的每个元件处理成整个输入序列或输入序列的预定义窗口,并且如果探针或指导RNA的起点在元件内结合,那么每个元件被视为“覆盖的”。
提供了用于开发针对病原体的探针和引物的方法,所述方法包括向一个或多个靶病原体提供输入基因组序列组。在一些实施方案中,本文所公开的方法可以用于在单个测定中鉴定给定病毒或多个不同病毒的所有变体。此外,本文所公开的方法将组覆盖问题中“通用”的每个元件处理成靶序列的核苷酸,并且每个元件被视为“覆盖的”,只要探针或指导RNA结合至包括元件的靶基因组的某个区段即可。胜过仅询问给定引物或探针是否结合至给定的窗口,此类方法可以用于检测杂交模式-即,在给定引物或探针结合至一个或多个靶序列的情况下-然后从那些杂交模式确定覆盖靶序列组至足以能够从样品富集并且对任何和所有靶序列进行测序的程度所需的最小数目的引物或探针。这些杂交模式可以通过定义某些参数来确定,所述参数使损失功能降至最低,从而能够以允许参数对于每个物种有变化,例如以反映每个物种的多样性的方式,以及以使用组覆盖求解的简单应用,例如在引物或探针设计情形中先前应用的那些无法达成的计算有效方式鉴定最小探针或指导RNA组。向靶序列组应用所公开的组覆盖求解过程以鉴定一个或多个靶扩增序列。在多个实施方案中,所述一个或多个靶扩增序列是靶病原体的所述输入基因组序列组之间共享的高度保守的靶序列。此类靶病原体可以如在例如国际专利公布WO 2018/170340的[0289]-[0300]和[0347]-[0354]中所述,所述专利公布具体以引用方式并入本文。
检测多个转录物丰度的能力可以允许产生指示特定表型的独特病毒或微生物标识。各种机器学习技术可以用于导出基因标识。因此,本发明的引物和/或探针可以用于鉴定和/或定量由基因标识定义的生物标志的相对水平以检测某些表型。在某些示例性实施方案中,基因标识指示对特定治疗的易感性、对治疗的抗性,或其组合。
在本发明的一个方面,方法包括检测一种或多种病原体。以这种方式,可以获得个别微生物对受试者的感染之间的区别。在一些实施方案中,此种区别能够由临床医师检测或诊断特定疾病,例如疾病的不同变体。优选地,病毒或病原体序列是病毒或病原体的基因组或其片段。所述方法还可以包括确定病原体的演变。确定病原体的演变可以包括鉴别病原体突变,例如核苷酸缺失、核苷酸插入、核苷酸取代。在后者当中,存在非同义、同义和非编码取代。突变在爆发期间更频繁地是非同义的。所述方法还可以包括确定如上文所描述而分析的两个病原体序列之间的取代率。突变是有害的还是甚至适应性的将需要功能性分析,然而,非同义突变率表明这种流行病的持续进展可能为病原体适应提供机会,强调了快速遏制的需要。因此,方法还可以包括评价病毒适应的风险,其中确定非同义突变的数目。(Gire等人,Science345,1369,2014)。所述方法可包括如本文其他地方所述的诊断-指导-设计。
使用诊断-指导-设计来产生一个或多个引物、一个或多个探针、或引物对和探针组合允许优化样品中病毒或其他病原体的检测。输入基因组序列组可代表来自两种或多种病毒病原体的基因组序列。所产生的一个或多个引物、一个或多个探针、或引物对和探针组合可以包含用于检测五种或更多种病毒的序列。在多个实施方案中,所述方法允许进行泛病毒检测。在特定实施方案中,输入基因组序列组代表来自5、6、7、8、9、10、20、25、30、35、40、45、50、55、60、65或更多种病毒的组的序列。
参考国际专利公布WO/2018/039643和其中公开的鉴定病原体变体和/或病原体物种中高度保守区域的方法以及针对这些区域的引物和探针用于开发和使用用于检测病原体的基于核酸的检测测定的用途。如其中所描述的,两个或多个核酸序列或两个或多个氨基酸序列之间的同一性/相似性可以根据序列之间的同一性或相似性来表示——根据同一性百分比来衡量,这样百分比越高,序列同一性越高。当使用标准方法比对时,核酸或氨基酸序列的同系物或直向同源物具有相对高程度的序列同一性/相似性。病原性序列比对和设计的方法在国际专利公布WO/2018/039643的实施例1中进一步描述,所述国际专利公布具体以引用方式并入。
比对序列用于比较的方法是本领域中众所周知的。各种程序和比对算法描述于:Smith和Waterman,Adv.Appl.Math.2:482,1981;Needleman和Wunsch,J.Mol.Biol.48:443,1970;Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444,1988;Higgins和Sharp,Gene,73:237-44,1988;Higgins和Sharp,CABIOS 5:151-3,1989;Corpet等人,Nuc.AcidsRes.16:10881-90,1988;Huang等人Computer Appls.in the Biosciences 8,155-65,1992;以及Pearson等人,Meth.Mol.Bio.24:307-31,1994中。Altschul等人,J.Mol.Biol.215:403-10,1990详细介绍了序列比对方法和同源性计算。NCBI基本局部比对搜索工具(Basic Local Alignment Search Tool,BLAST)(Altschul等人,J.Mol.Biol.215:403-10,1990)可从多个来源获得,包括国家生物信息中心(NationalCenter for Biological Information,NCBI,National Library of Medicine,Building38A,Room 8N805,Bethesda,MD 20894)和互联网,用于与序列分析程序blastp、blastn、blastx、tblastn和tblastx结合使用。Blastn用于比较核酸序列,而blastp用于比较氨基酸序列。更多信息可以在NCBI网站上找到;还可参见WO 2018/039643的[0100],其以引用方式并入。
对齐后,通过计算两个序列中存在相同核苷酸或氨基酸残基的位置的数目来确定匹配数目。序列同一性百分比的确定方式为将匹配数目除以已鉴定序列中所示的序列的长度或者除以铰接长度(诸如来自已鉴定序列中所示的序列的100个连续核苷酸或氨基酸残基),然后将所得值乘以100。
关于引物的设计,可以利用用于靶病原体序列的方法,利用在软件工具中实施的“诊断-指导-设计”方法。就病毒序列而言,可以利用病毒序列比对输入,其目标是找到一组指导序列,所有序列都在某个指定的扩增子长度内,这些指导序列将检测到某一期望分数(例如95%)的可容忍指导物与靶标之间某一错配数目(通常为1)的输入序列。对于亚型分型(或任何差异化识别)至关重要的是,它设计了不同的指导物集合,确保每个集合特定于一个亚型。在多个实施方案中,人们利用这种设计方法来使用诊断-指导-设计(“d-g-d”)与其他工具同时设计扩增子引物和指导序列以进行物种识别。可以考虑热力学和动力学设计另外的引物和探针(参见例如Chen等人,Nature Communications 10,4675(2019)doi:10.1038/s4167-019-12593-9),参照PCR中的额外特异性、竞争和错配(参见例如Bustin等人,DOI:10.1016/j.bdq.2017.11.001)。用于设计探针和引物的工具是可得的,并且可以针对基因组、靶序列和测定进行定制,参见例如用于引物设计的开放软件构建模块(DOI:10.1371/jounal.pone.0080156);自动化多重寡核苷酸设计工具(DOI:10.1093/ar/gky319);LAMP引物(DOI:10.7717/peerj.6801);具有多种搜索模式的qPCR工具(参见例如Jeon等人,DOI:10.1093/nar/gkz323),以及NCBI工具诸如Primer-BLAST。
基于RNA的掩蔽构建体
如本文所用,“掩蔽构建体”是指可以通过本文所述的激活的CRISPR系统效应蛋白切割或以其他方式灭活的分子。术语“掩蔽构建体”替代地也可以称为“检测构建体”。在某些示例性实施方案中,掩蔽构建体是基于RNA的掩蔽构建体。基于RNA的掩蔽构建体包含可被CRISPR效应蛋白切割的RNA元件。RNA元件的切割释放剂或产生构象变化,其允许可检测信号产生。下面描述了证实如何使用RNA元件以阻止或掩蔽可检测信号的产生的示例性构建体,并且本发明的实施方案包括其变体。在切割之前,或当掩蔽构建体处于“活性”状态时,掩蔽构建体阻断阳性可检测信号的生成或检测。应当理解,在某些示例性实施方案中,可以在活性RNA掩蔽构建体存在下产生极小背景信号。阳性可检测信号可以是可使用本领域中已知的光学、荧光、化学发光、电化学或其他检测方法检测到的任何信号。术语“阳性可检测信号”用于与在掩蔽构建体存在下可检测的其他可检测信号区分开。举例来说,在某些实施方案中,当存在掩蔽剂时可以检测到第一信号(即阴性可检测信号),所述第一信号然后在检测到靶分子且掩蔽剂被激活的CRISPR效应蛋白切割或灭活时转化为第二信号(例如阳性可检测信号)。
因此,在本发明的某些实施方案中,所述基于RNA的掩蔽构建体阻遏可检测阳性信号的生成,或者所述基于RNA的掩蔽构建体通过掩蔽所述可检测阳性信号或替代地生成可检测阴性信号来阻遏可检测阳性信号的生成,或者所述基于RNA的掩蔽构建体包含沉默RNA,所述沉默RNA阻遏由报告构建体编码的基因产物的生成,其中所述基因产物在表达时生成所述可检测阳性信号。
在另外的实施方案中,所述基于RNA的掩蔽构建体是生成所述阴性可检测信号的核酶,并且其中当所述核酶被灭活时生成所述阳性可检测信号,或者所述核酶将底物转化为第一颜色,并且其中当所述核酶被灭活时,所述底物转化为第二颜色。
在其他实施方案中,所述基于RNA的掩蔽剂是RNA适体,或者所述适体螯合酶,其中所述酶通过作用于底物而在从所述适体释放后生成可检测信号,或者所述适体螯合一对剂,所述剂在从所述适体释放时组合以生成可检测信号。
在另一个实施方案中,所述基于RNA的掩蔽构建体包含RNA寡核苷酸,可检测配体和掩蔽组分附接至所述RNA寡核苷酸。在另一个实施方案中,所述可检测配体是荧光团,并且所述掩蔽组分是猝灭剂分子,或用以扩增靶RNA分子的试剂,诸如但不限于NASBA或RPA试剂。
在某些示例性实施方案中,掩蔽构建体可以阻遏基因产物的生成。基因产物可以由添加到样品中的报告构建体编码。掩蔽构建体可以是参与RNA干扰途径的干扰RNA,诸如短发夹RNA(shRNA)或小干扰RNA(siRNA)。掩蔽构建体还可以包含微小RNA(miRNA)。当存在时,掩蔽构建体阻遏基因产物的表达。基因产物可以是在不存在掩蔽构建体时可被标记的探针、适体或抗体检测的荧光蛋白或其他RNA转录物或蛋白。在激活效应蛋白后,掩蔽构建体被切割或以其他方式沉默而允许基因产物作为阳性可检测信号表达和检测。
在某些示例性实施方案中,掩蔽构建体可以螯合生成可检测阳性信号所需要的一种或多种试剂,使得从掩蔽构建体释放一种或多种试剂导致可检测阳性信号的生成。所述一种或多种试剂可以组合以产生比色信号、化学发光信号、荧光信号或任何其他可检测信号,并且可以包括已知适合于这样的目的的任何试剂。在某些示例性实施方案中,所述一种或多种试剂被结合所述一种或多种试剂的RNA适体鳌合。当检测到靶分子而效应蛋白被激活并且RNA适体被降解时,释放一种或多种试剂。
在某些示例性实施方案中,掩蔽构建体可以固定在个别离散体积(在下文中进一步定义)的固体衬底上,并螯合单一试剂。举例来说,试剂可以是包含染料的珠粒。当被固定的试剂鳌合时,个别珠粒过于扩散而不能生成可检测信号,但是从掩蔽构建体释放后能够生成可检测信号,例如在溶液浓缩中通过聚集或简单增加。在某些示例性实施方案中,固定的掩蔽剂是基于RNA的适体,所述适体可以在检测到靶分子后被激活的效应蛋白切割。
在某些其他示例性实施方案中,掩蔽构建体与溶液中的固定的试剂结合,从而阻断试剂与溶液中游离的单独标记结合配偶体结合的能力。因此,在对样品施加洗涤步骤后,在不存在靶分子的情况下标记的结合配偶体会从样品中洗掉。然而,如果效应蛋白被激活,则掩蔽构建体被切割至足以干扰掩蔽构建体结合试剂的能力的程度,从而允许标记的结合配偶体与固定的试剂结合。因此,标记的结合配偶体在洗涤步骤后保留,表明样品中存在靶分子。在某些方面,结合固定的试剂的掩蔽构建体是RNA适体。固定的试剂可以是蛋白质,并且标记的结合配偶体可以是标记的抗体。或者,固定的试剂可以是链霉亲和素,并且标记的结合配偶体可以是标记的生物素。在上述实施方案中使用的结合配偶体上的标记可以是本领域中已知的任何可检测标记。此外,可以根据本文所述的总体设计使用其他已知的结合配偶体。
在某些示例性实施方案中,掩蔽构建体可以包含核酶。核酶是具有催化特性的RNA分子。天然核酶和工程化的核酶两者包含可以被本文所公开的效应蛋白靶向的RNA或由其组成。可以选择或工程化核酶以催化生成阴性可检测信号或阻止生成阳性对照信号的反应。在激活的效应蛋白灭活核酶后,生成阴性对照信号或阻止生成阳性可检测信号的反应被移除,从而允许阳性可检测信号生成。在一个示例性实施方案中,核酶可以催化比色反应,使溶液显示为第一颜色。当核酶灭活时,溶液然后变成第二颜色,第二颜色是可检测阳性信号。Zhao等人“Signal amplification of glucosamine-6-phosphate based onribozyme glmS,”Biosens Bioelectron.2014;16:337-42描述了核酶如何用于催化比色反应的实例,并提供如何修饰这样的系统以在本文所公开的实施方案的情形中工作的实例。或者,核酶当存在时可以生成例如RNA转录物的切割产物。因此,阳性可检测信号的检测可以包括检测仅在不存在核酶的情况下生成的未切割的RNA转录物。
在某些示例性实施方案中,一种或多种试剂是能够促进生成可检测信号,诸如比色、化学发光或荧光信号的蛋白,诸如酶,所述蛋白被抑制或鳌合使得因一种或多种RNA适体与蛋白的结合,蛋白无法生成可检测信号。在本文所公开的效应蛋白激活时,RNA适体被切割或降解到一个程度即它们不再抑制蛋白产生可检测信号的能力。在某些示例性实施方案中,适体是凝血酶抑制剂适体。在某些示例性实施方案中,凝血酶抑制剂适体具有GGGAACAAAGCUGAAGUACUUACCC(SEQ ID NO:5)的序列。当该适体被切割时,凝血酶将变得具有活性并且将切割肽比色或荧光底物。在某些示例性实施方案中,比色底物是与凝血酶的肽底物共价连接的对硝基苯胺(pNA)。在被凝血酶切割后,pNA被释放并变成黄色并且容易被眼睛看到。在某些示例性实施方案中,荧光底物是可以使用荧光检测器检测的7-氨基-4-甲基香豆素蓝色荧光团。抑制性适体也可以用于辣根过氧化物酶(HRP)、β-半乳糖苷酶或小牛碱性磷酸酶(CAP),并且在上述一般原理内。
在某些实施方案中,用比色法经由酶抑制性适体的切割检测RNA酶。将RNA酶转化为比色信号的一种潜在模式是将RNA适体的切割与能够产生比色输出的酶的再激活结合。在不存在RNA切割的情况下,完整的适体将与酶靶标结合并抑制其活性。该读出系统的优点在于酶提供了另外的扩增步骤:一旦经由附带活性(例如Cas13a附带活性)从适体释放,比色酶将继续产生比色产物,导致信号放大。
在某些实施方案中,使用抑制具有比色读出的酶的现有适体。存在若干具有比色读出的适体/酶对,诸如凝血酶、蛋白C、中性粒细胞弹性蛋白酶和枯草杆菌蛋白酶。这些蛋白酶具有基于pNA的比色底物,并且可以商购获得。在某些实施方案中,使用靶向共同比色酶的新颖适体。常见且稳健的酶,诸如β-半乳糖苷酶、辣根过氧化物酶或小牛肠碱性磷酸酶,可以通过由选择策略(诸如SELEX)设计的工程化的适体靶向。这样的策略允许快速选择具有纳摩尔级结合效率的适体,并且可以用于开发用于比色读出的另外的酶/适体对。
在某些实施方案中,用比色法经由RNA拴系的抑制剂的切割检测RNA酶活性。许多常见的比色酶具有竞争性的可逆抑制剂:例如,β-半乳糖苷酶可以被半乳糖抑制。这些抑制剂中许多都很弱,但是它们的效果可以通过局部浓度的增加来增加。通过将局部浓度的抑制剂与RNA酶活性联系起来,比色酶和抑制剂对可以被工程化至RNA酶传感器中。基于小分子抑制剂的比色RNA酶传感器涉及三个组分:比色酶、抑制剂,和与抑制剂和酶共价连接以将抑制剂拴系在酶上的桥接RNA。在未切割的构型中,酶被增加的局部浓度的小分子所抑制;当RNA被切割时(例如通过Cas13a附带切割),抑制剂将被释放并且比色酶将被激活。
在某些实施方案中,通过比色法经由G四链体的形成和/或激活来检测RNA酶活性。DNA中的G四链体可以与血红素(铁(III)-原卟啉IX)复合以形成具有过氧化物酶活性的DNA酶。当提供过氧化物酶底物(例如ABTS:(2,2’-氮杂双[3-乙基苯并噻唑啉-6-磺酸]-二铵盐))时,在过氧化氢存在下G四链体-血红素复合物使得底物氧化,底物然后在溶液中形成绿色。示例性的形成G四链体的DNA序列是:GGGTAGGGCGGGTTGGGA(SEQ.I.D.NO.6)。通过将RNA序列与该DNA适体杂交,G四链体结构的形成将受到限制。RNA酶附带激活(例如C2c2复合物附带激活)后,RNA钉将被切割,从而允许G四链体形成并且与血红素结合。该策略特别有吸引力,因为颜色形成是酶促的,这意味着除了RNA酶激活之外还存在另外的扩增。
在某些示例性实施方案中,掩蔽构建体可以固定在个别离散体积(在下文中进一步定义)的固体衬底上,并螯合单一试剂。举例来说,试剂可以是包含染料的珠粒。当被固定的试剂鳌合时,个别珠粒过于扩散而不能生成可检测信号,但是从掩蔽构建体释放后能够生成可检测信号,例如在溶液浓缩中通过聚集或简单增加。在某些示例性实施方案中,固定的掩蔽剂是基于RNA的适体,所述适体可以在检测到靶分子后被激活的效应蛋白切割。
在一个示例性实施方案中,掩蔽构建体包含检测剂,所述检测剂根据检测剂在溶液中聚集或分散而改变颜色。举例来说,某些纳米粒子,诸如胶体金,当它们从聚集体移动到分散的粒子时,经历可见的紫色到红色的色移。因此,在某些示例性实施方案中,这样的检测剂可以通过一种或多种桥分子聚集。桥分子的至少一部分包含RNA。在本文所公开的效应蛋白激活后,桥分子的RNA部分被切割,允许检测剂分散并导致相应的颜色变化。参见例如图46。在某些示例性实施方案中,桥分子是RNA分子。在某些示例性实施方案中,检测剂是胶体金属。胶体金属材料可以包括水不溶性金属粒子或分散在液体、水溶胶或金属溶胶中的金属化合物。胶体金属可以选自周期表中IA、IB、IIB和IIIB族的金属,以及过渡金属,尤其是VIII族的那些金属。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括以下金属的各种氧化态:锂、钠、镁、钾、钪、钛、钒、铬、锰、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂和钆。金属优选以离子形式提供,来源于适当的金属化合物,例如Al3+、Ru3+、Zn2+、Fe3+、Ni2+和Ca2+离子。
当RNA桥被激活的CRISPR效应子切割时,观察到前述的色移。在某些示例性实施方案中,粒子是胶体金属。在某些其他示例性实施方案中,胶体金属是胶体金。在某些示例性实施方案中,胶体纳米粒子是15nm金纳米粒子(AuNP)。由于胶体金纳米粒子的独特表面特性,当在溶液中完全分散时在520nm处观察到最大吸光度,并且肉眼看起来呈红色。在AuNP聚集时,它们表现出最大吸光度的红移并且颜色看起来更暗,最终作为深紫色聚集体从溶液中沉淀出来。在某些示例性实施方案中,纳米粒子经修饰而包括从纳米粒子表面延伸的DNA接头。个别粒子通过在RNA的每个末端与DNA接头的至少一部分杂交的单链RNA(ssRNA)桥连接在一起。因此,纳米粒子将形成连接的粒子和聚集体的网状物,呈现为暗沉淀物。在本文所公开的CRISPR效应子激活后,ssRNA桥将被切割,从连接网格释放AU NP并产生可见的红色。下面列出了示例性DNA接头和RNA桥序列。DNA接头末端的硫醇接头可以用于与AuNP的表面缀合。可以使用其他形式的缀合。在某些示例性实施方案中,可以生成两个AuNP群,每个DNA接头一个。这将有助于促进ssRNA桥以正确取向正确结合。在某些示例性实施方案中,第一DNA接头通过3’端缀合,而第二DNA接头通过5’端缀合。
Figure BDA0003161422120000441
Figure BDA0003161422120000451
在某些其他示例性实施方案中,掩蔽构建体可以包含可检测标记与其连接的RNA寡核苷酸和该可检测标记的掩蔽剂。这样的可检测标记/掩蔽剂对的实例是荧光团和荧光团的猝灭剂。由于荧光团与另一荧光团或非荧光分子之间形成非荧光复合物,可以发生荧光团的猝灭。这种机制称为基态复合物形成、静态猝灭或接触猝灭。因此,可以设计RNA寡核苷酸,使得荧光团和猝灭剂足够接近以发生接触猝灭。荧光团及其关联猝灭剂在本领域中是已知的,并且可以由本领域普通技术人员为此目的进行选择。特定的荧光团/猝灭剂在本发明的情形中并不重要,只要荧光团/猝灭剂对的选择能确保荧光团的掩蔽。在激活本文所公开的效应蛋白后,RNA寡核苷酸被切割,从而切断维持接触猝灭效应所需的荧光团和猝灭剂之间的接近度。因此,荧光团的检测可以用于确定样品中靶分子的存在。
在某些其他示例性实施方案中,掩蔽构建体可以包含一种或多种金属纳米粒子诸如金纳米粒子附接至其的一种或多种RNA寡核苷酸。在一些实施方案中,掩蔽构建体包含由形成闭环的多个RNA寡核苷酸交联的多个金属纳米粒子。在一个实施方案中,掩蔽构建体包含由形成闭环的三个RNA寡核苷酸交联的三个金纳米粒子。在一些实施方案中,CRISPR效应蛋白切割RNA寡核苷酸导致由金属纳米粒子产生可检测信号。
在某些其他示例性实施方案中,掩蔽构建体可以包含一种或多种量子点附接至其的一种或多种RNA寡核苷酸。在一些实施方案中,CRISPR效应蛋白切割RNA寡核苷酸导致由量子点产生的可检测信号。
在一个示例性实施方案中,掩蔽构建体可以包含量子点。量子点可以具有附接至表面的多个接头分子。接头分子的至少一部分包含RNA。接头分子在一端附接至量子点,并沿着接头的长度或在接头的末端附接至一种或多种猝灭剂,使得猝灭剂保持足够接近以发生量子点的猝灭。接头可以是分支的。如上所述,量子点/猝灭剂对并不重要,只要量子点/猝灭剂对的选择能确保荧光团的掩蔽即可。量子点及其关联猝灭剂在本领域中是已知的,并且可以由本领域普通技术人员为此目的进行选择。在本文所公开的效应蛋白激活后,接头分子的RNA部分被切割,从而消除了维持猝灭效应所需的量子点与一种或多种猝灭剂之间的接近度。在某些示例性实施方案中,量子点是链霉亲和素缀合的。RNA经由生物素接头附接并用序列/5Biosg/UCUCGUACGUUC/3IAbRQSp/(SEQ ID NO.10)或/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(SEQ ID NO.11)募集猝灭剂分子,其中/5Biosg/是生物素标签并且/31AbRQSp/是Iowa黑猝灭剂。在被本文所公开的激活的效应子切割后,量子点将可见地发荧光。
以类似的方式,荧光能量转移(FRET)可以用于生成可检测阳性信号。FRET是非辐射过程,通过该过程,来自能量激发的荧光团(即“供体荧光团”)的光子将另一分子(即“受体”)中的电子的能态提升到激发单重态的更高振动水平。供体荧光团返回基态而不发出该荧光团的荧光特征。受体可以是另一荧光团或非荧光分子。如果受体是荧光团,则转移的能量作为该荧光团的荧光特征发射。如果受体是非荧光分子,则吸收的能量作为热量而损失。因此,在如本文所公开的实施方案的情形中,荧光团/猝灭剂对被附接至寡核苷酸分子的供体荧光团/受体对替换。当完整时,如通过从受体发射的荧光或热检测到的,掩蔽构建体生成第一信号(阴性可检测信号)。在本文所公开的效应蛋白激活后,RNA寡核苷酸被切割并且FRET被破坏,使得现在检测到供体荧光团的荧光(阳性可检测信号)。
在某些示例性实施方案中,掩蔽构建体包括使用插入染料,所述插入染料响应于长RNA切割为短核苷酸而改变它们的吸光度。存在若干这样的染料。举例来说,焦宁-Y将与RNA复合并形成在572nm处具有吸光度的复合物。RNA的切割导致吸光度损失和颜色变化。亚甲蓝可以以类似的方式使用,RNA切割后亚甲蓝在688nm处的吸光度变化。因此,在某些示例性实施方案中,掩蔽构建体包含RNA和插入染料复合物,所述复合物在本文所公开的效应蛋白切割RNA后改变吸光度。
在某些示例性实施方案中,掩蔽构建体可以包含用于HCR反应的引发剂。参见例如Dirks和Pierce.PNAS 101,15275-15728(2004)。HCR反应利用两种发夹物质中的势能。当具有与发夹之一上的相应区域互补的部分的单链引发剂被释放到先前稳定的混合物中时,它打开一种物质的发夹。该过程进而暴露出打开其他物质的发夹的单链区域。该过程进而暴露出与原始引发剂相同的单链区域。所产生的链反应可以导致形成切刻的双螺旋,所述切刻的双螺旋生长直至发夹供应耗尽。所得产物的检测可以在凝胶上或用比色法进行。示例性比色检测方法包括例如在Lu等人“Ultra-sensitive colorimetric assay systembased on the hybridization chain reaction-triggered enzyme cascadeamplification ACS Appl Mater Interfaces,2017,9(1):167-175;Wang等人“An enzyme-free colorimetric assay using hybridization chain reaction amplification andsplit aptamers”Analyst 2015,150,7657-7662;以及Song等人“Non covalentfluorescent labeling of hairpin DNA probe coupled with hybridization chainreaction for sensitive DNA detection.”Applied Spectroscopy,70(4):686-694(2016)中公开的那些。
在某些示例性实施方案中,掩蔽构建体可以包含HCR引发剂序列和阻止引发剂引发HCR反应的可切割结构元件,诸如环或发夹。在激活的CRISPR效应蛋白切割切割结构元件后,接着释放引发剂以触发HCR反应,检测到HCR反应表明样品中存在一种或多种靶标。在某些示例性实施方案中,掩蔽构建体包含具有RNA环的发夹。当激活的CRISRP效应蛋白切割RNA环时,可以释放引发剂以触发HCR反应。
光学条形码、条形码和独特分子标识符(UMI)
如本文所公开的系统可包括用于一种或多种靶分子的光学条形码和与检测CRISPR系统缔合的光学条形码。例如,一种或多种靶分子的条形码和包含靶分子的目标样品可以与含有光学条形码的含CRISPR检测系统的液滴合并。
如本文所用,术语“条形码”是指用作相关分子(诸如靶分子和/或靶核酸)的标识符、或用作相关分子来源(诸如起源细胞)的标识符的短核苷酸序列(例如DNA或RNA)。条形码还可以指代可用于识别核酸片段的来源的任何独特的、非天然存在的核酸序列。尽管没有必要了解发明机制,但据信条形码序列提供了与单一细胞、病毒载体、标记配体(例如适体)、蛋白质、shRNA、sgRNA或cDNA缔合的条形码的高质量个别读取,使得可以一起测序多个物种。
条形码化可基于专利公布WO 2014047561 A1(Compositions and methods forlabeling of agents)中公开的任何组合物或方法进行,所述专利公布整体并入本文。在某些实施方案中,条形码化使用纠错方案(T.K.Moon,Error Correction Coding:Mathematical Methods and Algorithms(Wiley,New York,第1版,2005)).不受理论的束缚,来自单个细胞的扩增序列可一起测序并基于与每个细胞缔合的条形码进行解析。
可以将光学编码粒子随机递送至离散体积,从而在每个孔中产生光学编码粒子的随机组合,或者可以将光学编码粒子的独特组合特定地指派给每个离散体积。然后可以使用光学编码粒子的可观察组合来识别每个离散体积。可以对每个离散体积进行光学评估(诸如表型)并记录。在一些情况下,条形码可以是可通过光学或荧光显微镜法观察的光学可检测条形码。在某些示例性实施方案中,光学条形码包含具有来自一组限定颜色的可区分颜色的荧光团或量子点的子组。在一些情况下,可以将光学编码粒子随机递送至离散体积,从而在每个孔中产生光学编码粒子的随机组合,或者可以将光学编码粒子的独特组合特定地指派给每个离散体积。
在一个示例性实施方案中,不同水平的3种荧光染料(例如Alexa Fluor555、594、647)可以产生105个条形码。可以添加第四种染料,并且可以扩展到数百个独特条形码;类似地,五种颜色可以增加独特条形码的数目,这可以通过改变颜色的比率来实现。通过用不同比率的染料进行标记,可选择染料比率,使得在归一化后染料在对数坐标中均匀分布。
在一个实施方案中,在每个液滴或离散体积中接收的荧光团的指派或随机子组决定了每个离散体积中光学编码离散粒子的可观察图谱,从而允许独立地识别每个离散体积。使用适当的成像技术对每个离散体积进行成像,以检测光学编码粒子。举例来说,如果光学编码粒子以荧光方式标记,则使用荧光显微镜对每个离散体积进行成像。在另一个实例中,如果光学编码粒子以比色方式标记,则使用具有一个或多个滤光器的显微镜对每个离散体积进行成像,所述一个或多个滤光器与每个颜色标签固有的波长或吸收光谱或发射光谱相匹配。设想了与所使用的光学系统相匹配的其他检测方法,例如本领域已知的用于检测量子点、染料等的检测方法。可以记录所观察到的每个离散体积的光学编码离散粒子的图谱以供以后使用。
光学条形码可以任选地包括独特寡核苷酸序列,其产生方法可如例如国际专利申请公布号WO/2014/047561的[050]-[0115]中所述。在一个示例性实施方案中,将引物粒子标识符并入靶分子中。本领域中已知的下一代测序(NGS)技术可用于测序,依据一个或多个靶序列的序列相似性进行聚类。依据序列变异性的比对将允许基于并入比对序列信息中的粒子标识符来识别递送至离散体积的光学编码粒子。在一个实施方案中,并入比对序列信息中的每个引物的粒子标识符指示在产生扩增子的相应离散体积中可观察到的光学编码粒子的图谱。这样就可以将核酸序列变异性原始离散体积关联起来,并进一步与由该离散体积中含有核酸的样本构成的光学评估(诸如表型)相匹配。
在优选的实施方案中,使用独特分子标识符(UMI)进行测序。如本文所用,术语“独特分子标识符”(UMI)是指在使用分子标签检测和定量独特扩增产物的方法中使用的测序接头或核酸条形码亚型。UMI用于区分单个克隆和多个克隆的效果。如本文所用,术语“克隆”可指待测序的单个mRNA或靶核酸。UMI还可用于确定产生扩增产物的转录物的数量,或在如本文所述的目标条形码的情况下,确定结合事件的数量。在优选的实施方案中,扩增是通过PCR或多重置换扩增(MDA)进行的。
在某些实施方案中,将具有4至20个碱基对的随机序列的UMI添加至模板,对该模板进行扩增并测序。在优选的实施方案中,将UMI添加至模板的5’端。测序允许高分辨率读取,从而能够准确检测真变体。如本文所用,“真变体”将存在于源自原始克隆的每个扩增产物中,如通过比对具有UMI的所有产物所识别的。扩增的每个克隆将具有不同的随机UMI,其将指示该扩增产物源自该克隆。可消除由扩增过程的保真性引起的背景,因为真变体将存在于所有扩增产物中,而代表随机误差的背景仅存在于单个扩增产物中(参见例如,IslamS.等人,2014.Nature Methods第11期,163-166)。不受理论的束缚,UMI的设计使得即使在扩增或测序过程中出现多达4-7个错误,也可指派给原始物。不受理论的束缚,UMI可用于辨别真条形码序列。
可以使用独特分子识别符(例如),以便针对可变扩增效率队样品进行归一化。举例来说,在以核酸条形码(例如共享相同序列的多个条形码)所附接的固体或半固体支持物(例如水凝胶珠粒)为特征的各个实施方案中,可将每个条形码进一步偶联至独特分子标识符,使得特定固体或半固体支持物上的每个条形码接收不同的独特分子标识符。然后可例如将独特分子标识符转移至具有所缔合的条形码的靶分子,使得靶分子不仅接收核酸条形码,而且还接收在源自该固体或半固体支持物的标识符之中独特的标识符。
核酸条形码或UMI可以具有至少例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90或100个核苷酸的长度,并且可以呈单链或双链形式。靶分子和/或靶核酸可以用多个核酸条形码以组合方式,诸如核酸条形码多联体作标记。通常,核酸条形码用于将靶分子和/或靶核酸识别为来自特定离散体积,具有特定物理特性(例如亲和力、长度、序列等),或已经经受某些处理条件。靶分子和/或靶核酸可以与多个核酸条形码相缔合以提供关于所有这些特征(和更多特征)的信息。另一方面,给定UMI群体的每个成员通常与一组特定的相同的特异性(例如,离散体积特异性、物理特性特异性或处理条件特异性)核酸条形码的个别成员相缔合(例如,与其共价结合或与其相同分子的组分缔合)。因此,例如,具有相同或匹配的条形码序列的一组起源特异性核酸条形码或其他核酸标识符或连接器寡核苷酸的每个成员可与独特或不同UMI缔合(例如,与其共价结合或与其相同分子的组分缔合)。
如本文所公开,使用独特核酸标识符来标记靶分子和/或靶核酸,例如起源特异性条形码等。核酸标识符、核酸条形码可包括核苷酸短序列,所述核苷酸短序列可用作缔合分子、位置或条件的标识符。在某些实施方案中,核酸标识符还包括一个或多个独特分子标识符和/或条形码接收衔接子。核酸标识符可以具有例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90或100个碱基对(bp)或核苷酸(nt)的长度。在某些实施方案中,可通过组合随机选择的索引(例如约1、2、3、4、5、6、7、8、9或10个索引)以组合方式构建核酸标识符。每个这样的索引是具有不同序列的核苷酸(例如,DNA、RNA或它们的组合)的短序列。索引可以具有约例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25bp或nt的长度。可以例如通过分开-汇集合成法(诸如例如国际专利公布号WO 2014/047556和WO 2014/143158中所描述的那些,所述专利公布各自以引用方式整体并入本文)产生核酸标识符。
可以将一个或多个核酸标识符(例如核酸条形码)附接或“作为标签连接”于靶分子。这种附接可以是直接的(例如,核酸标识符与靶分子共价或非共价结合)或间接的(例如,经由额外的分子)。此类间接附接可例如包括与识别靶分子的特异性结合剂结合的条形码。在某些实施方案中,将条形码附接至蛋白G并且靶分子是抗体或抗体片段。可使用本领域中众所周知的标准方法将条形码附接至靶分子(例如蛋白质和其他生物分子)。举例来说,条形码可经由半胱氨酸残基(例如,C端半胱氨酸残基)连接。又如,可使用适当的组特异性试剂经由多肽上的各种官能团以化学方式将条形码引入多肽(例如,抗体)中(参见例如www.drmr.com/abcon)。在某些实施方案中,如本文所述,可经由与靶分子缔合(例如,附接)的条形码接收衔接子来进行条形码标签化。
可任选地用多个条形码(例如,使用与一种或多种特异性地识别靶分子的特异性结合剂结合的多个条形码)以组合方式标记靶分子,由此极大地增加特定条形码汇集物内可能的独特标识符的数目。在某些实施方案中,将条形码添加至附接至靶分子的增长条形码多联体中,例如,一次添加一个。在其他实施方案中,在附接至靶分子之前将多个条形码组装。例如在国际专利公布号WO 2014/047561中描述了用于将多个条形码多联体化的组合物和方法,所述国际专利公布以引用方式整体并入本文。
在一些实施方案中,可将核酸标识符(例如核酸条形码)附接至允许扩增和测序的序列(例如,用于Illumina测序的SBS3和P5元件)。在某些实施方案中,核酸条形码可还包括附接至条形码末端的引物(例如单链DNA引物)的杂交位点。例如,起源特异性条形码可以是包括条形码和用于特定引物的杂交位点的核酸。在特定实施方案中,一组起源特异性条形码包括例如使用随机化寡核苷酸类型NNNNNNNNNNNN制备的独特引物特异性条形码。
核酸标识符还可包括独特分子标识符和/或例如对一个或多个核酸标识符所附接的共同支持物具有特异性的额外条形码。因此,可将靶分子汇集物例如添加至含有代表不同处理条件的多个固体或半固体支持物(例如珠粒)的离散体积(和/或例如可在引入靶分子汇集物之后将一个或多个额外的固体或半固体支持物依序添加至离散体积中),使得可随后通过对给定靶分子所缔合的独特分子标识符进行测序来确定给定靶分子所暴露的条件的精确组合。
可通过本领域中已知的方法(诸如聚合酶链反应,PCR)来扩增与起源特异性核酸条形码(任选地与如本文所述的其他核酸条形码组合)缔合的带标记的靶分子和/或靶核酸。举例来说,核酸条形码可含有通用引物识别序列,所述通用引物识别序列可由PCR引物结合用于PCR扩增和后续高通量测序。在某些实施方案中,核酸条形码包括或连接至测序衔接子(例如通用引物识别序列),使得条形码和测序衔接子元件均偶联至靶分子。在特定实例中,例如使用PCR来扩增起源特异性条形码的序列。在一些实施方案中,起源特异性条形码还包含测序衔接子。在一些实施方案中,起源特异性条形码还包含通用引发位点。可任选地通过本领域中已知的任何方法(例如高通量测序方法,也称为下一代测序或深度测序)对核酸条形码(或其多联体)、靶核酸分子(例如DNA或RNA分子)、编码靶肽或多肽的核酸和/或编码特异性结合剂的核酸进行测序。可对用条形码(例如起源特异性条形码)标记的核酸靶分子利用所述条形码进行测序,以产生靶分子和条形码两者的单个读段和/或含有所述序列的重叠群,或其部分。示例性下一代测序技术包括例如Illumina测序、离子激流测序(IonTorrent sequencing)、454测序、SOLiD测序和纳米孔测序等。在一些实施方案中,通过不基于测序的方法来测定所标记靶分子的序列。举例来说,可使用可变长度的探针或引物依据例如条形码的长度、靶核酸的长度或编码靶多肽的核酸的长度来辨别标记不同靶分子的条形码(例如起源特异性条形码)。在其他情况下,条形码可包括识别例如特定靶分子的分子类型(例如多肽、核酸、小分子或脂质)的序列。举例来说,在含有多个类型的靶分子的所标记靶分子的汇集物中,多肽靶分子可接收一个识别序列,而靶核酸分子可接收不同的识别序列。可使用此类识别序列来选择性扩增标记特定类型的靶分子的条形码,例如通过使用对特异于特定类型的靶分子的识别序列具特异性的PCR引物来实现。举例来说,可从汇集物选择性扩增标记多肽靶分子的条形码,由此仅检索来自靶分子汇集物的多肽子组的条形码。
可例如在切割之后对核酸条形码进行测序,以确定靶分子的存在、量或其他特征。在某些实施方案中,可将核酸条形码进一步附接至另一核酸条形码。举例来说,可在特异性结合剂结合至靶分子或标签之后使核酸条形码从特异性结合剂裂解(例如,从靶分子裂解的编码多肽标识符元件),并且然后可将核酸条形码连接至起源特异性条形码。可将所得核酸条形码多联体与其他此类多联体汇集在一起并且测序。可使用测序读段来识别哪些靶分子最初存在于哪些离散体积中。
条形码可逆偶联至固体基底
在一些实施方案中,将起源特异性条形码可逆偶联至固体或半固体基底。在一些实施方案中,起源特异性条形码还包含特异性结合至靶核酸的核酸捕获序列和/或特异性结合至靶分子的特异性结合剂。在具体实施方案中,起源特异性条形码包括两个或更多个起源特异性条形码群体,其中第一群体包含核酸捕获序列,而第二群体包含特异性结合至靶分子的特异性结合剂。在一些实例中,第一起源特异性条形码群体还包含靶核酸条形码,其中所述靶核酸条形码将所述群体识别为标记核酸的群体。在一些实例中,第二起源特异性条形码群体还包含靶分子条形码,其中所述靶分子条形码将所述群体识别为标记靶分子的群体。
具有切割位点的条形码
核酸条形码可为例如在特异性结合剂已结合于靶分子之后可从特异性结合剂裂解的。在一些实施方案中,起源特异性条形码还包含一个或多个切割位点。在一些实例中,对至少一个切割位点进行定向,使得在该位点处的切割使起源特异性条形码从与其偶联的基底(诸如珠粒,例如水凝胶珠粒)释放。在一些实施方案中,对至少一个切割位点进行定向,使得在该位点处的切割使起源特异性条形码从靶分子特异性结合剂释放。在一些实施方案中,切割位点为酶切割位点,诸如存在于特异性核酸序列中的核酸内切酶位点。在其他实施方案中,切割位点为肽切割位点,使得特定酶可切割氨基酸序列。在其他实施方案中,切割位点为化学切割位点。
条形码衔接子
在一些实施方案中,将靶分子附接至起源特异性条形码接收衔接子,诸如核酸。在一些实施方案中,起源特异性条形码接收衔接子包含突出,并且起源特异性条形码包含能够杂交至所述突出的序列。条形码接收衔接子是被配置成接受或接收核酸条形码(诸如起源特异性核酸条形码)的分子。举例来说,条形码接收衔接子可包括能够例如经由与核酸条形码的一部分或全部互补的序列杂交至给定条形码(例如起源特异性条形码)的单链核酸序列(例如突出)。在某些实施方案中,条形码的此部分为在个别条形码之间保持恒定的标准序列。杂交将条形码接收衔接子偶联至条形码。在一些实施方案中,可使条形码接收衔接子与靶分子缔合(例如,附接)。因而,条形码接收衔接子可充当使起源特异性条形码附接至靶分子的构件。可根据本领域中已知的方法将条形码接收衔接子附接至靶分子。举例来说,可在半胱氨酸残基(例如C端半胱氨酸残基)处将条形码接收衔接子附接至多肽靶分子。可使用条形码接收衔接子来识别与一个或多个靶分子有关的特定条件,诸如起源细胞或起源离散体积。举例来说,靶分子可为由细胞表达的细胞表面蛋白,其接收细胞特异性条形码接收衔接子。在使细胞暴露于一种或多种条件时,可使条形码接收衔接子缀合至一个或多个条形码,使得可随后通过识别条形码接收衔接子/条形码多联体的序列来确定靶分子的原始起源细胞以及细胞所暴露于的各条件。
具有捕获部分的条形码
在一些实施方案中,起源特异性条形码还包括共价或非共价连接的捕获部分。因此,在一些实施方案中,用特异性结合捕获部分的特异性结合剂来捕获起源特异性条形码和结合或附接至其的包括捕获部分的任何东西。在一些实施方案中,将捕获部分吸附或以其他方式捕获于表面上。在具体实施方案中,例如通过在体外转录期间并入生物素-16-UTP对靶向探针用生物素进行标记,从而允许随后由链霉亲和素捕获。用于标记、捕获以及检测起源特异性条形码的其他手段包括:并入氨基烯丙基标记的核苷酸、并入巯基标记的核苷酸、并入含有稀丙基或叠氮基的核苷酸以及在Bioconjugate Techniques(第2版),GregT.Hermanson,Elsevier(2008)中所描述的许多其他方法,所述文献特定地以引用方式并入本文。在一些实施方案中,使用诸如并入氨基烯丙基标记的核苷酸随后将1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)偶联至羧基激活型固体支持物等的方法或在BioconjugateTechniques中所描述的其他方法将靶向探针在接触样品之前共价偶联至固体支持物或其他捕获装置。在一些实施方案中,已将特异性结合剂例如固定于固体支持物上,由此分离起源特异性条形码。
其他条形码化实施方案
DNA条形码化也是一种分类方法,它使用生物体DNA中的短遗传标记物来确定它属于特定物种。它与分子系统发育的不同之处在于,其主要目标不是确定分类,而是根据已知分类来识别未知样品。Kress等人,“Use of DNA barcodes to identify floweringplants”Proc.Natl.Acad.Sci.U.S.A.102(23):8369-8374(2005)。有时使用条形码来识别未知物种或者评估是否应该合并或分离物种。Koch H.,“Combining morphology and DNAbarcoding resolves the taxonomy of Western Malagasy Liotrigona Moure,1961”African Invertebrates 51(2):413-421(2010);和Seberg等人,“How many loci does ittake to DNA barcode a crocus?”PLoS One 4(2):e4598(2009)。已例如使用条形码来识别植物叶子,即使没有花或果实,根据胃内容物或粪便识别动物的饮食,和/或识别商业产品(例如草药补充剂或木材)。Soininen等人,“Analysing diet of small herbivores:theefficiency of DNA barcoding coupled with high-throughput pyrosequencing fordeciphering the composition of complex plant mixtures”Frontiers in Zoology 6:16(2009)。
有人建议,应标准化DNA条形码化的理想基因座,以便可开发该基因座的大型序列数据库。大多数目标分类群具有无需物种特异性PCR引物即可测序的基因座。CBOL PlantWorking Group,“A DNA barcode for land plants”PNAS 106(31):12794-12797(2009)。此外,拒信这些假定的条形码基因座足够短,可以很容易地用当前技术进行测序。Kress等人,“DNA barcodes:Genes,genomics,and bioinformatics”PNAS 105(8):2761-2762(2008)。因此,这些基因座将提供物种之间的大量变异以及物种内相对少量的变异。Lahaye等人,“DNA barcoding the floras of biodiversity hotspots”Proc Natl Acad SciUSA 105(8):2923-2928(2008)。
DNA条形码化是基于一个相对简单的概念。举例来说,大多数真核细胞含有线粒体,线粒体DNA(mtDNA)突变率相对较快,导致种间mtDNA序列存在显著变异,而物种内变异原则上相对较小。提议将线粒体细胞色素c氧化酶亚基1(CO1)基因的648bp区域作为潜在的“条形码”。截至2009年,CO1序列数据库包括来自超过58,000种动物的至少620,000个样本,比任何其他基因可用的数据库都要大。Ausubel,J.,“A botanical macroscope”Proceedings of the National Academy of Sciences 106(31):12569(2009)。
用于DNA条形码化的软件需要集成现场信息管理系统(FIMS)、实验室信息管理系统(LIMS)、序列分析工具、连接现场数据和实验室数据的工作流跟踪、数据库提交工具和管道自动化以便扩展到生态系统规模项目。Geneious Pro可用于序列分析组件,以及通过Moorea Biocode Project、Biocode LIMS和Genbank Submission插件处理与FIMS、LIMS、工作流跟踪和数据库提交的集成免费提供的两个插件。
此外,已描述了其他条形码化设计和工具(参见例如Birrell等人,(2001)Proc.Natl Acad.Sci.USA 98,12608-12613;Giaever等人,(2002)Nature 418,387-391;Winzeler等人,(1999)Science 285,901-906;和Xu等人,(2009)Proc Natl Acad SciUSA.Feb 17;106(7):2289-94)。
如本文所述,靶分子可包括任何靶核酸序列,在多个实施方案中,一种或多种指导RNA被设计成结合至一种或多种对疾病状态具诊断性的靶分子。在另外的实施方案中,疾病状态是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病或环境获得性疾病。在另外的实施方案中,疾病状态是感染,包括微生物感染。
在另外的实施方案中,感染由病毒、细菌或真菌引起,或者感染是病毒感染。在具体实施方案中,病毒感染由双链RNA病毒、正义RNA病毒、反义RNA病毒、逆转录病毒或它们的组合引起。在某些实施方案中,所述应用可实现多重株系辨别。在一些实施方案中,可检测病原体亚型分型,在一个实施方案中,可进行流感亚型分型、葡萄球菌或链球菌亚型分型以及细菌重叠感染亚型检测。在一个优选的实施方案中,可对甲型流感病毒的所有H和N亚型进行多重检测和鉴定。在一方面,使用汇集(或排列)的crRNA来捕获亚型内的变异。在某些情况下,感染是HIV。在一个实施方案中,HIV逆转录酶中的耐药突变可经由SNP检测进行。在一些实施方案中,突变可以是K65R、K103N、V106M、Y181C、M184V、G190A。类似地,可在其他感染中,诸如在结核病中进行SNP检测。在一些实施方案中,突变可为katG,315ACC:异烟肼抗性;rpoB,531TTG:利福平抗性;gyrA,94GGC:氟喹诺酮抗性;rrs,1401G:氨基糖苷类抗性。此外,可检测到HIV/TB共感染。可实现大规模多重化来检测泛病毒、病毒带泛病毒、泛细菌或泛病原体检测。
如本文所述,用于本发明的含有靶分子的样品可以是生物或环境样品,诸如食物样品(新鲜水果或蔬菜、肉)、饮料样品、纸表面、织物表面、金属表面、木材表面、塑料表面、土壤样品、淡水样品、废水样品、盐水样品、暴露于大气或其他气体样品,或它们的组合。举例来说,可以拭抹由包括但不限于金属、木材、塑料、橡胶等的任何材料制成的家用/商业/工业表面并测试污染物。可以针对病原性细菌或寄生虫或者其他微生物的存在测试土壤样品,用于环境目的和/或用于人类、动物或植物疾病测试。可以评估诸如淡水样品、废水样品或盐水样品的水样品的清洁度和安全性和/或可饮用性,以检测例如微小隐孢子虫(Cryptosporidium parvum)、兰伯氏贾第虫(Giardia lamblia)或其他微生物污染的存在。在另外的实施方案中,生物样品可以获自以下来源:包括但不限于组织样品、唾液、血液、血浆、血清、粪便、尿液、痰液、粘液、淋巴、滑液、脑脊髓液、腹水、胸腔积液、血清肿、脓液,或皮肤或粘膜表面的拭子。在一些具体实施方案中,环境样品或生物样品可以是粗样品和/或在应用方法之前一种或多种靶分子可能未从样品纯化或扩增。微生物的鉴定可用于许多应用和/或为许多应用所需,并且因此可以根据本发明使用本领域技术人员认为适当的来自任何来源的任何类型的样品。
在一些实施方案中,生物样品可包括但不必要限于血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊髓液、水状液或玻璃体液,或任何身体分泌物、渗出物、渗出液,或获自关节的流体,或皮肤或粘膜表面的拭子。
在具体实施方案中,样品可以是获自人类患者的血液、血浆或血清。
在一些实施方案中,样品可以是植物样品。在一些实施方案中,样品可以是粗样品。在一些实施方案中,样品可以是纯化的样品。
包括微孔阵列的微流体装置
微流体装置包括微孔阵列与在微孔下方的至少一个流动通道。在某些示例性实施方案中,装置是产生和/或合并不同液滴(即个别离散体积)的微流体装置。举例来说,可以形成含有待筛选的样品的第一组液滴,并且形成含有本文所述的系统的元件的第二组液滴。然后合并第一组液滴和第二组液滴,然后在合并的液滴组上执行如本文所述的诊断方法。
本文所公开的微流体装置可以是基于硅酮的芯片并且可以使用多种技术制造,所述技术包括但不限于热压花、弹性体模制、注射成型、LIGA、软光刻、硅制造和相关的薄膜加工技术。用于制造微流体装置的合适材料包括但不限于环烯烃共聚物(COC)、聚碳酸酯、聚(二甲基硅氧烷)(PDMS)和聚(甲基丙烯酸酯)(PMMA)。在一个实施方案中,PDMS中的软光刻可用于制备微流体装置。举例来说,可以使用限定基底内流动通道、阀门和过滤器的位置的光刻制造模具。将基底材料倒入模具中并使其凝固以形成印模。然后将印模密封于固体支持物(诸如但不限于玻璃)上。由于一些聚合物(诸如PDMS)吸收一些蛋白质并且可以抑制某些生物过程的疏水性质,钝化剂可以是必要的(Schoffner等人Nucleic Acids Research,1996,24:375-379)。适合的钝化剂在本领域中是已知的并且包括但不限于硅烷、聚对二甲苯、正十二烷基-b-D-麦芽糖苷(DDM)、普朗尼克(pluronic)、Tween-20、其他类似表面活性剂、聚乙二醇(PEG)、白蛋白、胶原蛋白,以及其他类似蛋白质和肽。
可在本发明的情形中使用的微流体装置的实例描述于Kulesa等人PNAS,115,6685-6690,所述文献以引用方式并入本文。
在某些示例性实施方案中,所述装置可以包括个别孔,诸如微板孔。微板孔的尺寸可以是标准6、24、96、384、1536、3456或9600号孔的尺寸。在某些实施方案中,微孔的数目可超过40,0000或超过190,000。在某些示例性实施方案中,可以将本文所述的系统的成分冷冻干燥并且在分配和使用之前施加至孔的表面。
可以如代理人案卷号52199-505P03US或美国专利申请号15/559,381中所公开的那样设计微孔芯片,所述文献以引用方式并入本文。在一个实施方案中,可以将微孔芯片设计成尺寸为约6.2x 7.2cm的格式,包含49200个微孔;或者设计成尺寸为7.4x 10cm的更大的格式,包含97,194个微孔。可以将微孔阵列成形为例如直径为约50-300μm的两个圆,在特定实施方案中,直径为150μm,设置为10%重叠。微孔阵列可以50μm的孔间距以六方点格排列。在一些情况下,可以其他形状、间距和尺寸排列微孔,以容纳不同数量的液滴。在一些实施方案中,以有利方式设定微孔芯片的尺寸以与标准实验室设备(包括成像设备,诸如显微镜)一起使用。
在示例性方法中,可以将化合物与独特比率的荧光染料(例如Alexa Fluor555、594、647)混合。可以将靶分子与染料混合物的各混合物乳化成液滴。类似地,可以将具有光学条形码的各检测CRISPR系统乳化成液滴。在一些实施方案中,液滴各自为约1nL。然后可以将CRISPR检测系统液滴和靶分子液滴组合并施加至微孔芯片。可以通过简单混合或其他组合方法来组合液滴。在一个示例性实施方案中,将微孔芯片附加至诸如具有可移除间隔件的疏水性载玻片的平台上,可以通过夹具或其他固定构件(其可为例如钕磁体)从上方和下方夹持所述间隔件。可以将芯片和载玻片之间由间隔件形成的间隙加载油,并将液滴汇集物注入芯片中,通过注入更多的油并排出过量的液滴来继续使液滴流动。加载完成后,可以用油清洗芯片,并且可以移除间隔件以将微孔密封在载玻片上并闭合夹具。可以例如使用落射荧光显微镜将芯片成像,通过施加例如由电晕处理器提供的交流电场合并液滴以混合每个微孔中的化合物,随后根据所需方案进行处理。在一个实施方案中,可以在37℃下孵育微孔,同时使用落射荧光显微镜测量荧光。在对液滴进行操纵之后,可以如本文所述将液滴从微孔中洗脱以进行额外的分析、处理和/或操纵。
所公开的装置还可以包括入口和出口端口,或开口,其又可连接至阀、管、通道、腔室和注射器和/或泵用于将流体引入装置和从装置中抽出流体。这些装置可以连接至允许流体在微流体装置内定向移动的流体流动致动器。示例性致动器包括但不限于意图迫使流体移动的注射器泵、机械致动的再循环泵、电渗泵、球管、波纹管、隔膜或鼓泡器。在某些示例性实施方案中,装置连接至具有一起工作以使流体移动通过装置的可编程阀的控制器。在某些示例性实施方案中,装置连接至控制器,所述控制器在下文进一步详细讨论。这些装置可通过终止于金属销中以插入装置上的入口端口的管道连接至流动致动器、控制器和样品加载装置。
本发明可以与无线芯片实验室(LOC)诊断传感器系统一起使用(参见例如美国专利号9,470,699“Diagnostic radio frequency identification sensors andapplications thereof”)。在某些实施方案中,本发明在由无线装置(例如手机、个人数字助理(PDA)、平板电脑)控制的LOC中执行,并且将结果报告给所述装置。
射频识别(RFID)标签系统包括RFID标签,所述RFID标签发送数据以供RFID读取器(也称为询问机)接收。在典型RFID系统中,个别物体(例如储存商品)配备有含有转发器的相对小的标签。转发器具有给定独特的电子产品代码的存储芯片。RFID读取器发射信号,从而经由使用通信协议激活标签内的转发器。因此,RFID读取器能够读取数据并将数据写入标签。另外,RFID标签读取器根据RFID标签系统应用来处理数据。目前,存在无源和有源型RFID标签。无源型RFID标签不包含内部电源,而是由从RFID读取器接收的射频信号供电。或者,有源型RFID标签包含内部电源,这使有源型RFID标签具有更大的传输范围和存储容量。无源标签与有源标签的使用取决于特定应用。
芯片实验室技术在科学文献中有很充分的描述,由多个微流体通道、输入或化学孔组成。可以使用射频识别(RFID)标签技术来测量孔中的反应,因为来自RFID电子芯片的导电引线可以直接连接至每个测试孔。天线可以印刷或安装在电子芯片的另一层中或直接印刷或安装在装置的背面。此外,引线、天线和电子芯片可以嵌入LOC芯片中,从而防止电极或电子器件的短路。由于LOC允许复杂的样品分离和分析,因此该技术允许LOC测试独立于复杂或昂贵的读取器而完成。而是可以使用诸如蜂窝电话或PDA的简单无线装置。在一个实施方案中,无线装置还控制微流体通道的分离和控制,以进行更复杂的LOC分析。在一个实施方案中,LOC-RFID芯片中包括LED和其他电子测量或感测装置。不受理论束缚,这种技术是可任意使用的,允许在实验室外进行需要分离和混合的复杂的测试。
在优选的实施方案中,LOC可以是微流体装置。LOC可以是无源芯片,其中芯片经由无线装置供电和控制。在某些实施方案中,LOC包括用于容纳试剂的微流体通道和用于引入样品的通道。在某些实施方案中,来自无线装置的信号将电力传送至LOC并激活样品和测定试剂的混合。具体地,在本发明的情况下,系统可以包括掩蔽剂、CRISPR效应蛋白和对靶分子具有特异性的指导RNA。在LOC激活后,微流体装置可以混合样品与测定试剂。在混合后,传感器检测信号并将结果发送到无线装置。在某些实施方案中,去掩蔽剂是导电RNA分子。导电RNA分子可以附接至导电材料。导电分子可以是导电纳米粒子、导电蛋白、附接至蛋白质或乳胶的金属粒子或其他导电珠粒。在某些实施方案中,如果使用DNA或RNA,则导电分子可以直接附接至匹配的DNA或RNA链。可以跨越传感器检测导电分子的释放。测定可以是一步过程。
由于可以精确地测量表面区域的电导率,因此可以在可任意使用的无线RFID电测定中获得定量结果。此外,测试区域可以极小,从而允许在给定的区域中完成更多测试并且因此节约成本。在某些实施方案中,使用各自与固定至传感器的不同CRISPR效应蛋白和指导RNA相关联的单独传感器来检测多个靶分子。不受理论束缚,可以通过无线装置区分不同传感器的激活。
除本文所述的导电方法之外,可以使用依赖于RFID或蓝牙作为用于可任意使用的RFID测定的基础低成本通信和电力平台的其他方法。举例来说,可以使用光学构件来评估给定靶分子的存在和水平。在某些实施方案中,光学传感器检测荧光掩蔽剂的去掩蔽。
在某些实施方案中,本发明的装置可以包括用于诊断性读取测定的手持便携式装置(参见例如Vashist等人,Commercial Smartphone-Based Devices and SmartApplications for Personalized Healthcare Monitoring and Management,Diagnostics 2014,4(3),104-128;来自移动式测定的mReader;以及Holomic快速诊断测试读取器)。
如本文所指出的,某些实施方案允许通过比色变化的检测,当在POC情境下和或在获得更复杂的检测设备以读出信号可能受限的资源贫乏的环境中使用实施方案时,这些实施方案具有某些附带的益处。然而,本文所公开的便携式实施方案还可以与能够检测可见光范围之外的信号的手持式分光光度计结合。Das等人“Ultra-portable,wirelesssmartphone spectrophotometer for rapid,non-destructive testing of fruitripeness.”Nature Scientific Reports.2016,6:32504,DOI:10.1038/srep32504描述了可以与本发明结合使用的手持式分光光度计装置的实例。最后,在利用基于量子点的掩蔽构建体的某些实施方案中,由于量子点提供的接近完全的量子产率,可以成功地使用手持式UV光或其他合适的装置来检测信号。
个别离散体积
在一些实施方案中,CRISPR系统包含在个别离散体积中,每一个别离散体积包含CRISPR效应蛋白、一种或多种被设计成结合至相应靶分子的指导RNA和基于RNA的掩蔽构建体。在一些情况下,每一个别离散体积是液滴。在特别优选的实施方案中,液滴作为第一组液滴提供,每个液滴含有CRISPR系统。在一些实施方案中,靶分子或样品包含在个别离散体积中,每一个别离散体积包含靶分子。在一些情况下,每一个别离散体积是液滴。在一个特别优选的实施方案中,液滴作为第二组液滴提供,每个液滴含有靶分子。
在一方面,本文所公开的实施方案可以包括针对核酸检测系统的第一组液滴,所述核酸检测系统包括CRISPR系统、一种或多种被设计成结合至相应靶分子的指导RNA、掩蔽构建体,以及任选的用以扩增样品中的靶核酸分子的扩增试剂。在某些示例性实施方案中,所述系统还可包括一种或多种检测适体。一种或多种检测适体可包含RNA聚合酶位点或引物结合位点。一种或多种检测适体特异性地结合一种或多种靶多肽,并且被配置成使得RNA聚合酶位点或引物结合位点仅在检测适体与靶肽结合时暴露。RNA聚合酶位点的暴露有助于使用适体序列作为模板产生触发RNA寡核苷酸。因此,在此类实施方案中,一种或多种指导RNA被配置成结合至触发RNA。
“个别离散体积”是离散体积或离散空间,诸如容器(container)、接收器(receptacle)或可以由防止和/或抑制核酸、CRISPR检测系统和实施本文所公开的方法所必需的试剂迁移的特性限定的其他限定体积或空间,例如由物理特性诸如壁,例如孔、管的壁或液滴的表面(其可以是不可渗透的或半渗透的)限定的体积或空间,或者由诸如化学、扩散速率限制、电磁或光照射或它们的任何组合的其他手段限定的体积或空间。在特别优选的实施方案中,个别离散体积是液滴。所谓“扩散速率限制”(例如扩散限定的体积)意指由于扩散约束有效地限定了空间或体积而仅某些分子或反应可以接近的空间,如同其中扩散将限制靶分子从一个流到另一个流的迁移的两个平行层流的情况。所谓“化学”限定的体积或空间意指由于其化学或分子特性(诸如大小)而仅某些靶分子可以存在的空间,例如凝胶珠粒例如通过珠粒的表面电荷、基质尺寸或可允许选择可以进入珠粒内部的种类的其他物理特性,可以排除某些种类进入而不排除其他种类进入。所谓“电磁”限定的体积或空间意指其中靶分子或其支持物的电磁特性(诸如电荷或磁性)可用于限定空间中的某些区域(诸如在磁场内或直接在磁铁上捕获磁性粒子)的空间。所谓“光学”限定的体积是指可以通过用可见光、紫外线、红外线或其他波长的光照射它来限定的任何空间区域,使得仅可以标记该限定空间或体积内的靶分子。使用非壁或半透性离散体积的一个优点是一些试剂,诸如缓冲液、化学激活剂或其他剂可以通过离散体积,而其他材料诸如靶分子可以保持在离散体积或空间内。如本文所解释的,液滴系统允许分离化合物直至需要启动反应。通常,离散体积将包括在允许标记的条件下适合于用可转位核酸标识符标记靶分子的流体介质(例如,水溶液、油、缓冲液和/或能够支持细胞生长的培养基)。在所公开的方法中有用的示例性离散体积或空间包括液滴(例如,微流体液滴和/或乳液液滴)、水凝胶珠粒或其他聚合物结构(例如聚乙二醇二丙烯酸酯珠粒或琼脂糖珠粒)、组织载玻片(例如,具有由化学、光学或物理手段限定的特定区域、体积或空间的固定福尔马林石蜡包埋的组织载玻片)、具有由以有序阵列或随机图案的沉积试剂限定的区域的显微镜载玻片、管(诸如离心管、微量离心管、试管、比色杯、锥形管等)、瓶子(诸如玻璃瓶、塑料瓶、陶瓷瓶、锥形瓶、闪烁瓶等)、孔(诸如板中的孔)、板、移液管或移液管尖端等。在某些示例性实施方案中,个别离散体积是液滴。
液滴
本文所提供的液滴通常是由油输入通道和水性输入通道形成的油包水微乳液。可通过本领域中已知的多种分散方法形成液滴。在一个特定实施方案中,可通过微乳液制备在油相中均一的大量液滴。示例性方法可包括,例如,R结头几何,其中通过油剪切水相,从而产生液滴;流动聚焦几何,其中通过从两个方向剪切水流来产生液滴;或同流几何,其中喷射水相通过细毛细管,所述细毛细管同轴放置在更大的毛细管内,油通过该毛细管泵送。
所使用的单分散水性液滴通过微流体装置作为油包水乳液产生。在一个实施方案中,液滴被携带在流动油相中并通过表面活性剂稳定。在一方面,单一细胞或单一细胞器或单一分子(蛋白质、RNA、DNA)从水性溶液/分散液包封到均一的液滴中。在相关方面,多种细胞或多种分子可以取代单一细胞或单一分子。
体积范围为1pL至10nL的水性液滴作为单独反应器发挥作用。可在单次运行中处理和分析液滴中的104至105个单一细胞。为利用微液滴进行快速大规模化学筛选或复杂生物学文库的鉴定,不同种类的微液滴(各含有特定化学化合物或生物探针细胞或目标分子条形码)必须在优选的条件(例如混合比率、浓度和组合顺序)下产生和组合。将各液滴种类在汇合点从单独的入口微流体通道引入到主微流体通道中。优选地,如美国公布号US2007/0195127和国际公布号WO 2007/089541(其各自以引用方式整体并入本文),按照设计选择液滴体积以使得一个种类大于其他种类且在载体流体中以不同的速率移动,通常慢于其他种类。选择通道宽度和长度使得较快的液滴种类赶上最慢的种类。通道的尺寸限制防止较快移动的液滴经过较慢移动的液滴,导致液滴串进入合并区。多步骤化学反应、生物化学反应或测定检测化学作用经常在不同类型的物质添加至反应之前需要固定的反应时间。通过用第二、第三或更多个汇合点(各具有单独的合并点)重复该过程多次来实现多步骤反应。高度有效且精确的反应及反应的分析在来自入口通道的液滴的频率与最优比率匹配并且物种的体积相匹配以在组合的液滴中提供最优反应条件时实现。通过改变含有液滴的液体的流动,可以在本发明的流体系统中筛选或分选流体液滴。举例来说,在一组实施方案中,可以通过将包围流体液滴的液体指引到第一通道、第二通道等中来操纵或分选流体液滴。在另一组实施方案中,可以控制流体系统内(例如不同通道内或不同通道部分内)的压力以指引流体液滴的流动。举例来说,可以将液滴指引到包括用于进一步流动方向的多个选项的通道接合点(例如指引到通道中限定任选的下游流动通道的分支或分叉)。可以控制一个或多个任选的下游流动通道内的压力以指引液滴选择性地进入一个通道,并且可以按照相继的液滴到达接合点所需时间的顺序来实现压力的变化,使得可以独立地控制各相继的液滴的下游流动路径。
在一种布置中,可以利用液体贮存器的扩展和/或收缩来操纵或分选流体液滴进入通道中,例如通过使含有流体液滴的流体定向移动。在另一种布置中,例如,如本文所述的,可以将液体贮存器的扩展和/或收缩与其他流动控制装置和方法相结合。能够导致液体贮存器的扩展和/或收缩的装置的非限制性实例包括活塞。使用微流体通道处理液滴的关键要素包括:(1)产生适当体积的液滴,(2)以适当频率产生液滴以及(3)以第一样品液滴流的频率匹配第二样品液滴流的频率的方式使第一样品液滴流与第二样品液滴流集合到一起。优选地,以文库液滴的频率匹配样品液滴的频率的方式使样品液滴流与预制文库液滴流集合到一起。用于以规则的频率产生均一体积的液滴的方法是本领域中众所周知的。一种方法是使用分散相流体和不混溶载体流体的流体动力学聚焦产生液滴,如美国公布号US2005/0172476和国际公布号WO 2004/002627中公开的。希望在汇合处引入的种类之一是预制的微滴文库,其中所述文库包含多种反应条件,例如,文库可以以一定浓度范围包含作为单独文库元件包封的用于筛选其对于细胞或酶的作用的多种不同的化合物,或者文库可以由作为不同文库元件包封的用于基因座集合的靶向扩增的多个不同引物对构成,或者文库可以包含作为不同文库元件包封以进行多个结合测定的多个不同抗体种类。通过将预制的文库液滴集合用驱动流体推出小瓶来实现将反应条件文库引入到基底上。驱动流体是连续流体。驱动流体可以包含与载体流体相同的物质(例如碳氟化合物油)。举例来说,如果由10微微升液滴组成的文库用10,000微微升/秒流率的驱动流体驱动进入微流体基底上的入口通道中,则名义上液滴预期进入汇合点的频率是1000/秒。但是,实际上液滴在其之间用缓慢排出的油封装。载体流体随着时间从文库液滴排出并且液滴的数量密度(数量/mL)提高。因此,驱动流体的简单固定输注速率不提供将液滴引入基底的微流体通道中的均一速率。此外,平均文库液滴体积的文库-文库差异导致在汇合点处液滴引入频率的偏移。因此,由于样品差异和油排出导致的液滴均一性的缺乏提出了待解决的另一问题。举例来说,如果名义液滴体积在文库中预期为10微微升,但在文库之间从9微微升至11微微升变化,则10,000微微升/秒的输注速率名义上将产生900至1,100个液滴/秒的频率范围。简言之,在芯片上形成的液滴的分散相组成的样品-样品差异、文库液滴的数量密度随时间提高的趋势以及平均液滴体积的文库-文库差异严重地限制液滴频率可以通过简单地使用固定输注速率可靠地在汇合处匹配的程度。此外,这些限制也具有对体积可以重现地组合的程度有影响。与泵流率精度的典型变化和通道尺寸的变化相结合,系统受到严重的限制而无基于逐次运行进行补偿的手段。前述事实不仅说明了待解决的问题,而且阐明了对于即时调节对微流体通道内微液滴的微流体控制的方法的需要。
必须开发多种表面活性剂和油的组合以利于液滴的产生、储存和操纵,从而维持多样化文库的各液滴内独特的化学/生物化学/生物学环境。因此,表面活性剂和油的组合应当(1)在液滴形成过程及随后的收集和储存过程中稳定液滴以避免不受控的聚并,(2)最小化任何液滴内容物至油相的转运和/或在液滴之间的转运,并且(3)维持与各液滴的内容物的化学和生物学惰性(例如,包封的内容物在油-水界面处无吸附或反应,和对液滴中生物或化学成分无负面影响)。除对液滴文库功能和稳定性的要求之外,油中表面活性剂的溶液必须与流体物理和材料(其与平台相关)相结合。具体地,油溶液必须不使用于构建微流体芯片的材料溶胀、溶解或降解,并且油的物理特性(例如粘度、沸点等)必须适合于平台的流动和操作条件。在没有表面活性剂的油中所形成的液滴不稳定而允许聚并,因此必须将表面活性剂溶解于用作乳液文库的连续相的油中。表面活性剂分子是两亲性的——分子的一部分是油溶性的并且分子的一部分是水溶性的。当微流体芯片的喷嘴处(例如本文所述的入口模块中)形成水-油界面时,溶解于油相中的表面活性剂分子吸附到界面上。分子的亲水性部分居于液滴的内部,而分子的亲氟部分分(fluorophilic portion)分布于液滴的外部。当界面充满表面活性剂时,液滴的表面张力降低,因此乳液的稳定性提高。除了使液滴稳定以避免聚并之外,表面活性剂应当对于各液滴的内容物是惰性的并且表面活性剂不应当促进包封的组分至油或其他液滴的转运。液滴文库可以由一起汇集在单一集合中的多种文库元件构成(参见例如美国专利公布号2010002241)。
文库的复杂性可以从单一文库元件至1015个或更多个文库元件变化。各文库元件可以是固定浓度的一种或多种给定组分。元件可以是但不限于细胞、细胞器、病毒、细菌、酵母、珠粒、氨基酸、蛋白质、多肽、核酸、多核苷酸或小分子化学化合物。元件可以包含标识符诸如标记。术语“液滴文库”或“多个液滴文库”在本文中也称为“乳液文库”或“多个乳液文库”。这些术语在整个说明书中可互换使用。细胞文库元件可以包括但不限于杂交瘤、B细胞、原代细胞、培养细胞系、癌细胞、干细胞、从组织获得的细胞或任何其他细胞类型。细胞文库元件是通过在单个液滴中包封一个至成千上万的多个细胞来制备的。包封的细胞数通常从细胞的数量密度和液滴的体积通过泊松统计(Poisson statistic)给出。但是,在一些情况下,如Edd等人,“Controlled encapsulation of single-cells into monodispersepicolitre drops.”Lab Chip,8(8):1262-1264,2008中所述的,数字偏离泊松统计。细胞的离散性质允许大量制备具有全部存在于单一起始介质中的多种细胞变体的文库,并且然后该介质分散成包含至多一个细胞的单个液滴囊。然后这些单个液滴囊组合或汇集以形成由独特文库元件组成的文库。继包封之后或者,在一些实施方案中,紧接着包封,细胞分裂产生克隆文库元件。
在某些实施方案中,基于珠粒的文库元件可以包含一个或多个给定类型的珠粒并且还可包含其他试剂,诸如抗体、酶或其他蛋白质。在其中所有文库元件包含不同类型的珠粒但包含相同的周围介质的情况中,文库元件可以全部从单一起始流体制备或具有多种起始流体。在从变体(诸如遗传修饰的)酵母或细菌细胞的集合大量制备的细胞文库的情况中,文库元件从多种起始流体制备。经常希望的是,当用多个经工程化以产生蛋白质的变体的细胞或酵母或细菌开始时,每液滴恰好具有一个细胞而仅有一些液滴包含超过一个细胞。在一些情况下,可以获得与泊松统计的偏离以提供加强的液滴加载,使得更多的液滴恰好具有一个细胞/液滴,而空液滴或包含超过一个细胞的液滴很少。液滴文库的实例是具有不同内容物的液滴的集合,范围为珠粒、细胞、小分子、DNA、引物、抗体。较小的液滴可以是大约毫微微升(fL)体积的液滴,其特别地用液滴分配器设定。体积可在约5至约600fL的范围内。较大液滴的尺寸范围为大约0.5微米至500微米直径,相当于约1微微升至1纳升。然而,液滴可以小至5微米,大至500微米。优选地,液滴的直径为小于100微米、约1微米至约100微米。最优选的尺寸是直径约20至40微米(10至100微微升)。液滴文库检验的优选特性包括渗透压平衡、均一尺寸和尺寸范围。本发明乳液文库内的液滴可以包含在不混溶油内,所述不混溶油可以包含至少一种含氟表面活性剂。在一些实施方案中,不混溶氟碳化合物油内的含氟表面活性剂是由一个或多个全氟化聚醚(PFPE)嵌段和一个或多个聚乙二醇(PEG)嵌段组成的嵌段共聚物。在其他实施方案中,含氟表面活性剂是由通过酰胺连接基团与两个PFPE嵌段共价结合的PEG中心嵌段组成的三嵌段共聚物。含氟表面活性剂的存在(与文库中液滴的均一尺寸类似)对于维持液滴的稳定性和完整性是关键的并且也对于文库内液滴用于本文所述的各种生物学和化学测定的后续使用是必要的。可以在本发明的液滴文库中使用的流体(例如水性流体、不混溶油等)和其他表面活性剂在本文中更详细地描述。
本发明因此可涉及可以在不混溶油(例如氟碳化合物油)中包含多个水性液滴的乳液文库,所述不混溶油可以包含至少一种含氟表面活性剂,其中各液滴尺寸均一并且可以包含相同的水性流体且可以包含不同的文库元件。本发明还提供了用于形成乳液文库的方法,所述方法可以包括提供单一水性流体(其可以包含不同文库元件),将各文库元件包封到不混溶氟碳化合物油(其可以包含至少一种含氟表面活性剂)内的水性液滴中,其中各液滴尺寸均一并且可以包含相同的水性流体且可以包含不同的文库元件,以及汇集不混溶氟碳化合物油(其可以包含至少一种含氟表面活性剂)内的水性液滴,从而形成乳液文库。举例来说,在一种类型的乳液文库中,所有不同类型的元件(例如细胞或珠粒)可以汇集到相同介质中包含的单一来源中。在初始汇集之后,接着将细胞或珠粒包封在液滴中以产生液滴文库,其中具有不同类型的珠粒或细胞的各液滴是不同文库元件。初始溶液的稀释使得包封过程成为可能。在一些实施方案中,形成的液滴将包含单一细胞或珠粒或将不包含任何东西,即,是空的。在其他实施方案中,形成的液滴将包含多个拷贝的文库元件。包封的细胞或珠粒一般是相同类型的细胞或珠粒的变体。在另一个实例中,乳液文库可以包含不混溶氟碳化合物油内的多个水性液滴,其中单一分子可以被包封,使得对于所产生的每20-60个液滴(例如20、25、30、35、40、45、50、55、60个液滴,或其间的任何整数)存在液滴内包含的单一分子。单一分子可以通过稀释包含该分子的溶液至使得能够实现单一分子的包封的这种低浓度而包封。这些文库的形成可能依赖于有限稀释。
本发明还提供了可以在油(在一个实施方案中为氟碳化合物油,其可以包含至少一种表面活性剂,在一个实施方案中为含氟表面活性剂)内包含至少第一水性液滴和至少第二水性液滴的乳液文库,其中所述至少第一液滴和所述至少第二液滴的尺寸均一并且包含不同的水性流体和不同的文库元件。本发明还提供了用于形成乳液文库的方法,所述方法可以包括提供至少第一水性流体(其可以包含至少第一元件文库),提供至少第二水性流体(其可以包含至少第二元件文库),将所述至少第一文库的各元件包封到不混溶氟碳化合物油(其可以包含至少一种含氟表面活性剂)内的至少第一水性液滴中,将所述至少第二文库的各元件包封到不混溶氟碳化合物油(其可以包含至少一种含氟表面活性剂)内的至少第二水性液滴中,其中所述至少第一液滴和所述至少第二液滴的尺寸均一并包含不同的水性流体和不同的文库元件,以及汇集不混溶氟碳化合物油(其可以包含少一种含氟表面活性剂)内的至少第一水性液滴和至少第二水性液滴,从而形成乳液文库。
本领域技术人员将认识到,本发明的方法和系统不限于任何特定的样品类型,并且本发明的方法和系统可以用于任何类型的有机、无机或生物分子(参见例如美国专利公布号20120122714)。
在特定实施方案中,样品可以包括核酸靶分子。核酸分子可以是合成的或来源于天然存在的来源。在一个实施方案中,核酸分子可以从包含多种其他组分诸如蛋白质、脂质和非模板核酸的生物样品分离。核酸靶分子可以从获自动物、植物、细菌、真菌或任何其他细胞生物体的任何细胞物质获得。在某些实施方案中,核酸靶分子可以从单一细胞获得。用于本发明的生物样品可以包括病毒粒子或制剂。核酸靶分子可以直接获自生物体或获自从生物体获得的生物样品,例如获自血液、尿液、脑脊液、精液、唾液、痰液、粪便和组织。任何组织或体液样本都可以用作本发明中使用的核酸的来源。核酸靶分子也可以从培养的细胞诸如原代细胞培养物或细胞系分离。核酸由其获得的细胞或组织可以用病毒或其他细胞内病原体感染。样品也可以是从生物样本提取的总RNA、cDNA文库、病毒或基因组DNA。一般来讲,核酸可以通过多种技术诸如Maniatis等人,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor,N.Y.,第280-281页(1982)描述的那些从生物样品提取。核酸分子可以是单链的、双链的或具有单链区域的双链(例如茎和环结构)。从生物样品获得的核酸通常可以断裂以产生用于分析的合适片段。可以使用多种机械、化学和/或酶促方法将靶核酸断裂或剪切到所需长度。可以经由超声处理(例如Covaris法)、短暂暴露于DNA酶或使用一种或多种限制性酶或者转座酶或切口酶的混合物随机剪切DNA。可以通过短暂暴露于RNA酶、热加镁或通过剪切使RNA断裂。RNA可以转化为cDNA。如果采用断裂,RNA可以在断裂之前或之后转换为cDNA。在一个实施方案中,通过超声处理使来自生物样品的核酸断裂。在另一个实施方案中,通过水力剪切仪使核酸断裂。一般来讲,单个核酸靶分子可为约40个碱基至约40kb。核酸分子可以是单链的、双链的或具有单链区域的双链(例如茎和环结构)。可以在洗涤剂或表面活性剂的存在下均质化或分级分离如本文所述的生物样品。缓冲液中洗涤剂的浓度可为约0.05%至约10.0%。洗涤剂的浓度可以最高达到其中洗涤剂保持溶解于溶液中的量。在一个实施方案中,洗涤剂的浓度为0.1%至约2%。洗涤剂,特别是非变性的温和洗涤剂,可以起到增溶样品的作用。洗涤剂可以是离子的或非离子的。非离子洗涤剂的实例包括triton,诸如TritonTMX系列(TritonTMX-100t-Oct-C6H4--(OCH2--CH2)xOH,x=9-10,TritonTMX-100R,TritonTMX-114x=7-8)、辛基糖苷、聚氧乙烯(9)十二烷基醚、洋地黄皂苷、IGEPALTMCA630辛基苯基聚乙二醇、正辛基-β-D-吡喃葡萄糖苷(betaOG)、正十二烷基-β、TweenTM20聚乙二醇脱水山梨糖醇单月桂酸酯、TweenTM80聚乙二醇脱水山梨糖醇单油酸酯、聚多卡醇、正十二烷基β-D-麦芽糖苷(DDM)、NP-40壬基苯基聚乙二醇、C12E8(八乙二醇正十二烷基单醚)、六乙二醇单正十四烷基醚(C14E06)、辛基-β-硫代吡喃葡萄糖苷(辛基硫代葡萄糖苷,OTG)、Emulgen和聚氧乙烯10月桂基醚(C12E10)。离子洗涤剂(阴离子型或阳离子型)的实例包括脱氧胆酸盐、十二烷基硫酸钠(SDS)、N-月桂酰基肌氨酸和鲸蜡基三甲基溴化铵(CTAB)。两性离子试剂也可以用于本发明的纯化方案中,诸如Chaps、zwitterion 3-14和3-[(3-胆酰胺丙基)二甲基铵基]-1-丙烷磺酸盐。还设想可以在具有或不具有另一洗涤剂或表面活性剂的情况下添加尿素。裂解或均质化溶液可还包含其他剂,诸如还原剂。这些还原剂的实例包括二硫苏糖醇(DTT)、β-巯基乙醇、DTE、GSH、半胱氨酸、半胱胺、三羧基乙膦(TCEP)或亚硫酸的盐。可以进行核酸的尺寸选择以除去非常短的片段或非常长的片段。可以使用本领域中已知的任何合适方法将核酸片段分配到可包含所需数目的片段的级分中。限制各片段的片段大小的合适方法在本领域中是已知的。在本发明的各个实施方案中,片段大小限制于约10与100Kb之间或更长。本发明中或关于本发明的样品可以包括单个靶蛋白质、蛋白质复合物、具有翻译修饰的蛋白质和蛋白质/核酸复合物。蛋白质靶标包括肽,并且还包括酶、激素、结构组分(诸如病毒衣壳蛋白)和抗体。蛋白质靶标可以是合成的或来源于天然存在的来源。本发明的蛋白质靶标可以从包含多种其他组分(包括脂质、非模板核酸和核酸)的生物样品分离。蛋白质靶标可以从动物、细菌、真菌、细胞生物体和单细胞获得。蛋白质靶标可以直接获自生物体或获自从生物体获得的生物样品,包括体液诸如血液、尿液、脑脊液、精液、唾液、痰液、粪便和组织。蛋白质靶标也可以从细胞和组织裂解物和生物化学级分获得。单个蛋白质是分离的多肽链。蛋白质复合物包括两个或更多个多肽链。样品可以包括具有翻译后修饰(包括但不限于磷酸化、甲硫氨酸氧化、脱酰胺、糖基化、泛素化、氨甲酰化、S-羧甲基化、乙酰化和甲基化)的蛋白质。蛋白质/核酸复合物包括交联或稳定的蛋白质-核酸复合物。使用本领域中已知的方法提取或分离单个蛋白质、蛋白质复合物、具有翻译修饰的蛋白质和蛋白质/核酸复合物。
本发明因此可涉及形成样品液滴。液滴是被不混溶载体流体包围的水性液滴。形成这种液滴的方法例如显示于Link等人(美国专利申请号2008/0014589、2008/0003142和2010/0137163)、Stone等人(美国专利号7,708,949和美国专利申请号2010/0172803)、Anderson等人(美国专利号7,041,481且作为RE41,780重授权)和Raindance TechnologiesInc.的欧洲公布号EP2047910中。所述文献各自的内容以引用方式整体并入本文。本发明涉及用于在高通量微流体系统中操纵液滴的系统和方法。微流体液滴可包封分化的细胞,所述细胞被裂解并且其mRNA杂交到表面上包含条形码化寡聚dT引物的捕获珠粒上,这些全部在液滴内部。条形码经由柔性多原子接头如PEG共价附接至捕获珠粒。在优选的实施方案中,通过添加含氟表面活性剂(如全氟辛醇)使液滴破碎、洗涤并收集。然后进行逆转录(RT)反应以将各细胞的mRNA转化为第一链cDNA,对所述第一链cDNA加独特条形码并共价连接至mRNA捕获珠粒。随后,经由模板转换反应的通用引物使用常规文库制备方案进行修复以制备RNA-Seq文库。由于来自任何给定细胞的所有mRNA都带独特条形码,对单一文库进行测序,然后以计算方式解析以确定哪些mRNA来自哪些细胞。以这种方式,通过单一测序轮次,可以同时获得数以万计(或更多)的可区分转录组。可在珠粒表面上产生寡核苷酸序列。在这些循环过程中,将珠粒从合成柱移除,汇集并按质量等分成四个相等部分;然后将这些珠粒等份置于单独的合成柱中并且与dG、dC、dT或dA亚磷酰胺任一者反应。在其他情况下,使用二核苷酸、三核苷酸或长度较长的寡核苷酸,在其他实例中,将寡聚dT尾用基因特异性寡核苷酸替代以引发特定的靶标(单数或复数),任意长度的随机序列用于捕获所有或特定RNA。将这一过程重复12次,达到总共412=16,777,216个独特条形码序列。在完成这些循环后,在所有珠粒上进行8个循环的简并寡核苷酸合成,接着30个循环的dT添加。在其他实施方案中,将简并合成省略、缩短(少于8个循环)或延长(多于8个循环);换句话说,将30个循环的dT添加用基因特异性引物(单一靶标或多个靶标)或简并序列替代。前述微流体系统被视为本发明的试剂递送系统微流体文库打印机或液滴文库打印系统液滴从含有裂解试剂和条形码的液滴发生器通过含有油的微流体出口通道朝向接合点形成为样品流体流。限定体积的加载试剂乳液(对应于限定数目的液滴)按照需要分配到载体流体的流动流中。样品流体通常可以包含水性缓冲溶液,诸如超纯水(例如18兆欧电阻率,例如通过柱色谱法获得)、10mM Tris HCl和1mM EDTA(TE)缓冲液、磷酸盐缓冲盐水(PBS)或乙酸盐缓冲液。可以使用与核酸分子生理上相容的任何液体或缓冲液。载体流体可以包括与样品流体不混溶的载体流体。载体流体可以是非极性溶剂、癸烷(例如十四烷或十六烷)、氟碳化合物油、硅油、惰性油(诸如烃)或另一种油(例如矿物油)。载体流体可以包含一种或多种添加剂,诸如降低表面张力的剂(表面活性剂)。表面活性剂可以包括Tween、Span、含氟表面活性剂和相对于水可溶于油中的其他试剂。在一些应用中,通过向样品流体添加第二表面活性剂来改善性能。表面活性剂可以帮助控制或优化液滴尺寸、流动和均一性,例如通过降低挤出或注射液滴到交叉通道中所需的剪切力。这会影响液滴体积和周期性或者液滴破碎进入交叉通道中的速率或频率此外,表面活性剂可以用于稳定氟化油中的水性乳液以避免聚并。液滴可以被表面活性剂包围,表面活性剂通过降低水油界面处的表面张力来稳定液滴。可以添加至载体流体的优选的表面活性剂包括但不限于表面活性剂,诸如基于脱水山梨糖醇的羧酸酯(例如“Span”表面活性剂,Fluka Chemika),包括脱水山梨糖醇单月桂酸酯(Span 20)、脱水山梨糖醇单棕榈酸酯(Span 40)、脱水山梨糖醇单硬脂酸酯(Span 60)和脱水山梨糖醇单油酸酯(Span 80),以及全氟化聚醚(例如DuPont Krytox 157FSL、FSM和/或FSH)。可以使用的非离子型表面活性剂的其他非限制性实例包括聚氧乙烯化烷基酚(例如壬基酚、对十二烷基酚和二壬基酚)、聚氧乙烯化直链醇、聚氧乙烯化聚氧丙烯二醇、聚氧乙烯化硫醇、长链羧酸酯(例如天然脂肪酸、丙二醇、山梨糖醇的甘油酯和聚甘油酯、聚氧乙烯化山梨糖醇酯、聚氧乙烯二醇酯等)和烷醇胺(例如二乙醇胺-脂肪酸缩合物和异丙醇胺-脂肪酸缩合物)。在一些情况下,用于经由微流体系统建立单细胞测序文库的装置提供体积驱动的流,其中随时间注射恒定的体积。流体通道中的压力是注射速率和通道尺寸的函数。在一个实施方案中,所述装置提供油/表面活性剂入口、分析物入口、过滤器、mRNA捕获微珠和裂解试剂入口、连接入口的载体流体通道、阻流体、用于液滴夹止的收缩部、混合器和液滴出口。在一个实施方案中,本发明提供了用于经由微流体系统建立单细胞测序文库的设备,所述设备可包括:可包含过滤器和载体流体通道的油-表面活性剂入口,其中所述载体流体通道可还包含阻流体;可包含过滤器和载体流体通道的分析物入口,其中所述载体流体通道可还包含阻流体;可包含过滤器和载体流体通道的mRNA捕获微珠和裂解试剂入口,其中所述载体流体通道可还包含阻流体;所述载体流体通道具有在其中以可调节的或预定的流率流动的载体流体;其中各所述载体流体通道在接合点处合并;并且所述接合点连接至混合器,所述混合器包含液滴出口。因此,设想了用于经由微流体系统微流体流方案建立单细胞测序文库用于单细胞RNA-seq的设备。两个通道(一个承载细胞悬浮液,另一个承载带独特条形码的mRNA捕获珠粒、裂解缓冲液和文库制备试剂)在接合处相交且立即以一个细胞和一个珠粒/液滴的速率共包封在惰性载体油中。在各液滴中,使用珠粒的加条形码标签的寡核苷酸作为cDNA模板,各mRNA用独特的细胞特异性标识符加标签。本发明还涵盖小鼠和人类细胞混合物的Drop-Seq文库的用途。可以使载体流体流过出口通道,使得载体流体中的表面活性剂涂覆通道壁。可通过使全氟化聚醚DuPont Krytox 157FSL、FSM或FSH与氢氧化铵水溶液在挥发性氟化溶剂中反应来制备含氟表面活性剂。溶剂及残留的水和氨可以用旋转蒸发器除去。然后可以将表面活性剂溶解(例如2.5wt%)在氟化油(例如Fluorinert(3M))中,然后将其用作载体流体。激活样品流体贮存器以产生试剂液滴是基于经由按需功能的动态试剂递送的概念(例如组合条形码化)。如本文中所述,可以通过用于释放递送液滴至原始液滴的多种技术能力之一提供按需特征。
根据本公开和本文引用的本领域的文献和知识,开发流率、通道长度和通道几何形状在本领域技术人员的能力范围内;确定后,包含随机或指定试剂组合的液滴可以按需产生并与包含目标样品/细胞/底物的“反应室”液滴合并。通过将多个独特标签并入另外的液滴中并将标签接合至被设计成对于原始液滴具特异性的固体支持物上,可以编码和记录原始液滴所暴露的条件。举例来说,核酸标签可以依序连接以产生反映条件和条件顺序的序列。或者,标签可以独立地添加而附接至固体支持物。可以用于以生物信息学方式记录信息的动态标记系统的非限制性实例可以在2012年9月21日和2012年11月29日提交的题为“Compositions and Methods for Unique Labeling of Agents”的美国临时专利申请中找到。以这种方式,两个或更多个液滴可以暴露于多种不同的条件,其中每次液滴暴露于某一条件,将编码该条件的核酸添加至各自连接在一起的液滴或添加至与液滴缔合的独特固体支持物,使得即使随后组合具有不同历史的液滴,各液滴的条件仍能通过不同核酸保持为可得的。评估对暴露于多种条件的反应的方法的非限制性实例可以在2012年9月21日提交的美国临时专利申请和2015年4月17日提交的题为“Systems and Methods for DropletTagging”的美国临时专利申请15/303874中找到。因此,在本发明中或就本发明而言,可设想分子条形码(例如DNA寡核苷酸、荧光团等)的动态产生,其与各种目标化合物(siRNA、CRISPR指导RNA、试剂等)的受控递送无关或与之协同。举例来说,独特分子条形码可以在一个喷嘴阵列中产生,而单个化合物或化合物组合可以通过另一喷嘴阵列产生。然后可以将目标条形码/化合物与包含CRISPR检测系统的液滴合并。可以保持计算机日志文件形式的电子记录以将递送的条形码与递送的一种或多种下游试剂相关联。这一方法使得可能根据本文所述的方法有效地筛选大的细胞群体。所公开发明的装置和技术有助于以经济的方式进行需要单一细胞(或单一分子)水平的数据解析的研究的努力。将试剂高通量地且高分辨率地递送至可能包含靶分子样品的单个乳液液滴,以便通过使用在微流体芯片中作为油包水乳液逐一产生的单分散水性液滴进行进一步评估。
蛋白质检测
本文所公开的系统、装置和方法经由并入特异性构造的多肽检测适体可以适应于除核酸检测以外的多肽(或其他分子)的检测。多肽检测适体不同于上文所论述的掩蔽构建体适体。首先,适体被设计成特异性地结合至一种或多种靶分子。在一个示例性实施方案中,靶分子是靶多肽。在另一个示例性实施方案中,靶分子是靶化合物,诸如靶治疗性分子。设计和选择对给定靶标具有特异性的适体的方法(诸如SELEX)在本领域中是已知的。除了对给定靶标的特异性以外,适体被进一步设计成并入RNA聚合酶启动子结合位点。在某些示例性实施方案中,RNA聚合酶启动子是T7启动子。在将适体结合至靶标之前,RNA聚合酶位点对RNA聚合酶是不可及的或以其他方式不可识别。然而,适体被配置成使得在结合靶标后,适体的结构经历构象变化以便接着暴露RNA聚合酶启动子。在RNA聚合酶启动子下游的适体序列充当模板用于由RNA聚合酶产生触发RNA寡核苷酸。因此,适体的模板部分还可以并入识别给定适体及其靶标的条形码或其他识别序列。如上文所述的指导RNA然后可以被设计成识别这些特异性触发寡核苷酸序列。指导RNA结合至触发寡核苷酸会激活CRISPR效应蛋白,其继而使掩蔽构建体失活并且产生如本文所述的阳性可检测信号。
因此,在某些示例性实施方案中,本文所公开的方法包括另外的步骤:将样品或样品组分配到一组个别离散体积中,每一个别离散体积包含肽检测适体、CRISPR效应蛋白、一种或多种指导RNA、掩蔽构建体,以及在足以允许检测适体与一种或多种靶分子结合的条件下孵育样品或样品组,其中适体与相应靶标的结合导致RNA聚合酶启动子结合位点的暴露,使得通过RNA聚合酶与RNA聚合酶启动子结合位点的结合启动触发RNA的合成。
在另一个示例性实施方案中,在适体结合至靶多肽后,适体的结合可以暴露引物结合位点。举例来说,适体可以暴露RPA引物结合位点。因此,引物的添加或包括然后将送入扩增反应中,诸如上文所概述的RPA反应。
在某些示例性实施方案中,适体可以是构象转换适体,其在结合至目标靶标后可以改变二级结构并且暴露单链DNA的新区域。在某些示例性实施方案中,单链DNA的这些新区域可以用作接合的基底,延伸适体并产生可以使用本文所公开的实施方案特异性地检测的更长的ssDNA分子。适体设计可以与三元复合物进一步结合用于检测低表位靶标,诸如葡萄糖(Yang等人2015:http://pubs.acs.org/doi/abs/10.1021/acs.analchem.5b01634)。示例性构象转换适体和相应的指导RNA(crRNA)显示在下文中。
凝血酶适体 (SEQ.ID NO:12)
凝血酶连接探针 (SEQ.ID NO:13)
凝血酶RPA正向1引物 (SEQ.ID NO:14)
凝血酶RPA正向2引物 (SEQ.ID NO:15)
凝血酶RPA反向1引物 (SEQ.ID NO:16)
凝血酶crRNA 1 (SEQ.ID NO:17)
凝血酶crRNA 2 (SEQ.ID NO:18)
凝血酶crRNA 3 (SEQ.ID NO:19)
PTK7全长扩增子对照物 (SEQ.ID NO:20)
PTK7适体 (SEQ.ID NO:21)
PTK7连接探针 (SEQ.ID NO:22)
PTK7 RPA正向1引物 (SEQ.ID NO:23)
PTK7 RPA反向1引物 (SEQ.ID NO:24)
PTK7 crRNA 1 (SEQ.ID NO:25)
PTK7 crRNA 2 (SEQ.ID NO:26)
PTK7 crRNA 3 (SEQ.ID NO:27)
扩增
在某些示例性实施方案中,在激活CRISPR效应蛋白之前可以扩增靶RNA和/或DNA。在一些情况下,在形成包含靶分子的液滴组之前进行扩增。其他实施方案允许在形成包含靶分子的液滴组之后进行扩增,并且因此可以在包含靶分子的液滴中包括核酸扩增试剂。可以使用任何适合的RNA或DNA扩增技术。在某些示例性实施方案中,RNA或DNA扩增是等温扩增。在某些示例性实施方案中,等温扩增可以是基于核酸序列的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)或切口酶扩增反应(NEAR)。在某些示例性实施方案中,可以使用非等温扩增方法,包括但不限于PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)或分枝扩增方法(RAM)。在一些优选的实施方案中,RNA或DNA扩增是RPA或PCR。
在某些示例性实施方案中,RNA或DNA扩增是NASBA,其通过序列特异性反向引物对靶RNA的逆转录起始以建立RNA/DNA双链体。RNA酶H然后用于使RNA模板降解,从而允许含有启动子(诸如T7启动子)的正向引物结合互补链并起始互补链的延长,产生双链DNA产物。RNA聚合酶启动子介导的DNA模板转录然后建立靶RNA序列的拷贝。重要的是,新靶RNA中的每一个可以由指导RNA检测,由此进一步增强测定的灵敏度。靶RNA由指导RNA结合然后使得CRISPR效应蛋白激活并且方法如上文所概述继续进行。NASBA反应具有能够在适度等温条件下,例如在约41℃下继续进行的额外优点,使其适合于用于在实地和远离临床实验室的早期和直接检测而部署的系统和装置。
在某些其他示例性实施方案中,重组酶聚合酶扩增(RPA)反应可以用于扩增靶核酸。RPA反应采用能够使序列特异性引物与双链体DNA中的同源序列配对的重组酶。如果存在靶DNA,那么起始DNA扩增并且不需要其他样品操纵,诸如热循环或化学熔融。整个RPA扩增系统呈干燥的配方而稳定并且无需冷冻即可以安全地运输。RPA反应还可以在等温温度下进行,其中最佳反应温度为37℃-42℃。序列特异性引物被设计成扩增包含待检测的靶核酸序列的序列。在某些示例性实施方案中,将RNA聚合酶启动子(诸如T7启动子)添加至其中一个引物。这得到包含靶序列和RNA聚合酶启动子的扩增的双链DNA产物。在RPA反应之后或期间,添加RNA聚合酶,这将从双链DNA模板产生RNA。然后继而可以由CRISPR效应系统检测扩增的靶RNA。以这种方式,可以使用本文所公开的实施方案检测靶DNA。RPA反应还可以用于扩增靶RNA。首先使用逆转录酶使靶RNA转化为cDNA,接着第二链DNA合成,届时如上文所概述继续进行RPA反应。
因此,在某些示例性实施方案中,本文所公开的系统可以包括扩增试剂。本文描述了可用于核酸扩增的不同组分或试剂。举例来说,如本文所述的扩增试剂可以包括缓冲液,诸如Tris缓冲液。Tris缓冲液可以在适于所需应用或用途的任何浓度下使用,例如包括但不限于1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、25mM、50mM、75mM、1M等浓度。本领域技术人员将能够确定用于本发明的缓冲液(诸如Tris)的适当浓度。
为了改善核酸片段的扩增,可以在扩增反应(诸如PCR)中包括盐,诸如氯化镁(MgCl2)、氯化钾(KCl)或氯化钠(NaCl)。尽管盐浓度将取决于特定反应和应用,但在一些实施方案中,特定大小的核酸片段在特定盐浓度下可能产生最佳结果。较大产物可能需要改变的盐浓度,通常是较低的盐,以产生所需结果,而较小产物的扩增在较高盐浓度下可能产生较佳结果。本领域技术人员将了解,盐的存在和/或浓度以及盐浓度的改变可以改变生物或化学反应的严格度,并且因此可以使用为本发明和如本文所述的反应提供适当条件的任何盐。
生物或化学反应的其他组分可以包括细胞裂解组分以使细胞破开或溶解以供分析其中的物质。细胞裂解组分可以包括但不限于洗涤剂;如上所述的盐,诸如NaCl、KCl、硫酸铵[(NH4)2SO4];或其他。可以适于本发明的洗涤剂可以包括Triton X-100、十二烷基硫酸钠(SDS)、CHAPS(3-[(3-胆酰胺基丙基)二甲铵基]-1-丙磺酸盐)、乙基三甲基溴化铵、壬基苯氧基聚乙氧基乙醇(NP-40)。洗涤剂的浓度可以取决于特定应用,并且在一些情况下可以特定针对反应。扩增反应可以包括在适于本发明的任何浓度下使用的dNTP和核酸引物,诸如包括但不限于100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mM等浓度。同样地,根据本发明可用的聚合酶可以是本领域中已知并且可用于本发明的任何特定或一般聚合酶,包括Taq聚合酶、Q5聚合酶等。
在一些实施方案中,如本文所述的扩增试剂可以适用于热启动扩增中。热启动扩增在一些实施方案中可以有益于减少或消除衔接分子或寡核苷酸的二聚,或以其他方式防止不合需要的扩增产物或人造物并且获得所需产物的最佳扩增。本文所述的用于扩增中的许多组分也可以用于热启动扩增中。在一些实施方案中,视情况而定,适用于热启动扩增的试剂或组分可以替代组成组分中的一种或多种而使用。举例来说,可以使用在特定温度或其他反应条件下表现出所需活性的聚合酶或其他试剂。在一些实施方案中,可以使用经过设计或优化以用于热启动扩增中的试剂,例如,在转座之后或在达到特定温度之后可以使聚合酶激活。此类聚合酶可以是基于抗体或基于适体的。如本文所述的聚合酶在本领域中是已知的。此类试剂的实例可以包括但不限于热启动聚合酶、热启动dNTP和光笼化dNTP。此类试剂在本领域中是已知且可得的。本领域技术人员将能够确定适于个别试剂的最佳温度。
核酸扩增可以使用特定热循环机器或设备进行,并且可以在单个反应中或成批进行,以便可以同时进行任何所需数目的反应。在一些情况下,可以在液滴中或在液滴形成之前进行扩增。在一些实施方案中,扩增可以使用微流体或机器人装置进行,或可以使用温度的手动改变来进行以达成所需扩增。在一些实施方案中,可以进行优化以获得用于特定应用或材料的最佳反应条件。本领域技术人员将了解并且能够优化反应条件以获得足够的扩增。
在一些情况下,核酸扩增试剂包括重组酶聚合酶扩增(RPA)试剂、基于核酸序列的扩增(NASBA)试剂、环介导等温扩增(LAMP)试剂、链置换扩增(SDA)试剂、解旋酶依赖性扩增(HDA)试剂、切口酶扩增反应(NEAR)试剂、RT-PCR试剂、多重置换扩增(MDA)试剂、滚环扩增(RCA)试剂、连接酶链反应(LCR)试剂、分枝扩增法(RAM)试剂、基于转座酶的扩增试剂,或可编程CRISPR切口扩增(PCNA)试剂。
在某些实施方案中,使用本发明的方法或系统的DNA检测需要在检测之前将(扩增的)DNA转录成RNA。
显然,本发明的检测方法可以涉及核酸扩增和检测程序的各种组合。待检测的核酸可以是任何天然存在的或合成的核酸,包括但不限于DNA和RNA,核酸可以通过任何合适的方法来扩增以提供可以检测的中间产物。对中间产物的检测可以通过任何合适的方法来进行,所述方法包括但不限于结合并激活CRISPR蛋白,所述CRISPR蛋白通过直接或附带活性产生可检测信号部分。
可检测阳性信号的扩增和/或增强
在某些示例性实施方案中,可以引入进一步扩增可检测阳性信号的进一步修改。举例来说,激活的CRISPR效应蛋白附带激活可以用于产生二级靶标或另外的指导序列,或两者。在一个示例性实施方案中,反应溶液将包含以高浓度加标的二级靶标。二级靶标可不同于一级靶标(即,测定被设计用于检测的靶标),并且在某些情况下,在所有反应体积中可为共同的。举例来说,用于二级靶标的二级指导序列可以通过二级结构特征诸如带有RNA环的发夹加以保护,并且无法结合第二靶标或CRISPR效应蛋白。激活的CRISPR效应蛋白切割保护基(即,在与溶液中的一种或多种一级靶标形成复合物后激活),并在溶液中与游离CRISPR效应蛋白形成复合物,并从加标的第二靶标中激活。在某些其他示例性实施方案中,类似的概念用于二级靶序列的二级指导序列。二级靶序列可通过二级靶标上的结构特征或保护基团加以保护。从二级靶标上切割保护基团然后允许额外的CRISPR效应蛋白/二级指导序列/二级靶复合物形成。在另一个示例性实施方案中,所述一种或多种一级靶标对CRISPR效应蛋白的激活可用于切割受保护的或环化的引物,然后将所述引物释放以对编码二级指导序列、二级靶序列或两者进行等温扩增反应,诸如本文所公开的那些。对此扩增模板的后续转录将产生更多的二级指导序列和/或二级靶序列,随后进行额外的CRISPR效应蛋白附带激活。
方法
在一方面,本文所公开的实施方案涉及用于使用本文所述的系统检测样品中的靶核酸的方法。在一些实施方案中,本文所公开的方法可以包括以下步骤:产生第一组液滴,所述第一组液滴中的每个液滴包含至少一个靶分子和光学条形码;产生第二组液滴,所述第二组液滴中的每个液滴包含检测CRISPR系统,所述检测CRISPR系统包含靶向RNA的效应蛋白和一种或多种被设计成结合至相应靶分子的指导RNA、掩蔽构建体和光学条形码。通常通过混合或搅动所述第一组液滴和所述第二组液滴将所述第一组液滴和所述第二组液滴组合成液滴汇集物。然后可以使所述液滴汇集物流到微流体装置上,所述微流体装置包括微孔阵列和在微孔下方的至少一个流动通道,所述微孔的尺寸被设定成捕获至少两个液滴;检测在每个微孔中捕获的液滴的光学条形码;将在每个微孔中捕获的液滴合并以在每个微孔中形成合并液滴,所述合并液滴的至少一个子组包含检测CRISPR系统和靶序列;启动检测反应;以及在一个或多个时间段测量每个合并液滴的可检测信号。
液滴的产生
关于第一组液滴的产生,在一方面产生第一组液滴,每个第一液滴包含检测CRISPR系统,所述检测CRISPR系统可以包含靶向RNA的效应蛋白和一种或多种被设计成结合至相应靶分子的指导RNA、基于RNA的掩蔽构建体和如本文所述的光学条形码。在特定实施方案中,产生第二组液滴的步骤,第二组液滴中的每个液滴包含至少一个靶分子和如本文所提供的光学条形码。
在产生第一组液滴和第二组液滴之后,将第一组液滴和第二组液滴组合成液滴汇集物。可以通过任何手段来实现所述组合以组合第一组和第二组。在一个示例性实施方案中,将液滴组混合以组合成液滴汇集物。
一旦产生液滴汇集物,就执行使液滴汇集物流动的步骤。液滴汇集物的流动是通过将液滴加载到包含多个微孔的微流体装置上来执行的。微孔的尺寸被设定成捕获至少两个液滴。任选地,在加载之后,洗掉表面活性剂。
一旦将液滴加载到微孔阵列中,就执行检测在每个微孔中捕获的液滴的光学条形码的步骤。在一些情况下,当光学条形码为荧光条形码时,通过低倍率荧光扫描来检测光学条形码。无论何种光学条形码,每个液滴的条形码都是固独特的,因此可以识别每个液滴的内容物。将根据所利用的光学条形码的类型选择检测方式。然后合并每个微孔中包含的液滴。可以通过施加电场来执行合并。合并液滴的至少一个子组包含检测CRISPR系统和靶序列。
合并液滴之后,接着启动检测反应。在一些实施方案中,启动检测反应包括孵育合并液滴。在检测反应之后,对合并液滴进行光学测定(在一些情况下是低倍率荧光扫描)以产生测定评分。
在一些实施方案中,所述方法可以包括扩增靶分子的步骤。可以在产生第一组液滴之前或之后进行靶分子的扩增。
在另一方面,本文所公开的实施方案涉及一种用于检测多肽的方法。用于检测多肽的方法类似于上文所述用于检测靶核酸的方法。然而,还包括肽检测适体。肽检测适体如上文所述起作用,并且在与靶多肽结合后促进触发寡核苷酸的产生。指导RNA被设计成识别触发寡核苷酸,从而激活CRISPR效应蛋白。激活的CRISPR效应蛋白使掩蔽构建体失活导致可检测阳性信号的揭露、释放或产生。
利用报告构建体(例如荧光蛋白)的多重检测诊断可以快速检测靶序列,诊断药物抗性SNP,并辨别微生物种类的株系和亚型。在评估样品中是否存在微生物种类的一种或多种株系的情况下,例如,利用包含在第二组液滴中的CRISPR系统组评估来自样品的靶分子组,每个CRISPR系统包含不同的指导RNA。在组合第一组液滴和第二组液滴之后,快速并重复测试这些组合。将每个待测试的靶分子置于微板孔中。使用水和油输入通道形成包含待筛选的靶分子的单分散液滴。然后将靶分子液滴加载到微流体装置上。每个靶分子都标有条形码。当两个或更多个液滴合并时,组合的光学条形码可以识别合并液滴中存在哪个靶分子和/或CRISPR系统。条形码是用光学或荧光显微镜法观察的光学可检测条形码或芯片外检测的寡核苷酸条形码。
如本文所述,将包含指导RNA所靶向的靶分子的样品加载到一组液滴中并与包含指导RNA和CRISPR系统的一个或多个液滴合并。并入CRISPR系统液滴中的报告系统在掩蔽构建体中表达光学可检测标记物(例如荧光蛋白)。该组液滴包括CRISPR系统,所述CRISPR系统包含效应蛋白和一种或多种被设计成结合至相应靶分子的指导RNA,以及基于RNA的掩蔽构建体。液滴合并之后,可以通过光学扫描每个微孔以读取光学条形码来确定每个孔中分子种类的身份。报告系统的光学测量可以与条形码的光学扫描同时进行。因此,使用该组合筛选系统可以同时采集实验数据和分子种类识别。
在一些情况下,将微流体装置在成像之前孵育一段时间,并在多个时间点成像,以跟踪报告子测得量随时间的变化。另外,对于一些实验,将合并液滴从微流体装置上洗脱下来用于芯片外评估(参见例如国际公布号WO2016/149661,出于所有目的以引用方式整体并入本文,洗脱具体在[0056]-[0059]处论述)。
使用所公开的处理策略,并行处理数百万个液滴达到组合筛选所需要的规模。另外,液滴的纳升体积减少了筛选所需的化合物消耗。本公开在大的固定位置空间阵列中结合了光学条形码和液滴并行操纵以将液滴身份与测定结果联系起来。本发明系统的独特优势是在2nL测定体积中筛选的化合物的节约使用。本文的平台利用液滴微流体系统的高通量潜力,替代了构建化合物对组合所需的确定性液体处理操作,同时在微孔装置中并行合并随机液滴对。此方法的独特优势在于它可以在高通量下手动操作,并且微孔中的测定小型化使得可使用小样品量。当与SHEROCK技术相结合时,这些方法提供了可以利用较小样品量进行大规模多重复用的一种强大的检测技术。
本文的技术提供了一种处理平台,这种平台在三个步骤内测试输入化合物组的所有成对组合。首先,将靶分子与彩色条形码(两种、三种、四种或更多种荧光染料的独特比率)组合。可以依据靶分子的荧光染料(例如红色、绿色、蓝色等)的比率对靶分子进行条形码化。在样品处理之后,接着将靶分子乳化成油包水液滴,优选尺寸为约1纳升。在一些实施方案中,可以包括表面活性剂以稳定液滴。可以使用标准的多通道微量移液器技术将液滴组合成汇集物。制备的第二组液滴包含CRISPR系统、使用一定比率荧光染料的光学条形码和RNA掩蔽化合物。将第一组液滴和第二组液滴混合成大的汇集物,随后将液滴加载到微孔阵列中,使得每个微孔随机捕获两个液滴。在一些实施方案中,在加载之后接着将微孔阵列密封到玻璃基底上以限制微孔交叉污染和蒸发。在一些情况下,通过机械夹持将微孔阵列固定到组件上。由独特比率的两种、三种、四种或更多种荧光染料与识别的第一组液滴和第二组液滴预混合而成的荧光条形码编码每个液滴的内容物。
可以使用低倍率(2-4X)落射荧光显微镜来识别每个液滴和/或孔的内容物。然后将每个孔中的两个液滴合并,施加高压交流电场以诱导液滴合并。合并之后,启动SHERLOCK反应,将样品(在一些实施方案中)在37℃下孵育。随后,对阵列成像以确定光学表型(例如阳性荧光)并将该测量映射到先前在每个孔中识别的化合物对。特别优选的是在加载之后限制化合物交换的微孔阵列设计,一种示例性方式是在液滴加载之后机械密封微孔阵列。
在一方面,本文所述的实施方案涉及一种多重筛选一种或多种含核酸样本中的核酸序列变异的方法。核酸序列变异可以包括天然序列变异、基因表达变异、工程化遗传扰动或它们的组合。含核酸样本可以是细胞的或无细胞的。含核酸样本被制备为含有光学条形码的液滴。制备包含CRISPR检测系统和光学条形码的第二组液滴。在一些情况下,条形码可以是可通过光学或荧光显微镜法观察的光学可检测条形码。在某些示例性实施方案中,光学条形码包含具有来自一组限定颜色的可区分颜色的荧光团或量子点的子组。在一些情况下,可以将光学编码粒子随机递送至离散体积,从而在每个孔中产生光学编码粒子的随机组合,或者可以将光学编码粒子的独特组合特定地指派给每个离散体积。光学编码粒子的随机分布可以通过泵送、混合、摇动或搅动测定平台持续足以允许分布到所有离散体积的时间来实现。本领域普通技术人员可以基于所使用的测定平台选择合适的机制来将光学编码粒子随机分布在离散体积上。
然后可以使用光学编码粒子的可观察组合来识别每个离散体积。例如,可以使用荧光显微镜或其他成像装置对每个离散体积进行光学评估(诸如表型)并记录。如图13所示,使用不同水平的3种荧光染料(例如Alexa Fluor 555、594、647)可以产生105个条形码。可以添加第四种染料,并且可以扩展到数百个独特条形码;类似地,五种颜色可以增加独特条形码的数目,这可以通过改变颜色的比率来实现。
举例来说,可以将核酸功能化粒子合成到固体支持物上,随后用不同比率的染料(例如FAM、Cy3和Cy5)或3种荧光染料(例如Alexa Fluor 555、594、647)以不同水平标记,可以产生105个条形码。
在一个实施方案中,在每个液滴或离散体积中接收的荧光团的指派或随机子组决定了每个离散体积中光学编码离散粒子的可观察图谱,从而允许独立地识别每个离散体积。使用适当的成像技术对每个离散体积进行成像,以检测光学编码粒子。举例来说,如果光学编码粒子以荧光方式标记,则使用荧光显微镜对每个离散体积进行成像。在另一个实例中,如果光学编码粒子以比色方式标记,则使用具有一个或多个滤光器的显微镜对每个离散体积进行成像,所述一个或多个滤光器与每个颜色标签固有的波长或吸收光谱或发射光谱相匹配。设想了与所使用的光学系统相匹配的其他检测方法,例如本领域已知的用于检测量子点、染料等的检测方法。可以记录所观察到的每个离散体积的光学编码离散粒子的图谱以供以后使用。
此外,可以在合并液滴以及孵育CRISPR检测系统与靶分子之后进行光学评估。一旦靶分子由指导分子检测到,CRISPR效应蛋白被激活从而使掩蔽构建体失活,例如,通过切割掩蔽构建体以使得可检测阳性信号被揭露、释放或产生。可以在一个或多个时间段检测和测量每个合并液滴的可检测信号,当例如存在阳性可检测信号时指示靶分子的存在。
本发明的其他实施方案在以下编号的段落中描述。
1.一种用于开发针对病原体的探针和引物的方法,所述方法包括:
向一个或多个靶病原体提供输入基因组序列组;
向靶序列组应用组覆盖求解过程以鉴定一个或多个靶扩增序列,其中所述一个或多个靶扩增序列是所述靶病原体的所述输入基因组序列组之间共享的高度保守的靶序列;以及
基于所述一个或多个靶扩增序列产生一个或多个引物、一个或多个探针、或引物对和探针组合。
2.根据段落1所述的方法,其中所述输入基因组序列组代表来自10种或更多种病毒的组的基因组序列。
3.根据段落1所述的方法,其中以58℃至60℃的靶标解链温度鉴定所述引物组。
4.根据段落1所述的方法,其中鉴定推定扩增子。
5.根据段落3所述的方法,其中然后使所述一个或多个靶扩增序列经受诊断设计指导以产生一个或多个引物、一个或多个探针、或引物对和探针组合。
6.根据段落1所述的方法,其中所述输入基因组序列组代表来自两种或多种病毒病原体的基因组序列。
7.根据段落1所述的方法,其中所产生的一个或多个引物、一个或多个探针、或引物对和探针组合包含用于检测五种或更多种病毒的序列。
8.一种用于检测样品中的病毒的方法,所述方法包括:
使样品与引物对和具有可检测标签的探针接触,其中一个或多个引物和/或探针各自被配置成检测病毒种或亚种。
9.根据段落8所述的方法,其中一个或多个探针包含一种或多种被设计成结合至相应靶分子的指导RNA。
10.根据段落9所述的方法,其中所述一种或多种指导RNA被设计成检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。
11.根据段落8所述的方法,其中所述一种或多种指导RNA被设计成结合至一种或多种对疾病状态具诊断性的靶分子。
12.根据段落8所述的方法,其中所述一种或多种指导RNA被设计成区分一种或多种病毒株。
13.根据段落12所述的方法,其中所述一种或多种指导RNA包括至少90种指导RNA。
在以下实施例中进一步描述了本发明,这些实施例不限制权利要求中所描述的本发明的范围。
示例性方法
在示例性方法中,可以将化合物与独特比率的荧光染料混合。可以将靶分子与染料混合物的各混合物乳化成液滴。类似地,将具有光学条形码的各检测CRISPR系统乳化成液滴。在一些实施方案中,液滴各自为约1nL。然后可以将液滴组合并施加至微孔芯片。可以通过简单混合来组合液滴。在一个示例性实施方案中,将微孔芯片附加至诸如具有可移除间隔件的疏水性载玻片的平台上,可以通过夹具(例如钕磁体)从上方和下方夹持所述间隔件。可以将芯片和载玻片之间由间隔件形成的间隙加载油,并将液滴汇集物注入芯片中,通过注入更多的油并排出过量的液滴来继续使液滴流动。加载完成之后,可以用油清洗芯片以清除游离表面活性剂。可以移除间隔件以将微孔密封在载玻片上并闭合夹具。然后使用落射荧光显微镜将芯片成像,接着通过施加例如由电晕处理器提供的交流电场合并液滴以混合每个微孔中的化合物。在37℃下孵育微孔并使用落射荧光显微镜测量荧光。
关于引物的设计,可以利用以下用于病毒序列的示例性方法,利用在软件工具中实施的“诊断-指导物-设计”方法。就病毒序列而言,利用病毒序列比对输入,其目标是找到一组指导序列,所有序列都在某个指定的扩增子长度内,这些指导序列将检测到某一期望分数(例如95%)的可容忍指导物与靶标之间某一错配数目(通常为1)的输入序列。对于亚型分型(或任何差异化识别)至关重要的是,它设计了不同的指导物集合,确保每个集合特定于一个亚型。
目标是在此基础上使用诊断-指导物-设计(“d-g-d”)与其他工具同时设计扩增子引物和指导序列以进行物种识别:
组装必要的病毒基因组,在物种级别与mafft进行比对,对数据进行聚类以识别密切相关的物种。对分段病毒进行特殊处理;对每个区段都进行单独处理。最终,选择最好的区段(或两个)继续进行。
使用诊断-指导物-设计来确定推定的引物结合位点(25mer)。查找单一引物序列,覆盖率为95%,且容许错配不超过2个。
如果无法在某个位置/窗口达到此覆盖率,移至下一个位置,在识别primer3之前首先在整个基因组中执行此操作。
确定长度在80至120个核苷酸的扩增子的引物对。使用primer3缩小25mer以达到58-60C的靶标解链温度。
使用SEQUENCE_PRIMER_PAIR_OK_REGION_LIST指定推定扩增子的正向/反向引物位置。这样就可使用[fwd_start,fwd_length,rev_start,rev_length]格式输入引物可进入的区域。
优选地,可以在较低温度下,例如在50至55C下运行PCR。
如果引物的二级结构不良,则丢弃(PRIMER_MAX_SELF_ANY_TH,_PRIMER_PAIR_MAX_COMPL_ANY_TH,设定为40C)。这低于默认设置47C,但此处需要严格性以得到良好的引物。
使用聚类数据检查扩增子的交叉反应性。这可以使用primer3来完成,它允许引物应当避免的“错误引发文库”。可以在此处输入来自其他物种(但在同一簇中)的序列的列表。扩增子可能有独特的引物,但在crRNA水平上仍有重叠,这是确保测定极具特异性所必需的。
将这些扩增子传至d-g-d并尝试查找crRNA。
允许1个错配,就像之前所做的那样。
窗口大小是整个扩增子(与引物序列没有重叠)。
使用聚类数据进行差异化设计(可能只是检查扩增子与其他扩增子,因为未扩增的物质应该很少)。需要至少4个错配(不包括G-U对)。
列出crRNA少、覆盖率高且具有特异性的扩增子的列表。
现在,可准备单一“最佳”设计,但需要修改代码以允许例如白名单提供多个选项来测试每种病毒。
使用20uL反应在板中对寨卡病毒进行的SHERLOCK分析的相同寨卡病毒样品的灵敏度曲线与使用2nL反应在液滴中对寨卡病毒进行的SHERLOCK测定相同,表明液滴SHERLOCK(dSHERLOCK)检测限与板相当。(图3)。类似地,与板中测定相比,dSHERLOCK同等良好地辨别单核苷酸多态性(SNP)。
本文所公开的方法和系统可用于流感亚型的多重检测(图5)。值得注意的是,在芯片中产生检测混合物和靶标的所有组合所需的实验工作与仅在孔板中构建对角反应所需的工作相同,这允许将系统和方法应用于分析有大量组合。由于芯片会自动构建除对角之外的所有非对角组合,因此可以快速确定其预期产品的每种检测组合的选择性。指导RNA可以被设计成基于存放的序列靶向病毒的特定独特区段。在一些情况下,可以对设计进行加权以包括更近的序列数据或更普遍的序列。可以针对各种病毒亚型设计指导RNA组,如图6中针对流感H亚型所示,成功的结果提供了指导RNA与每个亚型的多数共有序列的对齐,具有0或1个错配。
当前系统和方法的其他示例性应用包括多重检测突变,包括检测TB(图11)和HIV逆转录酶中的药物抗性突变。指导RNA可以被设计成靶向祖先型或衍生型等位基因,测试显示使用衍生型等位基因和靶等位基因测试的潜力。(图10)。dSHERLOCK可以在30分钟内检测到荧光。(图11)。
在本文所公开的方法中结合SHERLOCK,使用微孔阵列芯片和液滴检测可以提供迄今为止最高的多路检测通量,条形码数量和芯片尺寸的扩展能够实现大规模多重化。(图12-14)。
***
在不脱离本发明的范围和精神的情况下,本发明所述的方法、药物组合物和药盒的各种修改和变型对于本领域技术人员而言是显而易见的。尽管已结合具体实施方案描述了本发明,但是应当理解,本发明能够进行进一步修改,并且所要求保护的本发明不应该不当地受到这些具体实施方案的限制。实际上,对于本领域技术人员而言显而易见的用于实施本发明的所述模式的各种变型旨在落入本发明的范围内。本申请旨在覆盖本发明的任何变型、用途或改型,这些变型、用途或改型总体遵循本发明的原理且包括在本发明所属领域内已知习惯性实践内的与本公开内容有所偏离的内容,并且可以在陈述之前应用于本文的基本特征。
Figure IDA0003161422220000011
Figure IDA0003161422220000021
Figure IDA0003161422220000031
Figure IDA0003161422220000041
Figure IDA0003161422220000051
Figure IDA0003161422220000061
Figure IDA0003161422220000071
Figure IDA0003161422220000081

Claims (13)

1.一种用于开发针对病原体的探针和引物的方法,所述方法包括:
向输入基因组序列组应用组覆盖求解过程以鉴定一个或多个靶扩增序列,其中所述一个或多个靶扩增序列是所述输入基因组序列组与靶病原体之间共享的高度保守的靶序列;以及
基于所述一个或多个靶扩增序列产生一个或多个引物、一个或多个探针、或引物对和探针组合。
2.如权利要求1所述的方法,其中所述输入基因组序列组代表来自10种或更多种病毒的组的基因组序列。
3.如权利要求1所述的方法,其中以58℃至60℃的靶标解链温度鉴定引物组。
4.如权利要求1所述的方法,其中鉴定推定扩增子。
5.如权利要求3所述的方法,其中然后使所述一个或多个靶扩增序列经受诊断设计指导以产生所述一个或多个引物、一个或多个探针、或引物对和探针组合。
6.如权利要求1所述的方法,其中所述输入基因组序列组代表来自两种或多种病毒病原体的基因组序列。
7.如权利要求1所述的方法,其中所产生的一个或多个引物、一个或多个探针、或引物对和探针组合包含用于检测五种或更多种病毒的序列。
8.一种用于检测样品中的病毒的方法,所述方法包括:
使样品与引物对和具有可检测标签的探针接触,其中一个或多个引物和/或探针各自被配置成检测病毒种或亚种。
9.如权利要求8所述的方法,其中一个或多个探针包含一种或多种被设计成结合至相应靶分子的指导RNA。
10.如权利要求9所述的方法,其中所述一种或多种指导RNA被设计成检测靶RNA或DNA中的单核苷酸多态性,或RNA转录物的剪接变体。
11.如权利要求8所述的方法,其中所述一种或多种指导RNA被设计成结合至一种或多种对疾病状态具诊断性的靶分子。
12.如权利要求8所述的方法,其中所述一种或多种指导RNA被设计成区分一种或多种病毒株。
13.如权利要求12所述的方法,其中所述一种或多种指导RNA包括至少90种指导RNA。
CN201980088945.4A 2018-11-14 2019-11-14 使用sherlock检测方法对高度进化的病毒变体进行多重化 Pending CN113302312A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862767076P 2018-11-14 2018-11-14
US62/767,076 2018-11-14
PCT/US2019/061574 WO2020102608A2 (en) 2018-11-14 2019-11-14 Multiplexing highly evolving viral variants with sherlock

Publications (1)

Publication Number Publication Date
CN113302312A true CN113302312A (zh) 2021-08-24

Family

ID=68916538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980088945.4A Pending CN113302312A (zh) 2018-11-14 2019-11-14 使用sherlock检测方法对高度进化的病毒变体进行多重化

Country Status (11)

Country Link
US (1) US20220002789A1 (zh)
EP (1) EP3880844A2 (zh)
JP (1) JP2022507573A (zh)
KR (1) KR20210104043A (zh)
CN (1) CN113302312A (zh)
AU (1) AU2019380590A1 (zh)
CA (1) CA3119971A1 (zh)
IL (1) IL283211A (zh)
MX (1) MX2021005702A (zh)
SG (1) SG11202105082SA (zh)
WO (1) WO2020102608A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113680406A (zh) * 2021-08-26 2021-11-23 清华大学 一种微流控芯片多指标检测方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112501256A (zh) * 2020-12-03 2021-03-16 台州市中心医院(台州学院附属医院) 一种CRSPR-cas13a驱动的基于双酶信号扩增策略的RNA快速检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017040316A1 (en) * 2015-08-28 2017-03-09 The Broad Institute, Inc. Sample analysis, presence determination of a target sequence
WO2018039643A1 (en) * 2016-08-26 2018-03-01 The Broad Institute, Inc. Nucleic acid amplification assays for detection of pathogens
WO2018170340A1 (en) * 2017-03-15 2018-09-20 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
US20180298445A1 (en) * 2017-03-15 2018-10-18 The Broad Institute, Inc. Crispr effector system based diagnostics
US20180305773A1 (en) * 2017-04-12 2018-10-25 The Broad Institute, Inc. Crispr effector system based diagnostics for malaria detection

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ504214A (en) 1997-10-24 2003-06-30 Invitrogen Corp Recombination cloning using nucleic acids having recombination sites
JP2006507921A (ja) 2002-06-28 2006-03-09 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 流体分散のための方法および装置
US7041481B2 (en) 2003-03-14 2006-05-09 The Regents Of The University Of California Chemical amplification based on fluid partitioning
CN1914823A (zh) 2004-01-27 2007-02-14 阿尔特维拉有限公司 诊断性无线射频识别传感器及其应用
WO2007081385A2 (en) 2006-01-11 2007-07-19 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
CA2640024A1 (en) 2006-01-27 2007-08-09 President And Fellows Of Harvard College Fluidic droplet coalescence
EP2530168B1 (en) 2006-05-11 2015-09-16 Raindance Technologies, Inc. Microfluidic Devices
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
JP5546112B2 (ja) 2008-07-07 2014-07-09 キヤノン株式会社 眼科撮像装置および眼科撮像方法
US8771985B2 (en) 2010-04-26 2014-07-08 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using zinc-finger nucleases
WO2012045012A2 (en) 2010-09-30 2012-04-05 Raindance Technologies, Inc. Sandwich assays in droplets
WO2014047556A1 (en) 2012-09-21 2014-03-27 The Broad Institute, Inc. Compositions and methods for long insert, paired end libraries of nucleic acids in emulsion droplets
WO2014047561A1 (en) 2012-09-21 2014-03-27 The Broad Institute Inc. Compositions and methods for labeling of agents
IL239317B (en) 2012-12-12 2022-07-01 Broad Inst Inc Providing, engineering and optimizing systems, methods and compositions for sequence manipulation and therapeutic applications
WO2014143158A1 (en) 2013-03-13 2014-09-18 The Broad Institute, Inc. Compositions and methods for labeling of agents
EP3271713B1 (en) 2015-03-18 2021-05-05 The Broad Institute, Inc. Massively parallel on-chip coalescence of microemulsions
CA3028158A1 (en) 2016-06-17 2017-12-21 The Broad Institute, Inc. Type vi crispr orthologs and systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017040316A1 (en) * 2015-08-28 2017-03-09 The Broad Institute, Inc. Sample analysis, presence determination of a target sequence
WO2018039643A1 (en) * 2016-08-26 2018-03-01 The Broad Institute, Inc. Nucleic acid amplification assays for detection of pathogens
WO2018170340A1 (en) * 2017-03-15 2018-09-20 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
US20180298445A1 (en) * 2017-03-15 2018-10-18 The Broad Institute, Inc. Crispr effector system based diagnostics
US20180305773A1 (en) * 2017-04-12 2018-10-25 The Broad Institute, Inc. Crispr effector system based diagnostics for malaria detection

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JORGE DUITAMA等: "Primer Hunter: a primer design tool for PCR-based virus subtype identification", NUCLEIC ACIDS RESEARCH ADVANCE ACCESS, vol. 37, no. 8, pages 2483 - 2492, XP055667397, DOI: 10.1093/nar/gkp073 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113680406A (zh) * 2021-08-26 2021-11-23 清华大学 一种微流控芯片多指标检测方法
CN113680406B (zh) * 2021-08-26 2022-04-15 清华大学 一种微流控芯片多指标检测方法

Also Published As

Publication number Publication date
MX2021005702A (es) 2021-09-21
KR20210104043A (ko) 2021-08-24
WO2020102608A3 (en) 2020-07-30
CA3119971A1 (en) 2020-05-22
AU2019380590A2 (en) 2021-07-08
JP2022507573A (ja) 2022-01-18
EP3880844A2 (en) 2021-09-22
AU2019380590A1 (en) 2021-07-01
US20220002789A1 (en) 2022-01-06
SG11202105082SA (en) 2021-06-29
WO2020102608A2 (en) 2020-05-22
IL283211A (en) 2021-06-30

Similar Documents

Publication Publication Date Title
CN113474456A (zh) 基于crispr系统的液滴诊断系统和方法
US20220119871A1 (en) In-situ spatial transcriptomics
AU2016348439B2 (en) Combinatorial sets of nucleic acid barcodes for analysis of nucleic acids associated with single cells
CN111448311A (zh) 基于多效应子crispr的诊断系统
CN111836903A (zh) 基于crispr效应系统的多重诊断
CN112020562A (zh) 基于crispr效应系统的诊断
WO2018172726A1 (en) Single cell dna sequencing
CN112543812A (zh) 基于crispr效应系统的扩增方法、系统和诊断
US20220228150A1 (en) Crispr system high throughput diagnostic systems and methods
Plongthongkum et al. Scalable dual-omics profiling with single-nucleus chromatin accessibility and mRNA expression sequencing 2 (SNARE-seq2)
US20160326513A1 (en) Systems and methods for isolating nucleic acids from cellular samples
CN112639121A (zh) 基于crispr双切口酶的扩增组合物、系统和方法
WO2021046257A1 (en) Crispr effector system based multiplex cancer diagnostics
JP2021000138A (ja) 診断方法及び組成物
CN113302312A (zh) 使用sherlock检测方法对高度进化的病毒变体进行多重化
CN111295443A (zh) 基于转座酶的基因组分析
US20210396756A1 (en) Crispr effector system based diagnostics for hemorrhagic fever detection
US20220243264A1 (en) Systems and methods for amplifying rna
US20220042097A1 (en) In-situ spatial transcriptomics and proteomics
Wang Droplet microfluidics for high-throughput single-cell analysis
Matson Preparation of Vibrio cholerae Samples for RNA-seq Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination