CN109641026A - 用于检测靶rna的方法和组合物 - Google Patents

用于检测靶rna的方法和组合物 Download PDF

Info

Publication number
CN109641026A
CN109641026A CN201780048641.6A CN201780048641A CN109641026A CN 109641026 A CN109641026 A CN 109641026A CN 201780048641 A CN201780048641 A CN 201780048641A CN 109641026 A CN109641026 A CN 109641026A
Authority
CN
China
Prior art keywords
amino acid
acid sequence
rna
albumen
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780048641.6A
Other languages
English (en)
Other versions
CN109641026B (zh
Inventor
J·A·多德纳
M·R·奥康奈尔
A·伊斯特-塞莱茨基
S·C·奈特
J·H·多德纳凯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Priority to CN202211656487.XA priority Critical patent/CN116287127A/zh
Publication of CN109641026A publication Critical patent/CN109641026A/zh
Application granted granted Critical
Publication of CN109641026B publication Critical patent/CN109641026B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/24Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a MBP (maltose binding protein)-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/307Single strand endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • C12Q2565/1015Interaction between at least two labels labels being on the same oligonucleotide
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Abstract

本公开提供了用于检测单链靶RNA的方法。本公开提供了将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法。本公开提供了用于检测样品中的靶RNA的试剂盒。

Description

用于检测靶RNA的方法和组合物
交叉引用
本申请要求2016年6月16日提交的美国临时专利申请号62/351,172、2016年8月22日提交的美国临时专利申请号62/378,156和2017年3月23日提交的美国专利申请号15/467,922的权益,这些申请以引用方式整体并入本文。
关于联邦政府资助的研究或开发的声明
本发明是在国家科学基金会(National Science Foundation)授予的1244557号在政府支持下完成的。政府对本发明享有一定权利。通过引用并入作为文本文件提供的序列表
序列表在此提供为在2017年3月21日创建且大小为67KB的文本文件“BERK-337WO_SeqList_ST25.txt”。该文本文件的内容以引用方式整体并入本文。
导言
细菌适应性免疫系统采用CRISPR(成簇规律间隔短回文重复序列)和CRISPR相关(Cas)蛋白进行RNA指导的核酸切割。虽然III型和VI型CRISPR系统通常靶向DNA底物,但是指导针对单链RNA(ssRNA)底物的干扰复合物。在VI型CRISPR系统中,单亚基C2c2蛋白作为RNA指导的RNA内切核酸酶起作用。
CRISPR-Cas系统通过RNA指导的核酸干扰而赋予细菌和古细菌中的适应性免疫。在多种CRISPR类型中,仅相对罕见的VI型CRISPR系统被认为仅靶向单链RNA底物,这是由大效应蛋白C2c2赋予的活性。VI型操纵子共享其它CRISPR-Cas基因组基因座的共同特征,包括充当短病毒DNA区段的储库的CRISPR序列阵列。为了提供抗病毒免疫,将经处理的CRISPR阵列转录物(crRNA)与含Cas蛋白的监督复合物组装,所述监督复合物识别与crRNA的病毒来源区段(称为间隔区)具有序列互补性的核酸。
免疫监督的第一步需要将由侧接病毒间隔区序列的重复序列组成的前体crRNA(pre-crRNA)加工成单独功能性crRNA,每个所述crRNA含有单个病毒来源的序列片段。CRISPR系统采用多种机制产生成熟的crRNA,包括使用专用的内切核酸酶(例如,I型和III型系统中的Cas6或Cas5d)、宿主内切核酸酶(例如,RNA酶III)与反式激活crRNA(tracrRNA,II型系统)的偶联、或效应器酶(例如,来自V型系统的Cpf1)本身内源的核糖核酸酶活性。
发明内容
本公开提供了用于检测单链靶RNA的方法。本公开提供了将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法。本公开提供了用于检测样品中的靶RNA的试剂盒。
提供了用于检测单链靶RNA的组合物和方法,其中所述方法包括(i)使具有多种RNA的样品与(a)C2c2指导RNA和(b)C2c2蛋白接触,所述C2c2指导RNA与单链靶RNA杂交,所述C2c2蛋白切割样品RNA;以及(ii)测量由切割产生的可检测信号。一旦主题C2c2蛋白由C2c2指导RNA激活,C2c2蛋白就变成切割样品RNA的内切核糖核酸酶,所述主题C2c2蛋白的激活是当样品包括指导RNA杂交的单链靶RNA(即,样品包括所靶向的单链靶RNA)时发生的。因此,当所靶向的单链靶RNA存在于样品中(例如,在一些情况下高于某一阈值量)时,结果是样品中RNA的切割,该切割可以使用任何合宜的检测方法检测(例如,使用经标记的检测RNA)。
在一些情况下,可以通过使用前体C2c2指导RNA阵列来提供两个或更多个C2c2指导RNA,所述前体C2c2指导RNA阵列可以由C2c2蛋白切割成单独的指导RNA,并且这与C2c2蛋白是否具有完整的HEPN1结构域和/或HEPN2结构域无关。因此,还提供了将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法。在一些情况下,C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。
附图说明
图1A至图1E示出了与内源C2c2基因座相关的示意图和证明重组C2c2蛋白的异源表达和纯化的实验。
图2描绘了使用C2c2蛋白执行的切割测定的结果。
图3描绘了显示C2c2强烈切割单链RNA的结果。
图4A至图4B示出了使用C2c2蛋白的各种切割测定的图和结果。
图5描绘了使用经标记的检测RNA(使用猝灭剂/荧光剂对)执行的检测由C2c2蛋白进行的RNA切割的实验的结果。
图6描绘了证明由C2c2蛋白进行pre-crRNA加工的实验的结果。
图7A至图7B描绘了示例性C2c2指导RNA的示意图和序列。
图8A至图8F提供了各种C2c2多肽的氨基酸序列。
图9A至图9C描绘了对前体crRNA转录物进行C2c2家族加工以产生成熟的crRNA。
图10A至图10C描绘了CRISPR重复序列的结构和序列对LbuC2c2介导的crRNA生物发生的影响。
图11A至图11C描绘了LbuC2c2对顺式和反式靶的指导依赖性ssRNA降解。
图12A至图12D描绘了LbuC2c2的两种不同的核糖核酸酶活性。
图13A至图13D描绘了C2c2介导的对复杂混合物中转录物的灵敏目视检测。
图14提供了表2:在实施例8-12中描述且在图12A至图12D中示出的研究中使用的各种DNA底物。
图15提供了表3:实施例8-12中描述的研究中使用的各种RNA底物。
图16A至图16F描绘了数据,所述数据显示由C2c2进行的pre-crRNA加工是不依赖于间隔区序列的,可以在串联crRNA阵列上发生,受pre-cRNA的5'和/或3'侧翼区域中的突变影响,并且是不依赖于金属的。
图17提供了pre-crRNA双突变对pre-crRNA加工活性的影响的总结。
图18A至图18B描绘了LbuC2c2 ssRNA靶切割位点映射。
图19A至图19C描绘了crRNA间隔区长度、反应温度和crRNA的5'末端序列对靶RNA切割效率的依赖性。
图20A至图20C描绘了LbuC2c2与成熟crRNA和靶ssRNA的结合数据。
图21描绘了RNA酶检测测定λ2-ssRNA的时间进程。
图22A至图22B描绘了C2c2家族和C2c2比对的系统发生树。
图23A至图23D描绘了C2c2的纯化和生产。
图24A至图24C描绘了数据,所述数据显示C2c2蛋白加工前体crRNA转录物以产生成熟crRNA。a.C2c2蛋白的最大似然系统发生树。本研究中使用的同系物以黄色突出显示。b.本研究中使用的三种VI型CRISPR基因座的图。黑色矩形表示重复元件,黄色菱形表示间隔区序列。Cas1和Cas2仅存在于LshC2c2附近的基因组中。c.C2c2介导的对来源于LbuC2c2、LseC2c2和LshC2c2 CRISPR重复序列基因座的pre-crRNA的切割。OH:碱水解梯带;T1:RNA酶T1水解梯带;用100nM的C2c2和小于1nM的pre-crRNA执行加工切割反应。右侧描绘了切割的示意图,并且下方示出了所预测的pre-crRNA二级结构,其中箭头指示了所映射(mapped)的C2c2切割位点。
图25A至图25C描绘了数据,所述数据显示LbuC2c2介导的crRNA生物发生取决于CRISPR重复序列的结构和序列。a.由LbuC2c2进行的对含有发夹的茎区和环区内的结构突变的pre-crRNA的代表性切割测定。下面列出的加工百分比是在60分钟处定量的(平均值±标准差,n=3)。b.条形图显示pre-crRNA加工对CRISPR重复序列的依赖性。野生型重复序列如下方所示,其中单独的条代表以红色标示的串联核苷酸突变。切割位点用卡通剪刀指示。在60分钟后测量加工百分比(平均值±标准差,n=3)。所描绘的测试突变体的发夹可以在扩展数据图3至4中找到。c.通过加入10-50mM的EDTA和EGTA以实现标准反应条件来测试crRNA加工反应的二价金属离子依赖性。
图26A至图26D描绘了数据,所述数据显示LbuC2c2含有两种不同的核糖核酸酶活性。a.在37℃下由LbuC2c2执行的顺式ssRNA靶(黑色)和pre-crRNA(青色)切割的定量时间过程数据。指数拟合示出为实线(n=3),并且所计算的伪一级速率常数(pseudo-first-order rate constant)(kobs)(平均值±标准差)对于顺式ssRNA靶切割和pre-crRNA切割分别为9.74±1.15分钟-1和0.12±0.02分钟-1。b.LbuC2c2架构描绘了HEPN基序和加工缺陷型点突变体的位置。c、d.LbuC2c2突变体针对c中的pre-crRNA加工和d中的ssRNA靶向的核糖核酸酶活性,并且扩展数据为图6d。
图27A至图27E示出,C2c2提供了对复杂混合物中转录物的灵敏检测。a.使用猝灭的荧光RNA报告物进行的LbuC2c2 RNA检测方法的示意图。b.在存在人总RNA的情况下下,由LbuC2c2针对不同浓度的靶RNA在30分钟后产生的荧光信号的定量。RNA酶A示出为阳性RNA降解对照。(平均值±标准差,n=3)。c.对于不同量的人总RNA或细菌总RNA,由负载有β-肌动蛋白靶向crRNA的LbuC2c2在3h后产生的荧光信号的定量(作为β-肌动蛋白空阴性对照)。(平均值±标准差,n=3)。d.串联pre-crRNA加工也使得能够进行RNA检测。(平均值±标准差,n=3)。e.VI型CRISPR途径的模型突出显示了C2c2的核糖核酸酶活性。
图28A至图28B描绘了C2c2家族和C2c2比对的完整系统发生树。a.C2c2蛋白的最大似然系统发生重建。叶包括GI蛋白数和来源生物;100个重新取样中的自展支持值被呈现用于内部分割。标尺是每个位点的取代。b.所分析的三种C2c2同系物的多重序列比对;坐标基于LbuC2c2。
图29A至图29D描绘了与C2c2的纯化和生产有关的数据。所有C2c2同系物在大肠杆菌(E.coli)中表达为His-MBP融合物,并通过亲和性、离子交换和尺寸排阻色谱的组合进行纯化。通过与TEV蛋白酶一起孵育去除Ni+亲和标签。色谱级分的代表性SDS-PAGE凝胶示出在(a、b)中。c.来自Superdex 200(16/60)柱的色谱图,表明C2c2作为单峰洗脱,缺乏核酸。d.对本稿图中使用的纯化蛋白的SDS PAGE分析。
图30A至图30I描绘了在体外和体内通过C2c2进行的pre-crRNA加工的映射。a.单个同源pre-crRNA阵列的LseC2c2和LshCc2c2切割的切割位点映射。OH:碱水解梯带;T1:T1RNA酶水解梯带。用100nM的C2c2和小于1nM的pre-crRNA进行切割反应。b-i.对来自Shmakov等人10的LshC2c2(b-f)和LseC2c2(g-i)CRISPR阵列RNA测序实验的再分析(分别为图S7和图5)。使用Bowtie2(参见方法)将所有读段(b、g)和经过滤的读段(55nt或更少;根据原始Shmakov等人的分析;c、h)与每个CRISPR阵列进行严格比对。示出了Lsh(d-f)和Lse(i)的单独CRISPR重复序列间隔区的详细视图。5'末端pre-crRNA加工的差异由每个序列下方的箭头指示。可以使用分析的BAM比对文件。该映射清楚地表明,从Lsh pre-crRNA产生的小RNA测序读段的5'末端映射到距所预测的发夹的碱基2nt的位置,这与体外加工数据(a)一致。这种模式适用于从在沙氏纤毛菌(L.shahii)中的天然表达和在大肠杆菌中的异源表达两者检测到的所有成熟crRNA。不幸的是,LseC2c2crRNA测序数据(用于g-i中)由于较低的读段深度而具有较少信息,并且每个比对的crRNA表现出略微不同的5'末端,几乎没有明显的均一性。经加工的重复序列中的一个重复序列(重复序列间隔区2;i)的映射与数据一致,但由于读段深度不足而仅具有低置信度。
图31A至图31D描绘了由C2c2进行的pre-crRNA加工是与间隔区序列无关的,可以在串联crRNA阵列上发生,受pre-cRNA的5'侧翼区域中的突变影响并且产生3'磷酸酯产物。a.串联pre-crRNA阵列的LbuCc2c2切割的切割位点映射。OH:碱水解梯带;T1:T1RNA酶水解梯带。用100nM的LbuC2c2和小于1nM的pre-crRNA进行切割反应。右侧描绘了切割产物的示意图,其中箭头指示了映射的C2c2切割产物。b.LbuC2c2 4聚突变体的pre-crRNA加工数据,表明5'单链侧翼区域对于有效的pre-crRNA加工的重要性。在60分钟后测量pre-crRNA加工的百分比(平均值±标准差,n=3)。c.代表性的LbuC2c2pre-crRNA切割时间过程,表明相似的pre-crRNA加工速率与crRNA间隔区序列无关地发生,间隔区A和间隔区λ2的伪一级速率常数(kobs)(平均值±标准差)分别为0.07±0.04分钟-1和0.08±0.04分钟-1。d.通过T4多核苷酸激酶(PNK)处理对经切割的RNA进行的端基分析。使用标准加工测定条件产生切割产物,然后将所述切割产物与PNK一起孵育1小时以去除任何2',3'-环状磷酸酯/3'-单磷酸酯。条带的延迟迁移指示从放射性标记的5'产物的3'末端去除了带电荷的单磷酸酯。
图32A至图32C示出LbuC2c2催化顺式和反式靶的指导依赖性ssRNA降解。a.两种C2c2指导依赖性ssRNA降解模式的示意图。b.由LbuC2c2切割两种不同的放射性标记的ssRNA底物A和B。在37℃预形成100nM的C2c2与50nM的crRNA的复合物,并在25℃下加入小于1nM的5'-标记的靶RNA时开始反应。反式切割反应包含等摩尔(小于1nM)浓度的放射性标记的非指导互补底物和未标记的在靶ssRNA。对于多种ssRNA底物,观察到LbuC2c2仅在与互补crRNA结合时催化有效切割,表明LbuC2c2:crRNA以RNA指导的方式切割ssRNA。此活性在下文中称为在靶切割或顺式靶切割。LbuC2c2介导的顺式切割导致多种产物的梯化,其中切割优先在尿嘧啶残基之前发生,类似于LshC2c29。在存在未标记的在靶(与crRNA互补的)ssRNA的情况下重复非靶切割反应。与顺式执行的非靶切割实验不同,观察到了非靶RNA的反式快速降解。对于顺式在靶切割和反式非靶切割观察到相似的RNA切割速率和几乎相同的切割产物暗示两种活性中的相同核酸酶中心。c.在存在25mM EDTA的情况下,测试负载有crRNA靶向间隔区A的LbuC2c2在顺式(靶A经标记)和反式(在存在未标记的靶A的情况下,靶B经标记)切割条件下的切割活性。
图33A至图33B示出了LbuC2c2 ssRNA靶切割位点映射。a.按照方法进行的ssRNA靶切割测定,证明LbuC2c2介导对具有相同的间隔区互补序列但不同的5'侧翼序列(具有不同长度和核苷酸组成)的若干个放射性标记的ssRNA底物的‘顺式’切割。ssRNA底物的序列示出在右侧,其中crRNA-A的间隔区互补序列以黄色突出显示。箭头指示检测到的切割位点。为了清楚起见而裁剪了凝胶。应当注意的是,在不同底物上产生的切割产物的模式(例如A.1对比A.2对比A.3)表明,切割位点选择主要由尿嘧啶偏好性驱动,并且表现为在crRNA互补靶序列内明显缺乏排他性切割机制,这与关于其它II类CRISPR单效应复合物(诸如Cas9和Cpf1)11,21观察到的相反。有趣的是,针对底物A.0观察到的切割模式提示了对polyG序列的次要偏好性。b.按照方法,使用一系列覆盖ssRNA靶的长度的crRNA进行的LbuC2c2 ssRNA靶切割测定。在该实验中使用的ssRNA底物的序列示出在凝胶下方,其中每个crRNA的间隔区互补序列以黄色突出显示。箭头指示所预测的切割位点。在每组泳道上方的小图指示间隔区序列沿着靶(黄色框)的位置以及观察到(红色箭头)或不存在(黑色箭头)切割产物。同样地,应当注意的是,对于每种crRNA,切割产物长度分布是非常相似的,再次表明在crRNA结合序列内明显缺乏排他性切割。在反应的子集中不存在几种切割产物可能是由于ssRNA靶上存在结合的C2c2:crRNA,这可以通过任何顺式(分子内)或反式(分子间)LbuC2c2活性位点在空间上阻断对尿嘧啶的接取。虽然对LbuC2c2的原型间隔区侧翼位点(PFS)偏好性的适当分析超出了本研究的范围,但观察到了3'侧翼核苷酸的最小影响。预期的PFS碱基在所测试的每个指导序列旁边的图表中以红色标示。
图34A至图34D描绘了RNA靶向对crRNA变异、温度和点突变的依赖性。a.按照方法进行的LbuC2c2 ssRNA靶切割测定,其中crRNA具有16nt、20nt或24nt的间隔区。b.按照方法在25℃和37℃处进行的LbuC2c2 ssRNA靶切割时间过程。c.按照方法进行的LbuC2c2 ssRNA靶切割时间过程,其中crRNA具有不同的5'端侧翼核苷酸突变。突变以红色突出显示。1-2个核苷酸的5'延伸可忽略不计地影响切割效率。相比之下,将侧翼区域缩短至3nt会减慢切割速率。d.点突变对C2c2在用于ssRNA靶向的HEPN基序内的保守残基突变体中的核糖核酸酶活性的影响。
图35A至图35D描绘了LbuC2c2与成熟crRNA和靶ssRNA的结合数据。a.如在方法中所描述地进行过滤结合测定以确定成熟crRNA-A_GG与LbuC2c2-WT、LbuC2c2-dHEPN1、LbuC2c2-dHEPN2或LbuC2c2-dHEPN1/dHEPN2的结合亲和力。将定量的数据与标准结合等温线拟合。误差条代表三次独立实验的标准偏差。从三个独立实验测量的解离常数(平均值±标准偏差)为27.1±7.5nM(LbuC2c2-WT)、15.2±3.2nM(LbuC2c2-dHEPN1)、11.5±2.5nM(LbuC2c2-dHEPN2)和43.3±11.5nM(LbuC2c2-dHEPN1/dHEPN2)。b.如所示,关于LbuC2c2-dHEPN1/dHEPN2:crRNA-A_GG与‘在靶’A ssRNA或‘脱靶’B ssRNA之间的结合反应的代表性电泳迁移率变动测定。如方法中所述进行三次独立实验。为了清楚起见而裁剪了凝胶。c.将来自(b)的定量结合数据与标准结合同种型拟合。误差条代表三次独立实验的标准偏差。从三个独立实验测量的解离常数(平均值±标准偏差)对于ssRNA A为1.62±0.43nM并且对于ssRNA B为未检测到的(>>10nM)。d.如在方法中所描述地进行过滤结合测定以确定成熟crRNA-A_GA与LbuC2c2-WT和LbuC2c2-R1079A的结合亲和力。将定量的数据与标准结合等温线拟合。误差条代表三次独立实验的标准偏差。从三个独立实验测量的解离常数(平均值±标准偏差)为4.65±0.6nM(LbuC2c2-WT)和2.52±0.5nM(LbuC2c2-R1079A)。应当注意的是,这些结合亲和力与图a不同。这种差异被解释为在指导序列的5'端序列方面略有不同,其中图a中的指导序列以5`-GGCCA……开始并且图d中的指导序列以5`-GACCA开始。虽然天然指导序列(5`-GACCA)与LbuC2c2更紧密地结合,但是在这些指导序列变体的RNA靶向效率方面没有看到差异(扩展数据图6c)。
图36A至图36B描绘了λ2-ssRNA的RNA酶检测测定的时间过程。a.在存在不断增加量的λ2ssRNA(0-1nM)的情况下,将LbuC2c2:crRNA-λ2与RNA酶-Alert底物(Thermo-Fisher))和100ng HeLa总RNA在37℃孵育120分钟。每5分钟进行荧光测量。1nM的λ2 ssRNA反应在可以测量第一时间点之前达到饱和。误差条代表三次独立实验的标准偏差。b.在存在或不存在在靶激活λ4ssRNA的情况下,将LbuC2c2:crRNA-λ4或apo LbuC2c2在HeLa总RNA中孵育2小时。按照方法在Bioanalyzer 2100中的小RNA芯片上解析背景小RNA的降解。在apo LbuC2c2和LbuC2c2:crRNA-λ4之间的片段谱中观察到了小差异。相比之下,在向反应中加入在靶ssRNA时,tRNA峰的急剧变宽和移位揭示了在激活LbuC2c2反式活性时反应中存在的其它结构化和非结构化RNA的广泛降解。
图37描绘了切割实验,所述切割实验证明当蛋白在选自R1079(例如,R1079A)、R1072(例如,R1072A)和K1082(例如,K1082A)的任何氨基酸位置处包括突变时,LbuC2c2对前体指导RNA的切割(指导RNA加工)严重减少。
图38A至图38C描绘了Cas13a家族内pre-crRNA加工的保守性。
图39A至图39C描绘了Cas13a同系物的CRISPR基因座和crRNA重复序列架构。
图40A至图40F描绘了对由LbuCas13a进行的pre-crRNA切割重要的残基。
图41A至图41B描绘了Cas13a家族成员的螺旋1结构域和HEPN结构域的比对。
图42A至图42D描绘了Cas13a家族成员对ssRNA的效率。
图43A至图43D描绘了由Cas13a同系物进行的反式ssRNA切割。
图44A至图44F描绘了Cas13a家族内的crRNA可交换性。
图45A至图45C描绘了用于RNA检测的正交Cas13a亚家族的功能验证。
图46A至图46D描绘了野生型(WT)LbuCas13a和LbuCas13a R1079A/K1080A双重突变体进行的crRNA阵列加工。
图47A至图47C描绘了在pre-crRNA加工所涉及的区域中由LbuCas13a点突变体进行的反式切割。
图48A至图48B描绘了LbuCas13a R1079A/K1080A双重突变体相对于野生型LbuCas13a的特征。
图49提供表4。
图50提供表5。
图51提供表6。
图52提供表7。
图53提供表8。
图54提供表9。
图55A至图55B呈现VI-A型CRISPR系统功能的模型。
图56A至图56K提供各种Cas13a多肽的氨基酸序列。
图57提供各种Cas13a多肽的氨基酸序列的比对。
定义
本文可互换使用的术语“多核苷酸”和“核酸”是指任何长度的核苷酸的聚合形式,为核糖核苷酸或脱氧核糖核苷酸。因此,术语“多核苷酸”和“核酸”涵盖单链DNA;双链DNA;多链DNA;单链RNA;双链RNA;多链RNA;基因组DNA;cDNA;DNA-RNA杂交体;以及这样的聚合物,所述聚合物包含嘌呤碱基和嘧啶碱基或其它天然、经化学或生物化学修饰的、非天然的或衍生的核苷酸碱基。
术语“寡核苷酸”是指3与100个核苷酸之间的单链或双链核酸(例如,DNA、RNA或经修饰的核酸)的多核苷酸。然而,出于本公开的目的,寡核苷酸的长度没有上限。寡核苷酸也称为“寡聚体”或“寡聚物”,并且可以从基因中分离、(体外和/或体内地)转录,或化学合成。术语“多核苷酸”和“核酸”应理解为包括适用于所描述的实施方案的单链(诸如有义或反义)和双链多核苷酸。
“可杂交的”或“互补的”或“基本上互补的”是指核酸(例如RNA、DNA)包含这样的核苷酸序列,所述核苷酸序列使所述核酸能够在适当的体外和/或体内温度和溶液离子强度条件下,与另一核酸以序列特异性、反向平行方式(即,核酸特异性结合互补核酸)非共价结合(即,形成Watson-Crick碱基对和/或G/U碱基对)、“退火”或“杂交”。标准Watson-Crick碱基配对包括:腺嘌呤/腺苷)(A)与胸腺嘧啶/胸苷(T)配对,A与尿嘧啶/尿苷(U)配对,以及鸟嘌呤/鸟苷(G)与胞嘧啶/胞苷(C)配对。此外,对于两个RNA分子(例如,dsRNA)之间的杂交,以及对于DNA分子与RNA分子的杂交(例如,当DNA靶核酸碱基与C2c2指导RNA配对时,等):G也可以与U碱基配对。例如,在tRNA反密码子与mRNA中的密码子进行碱基配对的情境下,G/U碱基配对部分地负责遗传密码的简并性(即,冗余)。因此,在本公开的上下文中,G(例如,C2c2指导RNA分子的蛋白结合区段(dsRNA双链体)的G;与C2c2指导RNA碱基配对的靶核酸的G)被认为是与U和C两者互补。例如,当可以在C2c2指导RNA分子的蛋白结合区段(例如,dsRNA双链体)的给定核苷酸位置处制备G/U碱基对时,该位置不被认为是不互补的,而是替代地被认为是互补的。
杂交和洗涤条件是众所周知的,并在Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor(1989)中,特别是该参考文献中的第11章和表11.1中;和Sambrook,J.和Russell,W.,Molecular Cloning:A Laboratory Manual,第三版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor(2001)中例示。温度和离子强度的条件决定了杂交的“严谨性”。
杂交需要两个核酸含有互补序列,但是碱基之间的错配是可能的。适合于两个核酸之间杂交的条件取决于核酸的长度和互补程度,核酸的长度和互补程度是本领域中众所周知的变量。两个核苷酸序列之间的互补程度越大,则具有这些序列的核酸的杂交体的解链温度(Tm)值越大。对于具有短链互补性(例如35个或更少个、30个或更少个、25个或更少个、22个或更少个、20个或更少个或18个或更少个核苷酸的互补性)的核酸之间的杂交,错配位置可能变得重要(参见Sambrook等人,出处同上,11.7-11.8)。通常,可杂交核酸的长度为8个核苷酸或更多个(例如,10个核苷酸或更多个、12个核苷酸或更多个、15个核苷酸或更多个、20个核苷酸或更多个、22个核苷酸或更多个、25个核苷酸或更多个或30个核苷酸或更多个)。可以根据诸如互补区域的长度和互补程度之类的因素,而根据需要调节温度和洗涤溶液盐浓度。
应当理解,多核苷酸的序列不需要与其可特异性杂交或可杂交的靶核酸的序列100%互补。此外,多核苷酸可以在一个或多个区段上杂交,使得插入或相邻区段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸可包含与其将杂交的靶核酸序列内的靶区域60%或更多、65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多或100%的序列互补性。例如,这样的反义核酸将代表百分之90的互补性,在所述反义核酸中,反义化合物的20个核苷酸中的18个与靶区域互补并因此与靶区域特异性杂交。在该实例中,剩余的非互补核苷酸可以与互补核苷酸成簇或散布,并且不需要彼此邻接或与互补核苷酸邻接。可以使用任何合宜的方法确定核酸内的特定核酸序列段之间的互补百分比。示例性方法包括BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,J.Mol.Biol.,1990,215,403-410;Zhang和Madden,Genome Res.,1997,7,649-656),或通过使用使用默认设置的Gap程序(Wisconsin序列分析包,用于Unix的第8版,Genetics Computer Group,UniversityResearch Park,Madison Wis.),所述程序使用Smith和Waterman算法(Adv.Appl.Math.,1981,2,482-489)。
术语“肽”、“多肽”和“蛋白”在本文中可互换使用,并且是指任何长度的氨基酸聚合形式,其可包括编码的和非编码的氨基酸、经化学修饰或生物化学修饰的或衍生化的氨基酸,以及具有经修饰的肽骨架的多肽。
如本文所用的“结合”(例如,参照多肽的RNA结合结构域、与靶核酸结合等)是指大分子之间的非共价相互作用(例如,蛋白与核酸之间的非共价相互作用;在C2c2指导RNA复合物和靶核酸之间的非共价相互作用;等等)。当处于非共价相互作用状态时,大分子被称为“缔合的”或“相互作用”或“结合”(例如,当分子X被称为与分子Y相互作用时,则意味着分子X以非共价方式与分子Y结合)。并非结合相互作用的所有组分都需要是序列特异性的(例如,与DNA骨架中的磷酸残基接触),但结合相互作用的一些部分可以是序列特异性的。结合相互作用的特征通常在于解离常数(Kd)小于10-6M、小于10-7M、小于10-8M、小于10-9M、小于10-10M、小于10-11M、小于10-12M、小于10-13M、小于10-14M,或小于10-15M。“亲和力”是指结合强度,增加的结合亲和力与较低的Kd相关。
“结合结构域”是指能够与另一分子非共价结合的蛋白结构域。结合结构域可以与例如RNA分子(RNA结合结构域)和/或蛋白分子(蛋白结合结构域)结合。在具有蛋白结合结构域的蛋白的情况下,所述蛋白在一些情况下可以与其自身结合(以形成同源二聚体、同源三聚体等)和/或所述蛋白可以与一个或多个不同蛋白的一个或多个区域结合。
术语“保守氨基酸取代”是指蛋白中具有相似侧链的氨基酸残基的可互换性。例如,一组具有脂肪族侧链的氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;一组具有脂肪族羟基侧链的氨基酸由丝氨酸和苏氨酸组成;一组具有含酰胺侧链的氨基酸由天冬酰胺和谷氨酰胺组成;一组具有芳香族侧链的氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;一组具有碱性侧链的氨基酸由赖氨酸、精氨酸和组氨酸组成;一组具有酸性侧链的氨基酸由谷氨酸和天冬氨酸组成;并且一组具有含硫侧链的氨基酸由半胱氨酸和甲硫氨酸组成。示例性保守氨基酸取代基是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸-甘氨酸,以及天冬酰胺-谷氨酰胺。
多核苷酸或多肽与另一多核苷酸或多肽具有一定百分比的“序列同一性”,意味着当比对时,在比较两个序列时,碱基或氨基酸的百分比是相同的,并且在相同的相对位置中。序列同一性可以以多种不同方式确定。为了确定序列同一性,可以使用各种方法和计算机程序(例如BLAST、T-COFFEE、MUSCLE、MAFFT、Phyre2等)比对序列,所述各种方法和计算机程序可通过万维网在包括ncbi.nlm.nili.go v/BLAST、ebi.ac.uk/Tools/msa/tcoffee/、ebi.ac.uk/Tools/msa/muscle/、mafft.cbrc.jp/alignment/software/、http://www.sbg.bio.ic.ac.uk/~phyre2/的网站处获得。参见例如Altschul等人,(1990),J.Mol.Bioi.215:403-10。
“编码”特定RNA的DNA序列是转录成RNA的DNA核酸序列。DNA多核苷酸可编码转化为蛋白的RNA(mRNA),或者DNA多核苷酸可编码未翻译成蛋白的RNA(例如tRNA、rRNA、微RNA(miRNA)、“非编码”RNA(ncRNA)、C2c2指导RNA等)。
本文可互换使用的术语“DNA调控序列”、“控制元件”和“调控元件”是指转录和翻译控制序列,诸如启动子、增强子、多腺苷酸化信号、终止子、蛋白降解信号等,所述转录和翻译控制序列提供和/或调控非编码序列(例如,Cas9指导RNA)或编码序列(例如,Cas9蛋白)的转录和/或调控编码多肽的翻译。
如本文所用,“启动子序列”是能够结合RNA聚合酶并启动下游(3'方向)编码或非编码序列的转录的DNA调控区。出于本公开的目的,启动子序列在其3'末端处由转录起始位点结合并向上游(5'方向)延伸,以包含以高于背景的可检测水平起始转录所必需的最少数量的碱基或元件。在启动子序列内将发现转录起始位点,以及负责结合RNA聚合酶的蛋白结合结构域。真核启动子通常将(但不总是)包含“TATA”盒和“CAT”盒。包括诱导型启动子在内的各种启动子可用于驱动本公开的各种载体。
如本文所用的应用于核酸、多肽、细胞或生物体的术语“天然存在的”或“未修饰的”或“野生型”是指在自然中存在的核酸、多肽、细胞或生物体。例如,存在于生物体(包括病毒)中、可以从自然中的来源分离并且尚未由人在实验室中有意修饰的多肽或多核苷酸序列是野生型(并且是天然存在的)。
如本文所用的“重组”是指特定核酸(DNA或RNA)是克隆、限制、聚合酶链式反应(PCR)和/或连接步骤的各种组合的产物,导致具有结构编码或非编码序列的构建体可与自然系统中存在的内源核酸区分开来。编码多肽的DNA序列可以由cDNA片段或由一系列合成的寡核苷酸组装而成,以提供能够从包含在细胞中或无细胞转录和翻译系统中的重组转录单元表达的合成核酸。包含相关序列的基因组DNA也可用于形成重组基因或转录单位。非翻译DNA的序列可以存在于开放阅读框的5'端或3'端,其中此类序列不干扰编码区的操纵或表达,并且确实可以作用以通过各种机制调节所需产物的产生(参见下文的“DNA调控序列”)。或者,编码未翻译的RNA(例如,C2c2指导RNA)的DNA序列也可以被认为是重组的。因此,例如,术语“重组”核酸是指这样的核酸,所述核酸是非天然存在的,例如,是通过两个经由人工干预以其它方式分开的序列区段的人工组合而制备的。这种人工组合往往通过化学合成手段或通过人工操纵分离的核酸区段(例如通过基因工程技术)来实现。通常这样做是为了用编码相同氨基酸、保守氨基酸或非保守氨基酸的密码子替换密码子。或者,执行将所需功能的核酸区段连接在一起以产生所需的功能组合。这种人工组合往往通过化学合成手段或通过人工操纵分离的核酸区段(例如通过基因工程技术)来实现。当重组多核苷酸编码多肽时,所编码的多肽的序列可以是天然存在的(“野生型”)或可以是天然存在序列的变体(例如,突变体)。因此,术语“重组”多肽不一定是指序列不是天然存在的多肽。相反,“重组”多肽由重组DNA序列编码,但是所述多肽的序列可以是天然存在的(“野生型”)或非天然存在的(例如,变体、突变体等)。因此,“重组”多肽是人工干预的结果,但可以是天然存在的氨基酸序列。
“载体”或“表达载体”是复制子,诸如质粒、噬菌体、病毒或粘粒,另一DNA区段(即“插入物”)可以附接到所述复制子以便引起附接片段在细胞中的复制。
“表达盒”包含与启动子可操作连接的DNA编码序列。“可操作地连接”是指并置,其中如此描述的组分处于允许它们以它们预期的方式起作用的关系中。例如,如果启动子影响编码序列的转录或表达,则所述启动子与所述编码序列可操作地连接。
术语“重组表达载体”或“DNA构建体”在本文中可互换地使用,以指代包含载体和一个插入物的DNA分子。通常产生重组表达载体以用于表达和/或增殖插入物的目的,或用于构建其它重组核苷酸序列的目的。插入物可以或可以不与启动子序列可操作地连接,并且可以或可以不与DNA调控序列可操作地连接。
任何给定的部件或部件组合可以是未标记的,或者可以用标记部分可检测地标记。在一些情况下,当标记两种或更多种组分时,它们可以用彼此可区分的标记部分标记。
一般的分子和细胞生物化学方法可以在标准教科书中找到,所述标准教科书为诸如Molecular Cloning:A Laboratory Manual,第3版(Sambrook等人,HaRBor LaboratoryPress 2001);Short Protocol s in Molecular Biology,第4版(Ausubel等人编辑,JohnWiley&Sons 1999);Protein Methods(Bollag人,John Wiley&Sons 1996);NonviralVectors for Gene Therapy(Wagner等人编辑,Academ ic Press 1999);Viral Vectors(Kaplift和Loewy编辑,Academic Pr ess 1995);Immunology Methods Manual(I.Lefkovits编辑,Acade mic Press 1997);以及Cell and Tissue Culture:LaboratoryProcedur es in Biotechnology(Doyle和Griffiths,John Wiley&Sons 1998),这些参考文献的公开内容以引用方式并入本文中。
在进一步描述本发明之前,应当理解本发明不限于所描述的特定实施方案,因此当然可以改变。还应当理解,本文所使用的术语仅用于描述特定实施方案的目的,而非旨在为限制性的,因为本发明的范围将仅受所附权利要求书的限制。
在提供值范围的情况下,应理解,除非上下文另有明确规定,每个居间值至该下限单位的十分之一在该范围的上限和下限之间,并且任何其它所述范围或该所述范围中的居间值被涵盖在本发明内。这些较小范围的上限和下限可以独立地包括在该等较小范围内,并且也被涵盖在本发明内,经受所述范围中任何特别排除的极限。在所述范围包括上限和下限中的一个或两个的情况下,排除了这些所包括的极限中的一者或两者的范围也被包括在本发明中。
除非另有定义,本文所使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管与本文描述的那些方法和材料类似或等同的任何方法和材料也可用于本发明的实践或测试中,但是现在描述优选的方法和材料。本文提及的所有出版物均以引用方式并入本文,以公开和描述与所引用的出版物相关的方法和/或材料。
必须注意,如本文和随附权利要求书中所使用,单数形式“一”、“一个”和“该”包括复数指示物,除非上下文另有明确规定。因此,例如,提及“一蛋白”包括多个此类蛋白,并且提及“该指导RNA”包括提及一个或多个此类指导RNA及本领域的技术人员已知的其等同物,等等。还应当注意,权利要求书可以撰写成排除任何任选要素。因此,本声明旨在充当使用与权利要求要素的叙述相关的诸如“单独地”、“仅”等排他性术语或使用“否定”限制的先行基础。
应当理解,为了清楚起见而在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为简洁起见而在单个实施方案的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合提供。与本发明有关的实施方案的所有组合由本发明具体包括,并且在本文中公开为如同每个和各个组合被单独和明确地公开一样。此外,各种实施例及其要素的所有子组合也由本发明具体包含,并且在本文中公开为如同每个此类子组合在此单独和明确地公开一样。
本文所论述的出版物仅仅是出于它们在本申请的申请日之前的公开内容而提供的。本文中的任何内容都不应被解释为承认本发明不能凭借优先权发明而在这些出版物之前授权。此外,所提供的出版物的日期可能与实际出版日期不同,这可能需要独立确认。
具体实施方式
本公开提供了用于检测单链靶RNA的方法。本公开提供了将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法。本公开提供了用于检测样品中的靶RNA的试剂盒。术语“C2c2指导RNA”在本文中与“Cas13a指导RNA”可互换地使用,并且在一些情况下指导RNA被称为crRNA(例如,“Cas13a crRNA”);术语“C2c2蛋白”(或“C2c2多肽”)在本文中与“Cas13a蛋白”(或“Cas13a多肽”)可互换地使用。
检测单链RNA的方法
提供了用于检测单链靶RNA的组合物和方法,其中所述方法包括(i)使具有多种RNA的样品与(a)C2c2指导RNA和(b)C2c2蛋白接触,所述C2c2指导RNA与单链靶RNA杂交,所述C2c2蛋白切割样品中存在的RNA;以及(ii)测量由切割产生的可检测信号。一旦主题C2c2蛋白被C2c2指导RNA激活,C2c2蛋白就被激活并作为非特异性地切割样品中存在的RNA(包括非靶RNA)的内切核糖核酸酶起作用,所述主题C2c2蛋白的激活是当样品包括指导RNA杂交的单链靶RNA(即,样品包含所靶向的单链靶RNA)时发生的。因此,当所靶向的单链靶RNA存在于样品中(例如,在一些情况下高于某一阈值量)时,结果是样品中RNA(包括非靶RNA)的切割,该切割可以使用任何合宜的检测方法检测(例如,使用经标记的检测RNA)。接触步骤通常在包含二价金属离子的组合物中进行。接触步骤可以在无细胞环境中进行,例如在细胞外进行。接触步骤可以在细胞内进行。接触步骤可以在体外细胞中进行。接触步骤可以在离体细胞中进行。接触步骤可以在体内细胞中进行。在一些情况下,C2c2指导RNA作为RNA被提供;并且C2c2蛋白本身作为蛋白被提供。在一些情况下,C2c2指导RNA作为编码指导RNA的DNA被提供;并且C2c2蛋白本身作为蛋白被提供。在一些情况下,C2c2指导RNA作为RNA被提供;并且C2c2蛋白作为编码C2c2蛋白的RNA被提供。在一些情况下,C2c2指导RNA作为编码指导RNA的DNA被提供;并且C2c2蛋白作为编码C2c2蛋白的RNA被提供。在一些情况下,C2c2指导RNA作为RNA被提供;并且C2c2蛋白作为包含编码C2c2蛋白的核苷酸序列的DNA被提供。在一些情况下,C2c2指导RNA作为编码指导RNA的DNA被提供;并且C2c2蛋白作为包含编码C2c2蛋白的核苷酸序列的DNA被提供。在一些情况下,本公开的方法提供了对样品中两种不同靶RNA(第一单链靶RNA和第二单链靶RNA)的基本上同时检测。
在一些情况下,可以通过使用前体C2c2指导RNA阵列来提供两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、或6个或更多个)C2c2指导RNA,所述前体C2c2指导RNA阵列可以由C2c2蛋白切割成单独的(“成熟”)指导RNA;前体C2c2指导RNA的切割与C2c2蛋白是否具有完整的HEPN1结构域和/或HEPN2结构域无关。因此,还提供了将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法。因此,C2c2指导RNA阵列可包括多于一个指导序列。在一些情况下,主题C2c2指导RNA可以包括来自前体crRNA的柄,但不一定必须包括多个指导序列。在一些情况下,C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。接触步骤可以在无细胞环境中进行,例如在细胞外进行。接触步骤可以在细胞内进行。接触步骤可以在体外细胞中进行。接触步骤可以在离体细胞中进行。接触步骤可以在体内细胞中进行。
在一些情况下(例如,当与C2c2指导RNA和C2c2蛋白接触时,当与前体C2c2指导RNA阵列和C2c2蛋白接触时,等等),在测量步骤之前使样品接触2小时或更短时间(例如,1.5小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间)。例如,在一些情况下,在测量步骤之前使样品接触40分钟或更短时间。在一些情况下,在测量步骤之前使样品接触20分钟或更短时间。在一些情况下,在测量步骤之前使样品接触10分钟或更短时间。在一些情况下,在测量步骤之前使样品接触5分钟或更短时间。在一些情况下,在测量步骤之前使样品接触1分钟或更短时间。在一些情况下,在测量步骤之前使样品接触50秒至60秒。在一些情况下,在测量步骤之前使样品接触40秒至50秒。在一些情况下,在测量步骤之前使样品接触30秒至40秒。在一些情况下,在测量步骤之前使样品接触20秒至30秒。在一些情况下,在测量步骤之前使样品接触10秒至20秒。
本公开提供了检测包含多种RNA(例如,包含靶RNA和多种非靶RNA)的样品中的单链RNA的方法。在一些情况下,所述方法包括:a)使样品与以下接触:(i)与单链靶RNA杂交的C2c2指导RNA,和(ii)切割样品中存在的RNA的C2c2蛋白;以及b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。在一些情况下,所述方法包括:a)使样品与以下接触:i)前体C2c2指导RNA阵列,所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;和(ii)C2c2蛋白,所述C2c2蛋白将前体C2c2指导RNA阵列切割成单独的C2c2指导RNA,并且还切割样品的RNA;以及b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。在一些情况下,本公开的方法提供了对样品中两种不同靶RNA(第一单链靶RNA和第二单链靶RNA)的基本上同时检测。
用于检测包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中的单链RNA(单链靶RNA)的本公开的方法可以以高灵敏度检测单链靶RNA。在一些情况下,本公开的方法可用于检测包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中靶单链RNA以每107个非靶RNA一个或多个拷贝(例如,每106个非靶RNA一个或多个拷贝、每105个非靶RNA一个或多个拷贝、每104个非靶RNA一个或多个拷贝、每103个非靶RNA一个或多个拷贝、每102个非靶RNA一个或多个拷贝、每50个非靶RNA一个或多个拷贝、每20个非靶RNA一个或多个拷贝、每10个非靶RNA一个或多个拷贝、或每5个非靶RNA一个或多个拷贝)存在。
在一些情况下,本公开的方法可以检测在包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中所述靶单链RNA以每107个非靶RNA一个拷贝至每10个非靶RNA一个拷贝(例如,从每107个非靶RNA 1个拷贝至每102个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每105个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每106个非靶RNA 1个拷贝,从每106个非靶RNA 1个拷贝至每10个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每102个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每105个非靶RNA 1个拷贝、从每105个非靶RNA 1个拷贝至每10个非靶RNA 1个拷贝、从每105个非靶RNA 1个拷贝至每102个非靶RNA 1个拷贝、从每105个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝或从每105个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝)存在。
在一些情况下,本公开的方法可以检测在包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中所述靶单链RNA以每107个非靶RNA一个拷贝至每100个非靶RNA一个拷贝(例如,从每107个非靶RNA 1个拷贝至每102个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每105个非靶RNA 1个拷贝、从每107个非靶RNA 1个拷贝至每106个非靶RNA 1个拷贝,从每106个非靶RNA 1个拷贝至每100个非靶RNA1个拷贝、从每106个非靶RNA 1个拷贝至每102个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝、从每106个非靶RNA 1个拷贝至每105个非靶RNA 1个拷贝、从每105个非靶RNA 1个拷贝至每100个非靶RNA 1个拷贝、从每105个非靶RNA 1个拷贝至每102个非靶RNA 1个拷贝、从每105个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝或从每105个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝)存在。
在一些情况下,对于检测样品中单链靶RNA的本方法,检测阈值为10nM或更低。术语“检测阈值”在本文中用于描述为了进行检测样品中必须存在的靶RNA的最小量。因此,作为说明性实例,当检测阈值为10nM时,则当靶RNA以10nM或更高的浓度存在于样品中时,可以检测到信号。在一些情况下,本公开的方法具有5nM或更低的检测阈值。在一些情况下,本公开的方法具有1nM或更低的检测阈值。在一些情况下,本公开的方法具有0.5nM或更低的检测阈值。在一些情况下,本公开的方法具有0.1nM或更低的检测阈值。在一些情况下,本公开的方法具有0.05nM或更低的检测阈值。在一些情况下,本公开的方法具有0.01nM或更低的检测阈值。在一些情况下,本公开的方法具有0.005nM或更低的检测阈值。在一些情况下,本公开的方法具有0.001nM或更低的检测阈值。在一些情况下,本公开的方法具有0.0005nM或更低的检测阈值。在一些情况下,本公开的方法具有0.0001nM或更低的检测阈值。在一些情况下,本公开的方法具有0.00005nM或更低的检测阈值。在一些情况下,本公开的方法具有0.00001nM或更低的检测阈值。在一些情况下,本公开的方法具有10pM或更低的检测阈值。在一些情况下,本公开的方法具有1pM或更低的检测阈值。在一些情况下,本公开的方法具有500fM或更低的检测阈值。在一些情况下,本公开的方法具有250fM或更低的检测阈值。在一些情况下,本公开的方法具有100fM或更低的检测阈值。在一些情况下,本公开的方法具有50fM或更低的检测阈值。
在一些情况下,检测阈值(在本方法中用于检测单链靶RNA)在500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM或1pM至10pM)的范围内(其中浓度是指可以检测至靶RNA的阈值靶RNA浓度)。在一些情况下,本公开的方法具有在800fM至100pM的范围内的检测阈值。在一些情况下,本公开的方法具有在1pM至10pM的范围内的检测阈值。在一些情况下,本公开的方法具有在10fM至500fM,例如10fM至50fM、50fM至100fM、100fM至250fM或250fM至500fM的范围内的检测阈值。
在一些情况下,可以在样品中检测到单链靶RNA的最小浓度在500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM或1pM至10pM)的范围内。在一些情况下,可以在样品中检测到单链靶RNA的最小浓度在800fM至100pM的范围内。在一些情况下,可以在样品中检测到单链靶RNA的最小浓度在1pM至10pM的范围内。
在一些情况下,本公开的方法可以检测包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中所述靶单链RNA以低至500fM(例如,低至800fM、低至1pM、低至10pM或低至100pM)的浓度存在。在一些情况下,本公开的方法可以检测包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中所述靶单链RNA以低至1pM的浓度存在。
在一些情况下,本公开的方法可以检测包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中所述靶单链RNA以低至500fM(例如,低至800fM、低至1pM、低至10pM或低至100pM)的浓度存在,并且其中在测量步骤之前使样品接触60分钟或更短时间(例如,在一些情况下为40分钟或更短时间)。在一些情况下,本公开的方法可以检测包含多种RNA(包括单链靶RNA和多种非靶RNA)的样品中存在的靶单链RNA,其中所述靶单链RNA以低至1pM的浓度存在,并且其中在测量步骤之前使样品接触60分钟或更短时间(例如,在一些情况下为40分钟或更短时间)。
例如,在一些情况下,本公开的方法提供用于检测以500fM或更高(例如,800fM或更高、1pM或更高、5pM或更高、10pM或更高)的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以1pM或更高(例如,2pM或更高、5pM或更高、或8pM或更高)的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以500fM或更高(例如,1pM或更高、5pM或更高、10pM或更高)的浓度存在于样品中的靶RNA,其中在测量步骤之前使样品接触60分钟或更短时间(例如,在一些情况下为40分钟或更短时间)。在一些情况下,本公开的方法提供用于检测以1pM或更高(例如,2pM或更高、5pM或更高、或8pM或更高)的浓度存在于样品中的靶RNA,其中在测量步骤之前使样品接触60分钟或更短时间(例如,在一些情况下为40分钟或更短时间)。
在一些情况下,本公开的方法提供用于检测以10nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以5nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以1nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.5nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.1nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.05nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.01nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.005nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.001nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.0005nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供了以0.0001nM或更低的浓度检测样品中存在的靶RNA。在一些情况下,本公开的方法提供用于检测以0.00005nM或更低的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以0.00001nM或更低的浓度存在于样品中的靶RNA。
在一些情况下,本公开的方法提供用于检测以10-6nM至1nM,例如10-6nM至5×10- 6nM、5×10-6nM至10-5nM、10-5nM至5×10-5nM、5×10-5nM至10-4nM、10-4nM至5×10-4nM、5×10- 4nM至10-3nM、10-3nM至5×10-3nM、5×10-3nM至10-2nM、10-2nM至5×10-2nM、5×10-2nM至0.1nM、0.1nM至0.5nM、0.5nM至1nM、1nM至5nM或5nM至10nM的浓度存在于样品中的靶RNA。
在一些情况下,本公开的方法提供用于检测以低于10nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于5nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于1nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.5nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.1nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.05nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.01nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.005nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.001nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.0005nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.0001nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.00005nM的浓度存在于样品中的靶RNA。在一些情况下,本公开的方法提供用于检测以低于0.00001nM的浓度存在于样品中的靶RNA。
在一些情况下,本公开的方法可用于确定样品(例如,包含靶RNA和多种非靶RNA的样品)中靶RNA的量。确定样品中靶RNA的量可以包括将从测试样品产生的可检测信号的量与从参考样品产生的可检测信号的量进行比较。确定样品中靶RNA的量可包括:测量可检测信号以产生测试测量值;测量由参考样品产生的可检测信号以产生参考测量值;以及将测试测量值与参考测量值进行比较以确定样品中存在的靶RNA的量。
例如,在一些情况下,用于确定样品中靶RNA的量的本公开的方法包括:a)使样品(例如,包含靶RNA和多种非靶RNA的样品)与以下接触:(i)与单链靶RNA杂交的C2c2指导RNA,和(ii)切割样品中存在的RNA的C2c2蛋白;b)测量由C2c2蛋白介导的RNA切割产生的可检测信号,产生测试测量值;c)测量由参考样品产生的可检测信号以产生参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶RNA的量。
作为另一实例,在一些情况下,用于确定样品中靶RNA的量的本公开的方法包括:a)使样品(例如,包含靶RNA和多种非靶RNA的样品)与以下接触:i)前体C2c2指导RNA阵列,所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;和(ii)C2c2蛋白,所述C2c2蛋白将前体C2c2指导RNA阵列切割成单独的C2c2指导RNA,并且还切割样品的RNA;b)测量由C2c2蛋白介导的RNA切割产生的可检测信号,产生测试测量值;c)测量由两个或更多个参考样品中的每一个产生的可检测信号,以产生两个或更多个参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶RNA的量。
样品
主题样品包括多种靶RNA。术语“多个”在本文中用于表示两个或更多个。因此,在一些情况下,样品包括两种或更多种(例如,3种或更多种、5种或更多种、10种或更多种、20种或更多种、50种或更多种、100种或更多种、500种或更多种、1,000种或更多种、或5,000种或更多种)RNA。本方法可以用作检测复杂的RNA混合物中存在的单链靶RNA的非常灵敏的方法。因此,在一些情况下,样品包括5种或更多种(例如,10种或更多种、20种或更多种、50种或更多种、100种或更多种、500种或更多种、1,000种或更多种、或5,000种或更多种RNA)序列彼此不同的RNA。在一些情况下,样品包括10种或更多种、20种或更多种、50种或更多种、100种或更多种、500种或更多种、103种或更多种、5×103种或更多种、104种或更多种、5×104种或更多种、105种或更多种、5×105种或更多种、106种或更多种、5×106种或更多种、或107种或更多种序列彼此不同的RNA。在一些情况下,样品包含10种至20种、20种至50种、50种至100种、100种至500种、500种至103种、103种至5×103种、5×103种至104种、104种至5×104种、5×104种至105种、105种至5×105种、5×105种至106种、106种至5×106种、或5×106种至107种、或多于107种序列彼此不同的RNA。在一些情况下,样品包含5种至107种序列彼此不同的RNA(例如,5种至106种、5种至105种、5种至50,000种、5种至30,000种、10种至106种、10种至105种、10种至50,000种、10种至30,000种、20种至106种、20种至105种、20种至50,000种、或20种至30,000种序列彼此不同的RNA)。在一些情况下,样品包含5种至50,000种序列彼此不同的RNA(例如,5种至30,000种、10种至50,000种、或10种至30,000种序列彼此不同的RNA)。在一些情况下,样品包括20种或更多种序列彼此不同的RNA。在一些情况下,样品包括来自细胞裂解物(例如,真核细胞裂解物、哺乳动物细胞裂解物、人细胞裂解物、原核细胞裂解物、植物细胞裂解物等)的RNA。例如,在一些情况下,样品包括从细胞诸如真核细胞(例如,哺乳动物细胞,诸如人细胞)表达的RNA。
术语“样品”在本文中用于表示包括单链RNA的任何样品。样品可以来源于任何来源,例如,样品可以是纯化RNA的合成组合;样品可以是细胞裂解物、富含RNA的细胞裂解物,或从细胞裂解物中分离和/或纯化的RNA。样品可以来自患者(例如,用于诊断目的)。样品可来自经透化的细胞。样品可以来自交联细胞。样品可以在组织切片中。样品可以来自通过交联之后进行脱脂和调节以产生均匀的折射率而制备的组织。在例如Shah等人,Development(2016)143,2862-2867doi:10.1242/dev.138560中已经描述了通过交联之后进行脱脂和调节以产生均匀的折射率而制备的组织的实例。
“样品”可包括单链靶RNA和多种非靶RNA。在一些情况下,靶单链RNA以每10个非靶RNA一个拷贝、每20个非靶RNA一个拷贝、每25个非靶RNA一个拷贝、每50个非靶RNA一个拷贝、每100个非靶RNA一个拷贝、每500个非靶RNA一个拷贝、每103个非靶RNA一个拷贝、每5×103个非靶RNA一个拷贝、每104个非靶RNA一个拷贝、每5×104个非靶RNA一个拷贝、每105个非靶RNA一个拷贝、每5×105个非靶RNA一个拷贝、每106个非靶RNA一个拷贝、或每106个非靶RNA少于一个拷贝存在于样品中。在一些情况下,靶单链RNA以每10个非靶RNA一个拷贝至每20个非靶RNA 1个拷贝、每20个非靶RNA 1个拷贝至每50个非拷贝1个拷贝、每50个非靶RNA1个拷贝至每100个非靶RNA 1个拷贝、每100个非靶RNA 1个拷贝至每500个非靶RNA 1个拷贝、每500个非靶RNA 1个拷贝至每103个非靶RNA 1个拷贝、每103个非靶RNA 1个拷贝至每5×103个非靶RNA 1个拷贝、每5×103个非靶RNA 1个拷贝至每104个非靶RNA 1个拷贝、每104个非靶RNA 1个拷贝至每105个非靶RNA 1个拷贝、每105个非靶RNA 1个拷贝至每106个非靶RNA 1个拷贝,或每106个非靶RNA 1个拷贝至每107个非靶RNA 1个拷贝存在于样品中。
合适的样品包括但不限于血液样品、血清样品、血浆样品、尿液样品、抽吸物样品和活组织检查样品。因此,关于患者的术语“样品”涵盖血液和其它生物来源的液体样品、实体组织样品(诸如活检样本或组织培养物或来源于其的细胞及其后代)。该定义还包括在获得后已经以任何方式操纵的样品,诸如通过用试剂处理;洗涤;或富集某些细胞群,诸如癌细胞。该定义还包括已经富集了特定类型的分子(例如,RNA)的样品。术语“样品”涵盖生物样品,诸如临床样品,诸如血液、血浆、血清、抽吸物、脑脊髓液(CSF),并且还包括通过手术切除获得的组织、通过活组织检查获得的组织、培养中的细胞、细胞上清液、细胞裂解物、组织样品、器官、骨髓等。“生物样品”包括来源于其的生物流体(例如,癌细胞、感染细胞等),例如包含从此类细胞获得的RNA的样品(例如,细胞裂解物或其它包含RNA的细胞提取物)。
样品可包括或可从多种细胞、组织、器官或无细胞流体中的任何一种获得。合适的样品来源包括真核细胞、细菌细胞和古细菌细胞。合适的样品来源包括单细胞生物和多细胞生物。合适的样品来源包括单细胞真核生物;植物或植物细胞;藻类细胞,例如布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、迦得拟微绿球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens)、羽藻(C.agardh)等等;真菌细胞(例如,酵母细胞);动物细胞、组织或器官;来自无脊椎动物的细胞、组织或器官(例如,果蝇、刺胞动物、棘皮动物、线虫、昆虫、蜘蛛类动物,等);来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、组织、流体或器官;来自哺乳动物(例如,人;非人灵长类动物;有蹄类动物;猫科动物;牛;绵羊;山羊;等)的细胞、组织、流体或器官。合适的样品来源包括线虫、原生动物等。合适的样品来源包括寄生虫,诸如蠕虫、疟疾寄生虫等。
合适的样品来源包括例如以下六个界中任何一个界的细胞、组织或生物:细菌界(例如,真细菌界);古细菌界;原生生物界;真菌界;植物界;和动物界。合适的样品来源包括原生生物界的植物样成员,包括但不限于藻类(例如,绿藻、红藻、灰胞藻、蓝细菌);原生生物界的真菌样成员,例如粘液菌、水霉菌等;原生生物界的动物样成员,例如鞭毛虫类(例如,眼虫藻)、变形虫类(amoeboids)(例如,变形虫)、孢子虫类(例如,顶复门(Apicomplexa)、粘体动物门(Myxozoa)、微孢子虫纲(Microsporidia))和纤毛虫类(例如,草履虫)。合适的样品来源包括真菌界的成员,包括但不限于以下门中的任何门的成员:担子菌门(担子菌类;例如,伞菌属、鹅膏菌属、牛肝菌属、鸡油菌属等成员);子囊菌门(子囊菌类,包括例如酵母菌);菌藻门(地衣);接合菌门(接合真菌);以及不完全菌门。合适的样品来源包括植物界的成员,包括但不限于以下门中的任何门的成员:苔藓植物门(例如,藓类)、角苔植物门(例如,角苔类)、苔类植物门(Hepaticophyta)(例如,苔类)、石松植物门(例如,石松类)、楔叶植物门(例如,木贼类)、裸蕨植物门(例如,松叶蕨类)、瓶尔小草门、蕨门(例如,蕨类)、苏铁门、银杏门、松柏门、买麻藤门和木兰门(例如,显花植物)。合适的样品来源包括动物界的成员,包括但不限于以下门中的任何门的成员:多孔动物门(海绵动物);扁盘动物门;直泳虫门(海洋无脊椎动物的寄生物);菱形虫门;刺胞动物门(珊瑚、海葵、海蜇、海笔、海肾、立方水母);栉水母门(栉水母类);扁虫动物门(扁虫类);纽形动物门(纽虫类);颚胃动物门(Ngathostomulida)(有颚蠕虫);腹毛动物门;轮虫动物门;曳鳃动物门;动吻动物门;铠甲动物门;棘头动物门;内肛亚门;线虫动物门;线形动物门;环口动物门;软体动物门(软体动物);星虫动物门(方格星虫(peanut worms));环节动物门(环节蠕虫);缓步动物门(缓步动物);有爪动物门(栉蚕);节肢动物门(包括以下亚门:有螯肢亚门、多足亚门、六足亚门和甲壳亚门,其中有螯肢亚门包括例如蛛形纲、肢口纲和海蜘蛛纲,多足亚门包括例如唇足纲(唇足类)、倍足纲(多足类)、少足纲(Paropoda)和综合纲,六足亚门包括昆虫纲,甲壳亚门包括虾、磷虾、藤壶等;帚虫动物门;外肛动物门(苔藓动物);腕足动物门;棘皮动物门(例如,海星、海雏菊、毛头星、海胆、海参、海蛇尾、脆篮(brittle baskets)等);毛颚动物门(箭虫);半索动物门(玉钩虫);和脊索动物门。合适的脊索动物门成员包括以下亚门的任何成员:尾索动物亚门(海鞘纲;包括海鞘目、樽海鞘目和幼形目);头索亚门(文昌鱼);盲鳗纲(盲鳗);和脊椎动物亚门,其中脊椎动物亚门成员包括例如以下纲的成员:鳃鳗纲(七鳃类),软骨鱼纲(软骨鱼),辐鳍鱼纲(辐鳍鱼),腔棘焦纲(腔棘鱼),肺鱼纲(肺鱼),爬行纲(爬行动物,例如蛇、短吻鳄、鳄鱼、蜥蜴等),鸟纲(鸟);和哺乳纲(哺乳动物)。合适的植物包括任何单子叶植物和任何双子叶植物。
合适的样品来源包括取自生物;从生物体分离的特定细胞或细胞群的细胞、流体、组织或器官等等。例如,在生物是植物的情况下,合适的来源包括木质部、韧皮部、形成层、叶、根等。在生物是动物的情况下,合适的来源包括特定组织(例如,肺、肝、心脏、肾、脑、脾、皮肤、胎儿组织等)、或特定细胞类型(例如,神经元细胞、上皮细胞、内皮细胞、星形胶质细胞、巨噬细胞、神经胶质细胞、胰岛细胞、T淋巴细胞、B淋巴细胞等)。
在一些情况下,样品的来源是患病的细胞、流体、组织或器官。在一些情况下,样品的来源是正常(非患病的)细胞、流体、组织或器官。在一些情况下,样品来源是病原体感染的细胞、组织或器官。病原体包括病毒、真菌、蠕虫、原生动物、疟疾寄生虫、疟原虫寄生虫、弓形虫寄生虫,血吸虫寄生虫等。“蠕虫”包括蛔虫、犬恶丝虫和植食性线虫(线虫纲)、吸虫(吸虫纲)、棘头虫、和绦虫(绦虫纲)。原生动物感染包括来自贾第虫属,毛滴虫属、非洲锥虫病、阿米巴痢疾、巴贝虫病、小袋虫性痢疾、查加斯病(Chaga's disease)、球虫病、疟疾和弓形体病的感染。病原体(诸如寄生/原生动物病原体)的实例包括但不限于:恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、克氏锥虫(Trypanosomacruzi)和刚地弓形虫(Toxoplasma gondii)。真菌病原体包括但不限于:新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、粗球孢菌(Coccidioides immitis)、皮炎芽生菌(Blastomyces dermatitidis)、沙眼衣原体(Chlamydia trachomatis)和白色念珠菌(Candida albicans)。病原性病毒包括例如免疫缺陷病毒(例如,HIV);流感病毒;登革热病毒;西尼罗河病毒;疱疹病毒;黄热病毒;肝炎病毒C;肝炎病毒A;肝炎病毒B;乳头瘤病毒;等等。病原体包括例如HIV病毒、结核分枝杆菌(Mycobacterium tuberculosis)、无乳链球菌(Streptococcus agalactiae)、耐甲氧西林金黄色葡萄球菌(methicillin-resistant Staphylococcus aureus)、嗜肺军团菌(Legionella pneumophila)、酿脓链球菌(Streptococcus pyogenes)、大肠杆菌(Escherichia coli)、淋病奈瑟氏菌(Neisseria gonorrhoeae)、脑膜炎奈瑟氏菌(Neisseria meningitidis),肺炎球菌(Pneumococcus)、新型隐球菌(Cryptococcusneoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、流感嗜血杆菌B(Hemophilusinfluenzae B)、梅毒密螺旋体(Treponema pallidum)、莱姆病螺旋体(Lyme diseasespirochetes)、铜绿假单胞菌(Pseudomonas aeruginosa)、麻风分枝杆菌(Mycobacteriumleprae)、流产布鲁氏菌(Brucella abortus)、狂犬病病毒(rabies virus)、流感病毒(influenza virus)、巨细胞病毒(cytomegalovirus)、单纯疱疹病毒I(herpes simplexvirus I)、单纯疱疹病毒II(herpes simplex virus II)、人血清细小样病毒(human serumparvo-like virus)、呼吸道合胞体病毒(respiratory syncytial virus)、水痘-带状疱疹病毒(varicella-zoster virus)、乙型肝炎病毒(hepatitis B virus)、丙型肝炎病毒(hepatitis C virus)、麻疹病毒(measles virus)、腺病毒(adenovirus)、人T细胞白血病病毒(human T-cell leukemia viruses)、艾普斯登-巴尔病毒(Epstein-Barr virus)、鼠白血病病毒(murine leukemia virus)、腮腺炎病毒(mumps virus)、水疱性口炎病毒(vesicular stomatitis virus)、辛德毕斯病毒(Sindbis virus)、淋巴细胞脉络丛脑膜炎病毒(lymphocytic choriomeningitis virus)、疣病毒(wart virus)、蓝舌病毒(bluetongue virus)、仙台病毒(Sendai virus)、猫白血病病毒(feline leukemia virus)、呼肠孤病毒(Reovirus)、脊髓灰质炎病毒(polio virus)、猿猴病毒40(simian virus 40)、小鼠乳腺肿瘤病毒(mouse mammary tumor virus)、登革热病毒(dengue virus)、风疹病毒(rubella virus)、西尼罗河病毒(West Nile virus)、恶性疟原虫(Plasmodiumfalciparum)、间日疟原虫(Plasmodium vivax)、刚地弓形虫(Toxoplasma gondii)、蓝氏锥虫(Trypanosoma rangeli)、克氏锥虫(Trypanosoma cruzi)、罗氏锥虫(Trypanosomarhodesiense)、布氏锥虫(Trypanosoma brucei)、曼氏血吸虫(Schistosoma mansoni)、日本血吸虫(Schistosoma japonicum)、巴贝斯虫(Babesia bovis)、柔嫩艾美球虫(Eimeriatenella)、盘尾丝虫(Onchocerca volvulus)、利什曼原虫(Leishmania tropica)、结核分枝杆菌(Mycobacterium tuberculosis)、旋毛虫(Trichinella spiralis)、泰勒原虫(Theileria parva)、胞状绦虫(Taenia hydatigena)、羊绦虫(Taenia ovis)、牛肉绦虫(Taenia saginata)、细粒棘球绦虫(Echinococcus granulosus)、柯氏中殖孔绦虫(Mesocestoides corti)、关节炎支原体(Mycoplasma arthritidis)、猪鼻支原体(M.hyorhinis)、口腔支原体(M.orale)、精氨酸支原体(M.arginini)、莱氏无胆甾原体(Acholeplasma laidlawii)、唾窦支原体(M.salivarium)和肺炎支原体(M.pneumoniae)。
靶RNA
靶RNA可以是任何单链RNA(ssRNA)。实例包括但不限于mRNA、rRNA、tRNA、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和微RNA(miRNA)。在一些情况下,靶ssRNA是mRNA。在一些情况下,单链靶核酸是来自病毒(例如,寨卡病毒、人免疫缺陷病毒、流感病毒等)的ssRNA。在一些情况下,单链靶核酸是寄生虫的ssRNA。在一些情况下,单链靶核酸是细菌(例如,病原细菌)的ssRNA。如上所述,靶RNA的来源可以与RNA样品的来源相同。
测量可检测信号
在一些情况下,本方法包括测量步骤(例如,测量由C2c2蛋白介导的RNA切割产生的可检测信号)。因为C2c2蛋白一旦被激活就切割非靶向RNA(所述激活当在存在C2c2蛋白的情况下C2c2指导RNA与靶RNA杂交时发生),所以可检测信号可以是当RNA被切割时产生的任何信号。例如,在一些情况下,测量步骤可以包括以下中的一者或多者:基于金纳米颗粒的检测(例如参见Xu等人,Angew Chem Int Ed Engl.2007;46(19):3468-70;和Xia等人,Proc Natl Acad Sci U S A.2010年6月15日;107(24):10837-41)、荧光偏振、胶体相变/分散(例如,Baksh等人,Nature.2004年1月8日;427(6970):139-41)、电化学检测、基于半导体的感测(例如,Rothberg等人,Nature.2011年7月20日;475(7356):348-52;例如,可以在RNA切割反应后使用磷酸酶以通过打开2'-3'环状磷酸酯并通过将无机磷酸盐释放到溶液中而产生pH变化),以及检测经标记的检测RNA(更多细节参见下文)。这种检测方法的读出可以是任何合宜的读出。可能的读出的实例包括但不限于:所测量的可检测荧光信号的量;对凝胶上条带(例如,表示切割产物对比未切割底物的条带)的视觉分析、基于视觉或传感器的对颜色存在与否的检测(即,颜色检测方法),以及是否存在电信号(或电信号的特定量)。
在一些情况下,例如在检测到的信号量可以用于确定样品中存在的靶RNA的量的意义上,测量可以是定量的。在一些情况下,例如在可检测信号的存在或不存在可以指示靶RNA的存在或不存在的意义上,测量可以是定性的。在一些情况下,除非靶RNA以高于特定阈值浓度存在(例如,参见图5),否则可检测信号将不存在(例如,高于给定阈值水平)。在一些情况下,可以通过修改C2c2蛋白、指导RNA、样品体积和/或检测RNA(如果使用的话)的量来滴定检测阈值。因此,例如,如本领域的普通技术人员应当理解的,如果需要的话,可以使用许多对照以建立一个或多个反应,每个反应设置用于检测靶RNA的不同阈值水平,并且因此可以使用这样的一系列反应来确定样品中存在的靶RNA的量(例如,可以使用这样的一系列反应来确定靶RNA‘以至少X的浓度’存在于样品中)。
经标记的检测RNA
在一些情况下,本方法包括使样品(例如,包含靶RNA和多种非靶RNA的样品)与以下接触:i)经标记的检测RNA;ii)C2c2蛋白;以及iii)C2c2指导RNA(或前体C2c2指导RNA阵列)。例如,在一些情况下,本方法包括使样品与经标记的检测RNA接触,所述经标记的检测RNA包含荧光发射染料对;C2c2蛋白在被激活(通过在指导RNA与靶RNA杂交的背景下与C2c2指导RNA结合)后切割所述经标记的检测RNA;并且所测量到的可检测信号是由荧光发射染料对产生的。例如,在一些情况下,本方法包括使样品与经标记的检测RNA接触,所述经标记的检测RNA包含荧光共振能量转移(FRET)对或猝灭剂/荧光剂对或两者。在一些情况下,本方法包括使样品与包含FRET对的经标记的检测RNA接触。在一些情况下,本方法包括使样品与包含荧光剂/猝灭剂对的经标记的检测RNA接触。荧光发射染料对包含FRET对或猝灭剂/荧光剂对。在FRET对和猝灭剂/荧光剂对的两种情况下,染料中的一种染料的发射光谱与所述对中的另一种染料的吸收光谱的某一区域重叠。如本文所用的,术语“荧光发射染料对”是用于包括“荧光共振能量转移(FRET)对”和“猝灭剂/荧光剂对”两者的通用术语,这两个术语将在下面更详细地讨论。术语“荧光发射染料对”与短语“FRET对和/或猝灭剂/荧光剂对”可互换地使用。
在一些情况下(例如,当检测RNA包括FRET对时),经标记的检测RNA在被切割之前产生一定量的可检测信号,并且当所述经标记的检测RNA被切割时所测量到的可检测信号的量减少。在一些情况下,经标记的检测RNA在被切割之前产生第一可检测信号(例如,来自FRET对),并且当所述经标记的检测RNA被切割时产生第二可检测信号(例如,来自猝灭剂/荧光剂对)。因此,在一些情况下,经标记的检测RNA包含FRET对和猝灭剂/荧光剂对。
在一些情况下,经标记的检测RNA包括FRET对。FRET是这样的过程,通过所述过程,能量的无辐射转移发生为从激发态荧光团到紧邻的第二发色团。能量转移可以发生的范围限制在约10纳米(100埃),并且转移效率对荧光团之间的分开距离非常敏感。因此,如本文所使用的,术语“FRET”(“荧光共振能量转移”;也被称为“萤光共振能量转移”)是指这样的物理现象,所述物理现象涉及供体荧光团和匹配的受体荧光团被选择为使得供体的发射光谱与受体的激发光谱重叠,并且被进一步选择为使得当供体和受体彼此非常接近(通常为10nm或更短距离)时,供体的激发将引起来自受体的激发和发射,这是因为一些能量经由量子耦合效应从供体传递到受体。因此,FRET信号用作供体和受体的接近度尺度;只有当它们彼此非常接近时才会产生信号。FRET供体部分(例如,供体荧光团)和FRET受体部分(例如,受体荧光团)在本文中统称为“FRET对”。
供体-受体对(FRET供体部分和FRET受体部分)在本文中被称为“FRET对”或“信号FRET对”。因此,在一些情况下,主题经标记的检测RNA包括两个信号配偶体(信号对),当一个信号配偶体是FRET供体部分时,另一个信号配偶体是FRET受体部分。因此,当信号配偶体非常接近时(例如,在相同的RNA分子上时),包括这种FRET对(FRET供体部分和FRET受体部分)的主题经标记的检测RNA将显示可检测信号(FRET信号),但是当所述配偶体分开时(例如,在用C2c2蛋白切割RNA分子后),信号将减少(或不存在)。
FRET供体和受体部分(FRET对)将是本领域的普通技术人员已知的,并且可以使用任何合宜的FRET对(例如,任何合宜的供体和受体部分对)。合适的FRET对的实例包括但不限于表1中所示的那些。还参见:Bajar等人,Sensors(Basel).2016年9月14日;16(9);和Abraham等人,PLoS One.2015年8月3日;10(8):e0134436。
表1.FRET对的实例(供体和受体FRET部分)
(1)5-(2-碘乙酰基氨基乙基)氨基萘-1-磺酸
(2)N-(4-二甲基氨基-3,5-二硝基苯基)马来酰亚胺
(3)羧基荧光素琥珀酰亚胺酯
(4)4,4-二氟-4-硼杂-3a,4a-二氮杂-s-吲哒生
在一些情况下,可检测信号在经标记的检测RNA被切割时产生(例如,在一些情况下,经标记的检测RNA包含猝灭剂/荧光剂对。信号猝灭对的一个信号配偶体产生可检测信号,而另一个信号配偶体是猝灭剂部分,所述猝灭剂部分猝灭第一信号配偶体的可检测信号(即,猝灭剂部分猝灭信号部分的信号,使得当信号配偶体彼此接近时(例如,当信号对的信号配偶体非常接近时),来自信号部分的信号减少(被猝灭)。
例如,在一些情况下,当经标记的检测RNA被切割时,可检测信号的量增加。例如,在一些情况下,由一个信号配偶体(信号部分)表现的信号被另一个信号配偶体(猝灭剂信号部分)猝灭,例如当在由C2c2蛋白进行切割之前两者存在于相同的RNA分子上时。这种信号对在本文中称为“猝灭剂/荧光剂对”、“猝灭对”或“信号猝灭对”。例如,在一些情况下,一个信号配偶体(例如,第一信号配偶体)是产生可检测信号的信号部分,所述可检测信号由第二信号配偶体(例如,猝灭剂部分)猝灭。因此,当配偶体被分开时(例如,在由C2c2蛋白切割检测RNA之后),这种猝灭剂/荧光剂对的信号配偶体将产生可检测信号,但是当配偶体非常接近(例如,在由C2c2蛋白切割检测RNA之前)时,所述信号将被猝灭。
猝灭剂部分可以将来自信号部分的信号(例如,在由C2c2蛋白切割检测RNA之前)猝灭至不同程度。在一些情况下,猝灭剂部分猝灭来自信号部分的信号,其中在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号是在不存在猝灭剂部分(当信号配偶体分开时)时检测到的信号的95%或更少。例如,在一些情况下,在存在猝灭剂部分的情况下检测到的信号可以是在不存在猝灭剂部分的情况下检测到的信号的90%或更少、80%或更少、70%或更少、60%或更少、50%或更少、40%或更少、30%或更少、20%或更少、15%或更少、10%或更少、或5%或更少。在一些情况下,在存在猝灭剂部分的情况下未检测到信号(例如,高于背景)。
在一些情况下,在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号是在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号的至少1.2倍(例如,至少1.3倍、至少1.5倍、至少1.7倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少7倍、至少10倍、至少20倍或至少50倍)。
在一些情况下,信号部分是荧光标记。在一些此类情况下,猝灭剂部分猝灭来自荧光标记的信号(光信号)(例如,通过吸收标记的发射光谱中的能量)。因此,当猝灭剂部分不与信号部分接近时,来自荧光标记的发射(信号)是可检测的,因为信号不被猝灭剂部分吸收。可以使用任何合宜的供体受体对(信号部分/猝灭剂部分对),并且许多合适的对是本领域中已知的。
在一些情况下,猝灭剂部分从信号部分(在本文中也称为“可检测标记”)吸收能量,然后发射信号(例如,不同波长的光)。因此,在一些情况下,猝灭剂部分本身是信号部分(例如,信号部分可以是6-羧基荧光素,而猝灭剂部分可以是6-羧基-四甲基罗丹明),并且在一些此类情况下,所述对也可以是FRET对。在一些情况下,猝灭剂部分是暗猝灭剂。暗猝灭剂可以吸收激发能量并以不同方式耗散能量(例如,作为热量)。因此,暗猝灭剂本身具有极小荧光至没有荧光(不发射荧光)。暗猝灭剂的实例进一步描述于美国专利号8,822,673和8,586,718;美国专利公开20140378330、20140349295和20140194611;以及国际专利申请:WO200142505和WO200186001中,所有这些专利都据此以引用方式整体并入本文。
荧光标记的实例包括但不限于:Alexa染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTORho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、方形染料(Square dye)、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白(tethered fluorescent protein)。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa 染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、方形染料、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿和太平洋橙。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa 染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、方形染料、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白。
ATTO染料的实例包括但不限于:ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTORho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTORho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTOOxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、以及ATTO 740。
AlexaFluor染料的实例包括但不限于:Alexa350、Alexa405、Alexa430、Alexa488、Alexa500、Alexa514、Alexa532、Alexa546、Alexa555、Alexa568、Alexa594、Alexa610、Alexa633、Alexa635、Alexa647、Alexa660、Alexa680、Alexa700、Alexa750、Alexa790等等。
猝灭剂部分的实例包括但不限于:暗猝灭剂、Black Hole(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇(诸如金纳米粒子)等。
在一些情况下,猝灭剂部分选自:暗猝灭剂、Black Hole(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇。
ATTO猝灭剂的实例包括但不限于:ATTO 540Q、ATTO 580Q和ATTO 612Q。BlackHole的实例包括但不限于:BHQ-0(493nm)、BHQ-1(534nm)、BHQ-2(579nm)和BHQ-3(672nm)。
对于一些可检测标记(例如,荧光染料)和/或猝灭剂部分的实例,参见例如Bao等人,Annu Rev Biomed Eng.2009;11:25-47;以及美国专利号8,822,673和8,586,718;美国专利公开20140378330、20140349295、20140194611、20130323851、20130224871、20110223677、20110190486、20110172420、20060179585和20030003486;以及国际专利申请:WO200142505和WO200186001,所有这些参考文献据此以引用方式整体并入。
在一些情况下,可以通过测量比色读出来检测对经标记的检测RNA的切割。例如,荧光团的释放(例如,从FRET对释放、从猝灭剂/荧光剂对释放等)可导致可检测信号的波长偏移(并因此色移)。因此,在一些情况下,可以通过色移检测主题经标记的检测RNA的切割。这种偏移可以表示为一种颜色(波长)信号的量损失、另一种颜色的量的增益、一种颜色与另一种颜色的比率的变化等。
核酸修饰
在一些情况下,经标记的检测RNA包含一种或多种修饰,例如碱基修饰、骨架修饰、糖修饰等,以为核酸提供新的或增强的特征(例如,改善的稳定性)。如本领域中已知的,核苷是碱基-核糖组合。核苷的碱基部分通常是杂环碱基。此类杂环碱基的两种最常见的类别是嘌呤和嘧啶。核苷酸是这样的核苷,所述核苷还包括与核苷的糖部分共价连接的磷酸基团。对于那些包括戊呋喃糖基糖的核苷,磷酸基团可以与所述糖的2'、3'或5'羟基部分连接。在形成寡核苷酸时,磷酸基团将相邻的核苷彼此共价连接以形成直链聚合化合物。继而,该直链聚合化合物的各个末端可以进一步连接以形成环状化合物,然而,直链化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以以产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸基团通常被称为形成寡核苷酸的核苷间骨架。RNA和DNA的正常键或骨架是3'至5'磷酸二酯键。
经修饰的骨架和经修饰的核苷间键
合适的修饰的实例包括经修饰的核酸骨架和非天然的核苷间键。具有经修饰的骨架的核酸包括在骨架中保留磷原子的核酸和在骨架中不具有磷原子的核酸。
其中含有磷原子的合适的经修饰寡核苷酸骨架包含例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其它烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、具有正常3'-5'键的硒代磷酸酯和硼代磷酸酯、硒代磷酸酯和硼代磷酸酯的2'-5'连接的类似物,以及具有反向极性的硒代磷酸酯和硼代磷酸酯,其中一个或多个核苷酸间键是3'至3'键、5'至5'键或2'至2'键。合适的具有反向极性的寡核苷酸包含在最3'核苷酸间键处的单个3'至3'键,即单个反向核苷残基,所述单个反向核苷残基可以是碱性的(核碱基丢失或具有羟基代替其)。还包括各种盐(诸如,钾盐或钠盐)、混合盐和游离酸形式。
在一些情况下,经标记的检测RNA包含一个或多个硫代磷酸酯和/或杂原子核苷间键,特别是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(称为亚甲基(甲基亚氨基)或MMI骨架)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键表示为-O-P(=O)(OH)-O-CH2-)。MMI型核苷间键在上面引用的美国专利号5,489,677中公开。合适的酰胺核苷间键在美国专利号5,602,240中公开。
同样合适的是如在例如美国专利号5,034,506中所述的具有吗啉代骨架结构的核酸。例如,在一些情况下,经标记的检测RNA包含6元吗啉代环代替核糖环。在一些情况下,二氨基磷酸酯或其它非磷酸二酯核苷间键取代磷酸二酯键。
其中不含磷原子的合适的经修饰多核苷酸骨架具有由短链烷基或环烷基核苷间键、混合杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的骨架。这些骨架包括具有吗啉代键(部分地由核苷的糖部分形成)的那些骨架;硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰基和硫代甲酰基骨架;亚甲基甲酰基和硫代甲酰基骨架;核糖乙酰骨架;含有烯基的骨架;氨基磺酸酯骨架;亚甲基亚氨基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及其它具有混合的N、O、S和CH2组成部分的骨架。
模拟物
经标记的检测RNA可以是核酸模拟物。应用于多核苷酸的术语“模拟物”旨在包括这样的多核苷酸,在所述多核苷酸中仅呋喃糖环或呋喃糖环和核苷酸间键两者被非呋喃糖基团替代,仅替代呋喃糖环也在本领域中被称为糖替代物。维持杂环碱基部分或经修饰的杂环碱基部分以与合适的靶核酸杂交。一种此类核酸,已显示具有优异杂交特性的多核苷酸模拟物,被称为肽核酸(PNA)。在PNA中,多核苷酸的糖骨架被含酰胺的骨架,特别是氨基乙基甘氨酸骨架取代。核苷酸被保留并直接或间接地结合骨架的酰胺部分的氮杂氮原子。
一种据报道具有优异杂交特性的多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的骨架是两个或更多个连接的氨基乙基甘氨酸单元,所述氨基乙基甘氨酸单元赋予PNA含酰胺的骨架。杂环碱基部分直接或间接地与骨架的酰胺部分的氮杂氮原子结合。描述PNA化合物制备的代表性美国专利包括但不限于:美国专利号5,539,082;5,714,331;和5,719,262。
已经研究的另一类多核苷酸模拟物基于连接的吗啉代单元(吗啉代核酸),所述连接的吗啉代单元具有附接到吗啉代环的杂环碱基。已经报道了许多连接基团,所述连接基团连接吗啉代核酸中的吗啉代单体单元。一类连接基团已经被选择用于提供非离子寡聚化合物。非离子的基于吗啉代的寡聚化合物不太可能与细胞蛋白发生不希望的相互作用。基于吗啉代的多核苷酸是寡核苷酸的非离子模拟物,其不太可能与细胞蛋白形成不希望的相互作用(Dwaine A.Braasch和David R.Corey,Biochemistry,2002,41(14),4503-4510)。基于吗啉代的多核苷酸在美国专利号5,034,506中公开。已经制备了吗啉代类多核苷酸内的多种化合物,所述化合物具有各种连接单体亚基的不同连接基团。
另一类多核苷酸模拟物被称为环己烯基核酸(CeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环替代。CeNA DMT保护的亚磷酰胺单体已被制备并用于按照经典的亚磷酰胺化学进行寡聚化合物合成。已经制备并研究了完全修饰的CeNA寡聚化合物和具有用CeNA修饰的特定位置的寡核苷酸(参见Wang等人,J.Am.Chem.Soc.,2000,122,8595-8602)。通常,将CeNA单体掺入DNA链中增加了其DNA/RNA杂交体的稳定性。CeNA寡腺苷酸以与天然复合物相似的稳定性而与RNA和DNA互补物形成复合物。通过NMR和圆二色性显示将CeNA结构掺入天然核酸结构中的研究,以进行简单的构象适应。
另一修饰包括锁定核酸(LNA),其中2'-羟基与糖环的4'碳原子连接,从而形成2'-C,4'-C-氧亚甲基键,从而形成双环糖部分。键可以是亚甲基(-CH2-)、桥接2'氧原子与4'碳原子的基团,其中n是1或2(Singh等人,Chem.Commun.,1998,4,455-456)。LNA和LNA类似物显示出非常高的互补DNA和RNA的双链热稳定性(Tm=+3至+10℃),朝向3'-核酸外切降解的稳定性和良好的溶解性。已经描述了含有LNA的有效和无毒的反义寡核苷酸(Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638)。
已经描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备,以及它们的寡聚化和核酸识别性质(Koshkin等人,Tetrahedron,1998,54,3607-3630)。LNA及其制备还描述于WO 98/39352和WO 99/14226中。
经修饰的糖部分
经标记的检测RNA还可包括一个或多个经取代的糖部分。合适的多核苷酸包含选自以下的糖取代基:OH;F;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基;O-炔基、S-炔基或N-炔基;或O-烷基-O-烷基,其中所述烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。特别合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2以及O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其它合适的多核苷酸包含选自以下的糖取代基:C1至C10低级烷基,取代的低级烷基、烯基、炔基,烷芳基,芳烷基,O-烷芳基或O-芳烷基,SH,SCH3,OCN,Cl,Br,CN,CF3,OCF3,SOCH3,SO2CH3,ONO2,NO2,N3,NH2,杂环烷基,杂环烷芳基,氨基烷基氨基,聚烷基氨基,取代的甲硅烷基,RNA切割基团,报告基团,嵌入剂,用于改善寡核苷酸的药代动力学性质的基团,或用于改善寡核苷酸的药效学性质的基团,以及其它具有相似性质的取代基。合适的修饰包括2'-甲氧基乙氧基(2'-O-CH2CH2OCH3,也称为2'-O-(2-甲氧基乙基)或2'-MOE)(Martin等人,Helv.Chim.Acta,1995,78,486-504),即烷氧基烷氧基基团。另一合适的修饰包括2'-二甲基氨氧乙氧基,即O(CH2)2ON(CH3)2基团,也称为2'-DMAOE,如下文实施例中所述;以及2'-二甲氨基乙氧基乙氧基(在本领域中也称为2'-O-二甲基-氨基-乙氧基-乙基或2'-DMAEOE),即2'-O-CH2-O-CH2-N(CH3)2
其它合适的糖取代基包括甲氧基(-O-CH3)、氨基丙氧基(--O CH2 CH2 CH2NH2)、烯丙基(-CH2-CH=CH2)、-O-烯丙基(--O--CH2—CH=CH2)和氟(F)。2'-糖取代基可以处于阿拉伯糖(上)位置或核糖(下)位置。合适的2'-阿拉伯糖修饰是2'-F。也可以在寡聚化合物上的其它位置,特别是3'末端核苷上或2'-5'连接的寡核苷酸的糖的3'位置处,以及5'末端核苷酸的5'位置处进行类似的修饰。寡聚化合物也可以具有糖模拟物,诸如环丁基部分代替戊呋喃糖基糖。
碱基修饰和取代
经标记的检测RNA还可以包括核碱基(在本领域中通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G),以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。经修饰的核碱基包括其它合成和天然核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、6-甲基腺嘌呤和鸟嘌呤以及腺嘌呤和鸟嘌呤的其它烷基衍生物、2-丙基腺嘌呤和鸟嘌呤以及腺嘌呤和鸟嘌呤的其它烷基衍生物、2-硫尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-氟尿嘧啶和胞嘧啶、5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其它炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代腺嘌呤和鸟嘌呤、8-氨基腺嘌呤和鸟嘌呤、8-巯基腺嘌呤和鸟嘌呤、8-硫代烷基腺嘌呤和鸟嘌呤、8-羟基腺嘌呤和鸟嘌呤以及其它8-取代的腺嘌呤和鸟嘌呤、5-卤代(特别是5-溴代)尿嘧啶和胞嘧啶、5-三氟甲基尿嘧啶和胞嘧啶以及其它5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮杂鸟嘌呤和7-脱氮杂腺嘌呤,以及3-脱氮杂鸟嘌呤和3-脱氮杂腺嘌呤。其它经修饰的核碱基包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-钳如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3',2':4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可包括嘌呤碱基或嘧啶碱基被其它杂环取代的那些杂环碱基部分,例如7-脱氮杂腺嘌呤、7-脱氮杂鸟苷、2-氨基吡啶和2-吡啶酮。其它核碱基包括在美国专利号3,687,808中公开的那些核碱基;在The Concise Encyclopedia Of PolymerScience And Engineering,第858-859页,Kroschwitz,J.I.编辑,John Wiley&Sons,1990中公开的那些核碱基;由Englisch等人,Angewandte Chemie,International Edition,1991,30,613公开的那些核碱基;以及由Sanghvi,Y.S.,第15章,Antisense Research andApplications,第289-302页,Crooke,S.T.和Lebleu,B.编辑,CRC Press,1993公开的那些核碱基。这些核碱基中的某些可用于增加寡聚化合物的结合亲和力。这些核碱基包括5-取代的嘧啶、6-氮杂嘧啶,以及N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示为使核酸双链体稳定性增加0.6-1.2℃(Sanghvi等人编辑,Antisense Research and Applications,CRC Press,Boca Raton,1993,第276-278页),并且是合适的碱基取代,例如当与2'-O-甲氧基乙基糖修饰组合时。
检测两种不同的靶RNA
如上所述,在一些情况下,本公开的方法提供了对样品中两种不同靶RNA(第一单链靶RNA和第二单链靶RNA)的基本上同时检测。在一些情况下,所述方法包括:a)使样品(例如,包含两种不同靶RNA和多种非靶RNA的样品)与以下接触:(i)第一C2c2蛋白,其切割样品中存在的腺嘌呤+RNA(即,包括A的RNA,而不是缺乏A的RNA,诸如聚U RNA);(ⅱ)第二C2c2蛋白,其切割尿嘧啶+RNA(即,包括U的RNA,而不是缺乏U的RNA,如聚A RNA);(iii)第一C2c2指导RNA,其包含与第一单链靶RNA杂交的第一核苷酸序列和与第一C2c2蛋白结合的第二核苷酸序列;以及(iv)第二C2c2指导RNA,其包含与第二单链靶RNA杂交的第一核苷酸序列和与第二C2c2蛋白结合的第二核苷酸序列;以及b)测量由第一和第二C2c2蛋白介导的RNA切割产生的可检测信号,其中第一可检测信号由第一C2c2蛋白产生,并且第二可检测信号由第二C2c2蛋白产生,其中所述第一可检测信号和所述第二可检测信号可彼此区分。在一些情况下,第一C2c2蛋白不被第二C2c2指导RNA激活,并且第一C2c2蛋白切割包括A的ssRNA(例如,不切割缺乏A的ssRNA);并且第二C2c2蛋白不被第一C2c2指导RNA激活,并且第二C2c2蛋白切割包括U的ssRNA(例如,不切割缺乏U的ssRNA)。在一些情况下,第一C2c2蛋白不被第二C2c2指导RNA激活,并且第一C2c2蛋白切割包括U的ssRNA(例如,不切割缺乏U的ssRNA);并且第二C2c2蛋白不被第一C2c2指导RNA激活,并且第二C2c2蛋白切割包括A的ssRNA(例如,不切割缺乏A的ssRNA)。
在一些情况下,所述方法还包括使样品与以下接触:i)第一经标记的检测RNA,其包含第一FRET对和/或第一猝灭剂/荧光剂对(上文描述了示例性FRET对和猝灭剂/荧光剂对);以及ii)第二经标记的检测RNA,其包含第二FRET对和/或第二猝灭剂/荧光剂对(上文描述了示例性FRET对和猝灭剂/荧光剂对)。在一些情况下,第一经标记的检测RNA包含至少一个A并且不包含U;而第二经标记的检测RNA包含至少一个U并且不包含A。在一些情况下,第一经标记的检测RNA包含至少一个U并且不包含A;而第二经标记的检测RNA包含至少一个A并且不包含U。第一C2c2蛋白切割第一经标记的检测RNA,并且第一可检测信号由第一FRET对和/或第一猝灭剂/荧光剂对产生,并且第二C2c2蛋白切割第二经标记的检测RNA,并且第二可检测信号由第二FRET对和/或第二猝灭剂/荧光剂对产生。检测到第一可检测信号表明样品中存在第一靶RNA;并且检测到第二可检测信号表明样品中存在第二靶RNA。在一些情况下,检测到的第一信号和第二信号的相对量指示样品中第一靶RNA与第二靶RNA的比率。
在一些情况下,第一经标记的检测RNA包含可与第二经标记的检测RNA的标记区分的标记。例如,第一经标记的检测RNA可包含第一FRET对和/或第一猝灭剂/荧光剂对;并且第二经标记的检测RNA可包含第二FRET对和/或第二猝灭剂/荧光剂对。作为一个非限制性实例,第一经标记的检测RNA可包含含色氨酸的供体和含丹酰的受体;并且第二经标记的检测RNA可包含含IAEDANS的供体和含DDPM的受体。作为另一个非限制性实例,第一经标记的检测RNA包含含丹酰的供体和含FITC的受体;并且第二经标记的检测RNA包含含Cy3的供体和含Cy5的受体。在一些情况下,第一经标记的检测RNA包含5’FAM(荧光素)-3’IBFQ(IowaFQ)猝灭剂/荧光剂对,并且在一些情况下,第二经标记的检测RNA包含5’FAM(荧光素)-3’IBFQ(IowaFQ)猝灭剂/荧光剂对。
在一些情况下,将第一和第二经标记的检测RNA同时加入样品中(基本上同时接触)。在一些此类情况下,由第一和第二经标记的检测RNA产生的信号同时被检测到(基本上同时接触),例如是因为在此类情况下,第一和第二经标记的检测RNA可以被区别地标记。
“基本上同时”是指在约5分钟内、约3分钟内、约2分钟内、约1分钟内、约30秒内、约15秒内、约10秒内、约5秒内,或约1秒内。
然而,在一些情况下,由第一和第二经标记的检测RNA产生的信号不是同时被检测到的,而是替代地被顺序检测到的(一个在另一个之前)。例如,在一些情况下,第一和第二经标记的检测RNA不是同时加入到样品中的,而是替代地顺序加入(例如,可以在第一经标记的检测RNA加入之后加入第二经标记的检测RNA),并且在一些此类情况下,直到检测到由第一经标记的检测RNA产生的信号之后才添加第二经标记的检测RNA。因此,在一些情况下,不需要可区分地标记第一和第二经标记的检测RNA(例如,它们可以在一些情况下产生相同的可检测信号,例如,可以在相同波长下发荧光),这是因为信号将被顺序地检测到。
作为说明性实例,在一些情况下:(i)没有可区别地标记第一和第二经标记的检测RNA;(ii)使样品与一种经标记的检测RNA接触,并且检测(例如,测量)由该经标记的检测RNA产生的信号;以及(iii)然后使样品与另一种经标记的检测RNA接触,并检测由所加入的第二经标记的检测RNA产生的信号-因此,当样品中存在两种靶ssRNA时,加入第二经标记的检测RNA可以导致信号增强(例如,如果信号随着切割增加而增加,例如荧光剂/猝灭剂对)或者可以导致在加入第二经标记的检测RNA之后可检测的信号减少(例如,如果信号随着切割增加而减少,例如FRET对)。
关于C2c2指导RNA结合,第一和第二C2c2蛋白可以彼此正交。在此类情况下,第一C2c2蛋白不与第二C2c2指导RNA结合;并且第二C2c2蛋白不与第一指导RNA结合。第一C2c2蛋白和第二C2c2蛋白还可以在它们的ssRNA切割偏好性方面彼此不同,使得C2c2蛋白中的一种C2c2蛋白在A处切割ssRNA而另一种C2c2蛋白在U处切割ssRNA。
对C2c2蛋白的正交对的指导可以在图44E中找到。
适用于本公开的方法的C2c2蛋白的正交对的非限制性实例包括下表10中描述的那些。切割偏好性在Cas13a蛋白名称后的括号中呈现。例如,“Lba(A)”是指Lba Cas13a蛋白,其在A处切割ssRNA;并且“Lbu(U)”是指Lbu Cas13a蛋白,其在U处切割ssRNA。
表10
第一和第二经标记的检测RNA可以各自独立地具有2至100个核糖核苷酸(例如,2至80个、2至60个、2至50个、2至40个、2至30个、2至20个、2至15个或2至10个核糖核苷酸)的长度。第一和第二经标记的检测RNA可以各自独立地具有2个核糖核苷酸至100个核糖核苷酸的长度,例如2个核糖核苷酸至5个核糖核苷酸、5个核糖核苷酸至7个核糖核苷酸、7个核糖核苷酸至10个核糖核苷酸、10个核糖核苷酸至15个核糖核苷酸、15个核糖核苷酸至20个核糖核苷酸、20个核糖核苷酸至25个核糖核苷酸、25个核糖核苷酸至30个核糖核苷酸、30个核糖核苷酸至35个核糖核苷酸、35个核糖核苷酸至40个核糖核苷酸、40个核糖核苷酸至45个核糖核苷酸,或45个核糖核苷酸至50个核糖核苷酸的长度。
在一些情况下,第一经标记的检测RNA包含至少一个A(例如,至少2个、至少3个或至少4个A)并且缺乏U;并且第二经标记的检测RNA包含至少一个U(例如,至少2个、至少3个或至少4个U)并且缺乏A。
在一些情况下,第一经标记的检测RNA缺乏U并且包括2至15个连续的A(例如,2至12个、2至10个、2至8个、2至6个、2至4个、3至15个、3至12个、3至10个、3至8个、3至6个、3至5个、4至15个、4至12个、4至10个、4至8个或4至6个连续的A)的段。在一些情况下,第一经标记的检测RNA缺乏U并且包括至少2个连续的A(例如,至少3个、至少4个或至少5个连续的A)的段。在一些情况下,第二经标记的检测RNA缺乏A并且包括2至15个连续的U(例如,2至12个、2至10个、2至8个、2至6个、2至4个、3至15个、3至12个、3至10个、3至8个、3至6个、3至5个、4至15个、4至12个、4至10个、4至8个或4至6个连续的U)的段。在一些情况下,第二经标记的检测RNA缺乏A并且包括至少2个连续的U(例如,至少3个、至少4个或至少5个连续的U)的段。
在一些情况下,第一经标记的检测RNA缺乏A并且包括2至15个连续的U(例如,2至12个、2至10个、2至8个、2至6个、2至4个、3至15个、3至12个、3至10个、3至8个、3至6个、3至5个、4至15个、4至12个、4至10个、4至8个或4至6个连续的U)的段。在一些情况下,第一经标记的检测RNA缺乏A并且包括至少2个连续的U(例如,至少3个、至少4个或至少5个连续的U)的段。在一些情况下,第二经标记的检测RNA缺乏U并且包括2至15个连续的A(例如,2至12个、2至10个、2至8个、2至6个、2至4个、3至15个、3至12个、3至10个、3至8个、3至6个、3至5个、4至15个、4至12个、4至10个、4至8个或4至6个连续的A)的段。在一些情况下,第二经标记的检测RNA缺乏U并且包括至少2个连续的A(例如,至少3个、至少4个或至少5个连续的A)的段。
在一些情况下,第一经标记的检测RNA包含至少一个U并且缺乏A;并且第二经标记的检测RNA包含至少一个A并且缺乏U。
在一些情况下,第一经标记的检测RNA包含至少一个A并且缺乏U。例如,在一些情况下,第一经标记的检测RNA是同聚腺苷聚合物(聚A RNA)。作为另一实例,第一经标记的检测RNA:i)包含至少一个A;ii)缺乏U;并且iii)包含一个或多个C和/或G。在一些情况下,第二经标记的检测RNA包含至少一个U并且缺乏A。例如,在一些情况下,第二经标记的检测RNA是同聚尿苷聚合物(聚U RNA)。作为另一实例,第二经标记的检测RNA:i)包含至少一个U;ii)缺乏A;并且iii)包含一个或多个C和/或G。
在一些情况下,第一经标记的检测RNA包含至少一个U并且缺乏A。例如,在一些情况下,第一经标记的检测RNA是同聚尿苷聚合物(聚U RNA)。作为另一实例,第二经标记的检测RNA:i)包含至少一个U;ii)缺乏A;并且iii)包含一个或多个C和/或G。在一些情况下,第二经标记的检测RNA包含至少一个A并且缺乏U。例如,在一些情况下,第二经标记的检测RNA是同聚腺苷聚合物(聚A RNA)。作为另一实例,第二经标记的检测RNA:i)包含至少一个A;ii)缺乏U;并且iii)包含一个或多个C和/或G。
如上所述,本公开的方法可以包括使样品与以下接触:第一C2c2蛋白;第二C2c2蛋白;第一C2c2指导RNA,其包含与第一单链靶RNA杂交的第一核苷酸序列和在本文中也称为‘恒定区’或‘柄’的第二核苷酸序列,所述第二核苷酸序列与第一C2c2蛋白结合;以及第二C2c2指导RNA,其包含与第二单链靶RNA杂交的第一核苷酸序列和与第二C2c2蛋白结合的第二核苷酸序列(柄)。
例如,在一些情况下,第一C2c2蛋白是Cas13a多肽,其包含与图56F中所示的LbaCas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第一C2c2指导RNA包含恒定区(‘柄’-与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列AGAUAGCCCAAGAAAGAGGGCAAUAAC(SEQ ID NO:16)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt,其中crRNA的长度为约25nt、26nt、27nt、28nt、29nt或30nt。在一些情况下,crRNA具有核苷酸序列AGAUAGCCCAAGAAAGAGGGCAAUAAC(SEQ ID NO:16);并且长度为27nt。在一些情况下,第二C2c2蛋白包含与图56K中所示的HheCas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GUAACAAUCCCCGUAGACAGGGGAACUGCAAC(SEQ ID NO:17)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt。在一些情况下,第二C2c2蛋白包含与图56G中所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列CAUCACCGCCAAGACGACGGCGGACUGAACC(SEQ ID NO:18)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt。在一些情况下,第二C2c2蛋白包含与图56B中所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列AAUUAUCCCAAAAUUGAAGGGAACUACAAC(SEQ ID NO:19)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列AAUUAUCCCAAAAUUGAAGGGAACUACAAC(SEQ ID NO:19);并且所述柄的长度为30nt。在一些情况下,第二C2c2蛋白包含与图56I中所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ IDNO:20)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ ID NO:20)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ ID NO:20);其中所述柄的长度为30nt。在一些情况下,第二C2c2蛋白包含与图56C中所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9);其中所述柄的长度为31nt。在一些情况下,第二C2c2蛋白包含与图56E中所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21);其中所述柄的长度为32nt。在一些情况下,第二C2c2蛋白包含与图56D中所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为25nt、26nt、27nt、28nt或29nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22);其中所述柄的长度为27nt。
作为另一实例,在一些情况下,第一C2c2蛋白是Cas13a多肽,其包含与图56J中所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第一C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列AAGUAGCCCGAUAUAGAGGGCAAUAAC(SEQ ID NO:23)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt,其中所述柄的长度为约25nt、26nt、27nt、28nt、29nt或30nt。在一些情况下,所述柄具有核苷酸序列AAGUAGCCCGAUAUAGAGGGCAAUAAC(SEQID NO:23);并且长度为27nt。在一些情况下,第一C2c2蛋白是Cas13a多肽,其包含与图56J中所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第一C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列AUACAGCUCGAUAUAGUGAGCAAUAAG(SEQ ID NO:24)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt,其中所述柄的长度为约25nt、26nt、27nt、28nt、29nt或30nt。在一些情况下,所述柄具有核苷酸序列AUACAGCUCGAUAUAGUGAGCAAUAAG(SEQ ID NO:24);并且长度为27nt。在一些情况下,第二C2c2蛋白包含与图56K中所示的HheCas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GUAACAAUCCCCGUAGACAGGGGAACUGCAAC(SEQ ID NO:17)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约30nt、31nt、32nt、33nt、34nt或35nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列GUAACAAUCCCCGUAGACAGGGGAACUGCAAC(SEQ ID NO:17);并且所述柄的长度为32nt。在一些情况下,第二C2c2蛋白包含与图56G中所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列UCACAUCACCGCCAAGACGACGGCGGACUGAACC(SEQ ID NO:25)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约32nt、33nt、34nt、35nt、36nt或37nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列UCACAUCACCGCCAAGACGACGGCGGACUGAACC(SEQ ID NO:25);并且所述柄的长度为34nt。在一些情况下,第二C2c2蛋白包含与图56B中所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列AAUUAUCCCAAAAUUGAAGGGAACUACAAC(SEQ ID NO:19)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列AAUUAUCCCAAAAUUGAAGGGAACUACAAC(SEQ ID NO:19);并且所述柄的长度为30nt。在一些情况下,第二C2c2蛋白包含与图56I中所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ IDNO:20)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ ID NO:20)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ ID NO:20);其中所述柄的长度为30nt。在一些情况下,第二C2c2蛋白包含与图56C中所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9);其中所述柄的长度为31nt。在一些情况下,第二C2c2蛋白包含与图56E中所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21);其中所述柄的长度为32nt。在一些情况下,第二C2c2蛋白包含与图56D中所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为25nt、26nt、27nt、28nt或29nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22);其中所述柄的长度为27nt。在一些情况下,第二C2c2蛋白包含与图56A中所示的LseCas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACUACCUCUAUAUGAAAGAGGACUAAAAC(SEQ ID NO:7)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列GACUACCUCUAUAUGAAAGAGGACUAAAAC(SEQ ID NO:7);并且所述柄的长度为30nt。
作为另一实例,在一些情况下,第一C2c2蛋白是Cas13a多肽,其包含与图56H中所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第一C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GAACAGCCCGAUAUAGAGGGCAAUAGAC(SEQ ID NO:26)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt,其中所述柄的长度为约26nt、27nt、28nt、29nt或30nt。在一些情况下,所述柄具有核苷酸序列GAACAGCCCGAUAUAGAGGGCAAUAGAC(SEQ IDNO:26);并且长度为28nt。在一些情况下,第二C2c2蛋白包含与图56K中所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GUAACAAUCCCCGUAGACAGGGGAACUGCAAC(SEQ ID NO:17)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约30nt、31nt、32nt、33nt、34nt,或35nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列GUAACAAUCCCCGUAGACAGGGGAACUGCAAC(SEQ ID NO:17);并且所述柄的长度为32nt。在一些情况下,第二C2c2蛋白包含与图56G中所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列UCACAUCACCGCCAAGACGACGGCGGACUGAACC(SEQ ID NO:25)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约32nt、33nt、34nt、35nt、36nt或37nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列UCACAUCACCGCCAAGACGACGGCGGACUGAACC(SEQ ID NO:25);并且所述柄的长度为34nt。在一些情况下,第二C2c2蛋白包含与图56B中所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列AAUUAUCCCAAAAUUGAAGGGAACUACAAC(SEQ ID NO:19)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列AAUUAUCCCAAAAUUGAAGGGAACUACAAC(SEQ ID NO:19);并且所述柄的长度为30nt。在一些情况下,第二C2c2蛋白包含与图56I中所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ IDNO:20)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ ID NO:20)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GAGUACCUCAAAACAAAAGAGGACUAAAAC(SEQ ID NO:20);其中所述柄的长度为30nt。在一些情况下,第二C2c2蛋白包含与图56C中所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9);其中所述柄的长度为31nt。在一些情况下,第二C2c2蛋白包含与图56E中所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列GACCACCCCAAUAUCGAAGGGGACUAAAACUU(SEQ ID NO:21);其中所述柄的长度为32nt。在一些情况下,第二C2c2蛋白包含与图56D中所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt(例如,包含与核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22)仅差异1nt、2nt、3nt、4nt或5nt的核苷酸序列);其中所述柄的长度为25nt、26nt、27nt、28nt或29nt。在一些情况下,第二指导RNA包含柄,所述柄包含核苷酸序列CACCCCAAUAUCGAAGGGGACUAAAAC(SEQ ID NO:22);其中所述柄的长度为27nt。在一些情况下,第二C2c2蛋白包含与图56A中所示的LseCas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2指导RNA包含柄(与Cas13a多肽结合的一段核苷酸),其包含这样的核苷酸序列,所述核苷酸序列与核苷酸序列GACUACCUCUAUAUGAAAGAGGACUAAAAC(SEQ ID NO:7)的差异不超过1个核苷酸(nt)、不超过2nt、不超过3nt、不超过4nt或不超过5nt;其中所述柄的长度为约28nt、29nt、30nt、31nt或32nt。在一些情况下,第二C2c2指导RNA包含柄,所述柄包含核苷酸序列GACUACCUCUAUAUGAAAGAGGACUAAAAC(SEQ ID NO:7);并且所述柄的长度为30nt。
混合检测
如上所述,在一些情况下,本公开的方法包括:a)使样品(例如,包含靶RNA和多种非靶RNA的样品)与以下接触:i)前体C2c2指导RNA阵列,其包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;和(ii)C2c2蛋白,其将前体C2c2指导RNA阵列切割成单独的C2c2指导RNA,并且还切割样品的RNA;以及b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。
在一些情况下,阵列(前体C2c2指导RNA阵列)上可以存在两个或更多个C2c2指导RNA。C2c2蛋白可以将前体C2c2指导RNA阵列切割成单独的C2c2指导RNA(例如,参见图4和图6)。
在一些情况下,主题C2c2指导RNA阵列包括2个或更多个C2c2指导RNA(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、或7个或更多个C2c2指导RNA)。给定阵列的C2c2指导RNA可以靶向相同靶RNA的不同靶位点(即,可以包括与所述不同靶位点杂交的指导序列)(例如,这可以增加检测的灵敏度)和/或可以靶向不同的靶RNA分子(例如,例如基于诸如单核苷酸多态性、单核苷酸多态性(SNP)等等之类的变异的转录物家族等可用于例如检测多种病毒株,诸如流感病毒变体、寨卡病毒变体、HIV变体等)。
C2c2蛋白
C2c2蛋白与C2c2指导RNA结合,由指导RNA(其与靶RNA杂交)引导到单链靶RNA,从而被“激活”。如果C2c2蛋白的HEPN1结构域和HEPN2结构域是完整的,则C2c2蛋白一旦被激活就切割靶RNA,但是也切割非靶RNA。
示例性的天然存在C2c2蛋白描绘于图8中,并且如SEQ ID NO:1至SEQ ID NO:6所示。在一些情况下,主题C2c2蛋白包括与SEQ ID NO:1至SEQ ID NO:6中任一项所示的氨基酸序列具有80%或更多(例如,85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多、或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,合适的C2c2多肽包含与SEQ ID NO:1所示的斯氏李斯特菌(Listeria seeligeri)C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,合适的C2c2多肽包含与SEQ ID NO:2所示的口腔纤毛菌(Leptotrichia buccalis)C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,合适的C2c2多肽包含与SEQ ID NO:4所示的荚膜红细菌(Rhodobacter capsulatus)C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,合适的C2c2多肽包含与SEQ ID NO:5所示的鸡肉杆菌(Carnobacterium gallinarum)C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,合适的C2c2多肽包含与SEQ ID NO:6所示的Herbinix hemicellulosilytica C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,C2c2蛋白包括与SEQ ID NO:2所示的口腔纤毛菌(Lbu)C2c2氨基酸序列具有80%或更多的氨基酸序列同一性的氨基酸序列。在一些情况下,C2c2蛋白是口腔纤毛菌(Lbu)C2c2蛋白(例如,参见SEQ ID NO:2)。在一些情况下,C2c2蛋白包括SEQ ID NO:1至SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一项所示的氨基酸序列。
在一些情况下,在本公开的方法中使用的C2c2蛋白不是沙氏纤毛菌(Leptotrichia shahii)(Lsh)C2c2蛋白。在一些情况下,在本公开的方法中使用的C2c2蛋白不是与SEQ ID NO:3所示的Lsh C2c2多肽具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的C2c2多肽。
在一些情况下,所述C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白在切割未由所述方法的C2c2指导RNA靶向的RNA方面更有效1.2倍或更多倍。在一些情况下,所述C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白在切割未由所述方法的C2c2指导RNA靶向的RNA方面更有效1.5倍或更多倍。在一些情况下,在本公开的方法中使用的C2c2多肽当被激活时,比Lsh C2c2至少1.2倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少30倍或大于30倍有效地切割非靶RNA。
在一些情况下,C2c2蛋白在所述接触的1小时内表现出至少50%的RNA切割效率(例如,55%或更多、60%或更多、65%或更多、70%或更多、或75%或更多的切割效率)。在一些情况下,C2c2蛋白在所述接触的40分钟内表现出至少50%的RNA切割效率(例如,55%或更多、60%或更多、65%或更多、70%或更多、或75%或更多的切割效率)。在一些情况下,C2c2蛋白在所述接触的30分钟内表现出至少50%的RNA切割效率(例如,55%或更多、60%或更多、65%或更多、70%或更多、或75%或更多的切割效率)。
在一些情况下,适用于本公开的方法的C2c2蛋白在30秒至60分钟(例如,1分钟至60分钟、30秒至5分钟、1分钟至5分钟、1分钟至10分钟、5分钟至10分钟、10分钟至15分钟、15分钟至20分钟、20分钟至25分钟、25分钟至30分钟、30分钟至35分钟、35分钟至40分钟、40分钟至45分钟、45分钟至50分钟、50分钟至55分钟或55分钟至60分钟)的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在30秒至5分钟的时间段内(例如,1分钟至5分钟,例如在1分钟、2分钟、3分钟、4分钟或5分钟的时间段内)切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在5分钟至10分钟的时间段内(例如,在5分钟、6分钟、7分钟、8分钟、9分钟或10分钟的时间段内)切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在10分钟至15分钟(例如,10分钟、11分钟、12分钟、13分钟、14分钟或15分钟)的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在15分钟至20分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在20分钟至25分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在25分钟至30分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在30分钟至35分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在35分钟至40分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在40分钟至45分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在45分钟至50分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在50分钟至55分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在55分钟至60分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适用于本公开的方法的C2c2蛋白在小于1分钟的时间段内(例如,在50秒至59秒、40秒至49秒、30秒至39秒或20秒至29秒的时间段内)切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,切割在生理条件下发生。在一些情况下,切割在15℃至20℃、20℃至25℃、25℃至30℃、30℃至35℃、或35℃至40℃的温度下发生。在一些情况下,切割在约37℃发生。在一些情况下,切割在约37℃发生并且反应条件包括二价金属离子。在一些情况下,二价金属离子是Mg2+。在一些情况下,二价金属离子是Mn2+。在一些情况下,反应条件的pH在pH 5与pH 6之间。在一些情况下,反应条件的pH在pH 6与pH 7之间。在一些情况下,反应条件的pH在pH 6.5与pH 7.5之间。在某些情况下,反应条件的pH高于pH7.5。
术语“切割效率”在本文中用于指C2c2蛋白的以下能力:一旦C2c2蛋白已经通过适当的C2c2指导RNA/靶RNA杂交而被激活,就快速切割样品中的RNA。“切割效率”是指蛋白在给定时间段内可以切割的RNA的量。例如,50%的切割效率应表明50%的给定RNA在指定时间段内被切割。例如,如果样品中的RNA以100μM的起始浓度存在,则当已经切割了50μM的RNA时,已经实现了50%的切割。作为另一实例,如果样品中存在多个RNA分子,则当已经切割了50%的RNA分子时,已经实现了50%的切割;效率是切割一定百分比的总RNA所需的时间量的表示。这可以通过任何合宜的方法测量,并且许多此类方法对于本领域的普通技术人员来说将是已知的。例如,可以使用经标记的检测RNA。在一些情况下,RNA种类(切割的对比未切割的)可以在凝胶上分离,并且可以将切割的RNA的量与未切割的RNA的量进行比较,例如参见图3。
当使用短语“其中C2c2蛋白切割样品中存在的RNA的至少X%”(例如,在指定时间段内)时,意指样品中存在的‘信号产生’RNA的X%在指定时间段内被切割。哪种RNA是‘信号产生’RNA可以取决于所用的检测方法。例如,当使用经标记的检测RNA时,所述经标记的检测RNA可能是唯一的‘信号产生RNA'。然而,经标记的检测RNA用于代表样品的RNA,并且因此关于经标记的检测RNA所观察到的情况被假定为代表样品的非靶RNA发生的情况。因此,当50%的经标记的检测RNA被切割时,这通常将被假设为表示当‘样品中存在的RNA'的50%被切割时。在一些情况下,通常测量RNA切割,因此样品的所有可切割RNA都是“信号产生RNA”。因此,当提及样品中存在的RNA的被切割百分比时,可以使用任何合宜的方法测量该值,并且无论使用何种方法,该值通常在本文中意指当酶已经切割样品中的可切割靶的一半。
在一些情况下,C2c2蛋白不是沙氏纤毛菌(Lsh)C2c2蛋白。在一些情况下,C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白更有效(例如,在切割非靶RNA方面)1.2倍或更高(例如,1.5倍或更高、1.7倍或更高、或2倍或更高)。因此,在一些情况下,主题C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白在切割未由所述方法的C2c2指导RNA靶向的RNA方面更有效1.2倍或更多倍(例如,1.5倍或更多倍、1.7倍或更多倍、或2倍或更多倍)。在一些情况下,在本公开的方法中使用的C2c2多肽当被激活时,比Lsh C2c2至少1.2倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少30倍或大于30倍有效地切割非靶RNA。
变体C2c2多肽
变体C2c2多肽包括SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一者的变体,其中变体C2c2多肽表现出降低的(或不可检测的)核酸酶活性。例如,在一些情况下,变体C2c2蛋白缺乏催化活性的HEPN1结构域。作为另一个实例,变体C2c2蛋白缺乏催化活性的HEPN2结构域。在一些情况下,变体C2c2蛋白缺乏催化活性的HEPN1结构域并且缺乏催化活性的HEPN2结构域。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2(口腔纤毛菌C2c2)所示的氨基酸序列的氨基酸R472、H477、R1048和H1053中的1个、2个、3个或4个氨基酸的氨基酸取代,或SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6中所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6中的相应氨基酸容易地被鉴别;参见例如图22B。例如,SEQ ID NO:1(斯氏李斯特菌C2c2)中对应于SEQID NO:2的R472、H477、R1048和H1053的氨基位置分别是R445、H450、R1016和H1021。作为另一实例,SEQ ID NO:4(荚膜红细菌C2c2)中对应于SEQ ID NO:2的R472、H477、R1048和H1053的氨基酸位置分别是R464、H469、R1052和H1057。作为另一实例,SEQ ID NO:5(鸡肉杆菌C2c2)中对应于SEQ ID NO:2的R472、H477、R1048和H1053的氨基酸位置分别是R467、H472、R1069和H1074。作为另一实例,SEQ ID NO:6(Herbinix hemicellulosilytica C2c2)中对应于SEQ ID NO:2的R472、H477、R1048和H1053的氨基酸位置分别是R472、H477、R1044和H1049。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R472和H477的氨基酸取代,或对SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQID NO:2所示的氨基酸序列的氨基酸R1048和H1053的氨基酸取代,或对SEQ ID NO:1、SEQID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R472、H477、R1048和H1053的氨基酸取代,或对SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1048和H1053的取代。在一些情况下,位置1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1048A和H1053A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053的取代。在一些情况下,位置472和1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1048A和H1053A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445和H450的取代。在一些情况下,位置445处的氨基酸是除了Arg以外的任何氨基酸;并且位置450处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A和H450A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1016和H1021的取代。在一些情况下,位置1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置1021处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1016A和H1021A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445、H450、R1016和H1021的取代。在一些情况下,位置445和1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置450和1016处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A、H450A、R1016A和H1021A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:4(荚膜红细菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464和H469的取代。在一些情况下,位置464处的氨基酸是除了Arg以外的任何氨基酸;并且位置469处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A和H469A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1052和H1057的取代。在一些情况下,位置1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1052A和H1057A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464、H469、R1052和H1057的取代。在一些情况下,位置464和1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置469和1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A、H469A、R1052A和H1057A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:5(鸡肉杆菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467和H472的取代。在一些情况下,位置467处的氨基酸是除了Arg以外的任何氨基酸;并且位置472处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A和H472A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1069和H1074的取代。在一些情况下,位置1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1069A和H1074A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467、H472、R1069和H1074的取代。在一些情况下,位置467和1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置472和1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A、H472A、R1069A和H1074A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:6(Herbinixhemicellulosilytica C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1044和H1049的取代。在一些情况下,位置1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1044A和H1049A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1044和H1049的取代。在一些情况下,位置472和1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1044A和H1049A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053中的1个、2个、3个或4个氨基酸的取代,使得变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并且保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。例如,在一些情况下,变体C2c2多肽表现出由具有SEQ ID NO:2所示氨基酸序列的C2c2多肽表现出的RNA指导的非靶RNA切割的小于50%、小于40%、小于30%、小于20%、小于10%、小于5%、小于1%或小于0.1%。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
上述变体C2c2多肽中的任一者还可以包括突变(例如,在位置R1079、R1072和K1082中的任一者处,如下文进一步详细描述的),所述突变导致降低的切割前体C2c2指导RNA的能力(例如,能力丧失)。
在一些情况下,变体C2c2多肽具有降低的切割前体C2c2指导RNA的能力(例如,参见下面的实施例和相关的图26C至图26D、图35D和图37)。例如,在一些情况下,变体C2c2多肽包含对SEQ ID NO:2(口腔纤毛菌C2c2)所示的氨基酸序列的氨基酸R1079、R1072和K1082中的1个、2个或3个氨基酸的氨基酸取代,或者对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6中的相应氨基酸容易被鉴别。例如,SEQ ID NO:1(斯氏李斯特菌C2c2)中对应于SEQ ID NO:2的R1079、R1072和K1082和K1082的氨基位置分别是R1048、R1041和K1051。作为另一实例,SEQ ID NO:4(荚膜红细菌C2c2)中对应于SEQ ID NO:2的R1079、R1072和K1082的氨基酸位置分别是R1085、R1078和K1088。作为另一实例,SEQ ID NO:5(鸡肉杆菌C2c2)中对应于SEQ ID NO:2的R1079、R1072和K1082的氨基酸位置分别是R1099、R1092和K1102。作为另一实例,SEQ ID NO:6(Herbinixhemicellulosilytica C2c2)中对应于SEQ ID NO:2的R1079和R1072的氨基酸位置分别是R1172和R1165。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R1079(例如,R1079A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ IDNO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R1072(例如,R1072A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸K1082(例如,K1082A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含在SEQ ID NO:2所示的氨基酸序列的选自R1079(例如,R1079A)、R1072(例如,R1072A)和K1082(例如,K1082A)的位置处的一个或多个(例如,两个或更多个、或全部三个)氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R1079(例如,R1079A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ IDNO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R1072(例如,R1072A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:2所示的氨基酸序列的氨基酸K1082(例如,K1082A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含在SEQ ID NO:2所示的氨基酸序列的选自R1079(例如,R1079A)、R1072(例如,R1072A)和K1082(例如,K1082A)的位置处的一个或多个(例如,两个或更多个、或全部三个)氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:1所示的氨基酸序列的氨基酸R1041(例如,R1041A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5或SEQ IDNO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:1所示的氨基酸序列的氨基酸R1048(例如,R1048A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQID NO:2、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:1所示的氨基酸序列的氨基酸K1051(例如,K1051A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5或SEQID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含在SEQ ID NO:1所示的氨基酸序列的选自R1048(例如,R1048A)、R1041(例如,R1041A)和K1051(例如,K1051A)的位置处的一个或多个(例如,两个或更多个、或全部三个)氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:4所示的氨基酸序列的氨基酸R1085(例如,R1085A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:5或SEQ IDNO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:4所示的氨基酸序列的氨基酸R1078(例如,R1078A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQID NO:1、SEQ ID NO:2、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:4所示的氨基酸序列的氨基酸K1088(例如,K1088A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:5或SEQID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含在SEQ ID NO:4所示的氨基酸序列的选自R1085(例如,R1085A)、R1078(例如,R1078A)和K1088(例如,K1088A)的位置处的一个或多个(例如,两个或更多个、或全部三个)氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:5所示的氨基酸序列的氨基酸R1099(例如,R1099A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:2或SEQ IDNO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:5所示的氨基酸序列的氨基酸R1092(例如,R1092A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQID NO:1、SEQ ID NO:4、SEQ ID NO:2或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:5所示的氨基酸序列的氨基酸K1102(例如,K1102A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:2或SEQID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含在SEQ ID NO:5所示的氨基酸序列的选自R1099(例如,R1099A)、R1092(例如,R1092A)和K1102(例如,K1102A)的位置处的一个或多个(例如,两个或更多个、或全部三个)氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:2或SEQ ID NO:6所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:6所示的氨基酸序列的氨基酸R1172(例如,R1172A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ IDNO:2所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对SEQ ID NO:6所示的氨基酸序列的氨基酸R1165(例如,R1165A)的氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:2所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含在SEQ ID NO:6所示的氨基酸序列的选自R1172(例如,R1172A)和R1165(例如,R1165A)的位置处的一个或多个(例如,两个)氨基酸取代,或对任何C2c2氨基酸序列(例如,SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:2所示的C2c2氨基酸序列)的相应氨基酸的氨基酸取代。
C2c2指导RNA
主题C2c2指导RNA(例如,C2c2crRNA)包括指导序列和恒定区(例如,指导序列的5'端的区域)。指导序列的5'端的区域与C2c2蛋白结合(并且可以被认为是蛋白结合区),而指导序列与靶RNA的靶序列杂交。
指导序列
指导序列与单链靶RNA的靶序列具有互补性(与单链靶RNA的靶序列杂交)。在一些情况下,直接位于靶序列(原型间隔区)3'端的靶RNA的碱基不是G。在一些情况下,指导序列的长度为16-28个核苷酸(nt)(例如,长度为16-26nt、16-24nt、16-22nt、16-20nt、16-18nt、17-26nt、17-24nt、17-22nt、17-20nt、17-18nt、18-26nt、18-24或18-22nt)。在一些情况下,指导序列的长度为18-24个核苷酸(nt)。在一些情况下,指导序列的长度为至少16nt(例如,长度为至少18nt、20nt或22nt)。在一些情况下,指导序列的长度为至少17nt。在一些情况下,指导序列的长度为至少18nt。在一些情况下,指导序列的长度为至少20nt。
在一些情况下,指导序列与单链靶RNA的靶序列具有80%或更多(例如,85%或更多、90%或更多、95%或更多、或100%)的互补性。在一些情况下,指导序列与单链靶RNA的靶序列100%互补。
恒定区
以下3个序列各自是天然存在的C2c2指导RNA的恒定区的实例(例如,在指导序列的5'端的区域):
GACUACCUCUAUAUGAAAGAGGACUAAAAC(SEQ ID NO:7)
(斯氏李斯特菌)(“Lse”)
CCACCCCAAUAUCGAAGGGGACUAAAACA(SEQ ID NO:8)
(沙氏纤毛菌)(“Lsh”)
GACCACCCCAAAAAUGAAGGGGACUAAAACA(SEQ ID NO:9)
(口腔纤毛菌)(“Lbu”)
在一些实施方案中,主题C2c2指导RNA包括与SEQ ID NO:7至SEQ ID NO:9中任一项所示的序列具有70%或更多同一性(例如,80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、或100%同一性)的核苷酸序列。在一些实施方案中,主题C2c2指导RNA包括与SEQ ID NO:7至SEQ ID NO:9中任一项所示的序列具有90%或更多同一性(例如,95%或更多、98%或更多、99%或更多、或100%同一性)的核苷酸序列。在一些实施方案中,主题C2c2指导RNA包含SEQ ID NO:7至SEQ ID NO:9中任一者所示的核苷酸序列。
在一些实施方案中,主题C2c2指导RNA包括与SEQ ID NO:9所示的序列具有70%或更多同一性(例如,80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、或100%同一性)的核苷酸序列。在一些实施方案中,主题C2c2指导RNA包括与SEQ IDNO:9中所示的序列具有90%或更多同一性(例如,95%或更多、98%或更多、99%或更多、或100%同一性)的核苷酸序列。在一些实施方案中,主题C2c2指导RNA包括SEQ ID NO:9所示的核苷酸序列。
在一些实施方案中,主题C2c2指导RNA不包括沙氏纤毛菌(LsH)C2c2指导RNA的核苷酸序列。例如,在一些情况下,所使用的C2c2蛋白不是来自沙氏纤毛菌的C2c2(例如,不是Lsh C2c2蛋白),并且在一些此类情况下,所使用的C2c2指导RNA也不来自沙氏纤毛菌(例如,所使用的指导RNA不包括Lsh C2c2指导RNA的恒定区)。因此,在一些情况下,主题C2c2指导RNA不包括SEQ ID NO:8所示的序列。
在一些情况下,C2c2指导RNA包括双链RNA双链体(dsRNA双链体)。例如,参见图7A,其示出了来自Lbu的C2c2指导RNA与单链靶RNA杂交,其中所述C2c2指导RNA包括长度为4个碱基对(bp)的dsRNA双链体。在一些情况下,C2c2指导RNA包括长度为2至12bp(例如,2至10bp、2至8bp、2至6bp、2至5bp、2至4bp、3至12bp、3至10bp、3至8bp、3至6bp、3至5bp、3至4bp、4至12bp、4至10bp、4至8bp、4至6bp或4至5bp)的dsRNA双链体。在一些情况下,C2c2指导RNA包括长度为2bp或更长(例如,长度为3bp或更长、4bp或更长、5bp或更长、6bp或更长、或7bp或更长)的dsRNA双链体。在一些情况下,C2c2指导RNA包括比相应的野生型C2c2指导RNA的dsRNA双链体更长的dsRNA双链体。例如,参见图7A,其示出了来自Lbu的C2c2指导RNA与单链靶RNA杂交,其中所述C2c2指导RNA包括长度为4个碱基对(bp)的dsRNA双链体。因此,C2c2指导RNA可以在一些情况下包括长度为5bp或更长(例如,长度为6bp或更长、7bp或更长、或8bp或更长)的dsRNA双链体。在一些情况下,C2c2指导RNA包括比相应的野生型C2c2指导RNA的dsRNA双链体更短的dsRNA双链体。因此在一些情况下,C2c2指导RNA包括长度小于4bp的dsRNA双链体。在一些情况下,C2c2指导RNA包括长度为2或3bp的dsRNA双链体。
在一些情况下,C2c2指导RNA的在指导序列的5'端的区域的长度为15个或更多个核苷酸(nt)(例如,长度为18nt或更长、20nt或更长、21nt或更长、22nt或更长、23nt或更长、24nt或更长、25nt或更长、26nt或更长、27nt或更长、28nt或更长、29nt或更长、30nt或更长、31nt或更长、32nt或更长、33nt或更长、34nt或更长、或35nt或更长)。在一些情况下,C2c2指导RNA的在指导序列的5'端的区域的长度为29nt或更长。
在一些情况下,C2c2指导RNA的在指导序列的5'端的区域的长度在12至100nt(例如,12至90nt、12至80nt、12至70nt、12至60nt、12至50nt、12至40nt、15至100nt、15至90nt、15至80nt、15至70nt、15至60nt、15至50nt、15至40nt、20至100nt、20至90nt、20至80nt、20至70nt、20至60nt、20至50nt、20至40nt、25至100nt、25至90nt、25至80nt、25至70nt、25至60nt、25至50nt、25至40nt、28至100nt、28至90nt、28至80nt、28至70nt、28至60nt、28至50nt、28至40nt、29至100nt、29至90nt、29至80nt、29至70nt、29至60nt、29至50nt或29至40nt)的范围内。在一些情况下,C2c2指导RNA的在指导序列的5'端的区域的长度在28至100nt的范围内。在一些情况下,C2c2指导RNA的在指导序列的5'端的区域的长度在28至40nt的范围内。
在一些情况下,C2c2指导RNA的在指导序列的5'端的区域相对于(短于)相应野生型C2c2指导RNA的相应区域被截短。例如,成熟的Lse C2c2指导RNA包括在指导序列的5'端的长度为30个核苷酸(nt)的区域,并且因此主题截短C2c2指导RNA(相对于Lse C2c2指导RNA)可以具有在指导序列的5'端的长度小于30nt(例如,长度小于29nt、28nt、27nt、26nt、25nt、22nt或20nt)的区域。在一些情况下,截短C2c2指导RNA包括在指导序列的5'端的长度范围为12至29nt(例如,12至28nt、12至27nt、12至26nt、12至25nt、12至22nt、12至20nt、12至18nt)的区域。在一些情况下,截短C2c2指导RNA例如相对于相应的野生型C2c2指导物被截短一个或多个nt(例如,2nt或更长、3nt或更长、4nt或更长、5nt或更长、或10nt或更长))。
在一些情况下,C2c2指导RNA的在指导序列的5'端的区域相对于(长于)相应野生型C2c2指导RNA的相应区域被延长。例如,成熟的Lse C2c2指导RNA包括在指导序列的5'端的长度为30个核苷酸(nt)的区域,并且因此延长的C2c2指导RNA(相对于Lse C2c2指导RNA)可以具有在指导序列的5'端的长于30nt(例如,长于31nt、长于32nt、长于33nt、长于34nt或长于35nt)的区域。在一些情况下,延长的C2c2指导RNA包括在指导序列的5'端的长度范围为30至100nt(例如,30至90nt、30至80nt、30至70nt、30至60nt、30至50nt或30至40nt)的区域。在一些情况下,延伸的C2c2指导RNA包括在指导序列的5'端的(例如,相对于相应野生型C2c2指导RNA的相应区域)延伸一个或多个nt(例如,2nt或更长、3nt或更长、4nt或更长、5nt或更长、或10nt或更长)的区域。
在一些情况下,主题C2c2指导RNA的长度为30个或更多个核苷酸(nt)(例如,长度为34nt或更长、40nt或更长、45nt或更长、50nt或更长、55nt或更长、60nt或更长、65nt或更长、70nt或更长、或80nt或更长)。在一些情况下,C2c2指导RNA的长度为35nt或更长。
在一些情况下,主题C2c2指导RNA的长度在30至120nt(例如,30至110nt、30至100nt、30至90nt、30至80nt、30至70nt、30至60nt、35至120nt、35至110nt、35至100nt、35至90nt、35至80nt、35至70nt、35至60nt、40至120nt、40至110nt、40至100nt、40至90nt、40至80nt、40至70nt、40至60nt、50至120nt、50至110nt、50至100nt、50至90nt、50至80nt或50至70nt)的范围内。在一些情况下,C2c2指导RNA的长度在33至80nt的范围内。在一些情况下,C2c2指导RNA的长度在35至60nt的范围内。
在一些情况下,主题C2c2指导RNA相对于(短于)相应野生型C2c2指导RNA被截短。例如,成熟的Lse C2c2指导RNA的长度可以是50个核苷酸(nt),并且因此截短的C2c2指导RNA(相对于Lse C2c2指导RNA)的长度在一些情况下可以小于50nt(例如,长度为小于49nt、48nt、47nt、46nt、45nt、42nt或40nt)。在一些情况下,截短的C2c2指导RNA的长度在30至49nt(例如,30至48nt、30至47nt、30至46nt、30至45nt、30至42nt、30至40nt、35至49nt、35至48nt、35至47nt、35至46nt、35至45nt、35至42nt、或35至40nt)的范围内。在一些情况下,截短的C2c2指导RNA例如相对于相应的野生型C2c2指导物被截短一个或多个nt(例如,2nt或更长、3nt或更长、4nt或更长、5nt或更长、或10nt或更长))。
在一些情况下,主题C2c2指导RNA相对于(长于)相应的野生型C2c2指导RNA延长。例如,成熟的Lse C2c2指导RNA的长度可以为50个核苷酸(nt),并且因此延长的C2c2指导RNA(相对于Lse C2c2指导RNA)在一些情况下可以长于50nt(例如,长于51nt、长于52nt、长于53nt、长于54nt或长于55nt)。在一些情况下,延长的C2c2指导RNA的长度在51至100nt(例如,51至90nt、51至80nt、51至70nt、51至60nt、53至100nt、53至90nt、53至80nt、53至70nt、53至60nt、55至100nt、55至90nt、55至80nt、55至70nt或55至60nt)的范围内。在一些情况下,延长的C2c2指导RNA(例如,相对于相应野生型C2c2指导RNA)延长一个或多个nt(例如,2nt或更长、3nt或更长、4nt或更长、5nt或更长、或10nt或更长)。
切割前体C2C2指导RNA阵列的方法
本公开提供了将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法。该方法包括使前体C2c2指导RNA阵列与C2c2蛋白接触。前体C2c2指导RNA阵列包含两个或更多个(例如,2个、3个、4个、5个或更多个)C2c2指导RNA,每个所述C2c2指导RNA可以具有不同的指导序列。C2c2蛋白将前体C2c2指导RNA阵列切割成单独的C2c2指导RNA。在一些情况下,C2c2指导RNA的恒定区(也称为‘柄’)包括来自前体指导RNA的核苷酸序列(例如,在切割指导RNA阵列之前通常存在的序列)。换句话说,在一些情况下,主题C2c2指导RNA的恒定区包括前体crRNA柄。
在一些情况下,接触步骤不在细胞内(例如在活细胞内)发生。在一些情况下,接触步骤在细胞(例如,体外细胞(培养中)、离体细胞、体内细胞)内发生。任何细胞都是合适的。其中可以发生接触的细胞的实例包括但不限于:真核细胞;原核细胞(例如细菌细胞、古细菌细胞);单细胞真核生物;植物细胞;藻类细胞,例如布朗葡萄藻、莱茵衣藻、迦得拟微绿球藻、蛋白核小球藻、展枝马尾藻、羽藻等等;真菌细胞(例如,酵母细胞);动物细胞;无脊椎动物细胞(例如,果蝇、刺胞动物、棘皮动物、线虫、昆虫、蜘蛛类动物,等);脊椎动物细胞(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物);哺乳动物细胞(例如,人类;非人灵长类动物;有蹄类动物;猫科动物;牛;绵羊;山羊;大鼠;小鼠;啮齿动物;猪;绵羊;牛;等等);寄生虫细胞(例如,蠕虫、疟疾寄生虫等)。
C2c2蛋白
当C2c2蛋白具有完整的HEPN结构域时,其可以在被‘激活’后切割RNA(靶RNA以及非靶RNA)。然而,C2c2蛋白也可以以不依赖HEPN的方式将前体C2c2指导RNA切割成成熟C2c2指导RNA。例如,当C2c2蛋白缺乏催化活性的HEPN1结构域并且也缺乏催化活性的HEPN2结构域时,其仍然可以将前体指导RNA切割成成熟的指导RNA。因此,当在包括前体C2c2指导RNA和/或前体C2c2指导RNA阵列的方法中使用时,C2c2蛋白可以(并且在一些情况下将)缺乏催化活性的HEPN1结构域和/或催化活性的HEPN2结构域。在一些情况下,C2c2蛋白缺乏催化活性的HEPN1结构域并且缺乏催化活性的HEPN2结构域。
缺乏催化活性HEPN1结构域并且缺乏催化活性HEPN2结构域的C2c2蛋白在一些情况下可用于结合方法(例如,成像方法)中。例如,在一些情况下,结合(和/或成像)方法包括使样品与前体C2c2指导RNA阵列和缺乏催化活性HEPN1结构域且缺乏催化活性HEPN2结构域的C2c2蛋白接触。在此类情况下,可以可检测地标记C2c2蛋白(例如,融合表位标签、与荧光团融合、与荧光蛋白(诸如绿色荧光蛋白)融合等)。
适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白可具有完整的HEPN1和HEPN2结构域。然而,在一些情况下,C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。
在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包括与SEQ ID NO:1至SEQ ID NO:6中任一项所示的氨基酸序列具有80%或更多(例如,85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多、或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包含与SEQ ID NO:1所示的斯氏李斯特菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包含与SEQ ID NO:2所示的口腔纤毛菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包含与SEQ ID NO:4所示的荚膜红细菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包含与SEQ ID NO:5所示的鸡肉杆菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包含与SEQ ID NO:6所示的Herbinix hemicellulosilytica C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包含与SEQID NO:2所示的口腔纤毛菌(Lbu)C2c2氨基酸序列具有80%或更多的氨基酸序列同一性的氨基酸序列。在一些情况下,适用于包括在本公开的试剂盒中的C2c2蛋白是口腔纤毛菌(Lbu)C2c2蛋白(例如,参见SEQ ID NO:2)。在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2蛋白包括SEQ ID NO:1至SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一项所示的氨基酸序列。
在一些情况下,本公开的方法中所使用的用于切割前体C2c2指导RNA阵列的C2c2蛋白不是沙氏纤毛菌(Lsh)C2c2蛋白。在一些情况下,本公开的方法中所使用的用于切割前体C2c2指导RNA阵列的C2c2蛋白不是与SEQ ID NO:3所示的Lsh C2c2多肽具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的C2c2多肽。
在一些情况下,适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的C2c2多肽是变体C2c2多肽。适用于在本公开的方法中的用于切割前体C2c2指导RNA阵列的变体C2c2多肽包括SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一者的变体,其中变体C2c2多肽表现出降低的(或不可检测的)核酸酶活性。例如,在一些情况下,变体C2c2蛋白缺乏催化活性的HEPN1结构域。作为另一个实例,变体C2c2蛋白缺乏催化活性的HEPN2结构域。在一些情况下,变体C2c2蛋白缺乏催化活性的HEPN1结构域并且缺乏催化活性的HEPN2结构域。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2(口腔纤毛菌C2c2)所示的氨基酸序列的氨基酸R472、H477、R1048和H1053中的1个、2个、3个或4个氨基酸的氨基酸取代,或SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6中所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6中的相应氨基酸容易被鉴别;参见例如图22B。例如,SEQ ID NO:1(斯氏李斯特菌C2c2)中对应于SEQ IDNO:2的R472、H477、R1048和H1053的氨基位置分别是R445、H450、R1016和H1021。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R472和H477的氨基酸取代,或对SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQID NO:2所示的氨基酸序列的氨基酸R1048和H1053的氨基酸取代,或对SEQ ID NO:1、SEQID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R472、H477、R1048和H1053的氨基酸取代,或对SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1048和H1053的取代。在一些情况下,位置1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1048A和H1053A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053的取代。在一些情况下,位置472和1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1048A和H1053A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445和H450的取代。在一些情况下,位置445处的氨基酸是除了Arg以外的任何氨基酸;并且位置450处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A和H450A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1016和H1021的取代。在一些情况下,位置1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置1021处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1016A和H1021A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445、H450、R1016和H1021的取代。在一些情况下,位置445和1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置450和1016处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A、H450A、R1016A和H1021A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:4(荚膜红细菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464和H469的取代。在一些情况下,位置464处的氨基酸是除了Arg以外的任何氨基酸;并且位置469处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A和H469A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1052和H1057的取代。在一些情况下,位置1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1052A和H1057A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464、H469、R1052和H1057的取代。在一些情况下,位置464和1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置469和1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A、H469A、R1052A和H1057A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:5(鸡肉杆菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467和H472的取代。在一些情况下,位置467处的氨基酸是除了Arg以外的任何氨基酸;并且位置472处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A和H472A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1069和H1074的取代。在一些情况下,位置1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1069A和H1074A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467、H472、R1069和H1074的取代。在一些情况下,位置467和1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置472和1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A、H472A、R1069A和H1074A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:6(Herbinixhemicellulosilytica C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1044和H1049的取代。在一些情况下,位置1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1044A和H1049A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1044和H1049的取代。在一些情况下,位置472和1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1044A和H1049A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
前体C2c2指导RNA阵列
如下文工作实施例中所证明的,C2c2蛋白可以将前体C2c2指导RNA切割成成熟的指导RNA,例如通过对前体的内切核糖核酸酶切割。同样如以下工作实施例中所证明的,C2c2蛋白可以将前体C2c2指导RNA阵列(其包括串联排列的多于一个C2c2指导RNA)切割成两个或更多个单独的C2c2指导RNA。因此,在一些情况下,前体C2c2指导RNA阵列包含两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、2个、3个、4个或5个)C2c2指导RNA(例如,作为前体分子串联排列)。在一些情况下,前体C2c2指导RNA阵列的每个指导RNA具有不同的指导序列。在一些情况下,前体C2c2指导RNA阵列的两个或更多个指导RNA具有相同的指导序列。
在一些情况下,前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向相同靶RNA分子内的不同靶位点。例如,在一些情况下,当所述C2c2指导RNA中的任一者与靶RNA分子杂交时,这种情形可以通过激活C2c2蛋白而增加检测灵敏度。
在一些情况下,前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向不同的靶RNA分子。例如,当存在潜在靶RNA家族中的任何一者时,这种情况可以导致阳性信号。这种阵列可用于例如基于诸如单核苷酸多态性(SNP)之类的变异而靶向转录物家族(例如,用于诊断目的)。这也可用于检测是否存在许多不同病毒株中的任何一种(例如,流感病毒变体、寨卡病毒变体、HIV变体等)。这也可用于检测是否存在许多不同物种、菌株、分离株或细菌变体中的任何一者(例如,分枝杆菌(Mycobacterium)的不同物种、菌株、分离株或变体,奈瑟氏菌(Neisseria)的不同物种、菌株、分离株、或变体,金黄色葡萄球菌(Staphylococcus aureus)的不同物种、菌株、分离株、或变体;大肠杆菌的不同物种、菌株、分离株、或变体;等等)。
变体C2C2多肽
本公开提供了变体C2c2多肽,以及包含编码所述变体C2c2多肽的核苷酸序列的核酸(例如,重组表达载体)。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1048和H1053的取代。在一些情况下,位置1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1048A和H1053A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053的取代。在一些情况下,位置472和1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1048A和H1053A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445和H450的取代。在一些情况下,位置445处的氨基酸是除了Arg以外的任何氨基酸;并且位置450处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A和H450A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1016和H1021的取代。在一些情况下,位置1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置1021处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1016A和H1021A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445、H450、R1016和H1021的取代。在一些情况下,位置445和1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置450和1016处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A、H450A、R1016A和H1021A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:4(荚膜红细菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464和H469的取代。在一些情况下,位置464处的氨基酸是除了Arg以外的任何氨基酸;并且位置469处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A和H469A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1052和H1057的取代。在一些情况下,位置1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1052A和H1057A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464、H469、R1052和H1057的取代。在一些情况下,位置464和1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置469和1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A、H469A、R1052A和H1057A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:5(鸡肉杆菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467和H472的取代。在一些情况下,位置467处的氨基酸是除了Arg以外的任何氨基酸;并且位置472处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A和H472A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1069和H1074的取代。在一些情况下,位置1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1069A和H1074A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467、H472、R1069和H1074的取代。在一些情况下,位置467和1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置472和1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A、H472A、R1069A和H1074A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:6(Herbinixhemicellulosilytica C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1044和H1049的取代。在一些情况下,位置1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1044A和H1049A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1044和H1049的取代。在一些情况下,位置472和1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1044A和H1049A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053中的1个、2个、3个或4个氨基酸的取代,使得变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并且保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。例如,在一些情况下,变体C2c2多肽表现出由具有SEQ ID NO:2所示氨基酸序列的C2c2多肽表现出的RNA指导的非靶RNA切割的小于50%、小于40%、小于30%、小于20%、小于10%、小于5%、小于1%或小于0.1%。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
本公开提供了核酸(例如,分离的核酸),所述核酸包含编码本公开的变体C2c2多肽的核苷酸序列。在一些情况下,核苷酸序列与转录控制元件(例如,启动子)可操作地连接。在一些情况下,启动子是组成型启动子。在一些情况下,启动子是可调控的启动子。在一些情况下,启动子是诱导型启动子。在一些情况下,启动子是在真核细胞中起作用的。在一些情况下,启动子是在原核细胞中起作用的。
本公开提供了重组表达载体,所述重组表达载体包含本公开的核酸,例如包含编码本公开的变体C2c2多肽的核苷酸序列的核酸。
本公开提供了用本公开的核酸(例如,包含编码本公开的变体C2c2多肽的核苷酸序列的核酸)遗传修饰的宿主细胞。本公开提供了用包含本公开的核酸(例如,包含编码本公开的变体C2c2多肽的核苷酸序列的核酸)的重组表达载体遗传修饰的宿主细胞。在一些情况下,宿主细胞是原核细胞。在一些情况下,宿主细胞是真核细胞。在一些情况下,宿主细胞是体外的。在一些情况下,宿主细胞是离体的。在一些情况下,宿主细胞是体内的。在一些情况下,宿主细胞是细菌细胞。在一些情况下,宿主细胞是酵母细胞。在一些情况下,宿主细胞是植物细胞。在一些情况下,宿主细胞是哺乳动物细胞。在一些情况下,宿主细胞是人细胞。在一些情况下,宿主细胞是非人哺乳动物细胞。在一些情况下,宿主细胞是昆虫细胞。在一些情况下,宿主细胞是节肢动物细胞。在一些情况下,宿主细胞是真菌细胞。在一些情况下,宿主细胞是藻类细胞。
试剂盒
本公开提供了用于检测包含多种RNA的样品中的靶RNA的试剂盒。在一些情况下,所述试剂盒包含:(a)前体C2c2指导RNA阵列,其包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;以及(b)C2c2蛋白和/或编码所述C2c2蛋白的核酸。在一些情况下,此类试剂盒还包括经标记的检测RNA(例如,包含荧光发射染料对(即,FRET对和/或猝灭剂/荧光剂对)的经标记的检测RNA)。在一些情况下,给定前体C2c2指导RNA阵列的两个或更多个C2c2指导RNA(例如,在一些情况下,每个C2c2指导RNA)包括相同的指导序列。
在一些情况下,主题试剂盒包含:(a)经标记的检测RNA,其包含荧光发射染料对,即FRET对和/或猝灭剂/荧光剂对;以及(b)C2c2蛋白和/或编码所述C2c2蛋白的核酸。在一些情况下,此类试剂盒还包括(c)C2c2指导RNA(和/或编码C2c2指导RNA的核酸),和/或(d)前体C2c2指导RNA(和/或编码前体C2c2指导RNA的核酸),和/或(e)前体C2c2指导RNA阵列(和/或编码前体C2c2指导RNA阵列的核酸,例如编码包括供用户插入指导序列的插入位点的前体C2c2指导RNA阵列的核酸)。
1)包含前体C2c2指导RNA阵列和C2c2蛋白的试剂盒
在一些情况下,所述试剂盒包含:(a)前体C2c2指导RNA阵列,其包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;以及(b)C2c2蛋白和/或编码所述C2c2蛋白的核酸。如上所述,在一些情况下,此类试剂盒还包括经标记的检测RNA(例如,包含荧光发射染料对(即,FRET对和/或猝灭剂/荧光剂对)的经标记的检测RNA)。
C2c2蛋白
适合于包括在本公开的试剂盒中的C2c2蛋白与C2c2指导RNA结合,由指导RNA(其与靶RNA杂交)引导到单链靶RNA,从而被“激活”。如果C2c2蛋白的HEPN1结构域和HEPN2结构域是完整的,则C2c2蛋白一旦被激活就切割靶RNA,但是也切割非靶RNA。
在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包括与SEQ ID NO:1至SEQ ID NO:6中任一项所示的氨基酸序列具有80%或更多(例如,85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多、或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ IDNO:1所示的斯氏李斯特菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:2所示的口腔纤毛菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:4所示的荚膜红细菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:5所示的鸡肉杆菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:6所示的Herbinix hemicellulosilytica C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包括与SEQ ID NO:2所示的口腔纤毛菌(Lbu)C2c2氨基酸序列具有80%或更多的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白是口腔纤毛菌(Lbu)C2c2蛋白(例如,参见SEQ ID NO:2)。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包括SEQ ID NO:1至SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一项所示的氨基酸序列。
在一些情况下,包括在本公开的试剂盒中的C2c2蛋白不是沙氏纤毛菌(Lsh)C2c2蛋白。在一些情况下,包括在本公开的试剂盒中的C2c2蛋白不是与SEQ ID NO:3所示的LshC2c2多肽具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的C2c2多肽。
在一些情况下,包括在本公开的试剂盒中的C2c2多肽是变体C2c2多肽。适合于包括在本公开的试剂盒中的变体C2c2多肽包括SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一者的变体,其中变体C2c2多肽表现出降低的(或不可检测的)核酸酶活性。例如,在一些情况下,变体C2c2蛋白缺乏催化活性的HEPN1结构域。作为另一个实例,变体C2c2蛋白缺乏催化活性的HEPN2结构域。在一些情况下,变体C2c2蛋白缺乏催化活性的HEPN1结构域并且缺乏催化活性的HEPN2结构域。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2(口腔纤毛菌C2c2)所示的氨基酸序列的氨基酸R472、H477、R1048和H1053中的1个、2个、3个或4个氨基酸的氨基酸取代,或SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6中所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6中的相应氨基酸容易被鉴别;参见例如图22B。例如,SEQ ID NO:1(斯氏李斯特菌C2c2)中对应于SEQ IDNO:2的R472、H477、R1048和H1053的氨基位置分别是R445、H450、R1016和H1021。
在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R472和H477的氨基酸取代,或对SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQID NO:2所示的氨基酸序列的氨基酸R1048和H1053的氨基酸取代,或对SEQ ID NO:1、SEQID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。在一些情况下,变体C2c2多肽包含对SEQ ID NO:2所示的氨基酸序列的氨基酸R472、H477、R1048和H1053的氨基酸取代,或对SEQ ID NO:1、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6所示的C2c2氨基酸序列的相应氨基酸的氨基酸取代。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1048和H1053的取代。在一些情况下,位置1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1048A和H1053A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053的取代。在一些情况下,位置472和1048处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1053处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1048A和H1053A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445和H450的取代。在一些情况下,位置445处的氨基酸是除了Arg以外的任何氨基酸;并且位置450处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A和H450A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1016和H1021的取代。在一些情况下,位置1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置1021处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1016A和H1021A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R445、H450、R1016和H1021的取代。在一些情况下,位置445和1016处的氨基酸是除了Arg以外的任何氨基酸;并且位置450和1016处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R445A、H450A、R1016A和H1021A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:4(荚膜红细菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464和H469的取代。在一些情况下,位置464处的氨基酸是除了Arg以外的任何氨基酸;并且位置469处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A和H469A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1052和H1057的取代。在一些情况下,位置1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1052A和H1057A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R464、H469、R1052和H1057的取代。在一些情况下,位置464和1052处的氨基酸是除了Arg以外的任何氨基酸;并且位置469和1057处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R464A、H469A、R1052A和H1057A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:5(鸡肉杆菌C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467和H472的取代。在一些情况下,位置467处的氨基酸是除了Arg以外的任何氨基酸;并且位置472处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A和H472A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1069和H1074的取代。在一些情况下,位置1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1069A和H1074A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R467、H472、R1069和H1074的取代。在一些情况下,位置467和1069处的氨基酸是除了Arg以外的任何氨基酸;并且位置472和1074处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R469A、H472A、R1069A和H1074A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
在一些情况下,变体C2c2多肽包含与SEQ ID NO:6(Herbinixhemicellulosilytica C2c2)所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。在一些情况下,位置472处的氨基酸是除了Arg以外的任何氨基酸;并且位置477处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A和H477A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1044和H1049的取代。在一些情况下,位置1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R1044A和H1049A。在一些情况下,变体C2c2多肽包含与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1044和H1049的取代。在一些情况下,位置472和1044处的氨基酸是除了Arg以外的任何氨基酸;并且位置477和1049处的氨基酸是除了His以外的任何氨基酸。在一些情况下,取代是R472A、H477A、R1044A和H1049A。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),并保留结合C2c2指导RNA和ss RNA的能力。在一些情况下,变体C2c2多肽保留切割前体C2c2指导RNA的能力。在一些情况下,变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
2)包含经标记的检测RNA和C2c2蛋白的试剂盒
在一些情况下,所述试剂盒包含:(a)经标记的检测RNA,其包含荧光发射染料对,即FRET对和/或猝灭剂/荧光剂对;以及(b)C2c2蛋白和/或编码所述C2c2蛋白的核酸。在一些情况下,试剂盒还包括C2c2指导RNA、前体C2c2指导RNA阵列和/或编码C2c2指导RNA的恒定区的核酸。如上所述,在一些情况下,此类试剂盒还包括(c)C2c2指导RNA(和/或编码C2c2指导RNA的核酸),和/或(d)前体C2c2指导RNA(和/或编码前体C2c2指导RNA的核酸),和/或(e)前体C2c2指导RNA阵列(和/或编码前体C2c2指导RNA阵列的核酸,例如编码包括供用户插入指导序列的插入位点的前体C2c2指导RNA阵列的核酸)。
经标记的检测RNA
在一些情况下,本公开的试剂盒包含经标记的检测RNA,所述经标记的检测RNA包含荧光发射染料对,即FRET对和/或猝灭剂/荧光剂对。经标记的检测RNA在被切割之前产生一定量的可检测信号,并且当所述经标记的检测RNA被切割时所测量到的可检测信号的量减少。在一些情况下,经标记的检测RNA在被切割之前产生第一可检测信号(例如,来自FRET对),并且当所述经标记的检测RNA被切割时产生第二可检测信号(例如,来自猝灭剂/荧光剂对)。因此,在一些情况下,经标记的检测RNA包含FRET对和猝灭剂/荧光剂对。
在一些情况下,经标记的检测RNA包含FRET对。FRET是这样的过程,通过所述过程,能量的无辐射转移发生为从激发态荧光团到紧邻的第二发色团。能量转移可以发生的范围限制在约10纳米(100埃),并且转移效率对荧光团之间的分开距离非常敏感。供体-受体对(FRET供体部分和FRET受体部分)在本文中被称为“FRET对”或“信号FRET对”。因此,在一些情况下,主题经标记的检测RNA包括两个信号配偶体(信号对),当一个信号配偶体是FRET供体部分时,另一个信号配偶体是FRET受体部分。因此,当信号配偶体非常接近时(例如,在相同的RNA分子上时),包括这种FRET对(FRET供体部分和FRET受体部分)的主题经标记的检测RNA将显示可检测信号(FRET信号),但是当所述配偶体分开时(例如,在用C2c2蛋白切割RNA分子后),信号将减少(或不存在)。
FRET供体和受体部分(FRET对)将是本领域的普通技术人员已知的,并且可以使用任何合宜的FRET对(例如,任何合宜的供体和受体部分对)。合适的FRET对的实例包括但不限于上表1中所示的那些。
在一些情况下,可检测信号在经标记的检测RNA被切割时产生(例如,在一些情况下,经标记的检测RNA包含猝灭剂/荧光剂对。信号猝灭对的一个信号配偶体产生可检测信号,而另一个信号配偶体是猝灭剂部分,所述猝灭剂部分猝灭第一信号配偶体的可检测信号(即,猝灭剂部分猝灭信号部分的信号,使得当信号配偶体彼此接近时(例如,当信号对的信号配偶体非常接近时),来自信号部分的信号减少(被猝灭)。
例如,在一些情况下,当经标记的检测RNA被切割时,可检测信号的量增加。例如,在一些情况下,由一个信号配偶体(信号部分)表现的信号被另一个信号配偶体(猝灭剂信号部分)猝灭,例如当在由C2c2蛋白进行切割之前两者存在于相同的RNA分子上时。这种信号对在本文中称为“猝灭剂/荧光剂对”、“猝灭对”或“信号猝灭对”。例如,在一些情况下,一个信号配偶体(例如,第一信号配偶体)是产生可检测信号的信号部分,所述可检测信号由第二信号配偶体(例如,猝灭剂部分)猝灭。因此,当配偶体被分开时(例如,在由C2c2蛋白切割检测RNA之后),这种猝灭剂/荧光剂对的信号配偶体将产生可检测信号,但是当配偶体非常接近(例如,在由C2c2蛋白切割检测RNA之前)时,所述信号将被猝灭。
猝灭剂部分可以将来自信号部分的信号(例如,在由C2c2蛋白切割检测RNA之前)猝灭至不同程度。在一些情况下,猝灭剂部分猝灭来自信号部分的信号,其中在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号是在不存在猝灭剂部分(当信号配偶体分开时)时检测到的信号的95%或更少。例如,在一些情况下,在存在猝灭剂部分的情况下检测到的信号可以是在不存在猝灭剂部分的情况下检测到的信号的90%或更少、80%或更少、70%或更少、60%或更少、50%或更少、40%或更少、30%或更少、20%或更少、15%或更少、10%或更少、或5%或更少。在一些情况下,在存在猝灭剂部分的情况下未检测到信号(例如,高于背景)。
在一些情况下,在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号是在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号的至少1.2倍(例如,至少1.3倍、至少1.5倍、至少1.7倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少7倍、至少10倍、至少20倍或至少50倍。
在一些情况下,信号部分是荧光标记。在一些此类情况下,猝灭剂部分猝灭来自荧光标记的信号(光信号)(例如,通过吸收标记的发射光谱中的能量)。因此,当猝灭剂部分不与信号部分接近时,来自荧光标记的发射(信号)是可检测的,因为信号不被猝灭剂部分吸收。可以使用任何合宜的供体受体对(信号部分/猝灭剂部分对),并且许多合适的对是本领域中已知的。
在一些情况下,猝灭剂部分从信号部分(在本文中也称为“可检测标记”)吸收能量,然后发射信号(例如,不同波长的光)。因此,在一些情况下,猝灭剂部分本身是信号部分(例如,信号部分可以是6-羧基荧光素,而猝灭剂部分可以是6-羧基-四甲基罗丹明),并且在一些此类情况下,所述对也可以是FRET对。在一些情况下,猝灭剂部分是暗猝灭剂。暗猝灭剂可以吸收激发能量并以不同方式耗散能量(例如,作为热量)。因此,暗猝灭剂本身具有极小荧光至没有荧光(不发射荧光)。暗猝灭剂的实例进一步描述于美国专利号8,822,673和8,586,718;美国专利公开20140378330、20140349295和20140194611;以及国际专利申请:WO200142505和WO200186001中,所有这些专利都据此以引用方式整体并入本文。
荧光标记的实例包括但不限于:Alexa染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTORho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、方形染料(Square dye)、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白(tethered fluorescent protein)。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、方形染料(Square dye)、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿和太平洋橙。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa 染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、方形染料(Square dye)、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白。
ATTO染料的实例包括但不限于:ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTORho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTORho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTOOxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725以及ATTO 740。
AlexaFluor染料的实例包括但不限于:Alexa350、Alexa405、Alexa430、Alexa488、Alexa500、Alexa514、Alexa532、Alexa546、Alexa555、Alexa568、Alexa594、Alexa610、Alexa633、Alexa635、Alexa647、Alexa660、Alexa680、Alexa700、Alexa750、Alexa790等等。
猝灭剂部分的实例包括但不限于:暗猝灭剂、Black Hole(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇(诸如金纳米粒子)等。
在一些情况下,猝灭剂部分选自:暗猝灭剂、Black Hole(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇。
ATTO猝灭剂的实例包括但不限于:ATTO 540Q、ATTO 580Q和ATTO 612Q。BlackHole的实例包括但不限于:BHQ-0(493nm)、BHQ-1(534nm)、BHQ-2(579nm)和BHQ-3(672nm)。
对于一些可检测标记(例如,荧光染料)和/或猝灭剂部分的实例,参见例如Bao等人,Annu Rev Biomed Eng.2009;11:25-47;以及美国专利号8,822,673和8,586,718;美国专利公开20140378330、20140349295、20140194611、20130323851、20130224871、20110223677、20110190486、20110172420、20060179585和20030003486;以及国际专利申请:WO200142505和WO200186001,所有这些参考文献据此以引用方式整体并入。
核酸修饰
在一些情况下,经标记的检测RNA包含一种或多种修饰,例如碱基修饰、骨架修饰、糖修饰等,以为核酸提供新的或增强的特征(例如,改善的稳定性)。如本领域中已知的,核苷是碱基-核糖组合。核苷的碱基部分通常是杂环碱基。此类杂环碱基的两种最常见的类别是嘌呤和嘧啶。核苷酸是这样的核苷,所述核苷还包括与核苷的糖部分共价连接的磷酸基团。对于那些包括戊呋喃糖基糖的核苷,磷酸基团可以与所述糖的2'、3'或5'羟基部分连接。在形成寡核苷酸时,磷酸基团将相邻的核苷彼此共价连接以形成直链聚合化合物。继而,该直链聚合化合物的各个末端可以进一步连接以形成环状化合物;然而,直链化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以以产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸基团通常被称为形成寡核苷酸的核苷间骨架。RNA和DNA的正常键或骨架是3'至5'磷酸二酯键。
经修饰的骨架和经修饰的核苷间键
合适的修饰的实例包括经修饰的核酸骨架和非天然的核苷间键。(具有经修饰的骨架的核酸包括在骨架中保留磷原子的核酸和在骨架中不具有磷原子的核酸。
其中含有磷原子的合适的经修饰寡核苷酸骨架包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其它烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、具有正常3'-5'键的硒代磷酸酯和硼代磷酸酯、硒代磷酸酯和硼代磷酸酯的2'-5'连接的类似物,以及具有反向极性的硒代磷酸酯和硼代磷酸酯,其中一个或多个核苷酸间键是3'至3'键、5'至5'键或2'至2'键。合适的具有反向极性的寡核苷酸包含在最3'核苷酸间键处的单个3'至3'键,即单个反向核苷残基,所述单个反向核苷残基可以是碱性的(核碱基丢失或具有羟基代替其)。还包括各种盐(诸如,钾盐或钠盐)、混合盐和游离酸形式。
在一些情况下,经标记的检测RNA包含一个或多个硫代磷酸酯和/或杂原子核苷间键,特别是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(称为亚甲基(甲基亚氨基)或MMI骨架)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键表示为-O-P(=O)(OH)-O-CH2-)。MMI型核苷间键在上面引用的美国专利号5,489,677中公开。合适的酰胺核苷间键在美国专利号5,602,240中公开。
同样合适的是如在例如美国专利号5,034,506中所述的具有吗啉代骨架结构的核酸。例如,在一些情况下,经标记的检测RNA包含6元吗啉代环代替核糖环。在一些情况下,二氨基磷酸酯或其它非磷酸二酯核苷间键取代磷酸二酯键。
其中不含磷原子的合适的经修饰多核苷酸骨架具有由短链烷基或环烷基核苷间键、混合杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的骨架。这些骨架包括具有吗啉代键(部分地由核苷的糖部分形成)的那些骨架;硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰基和硫代甲酰基骨架;亚甲基甲酰基和硫代甲酰基骨架;核糖乙酰骨架;含有烯基的骨架;氨基磺酸酯骨架;亚甲基亚氨基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及其它具有混合的N、O、S和CH2组成部分的骨架。
模拟物
经标记的检测RNA可以是核酸模拟物。应用于多核苷酸的术语“模拟物”旨在包括这样的多核苷酸,在所述多核苷酸中仅呋喃糖环或呋喃糖环和核苷酸间键两者被非呋喃糖基团替代,仅替代呋喃糖环也在本领域中被称为糖替代物。维持杂环碱基部分或经修饰的杂环碱基部分以与合适的靶核酸杂交。一种此类核酸,已显示具有优异杂交特性的多核苷酸模拟物,被称为肽核酸(PNA)。在PNA中,多核苷酸的糖骨架被含酰胺的骨架,特别是氨基乙基甘氨酸骨架取代。核苷酸被保留并直接或间接地结合骨架的酰胺部分的氮杂氮原子。
一种据报道具有优异杂交特性的多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的骨架是两个或更多个连接的氨基乙基甘氨酸单元,所述氨基乙基甘氨酸单元赋予PNA含酰胺的骨架。杂环碱基部分直接或间接地与骨架的酰胺部分的氮杂氮原子结合。描述PNA化合物制备的代表性美国专利包括但不限于:美国专利号5,539,082;5,714,331;和5,719,262。
已经研究的另一类多核苷酸模拟物基于连接的吗啉代单元(吗啉代核酸),所述连接的吗啉代单元具有附接到吗啉代环的杂环碱基。已经报道了许多连接基团,所述连接基团连接吗啉代核酸中的吗啉代单体单元。一类连接基团已经被选择用于提供非离子寡聚化合物。非离子的基于吗啉代的寡聚化合物不太可能与细胞蛋白发生不希望的相互作用。基于吗啉代的多核苷酸是寡核苷酸的非离子模拟物,其不太可能与细胞蛋白形成不希望的相互作用(Dwaine A.Braasch和David R.Corey,Biochemistry,2002,41(14),4503-4510)。基于吗啉代的多核苷酸在美国专利号5,034,506中公开。已经制备了吗啉代类多核苷酸内的多种化合物,所述化合物具有各种连接单体亚基的不同连接基团。
另一类多核苷酸模拟物被称为环己烯基核酸(CeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环替代。CeNA DMT保护的亚磷酰胺单体已被制备并用于按照经典的亚磷酰胺化学进行寡聚化合物合成。已经制备并研究了完全修饰的CeNA寡聚化合物和具有用CeNA修饰的特定位置的寡核苷酸(参见Wang等人,J.Am.Chem.Soc.,2000,122,8595-8602)。通常,将CeNA单体掺入DNA链中增加了其DNA/RNA杂交体的稳定性。CeNA寡腺苷酸以与天然复合物相似的稳定性而与RNA和DNA互补物形成复合物。通过NMR和圆二色性显示将CeNA结构掺入天然核酸结构中的研究,以进行简单的构象适应。
另一修饰包括锁定核酸(LNA),其中2'-羟基与糖环的4'碳原子连接,从而形成2'-C,4'-C-氧亚甲基键,从而形成双环糖部分。键可以是亚甲基(-CH2-)、桥接2'氧原子与4'碳原子的基团,其中n是1或2(Singh等人,Chem.Commun.,1998,4,455-456)。LNA和LNA类似物显示出非常高的互补DNA和RNA的双链热稳定性(Tm=+3至+10℃),朝向3'-核酸外切降解的稳定性和良好的溶解性。已经描述了含有LNA的有效和无毒的反义寡核苷酸(Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638)。
已经描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备,以及它们的寡聚化和核酸识别性质(Koshkin等人,Tetrahedron,1998,54,3607-3630)。LNA及其制备还描述于WO 98/39352和WO 99/14226中。
经修饰的糖部分
经标记的检测RNA还可包括一个或多个经取代的糖部分。合适的多核苷酸包含选自以下的糖取代基:OH;F;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基;O-炔基、S-炔基或N-炔基;或O-烷基-O-烷基,其中所述烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。特别合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2、以及O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其它合适的多核苷酸包含选自以下的糖取代基:C1至C10低级烷基,取代的低级烷基、烯基、炔基,烷芳基,芳烷基,O-烷芳基或O-芳烷基,SH,SCH3,OCN,Cl,Br,CN,CF3,OCF3,SOCH3,SO2CH3,ONO2,NO2,N3,NH2,杂环烷基,杂环烷芳基,氨基烷基氨基,聚烷基氨基,取代的甲硅烷基,RNA切割基团,报告基团,嵌入剂,用于改善寡核苷酸的药代动力学性质的基团,或用于改善寡核苷酸的药效学性质的基团,以及其它具有相似性质的取代基。合适的修饰包括2'-甲氧基乙氧基(2'-O-CH2CH2OCH3,也称为2'-O-(2-甲氧基乙基)或2'-MOE)(Martin等人,Helv.Chim.Acta,1995,78,486-504),即烷氧基烷氧基基团。另一合适的修饰包括2'-二甲基氨氧乙氧基,即O(CH2)2ON(CH3)2基团,也称为2'-DMAOE,如下文实施例中所述;以及2'-二甲氨基乙氧基乙氧基(在本领域中也称为2'-O-二甲基-氨基-乙氧基-乙基或2'-DMAEOE),即2'-O-CH2-O-CH2-N(CH3)2
其它合适的糖取代基包括甲氧基(-O-CH3)、氨基丙氧基(--O CH2 CH2 CH2NH2)、烯丙基(-CH2-CH=CH2)、-O-烯丙基(--O--CH2—CH=CH2)和氟(F)。2'-糖取代基可以处于阿拉伯糖(上)位置或核糖(下)位置。合适的2'-阿拉伯糖修饰是2'-F。也可以在寡聚化合物上的其它位置,特别是3'末端核苷上或2'-5'连接的寡核苷酸的糖的3'位置处,以及5'末端核苷酸的5'位置处进行类似的修饰。寡聚化合物也可以具有糖模拟物,诸如环丁基部分代替戊呋喃糖基糖。
碱基修饰和取代
经标记的检测RNA还可以包含核碱基(在本领域中通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G),以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。经修饰的核碱基包括其它合成和天然核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、6-甲基腺嘌呤和鸟嘌呤以及腺嘌呤和鸟嘌呤的其它烷基衍生物、2-丙基腺嘌呤和鸟嘌呤以及腺嘌呤和鸟嘌呤的其它烷基衍生物、2-硫尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-氟尿嘧啶和胞嘧啶、5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其它炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代腺嘌呤和鸟嘌呤、8-氨基腺嘌呤和鸟嘌呤、8-巯基腺嘌呤和鸟嘌呤、8-硫代烷基腺嘌呤和鸟嘌呤、8-羟基腺嘌呤和鸟嘌呤以及其它8-取代的腺嘌呤和鸟嘌呤、5-卤代(特别是5-溴代)尿嘧啶和胞嘧啶、5-三氟甲基尿嘧啶和胞嘧啶以及其它5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮杂鸟嘌呤和7-脱氮杂腺嘌呤,以及3-脱氮杂鸟嘌呤和3-脱氮杂腺嘌呤。其它经修饰的核碱基包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-钳如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3',2':4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可包括嘌呤碱基或嘧啶碱基被其它杂环取代的那些杂环碱基部分,例如7-脱氮杂腺嘌呤、7-脱氮杂鸟苷、2-氨基吡啶和2-吡啶酮。其它核碱基包括在美国专利号3,687,808中公开的那些核碱基;在The Concise Encyclopedia Of PolymerScience And Engineering,第858-859页,Kroschwitz,J.I.编辑,John Wiley&Sons,1990中公开的那些核碱基;由Englisch等人,Angewandte Chemie,International Edition,1991,30,613公开的那些核碱基;以及由Sanghvi,Y.S.,第15章,Antisense Research andApplications,第289-302页,Crooke,S.T.和Lebleu,B.编辑,CRC Press,1993公开的那些核碱基。这些核碱基中的某些可用于增加寡聚化合物的结合亲和力。这些核碱基包括5-取代的嘧啶、6-氮杂嘧啶,以及N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示为使核酸双链体稳定性增加0.6-1.2℃。(Sanghvi等人编辑,Antisense Research and Applications,CRC Press,Boca Raton,1993,第276-278页),并且是合适的碱基取代,例如当与2'-O-甲氧基乙基糖修饰组合时。
3)包含两种不同C2c2蛋白和两种不同经标记的检测RNA的试剂盒
在一些情况下,主题试剂盒包含:(a)第一经标记的检测RNA,其缺乏U但包含至少一个A(例如,至少2个、至少3个、或至少4个A)并且包含第一FRET对和/或第一猝灭剂/荧光剂对;(b)第二经标记的检测RNA,其缺乏A但包含至少一个U(例如,至少2个、至少3个或至少4个U)并且包含第二FRET对和/或第二猝灭剂/荧光剂对;(c)第一C2c2蛋白和/或编码所述第一C2c2蛋白的核酸,其中所述第一C2c2蛋白在被激活时切割腺嘌呤+RNA(包括A的RNA)而不切割缺乏A的RNA(例如,聚U RNA)[例如,第一C2c2蛋白可以切割第一经标记的检测RNA而不切割第二经标记的检测RNA];以及(d)第二C2c2蛋白和/或编码所述第二C2c2蛋白的核酸,其中所述第二C2c2蛋白在被激活时切割尿嘧啶+RNA(包括U的RNA)而不切割缺乏U的RNA(例如,聚A RNA)(例如,第二C2c2蛋白可以切割第二经标记的检测RNA而不切割第一经标记的检测RNA)。
在一些情况下,第一经标记的检测RNA缺乏U并且包括2至15个连续的A(例如,2至12个、2至10个、2至8个、2至6个、2至4个、3至15个、3至12个、3至10个、3至8个、3至6个、3至5个、4至15个、4至12个、4至10个、4至8个或4至6个连续的A)的段。在一些情况下,第一经标记的检测RNA缺乏U并且包括至少2个连续的A(例如,至少3个、至少4个或至少5个连续的A)的段。在一些情况下,第二经标记的检测RNA缺乏A并且包括2至15个连续的U(例如,2至12个、2至10个、2至8个、2至6个、2至4个、3至15个、3至12个、3至10个、3至8个、3至6个、3至5个、4至15个、4至12个、4至10个、4至8个或4至6个连续的U)的段。在一些情况下,第二经标记的检测RNA缺乏A并且包括至少2个连续的U(例如,至少3个、至少4个或至少5个连续的U)的段。
在一些情况下,此类试剂盒还包括:(e)第一C2c2指导RNA(和/或编码所述第一C2c2指导RNA的核酸),例如包含编码所述第一C2c2指导RNA的核苷酸序列的核酸,其中所述核酸包括供用户插入指导序列(例如,与靶RNA杂交的核苷酸序列)的序列插入位点);以及(f)第二C2c2指导RNA(和/或编码所述第二C2c2指导RNA的核酸),例如包含编码所述第二C2c2指导RNA的核苷酸序列的核酸,其中所述核酸包括供用户插入指导序列(例如,与靶RNA杂交的核苷酸序列)的序列插入位点)。第一C2c2指导RNA包含与第一单链靶RNA杂交的第一核苷酸序列和与第一C2c2蛋白结合的第二核苷酸序列。第二C2c2指导RNA包含与第二单链靶RNA杂交的第一核苷酸序列和与第二C2c2蛋白结合的第二核苷酸序列。第一C2c2蛋白不被第二C2c2指导RNA激活,并且第一C2c2蛋白切割包括至少一个A的ssRNA(例如,不切割缺乏A的ssRNA)。第二个C2c2蛋白不被第一C2c2指导RNA激活,并且第二C2c2蛋白切割包括至少一个U的ssRNA(例如,不切割缺乏U的ssRNA)。
以下是适合于包括在本公开的试剂盒中的第一和第二C2c2蛋白的非限制性实例(下文列出为a)至w)):
a)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
b)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
c)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
d)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
e)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
f)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
g)第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56D所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
h)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
i)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
j)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
k)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
l)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
m)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
n)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56D所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
o)第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56A所示的Lse Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
p)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
q)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
r)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
s)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
t)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
u)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
v)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56F所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;或者
w)第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且第二C2c2蛋白包含与图56A所示的Lse Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
C2c2蛋白
适合于包括在本公开的试剂盒中的C2c2蛋白与C2c2指导RNA结合,由指导RNA(其与靶RNA杂交)引导到单链靶RNA,从而被“激活”。如果C2c2蛋白的HEPN1结构域和HEPN2结构域是完整的,则C2c2蛋白一旦被激活就切割靶RNA,但是也切割非靶RNA。
在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包括与SEQ ID NO:1至SEQ ID NO:6中任一项所示的氨基酸序列具有80%或更多(例如,85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多、或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ IDNO:1所示的斯氏李斯特菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:2所示的口腔纤毛菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:4所示的荚膜红细菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:5所示的鸡肉杆菌C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包含与SEQ ID NO:6所示的Herbinix hemicellulosilytica C2c2氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包括与SEQ ID NO:2所示的口腔纤毛菌(Lbu)C2c2氨基酸序列具有80%或更多的氨基酸序列同一性的氨基酸序列。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白是口腔纤毛菌(Lbu)C2c2蛋白(例如,参见SEQ ID NO:2)。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白包括SEQ ID NO:1至SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一项所示的氨基酸序列。
在一些情况下,包括在本公开的试剂盒中的C2c2蛋白不是沙氏纤毛菌(Lsh)C2c2蛋白。在一些情况下,包括在本公开的试剂盒中的C2c2蛋白不是与SEQ ID NO:3所示的LshC2c2多肽具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的C2c2多肽。
在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白在切割未由所述方法的C2c2指导RNA靶向的RNA方面更有效1.2倍或更多倍。在一些情况下,所述C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白在切割未由所述方法的C2c2指导RNA靶向的RNA方面更有效1.5倍或更多倍。在一些情况下,在本公开的方法中使用的C2c2多肽当被激活时,比Lsh C2c2至少1.2倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少30倍、或大于30倍有效地切割非靶RNA。
在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在所述接触的1小时内表现出至少50%的RNA切割效率(例如,55%或更多、60%或更多、65%或更多、70%或更多、或75%或更多的切割效率)。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在所述接触的40分钟内表现出至少50%的RNA切割效率(例如,55%或更多、60%或更多、65%或更多、70%或更多、或75%或更多的切割效率)。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在所述接触的30分钟内表现出至少50%的RNA切割效率(例如,55%或更多、60%或更多、65%或更多、70%或更多、或75%或更多的切割效率)。
在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在30秒至60分钟(例如,1分钟至60分钟、30秒至5分钟、1分钟至5分钟、1分钟至10分钟、5分钟至10分钟、10分钟至15分钟、15分钟至20分钟、20分钟至25分钟、25分钟至30分钟、30分钟至35分钟、35分钟至40分钟、40分钟至45分钟、45分钟至50分钟、50分钟至55分钟或55分钟至60分钟)的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在30秒至5分钟的时间段内(例如,1分钟至5分钟,例如在1分钟、2分钟、3分钟、4分钟或5分钟的时间段内)切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在5分钟至10分钟的时间段内(例如,在5分钟、6分钟、7分钟、8分钟、9分钟或10分钟的时间段内)切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在10分钟至15分钟(例如,10分钟、11分钟、12分钟、13分钟、14分钟或15分钟)的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在15分钟至20分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在20分钟至25分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在25分钟至30分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在30分钟至35分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在35分钟至40分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在40分钟至45分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在45分钟至50分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在50分钟至55分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白在55分钟至60分钟的时间段内切割样品中存在的RNA的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或大于99%。
在一些情况下,包括在本公开的试剂盒中的C2c2蛋白不是沙氏纤毛菌(Lsh)C2c2蛋白。在一些情况下,C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白更有效(例如,在切割非靶RNA方面)1.2倍或更高(例如,1.5倍或更高、1.7倍或更高、或2倍或更高)。因此,在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白比沙氏纤毛菌(Lsh)C2c2蛋白在切割未由所述方法的C2c2指导RNA靶向的RNA方面更有效1.2倍或更多倍(例如,1.5倍或更多倍、1.7倍或更多倍、或2倍或更多倍)。在一些情况下,适合于包括在本公开的试剂盒中的C2c2蛋白当被激活时,比Lsh C2c2至少1.2倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少30倍或大于30倍有效地切割非靶RNA。
阳性对照
包含经标记的检测RNA和C2c2多肽的本公开的试剂盒还可以包括阳性对照靶RNA。在一些情况下,试剂盒还包括阳性对照指导RNA,所述阳性对照指导RNA包含与对照靶RNA杂交的核苷酸序列。在一些情况下,阳性对照靶RNA以不同的量在分开的容器中提供。在一些情况下,阳性对照靶RNA以各种已知浓度在分开的容器中与对照非靶RNA一起提供。
编码C2c2指导RNA和/或前体C2c2指导RNA阵列和/或C2c2蛋白的核酸
虽然本公开的RNA(例如,C2c2指导RNA和前体C2c2指导RNA阵列)可以使用任何合宜的方法合成(例如,使用RNA聚合酶(例如,T7聚合酶、T3聚合酶、SP6聚合酶)在体外化学合成,等等),但是也设想了编码2c2指导RNA和/或前体C2c2指导RNA阵列的核酸。另外,虽然可以以蛋白形式提供本公开的C2c2蛋白(例如,作为试剂盒的部分),但是也可以提供编码所述C2c2蛋白的核酸(诸如mRNA和/或DNA)。
例如,在一些实施方案中,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码C2c2指导RNA的核苷酸序列。在一些情况下,核苷酸序列编码没有指导序列的C2c2指导RNA。例如,在一些情况下,核酸包含编码C2c2指导RNA(没有指导序列的C2c2指导RNA)的恒定区的核苷酸序列,并且包含编码指导序列的核酸的插入位点。在一些实施方案中,本公开的试剂盒包含核酸(例如,mRNA、DNA,例如重组表达载体),所述核酸包含编码C2c2蛋白的核苷酸序列。
在一些实施方案中,本公开的试剂盒包含核酸(例如,DNA,例如,重组表达载体),所述核酸包含编码前体C2c2指导RNA阵列的核苷酸序列(例如,在一些情况下,其中阵列的每个指导RNA具有不同的指导序列)。在一些情况下,阵列的经编码的指导RNA中的一者或多者不具有指导序列,例如,核酸可以包括所述阵列的一个或多个指导RNA的指导序列的插入位点。在一些情况下,主题C2c2指导RNA可以包括来自前体crRNA的柄,但不一定必须包括多个指导序列。
在一些情况下,编码C2c2指导RNA的核苷酸序列(和/或编码前体C2c2指导RNA阵列的核苷酸序列)与启动子可操作地连接,所述启动子为例如在原核细胞中起作用的启动子、在真核细胞中起作用的启动子、在哺乳动物细胞中起作用的启动子、在人细胞中起作用的启动子等。在一些情况下,编码C2c2蛋白的核苷酸序列与启动子可操作地连接,所述启动子为例如在原核细胞中起作用的启动子、在真核细胞中起作用的启动子、在哺乳动物细胞中起作用的启动子、在人细胞中起作用的启动子、细胞型特异性启动子、可调控的启动子、组织特异性启动子等。
本公开的非限制性方面的实例
上述本主题的各方面(包括实施方案)可以单独或与一个或多个其它方面或实施方案一起为有益的。在不限制前述描述的情况下,下面提供了编号1-90的本公开的某些非限制性方面。对于本领域的技术人员在阅读本公开时将显而易见的是,每个单独编号的方面可以使用或与前面或后面的单独编号的方面中的任一者一起组合。这旨在为各方面的所有此类组合提供支持,并且不限于以下明确提供的各方面的组合:
方面1.一种检测包含多种RNA的样品中的单链靶RNA的方法,所述方法包括:
a)使所述样品与以下接触:(i)C2c2指导RNA,其与所述单链靶RNA杂交;和(ii)C2c2蛋白,其切割所述样品中存在的RNA;以及
b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。
方面2.一种检测包含多种RNA的样品中的单链靶RNA的方法,所述方法包括:
(a)使样品与以下接触:i)前体C2c2指导RNA阵列,其包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;和(ii)C2c2蛋白,其将所述前体C2c2指导RNA阵列切割成单独的C2c2指导RNA,并且还切割所述样品的RNA;以及
(b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。
方面3.根据方面1或方面2所述的方法,其中所述C2c2蛋白在所述接触1小时内切割所述样品中存在的所述RNA的至少50%。
方面4.根据方面3所述的方法,其中所述C2c2蛋白在所述接触40分钟内切割所述样品中存在的所述RNA的至少50%。
方面5.根据方面4所述的方法,其中所述C2c2蛋白在所述接触5分钟内切割所述样品中存在的所述RNA的至少50%。
方面6.根据方面5所述的方法,其中所述C2c2蛋白在所述接触1分钟内切割所述样品中存在的所述RNA的至少50%。
方面7.根据方面1所述的方法,其中所述C2c2蛋白在所述接触1分钟内切割所述样品中存在的所述RNA的50%至多于90%。
方面8.根据方面1-7中任一方面所述的方法,其中可以检测到所述单链靶RNA的最小浓度在500fM至1nM的范围内。
方面9.根据方面1-7中任一方面所述的方法,其中可以在低至800fM的浓度下检测到所述单链靶RNA。
方面10.根据方面1-9中任一方面所述的方法,其中所述C2c2蛋白不是包含与SEQID NO:3所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列的沙氏纤毛菌(Lsh)C2c2蛋白。
方面11.根据方面10所述的方法,其中所述C2c2蛋白比包含与SEQ ID NO:3所示的氨基酸序列至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的沙氏纤毛菌(Lsh)C2c2蛋白至少1.2倍更有效地切割非靶RNA。
方面12.根据方面11所述的方法,其中所述C2c2蛋白比包含SEQ ID NO:3所示的氨基酸序列的沙氏纤毛菌(Lsh)C2c2蛋白至少1.5倍更有效地切割非靶RNA。
方面13.根据方面1-9中任一方面所述的方法,其中所述C2c2蛋白包含与SEQ IDNO:1、SEQ ID NO:2或SEQ ID NO:4至SEQ ID NO:6中任一者所示的氨基酸序列具有80%或更多氨基酸序列同一性的氨基酸序列。
方面14.根据方面1-9中任一方面所述的方法,其中所述C2c2蛋白包含与SEQ IDNO:2所示的口腔纤毛菌(Lbu)C2c2氨基酸序列具有80%或更多氨基酸序列同一性的氨基酸序列。
方面15.根据方面1-9中任一方面所述的方法,其中所述C2c2蛋白包含与SEQ IDNO:1所示的斯氏李斯特菌C2c2氨基酸序列具有80%或更多氨基酸序列同一性的氨基酸序列。
方面16.根据方面1-9中任一方面所述的方法,其中所述C2c2蛋白包含SEQ ID NO:1至SEQ ID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一者所示的氨基酸序列。
方面17.根据方面1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对R472、H477、R1048和H1053中的一者或多者的取代。
方面18.根据方面1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。
方面19.根据方面1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1048和H1053的取代。
方面20.根据方面1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053的取代。
方面21.根据方面1-20中任一方面所述的方法,其中在所述测量之前使所述样品接触2小时或更短时间。
方面22.根据方面21所述的方法,其中在所述测量之前使所述样品接触60分钟或更短时间。
方面23.根据方面22所述的方法,其中在所述测量之前使所述样品接触30分钟或更短时间。
方面24.根据方面23所述的方法,其中在所述测量之前使所述样品接触10分钟或更短时间。
方面25.根据方面24所述的方法,其中在所述测量之前使所述样品接触1分钟或更短时间。
方面26.根据方面1-25中任一方面所述的方法,其包括确定在所述样品中存在的靶RNA的量。
方面27.根据方面26所述的方法,其中所述确定包括:
测量所述可检测信号以产生测试测量值;
测量由参考样品产生的可检测信号以产生参考测量值;以及
将所述测试测量值与所述参考测量值进行比较以确定所述样品中存在的靶RNA的量。
方面28.根据方面26所述的方法,其包括:
测量所述可检测信号以产生测试测量值,
测量由两个或更多个参考样品中的每一个产生的可检测信号,其中所述两个或更多个参考样品各自包括不同量的阳性对照RNA,以产生两个或更多个参考测量值,以及
将所述测试测量值与所述两个或更多个参考测量值进行比较以确定所述样品中存在的靶RNA的量。
方面29.根据方面1-28中任一方面所述的方法,其中所述样品包含5至107个序列彼此不同的RNA。
方面30.根据方面1-28中任一方面所述的方法,其中所述样品包含10至106个序列彼此不同的RNA。
方面31.根据方面1-30中任一方面所述的方法,其中所述样品包含来自细胞裂解物的RNA。
方面32.根据方面1-31中任一方面所述的方法,其中测量可检测信号包括以下中的一者或多者:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
方面33.根据方面1-32中任一方面所述的方法,其中(i)所述方法包括使所述样品与包含荧光发射染料对(即,荧光共振能量转移(FRET)对和/或猝灭剂/荧光剂对)的经标记的检测RNA接触,(ii)所述C2c2蛋白切割所述经标记的检测RNA,以及(iii)所述可检测信号由所述FRET对和/或所述猝灭剂/荧光剂对产生。
方面34.根据方面33所述的方法,其中所述经标记的检测RNA在被切割之前产生一定量的可检测信号,并且当所述经标记的检测RNA被切割时可检测信号的量减少。
方面35.根据方面33所述的方法,其中所述经标记的检测RNA在被切割之前产生第一可检测信号,并且当所述经标记的检测RNA被切割时产生第二可检测信号。
方面36.根据方面35所述的方法,其中所述经标记的检测RNA包含FRET对和猝灭剂/荧光剂对。
方面37.根据方面33-36中任一方面所述的方法,其中所述经标记的检测RNA包含FRET对。
方面38.根据方面33所述的方法,其中在所述经标记的检测RNA被切割时产生可检测信号。
方面39.根据方面33所述的方法,其中当所述经标记的检测RNA被切割时,可检测信号的量增加。
方面40.根据方面38或方面39所述的方法,其中所述经标记的检测RNA包含猝灭剂/荧光剂对。
方面41.根据方面33-40中任一方面所述的方法,其中所述经标记的检测RNA包含经修饰的核碱基、经修饰的糖部分和/或经修饰的核酸键。
方面42.根据方面1-41中任一方面所述的方法,其中所述接触在无细胞样品中进行。
方面43.根据方面1-41中任一方面所述的方法,其中所述接触在体外、离体或体外细胞中进行。
方面44.一种将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法,所述方法包括:
使包含两个或更多个C2c2指导RNA的前体C2c2指导RNA阵列与C2c2蛋白接触,每个所述C2c2指导RNA阵列具有不同的指导序列,其中所述C2c2蛋白将所述前体C2c2指导RNA阵列切割成单独的C2c2指导RNA。
方面45.根据方面44所述的方法,其中所述C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。
方面46.根据方面44或方面45所述的方法,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向相同靶RNA分子内的不同靶序列。
方面47.根据方面44-46中任一方面所述的方法,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向不同靶RNA分子。
方面48.根据方面44-47中任一方面所述的方法,其中所述接触不在细胞内发生。
方面49.根据方面44-48中任一方面所述的方法,其中所述指导RNA和/或所述前体C2c2指导RNA阵列中的至少一者是可检测地标记的。
方面50.一种用于检测包含多种RNA的样品中的靶RNA的试剂盒,所述试剂盒包含:
(a)前体C2c2指导RNA阵列,和/或编码所述前体C2c2指导RNA阵列的核酸,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列和/或所选择的指导序列的插入位点;以及
(b)C2c2蛋白。
方面51.根据方面50所述的试剂盒,其中所述C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。
方面52.根据方面50或方面51所述的试剂盒,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向相同靶RNA分子内的不同靶序列。
方面53.根据方面50-52中任一方面所述的试剂盒,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向不同靶RNA分子。
方面54.根据方面50-53中任一方面所述的试剂盒,其中所述指导RNA和/或所述前体C2c2指导RNA阵列中的至少一者是可检测地标记的。
方面55.根据方面50-54中任一方面所述的试剂盒,其还包含经标记的检测RNA,所述经标记的检测RNA包含荧光发射染料对(即,FRET对和/或猝灭剂/荧光剂对)。
方面56.一种用于检测包含多种RNA的样品中的靶RNA的试剂盒,所述试剂盒包含:
(a)经标记的检测RNA,其包含荧光发射染料对(即,FRET对和/或猝灭剂/荧光剂对);以及
(b)C2c2蛋白。
方面57.根据方面56所述的试剂盒,其包含阳性对照靶RNA。
方面58.根据方面57所述的试剂盒,其中所述阳性对照靶RNA以不同的量在两个或更多个容器中的每一个中存在。
方面59.根据方面56-58中任一方面所述的试剂盒,其包含以下中的至少一者:
(c)C2c2指导RNA和/或编码所述C2c2指导RNA的核酸;
(d)前体C2c2指导RNA和/或编码所述前体C2c2指导RNA的核酸;以及
(e)前体C2c2指导RNA阵列,和/或编码所述前体C2c2指导RNA阵列的核酸,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列和/或所选择的指导序列的插入位点。
方面60.根据方面56-59中任一方面所述的试剂盒,其包含DNA,所述DNA包含编码具有或不具有指导序列的C2c2指导RNA的核苷酸序列。
方面61.根据方面60所述的试剂盒,其中所述DNA包含用于插入指导序列的插入序列。
方面62.根据方面60或方面61所述的试剂盒,其中所述DNA是表达载体,并且所述C2c2指导RNA与启动子可操作地连接。
方面63.根据方面62所述的试剂盒,其中所述启动子是T7启动子。
方面64.根据方面56-63中任一方面所述的试剂盒,其包含缺乏核酸酶活性的C2c2内切核糖核酸酶变体。
方面65.根据方面56-64中任一方面所述的试剂盒,其中所述经标记的检测RNA包含FRET对。
方面66.根据方面56-65中任一方面所述的试剂盒,其中所述经标记的检测RNA包含猝灭剂/荧光剂对。
方面67.根据方面56-66中任一方面所述的试剂盒,其中所述经标记的检测RNA包含产生第一可检测信号的FRET对和产生第二可检测信号的猝灭剂/荧光剂对。
方面68.一种变体C2c2多肽,其包含:
a)与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R472和H477;ii)氨基酸R1048和H1053;或iii)氨基酸R472、H477、R1048和H1053;
b)与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R445和H450;ii)氨基酸R1016和H1021;或iii)氨基酸R445、H450、R1016和H1021;
c)与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R464和H469;ii)氨基酸R1052和H1057;或iii)氨基酸R464、H469、R1052和H1057;
d)与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R467和H472;ii)氨基酸R1069和H1074;或iii)氨基酸R467、H472、R1069和H1074;或者
e)与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R472和H477;ii)氨基酸R1044和H1049;iii)或氨基酸R472、H477、R1044和H1049。
方面69.根据68所述的变体C2c2多肽,其中所述变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
方面70.一种核酸,其包含编码根据方面68或方面69所述的变体C2c2多肽的核苷酸序列。
方面71.根据方面70所述的核酸,其中所述核苷酸序列与组成型启动子或可调控的启动子可操作地连接。
方面72.一种重组表达载体,其包含根据方面70或方面71所述的核酸。
方面73.一种宿主细胞,用根据方面70或方面71所述的核酸或用根据方面72所述的重组表达载体遗传修饰。
方面74.根据方面73所述的宿主细胞,其中所述宿主细胞是真核细胞。
方面75.根据方面73所述的宿主细胞,其中所述宿主细胞是原核细胞。
方面76.根据方面73-75中任一方面所述的宿主细胞,其中所述宿主细胞是体外、离体或体内的。
方面77.一种检测包含多种RNA的样品中的至少两种不同单链靶RNA的方法,所述方法包括:
a)使所述样品与以下接触:
(i)第一C2c2蛋白,其切割包括至少一个A的单链RNA(ssRNA);
(ii)第二C2c2蛋白,其切割包括至少一个U的ssRNA;
(iii)第一C2c2指导RNA,其包含与所述第一单链靶RNA杂交的第一核苷酸序列和与所述第一C2c2蛋白结合的第二核苷酸序列;以及
(iv)第二C2c2指导RNA,其包含与所述第二单链靶RNA杂交的第一核苷酸序列和与所述第二C2c2蛋白结合的第二核苷酸序列;
其中所述第一C2c2蛋白不被所述第二C2c2指导RNA激活,并且其中所述第一C2c2蛋白切割包括至少一个A的ssRNA,并且
其中所述第二C2c2蛋白不被所述第一C2c2指导RNA激活,并且其中所述第二C2c2蛋白切割包括至少一个U的ssRNA;以及
b)测量由所述第一C2c2蛋白和所述第二C2c2蛋白介导的RNA切割产生的可检测信号,其中第一可检测信号在所述第一C2c2蛋白被激活时产生,并且第二可检测信号在所述第二C2c2蛋白被激活时产生,其中检测到所述第一信号表明所述第一靶ssRNA存在于所述样品中,并且其中检测到所述第二信号表明所述第二靶ssRNA存在于所述样品中。
方面78.根据方面77所述的方法,其中:
a)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
b)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
c)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
d)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
e)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
f)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
g)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56D所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
h)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
i)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
j)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
k)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
l)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
m)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
n)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56D所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
o)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56A所示的Lse Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
p)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
q)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
r)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
s)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
t)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
u)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
v)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56F所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;或者
w)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56A所示的Lse Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
方面79.根据方面77或方面78所述的方法,其中所述方法包括使所述样品与以下接触:
i)第一经标记的检测RNA,其包含第一荧光共振能量转移(FRET)对和/或第一猝灭剂/荧光剂对,其中所述第一经标记的检测RNA包含至少一个A并且不包含U;和
ii)第二经标记的检测RNA,其包含第二FRET对和/或第二猝灭剂/荧光剂对,其中所述第二经标记的检测RNA包含至少一个U并且不包含A,
其中所述第一C2c2蛋白切割所述第一经标记的检测RNA,并且所述第一可检测信号由所述第一FRET对和/或所述第一猝灭剂/荧光剂对产生,并且
其中所述第一C2c2蛋白切割所述第二经标记的检测RNA,并且所述第二可检测信号由所述第二FRET对和/或所述第二猝灭剂/荧光剂对产生。
方面80.根据方面79所述的方法,其中所述第一经标记的检测RNA包含2至15个连续的A的段和/或所述第二经标记的检测RNA包含2至15个连续的U的段。
方面81.根据方面79所述的方法,其中所述第一经标记的检测RNA包含4至15个连续的A的段和/或所述第二经标记的检测RNA包含4至15个连续的U的段。
方面82.根据方面79所述的方法,其中所述第一经标记的检测RNA包含至少3个连续的A的段和/或所述第二经标记的检测RNA包含至少3个连续的U的段。
方面83.根据方面79所述的方法,其中所述第一经标记的检测RNA包含至少4个连续的A的段和/或所述第二经标记的检测RNA包含至少4个连续的U的段。
方面84.一种试剂盒,其包含:
(a)第一经标记的检测RNA,其缺乏U并且包含至少一个A且包含第一荧光发射染料对;
(b)第二经标记的检测RNA,其缺乏A并且包含至少一个U且包含第二荧光发射染料对;
(c)第一C2c2蛋白,和/或编码所述第一C2c2蛋白的核酸,其中所述第一C2c2蛋白可切割所述第一经标记的检测RNA但不切割所述第二经标记的检测RNA(例如,所述第一C2c2蛋白当被激活时切割腺嘌呤+RNA并且不切割缺乏A的RNA);以及
(d)第二C2c2蛋白,和/或编码所述第二C2c2蛋白的核酸,其中所述第二C2c2蛋白可切割所述第二经标记的检测RNA但不切割所述第一经标记的检测RNA(例如,所述第二C2c2蛋白当被激活时切割尿嘧啶+RNA但不切割缺乏U的RNA)。
方面85.根据方面84所述的试剂盒,其包含以下中的至少一者:
(e)第一C2c2指导RNA和/或编码所述第一C2c2指导RNA的核酸,其中所述第一C2c2指导RNA包含与所述第一C2c2蛋白结合的恒定区序列;
(f)第二C2c2指导RNA和/或编码所述第二C2c2指导RNA的核酸,其中所述第二C2c2指导RNA包含与所述第二C2c2蛋白结合的恒定区序列;
(g)核酸,其包含编码与所述第一C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点;
(h)核酸,其包含编码与所述第二C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点。
方面86.根据方面84所述的试剂盒,其包含核酸,所述核酸包含编码第一C2c2指导RNA的核苷酸序列,其中所述第一C2c2指导RNA包含与所述第一C2c2蛋白结合的恒定区序列。
方面87.根据方面84所述的试剂盒,其包含核酸,所述核酸包含编码第二C2c2指导RNA的核苷酸序列,其中所述第二C2c2指导RNA包含与所述第二C2c2蛋白结合的恒定区序列。
方面88.根据方面84所述的试剂盒,其包含核酸,所述核酸包含编码与所述第一C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点。
方面89.根据方面84所述的试剂盒,其包含核酸,所述核酸包含编码与所述第二C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点。
方面90.根据方面86-89中任一方面所述的试剂盒,其中所述核酸是表达载体,并且所述核苷酸序列与启动子可操作地连接。
实施例
提出以下实施例是为了向本领域的普通技术人员提供如何制备和使用本发明的完整公开和描述,而非旨在限制本发明人认为是其发明的范围,也非旨在表示以下实验是所执行的全部或唯一实验。已经努力确保关于所使用的数值(例如量、温度等)的准确性,但是应该考虑一些实验误差和偏差。除非另有说明,否则份数是重量份,分子量是重均分子量,温度以摄氏度计,并且压力处于大气压或接近大气压。可以使用标准缩写,例如bp表示碱基对;kb表示千碱基;pl表示皮升;s或sec表示秒;min表示分钟;h或hr表示小时;aa表示氨基酸;kb表示千碱基;bp表示碱基对;nt表示核苷酸;i.m.表示肌内(肌内地);i.p.表示腹膜内(腹膜内地);s.c.表示皮下(皮下地);等等。
本文描述的数据显示,C2c2具有负责CRISPR RNA加工和ssRNA降解的两种不同核糖核酸酶活性。前体CRISPR RNA(pre-crRNA)的成熟是相对缓慢的、高度特异性的催化事件。相比之下,当与具有与crRNA的指导区段的序列互补性的靶RNA结合时,C2c2被激活为强大的通用RNA酶,所述RNA酶通过引发尿嘧啶核苷酸处的链断裂而顺式和反式地切割RNA。数据显示,这种反式切割活性可用于复杂混合物内的超灵敏RNA检测。
实施例1:C2c2重组蛋白纯化
图1A至图1E.对内源C2c2基因座以及重组C2c2蛋白的异源表达和纯化的概述。图1A.口腔纤毛菌C2c2基因座的示意图。所预测的HEPN活性位点以黄色指示,其中活性位点残基被标示。图1B.来自该VI型CRISPR系统的成熟crRNA的示意图。图1C.对阳离子交换色谱级分的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析。收获表达His-麦芽糖结合蛋白(MBP)-C2c2的大肠杆菌细胞并通过超声处理进行裂解。通过离心澄清裂解物,然后经由金属离子亲和色谱分离His-MBP-C2c2。将蛋白洗脱液与TEV蛋白酶一起孵育以切除His-MBP标签。将切割的蛋白上样到HiTrap肝素柱上,并以线性KCl梯度洗脱。将洗脱级分上样到10%SDS-PAGE凝胶上进行分析。图1D.将阳离子交换色谱级分汇集、浓缩,然后上样到S200尺寸排阻色谱柱上。经由SDS-PAGE分析来自尺寸交换色谱的级分。图1E.C2c2酶促活性的工作模型。
实施例2:C2c2是可编程的内切核糖核酸酶
纯化的C2c2以crRNA指导的方式切割单链RNA(ssRNA),所述crRNA指导的方式依赖于催化活性HEPN结构域的存在(图2)
图2.在20mM Tris-HCl pH 6.8、50mM KCl、5mM MgCl2、5%甘油中执行切割测定。将100nM C2c2蛋白与crRNA以2:1的比率在37℃下预孵育10分钟以促进复合物组装。约1nM的5’32P标记的ssRNA的加入引发反应,并且通过用甲酰胺上样缓冲液猝灭来获取时间点。将切割产物形成通过15%变性尿素-PAGE进行解析,并使用磷光成像仪可视化。灭活蛋白(由dC2c2表示法表示)是四点突变体(R472A、H477A、R1048A、H1053A),其在两个预测的活性位点中均从R-X4-6-H HEPN基序消除精氨酸和组氨酸两者。在这种凝胶中,所关注的泳道用红色框突出显示。使用脱靶ssRNA时或当HEPN结构域失活时未检测到切割活性。
实施例3:C2c2切割活性对单链RNA有特异性
C2c2表现为不切割双链RNA或DNA,其中与ssRNA相比,以大大降低的速率有限地切割单链DNA(图3)。
图3.C2c2强烈切割单链RNA并且不切割双链底物。切割测定条件如图2所示。将切割产物在15%变性尿素-PAGE凝胶上解析。在5分钟、10分钟、30分钟、75分钟时取样,其中所有对照泳道平行孵育75分钟。具有预期尺寸范围的切割产物可仅在ssRNA反应中检测到,并且在单链DNA条件下以更小程度检测到。对单链RNA靶的3'末端标记表明,切割发生在靶-间隔区序列杂交区外部。图中顶部的标签指示是添加了蛋白(“Lbu C2c2”)还是C2c2指导RNA(“crGAPDH1”)。对照包括(i)蛋白但没有指导RNA,(ii)指导RNA但没有蛋白,以及(iii)没有蛋白和没有指导RNA。
实施例4:C2c2将前体crRNA加工成成熟crRNA
C2c2以不依赖于HEPN结构域的方式将前体crRNA加工成成熟crRNA(图4A至图4B),表明存在另外的内切核酸酶结构域。
图4A.由C2c2催化的pre-crRNA加工反应的图。图4B.在用甲酰胺上样缓冲液进行猝灭之前,将100nM Lbu C2c2与约5nM 5’32P标记的ssRNA一起在20mM的HEPES pH 6.8、50mMKCl、5mM MgCl2、5%甘油中孵育60分钟。将反应产物在15%变性尿素-PAGE凝胶上解析,并使用磷光成像仪(phosphoimager)可视化。灭活蛋白(由dC2c2表示法表示)是四点突变体(R472A、H477A、R1048A、H1053A),其在两个预测的活性位点中均从R-X4-6-H HEPN基序消除精氨酸和组氨酸两者。测试具有可变间隔区序列的三种不同pre-crRNA的C2c2加工能力。
实施例5:复杂混合物中的转录物的灵敏检测
使用C2c2检测复杂混合物中的靶转录物(图5)。
图5.在存在不断增加量的λ2ssRNA(0-10nM)的情况下,将50nM的靶向C2c2:crRNA的λ2ssRNA与185nM的RNA酶-Alert底物(小型荧光-猝灭剂RNA寡核苷酸-用猝灭剂/荧光剂对标记的经标记的检测RNA)和100ng的HEK293T总RNA一起在37C下孵育30分钟。当‘经激活的’C2c2(C2c2:crRNA:λ2ssRNA)切割RNA酶-Alert底物而从猝灭剂部分释放荧光染料时,观察到荧光增加。
实施例6:由C2c2蛋白进行前体crRNA(pre-crRNA)加工
C2c2切割(加工)前体crRNA(pre-crRNA),并且该切割不依赖于HEPN结构域(图6)。
图6.将300nM的C2c2与1nM的5’-32P标记的pre-crRNA一起在37C下孵育0-60分钟。将RNA产物在15%尿素-PAGE上分离,并使用磷光成像仪成像。通过较小的‘经切割的RNA产物’的存在来确定pre-crRNA的成功加工。
实施例7
材料和方法
使用以下材料和方法,并且以下材料和方法适用于实施例8-12。
C2c2系统发生和候选选择。使用具有PROTGAMMALG进化模型和100个自展抽样(bootstrap sampling)的RAxML计算C2c2最大似然系统发生。通过MAFFT使用‘einsi’方法比对序列。Niewoehner,O.和Jinek,M.,Structural basis for the endoribonucleaseactivity of the type III-A CRISPR-associated protein Csm6.RNA 22,318–329(2016)。选择候选同系物来对蛋白家族的主要分支进行取样。
C2c2蛋白的生产和纯化。使用从Integrated DNA Technologies订购的合成gBlock组装用于蛋白纯化的表达载体。将密码子优化的C2c2基因组序列用His6-MBP-TEV切割位点进行N末端标记,其中表达由T7启动子驱动(根据要求可用的映射(map availableupon request))。经由野生型C2c2构建体的圆角化(round-the-horn)、定点诱变来克隆突变蛋白。将表达载体转化到于37℃下在2xYT肉汤中生长的Rosetta2大肠杆菌细胞中。将大肠杆菌细胞在对数期期间用0.5M的异丙基β-D-1-硫代半乳糖苷(ITPG)诱导,并将温度降至16℃以过夜表达His-MBP-C2c2。随后收获细胞,重悬于裂解缓冲液(50mM Tris-HCl pH7.0、500mM NaCl、5%甘油、1mM三(2-羧乙基)膦(TCEP)、0.5mM苯甲基磺酰氟(PMSF)以及不含乙二胺四乙酸(EDTA)的蛋白酶抑制剂(Roche)中,并通过超声裂解,并且将裂解物通过离心澄清。通过金属离子亲和色谱分离出可溶性His-MBP-C2c2,将含蛋白的洗脱物与烟草蚀纹病毒(TEV)蛋白酶一起在4℃下孵育过夜,同时透析到离子交换缓冲液(50mM Tris-HClpH 7.0、250mM KCl、5%甘油、1mM TCEP)中以切除His6-MBP标签。将切割的蛋白上样到HiTrap SP柱上,并以线性KCl(0.25-1.5M)梯度洗脱。将阳离子交换色谱级分汇集,并用30kD的截留浓缩管(Thermo Fisher)浓缩。将C2c2蛋白经由在S200柱上进行尺寸排阻色谱而进一步纯化,并储存在凝胶过滤缓冲液(20mM Tris-HCl pH 7.0、200mM KCl、5%甘油、1mM TCEP)中以供后续酶测定。
生成ssRNA。除了crRNA AES461是订购合成的(Integrated DNA Technologies)之外,本研究中使用的所有RNA都是在体外转录的[参见图15和图19]。如前所述进行体外转录反应,具有以下改变:T7聚合酶浓度降至10μg/mL,并且UTP浓度降至2.5mM。将转录在37℃下孵育1-2小时以减少核苷酸的非模板加入。使用15%变性PAGE凝胶纯化所有转录反应。将所有RNA重悬于切割缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2和5%甘油)中。对于放射性实验,在放射性标记之前用小牛肠磷酸盐(New England Biolabs)去除5'三磷酸酯,然后如前所述使用T4多核苷酸激酶(New England Biolabs)和[γ-32P]-ATP(Perkin Elmer)对ssRNA底物进行5'末端标记。Sternberg,S.H.、Haurwitz,R.E.和Doudna,J.A.Mechanismof substrate selection by a highly specific CRISPR endoribonuclease.RNA18,661–672(2012)。
在该研究中使用的DNA底物列于图14的表2中。
在该研究中使用的RNA底物列于图15的表3中。
pre-crRNA加工测定。在37℃下在加工缓冲液(20mM HEPES pH 6.8、50mM KCl、5mMMgCl2、10μg/mL牛血清白蛋白(BSA)、10μg/mL tRNA、0.05%Igepal CA-630和5%甘油)以及相对于5'-标记的pre-crRNA 100倍摩尔过量的C2c2(最终浓度分别为100nM和大于1nM)中执行Pre-crRNA切割测定。除非另有说明,否则在60分钟后用1.5X RNA上样染料(100%甲酰胺、0.025w/v%溴酚蓝和200μg mL-1肝素)猝灭反应。猝灭后,将反应在95℃变性5分钟,然后通过12%或15%变性PAGE(0.5X TBE缓冲液)解析。通过向反应缓冲液中加入浓度范围为10-100mM的EDTA或EGTA来测试反应的金属依赖性。将条带通过磷光成像可视化,并用ImageQuant(GE Healthcare)定量。切割百分比被确定为产物条带强度与产物条带和未切割的pre-crRNA条带两者的总强度的比率,并使用ImageQuant TL软件(GE Healthcare)针对各测量的底物内的背景进行归一化,并使用Prism(GraphPad)与单相指数关联进行拟合。
产物尺寸映射。通过使用得自Ambion的RNA酶T1试剂盒比较产物条带到碱水解梯带和RNA酶T1消化梯带的凝胶迁移,而生物化学地确定切割产物的长度。对于水解梯带,将15nM的全长RNA底物在95℃下于1X碱水解缓冲液(Ambion)中孵育5分钟。用1.5X RNA上样缓冲液猝灭反应,并冷却至-20℃以立即停止水解。对于RNA酶T1梯带,将15nM的全长RNA底物在65℃下在1X RNA测序缓冲液(Ambion)中解折叠。将反应冷却至环境温度,然后向反应中加入1μl的RNA酶T1。15分钟后,通过苯酚-氯仿提取终止反应,并加入1.5X RNA上样缓冲液进行储存。将水解条带与切割样品平行地在15%变性PAGE上解析,并通过磷光成像可视化。
靶切割测定。在25℃和37℃下在切割缓冲液(20mM HEPES pH6.8、50mM KCl、5mMMgCl2和5%甘油)中执行靶切割测定。通过加热至65℃达5分钟,以及然后在切割缓冲液中缓慢冷却至环境温度而将crRNA指导物预折叠。在加入5'末端标记的靶和/或其它非放射性标记的RNA靶底物之前,通常以2:1的蛋白与crRNA摩尔比在切割缓冲液中于37℃下执行RNP复合物形成达10分钟。除非另有说明,否则对于所有反应,蛋白、指导物和靶的最终浓度分别为100nM、50nM和大于1nM。用1.5X RNA上样染料猝灭反应,并通过15%变性PAGE(0.5XTBE缓冲液)解析。将条带通过磷光成像可视化,并用ImageQuant(GE Healthcare)定量。切割百分比被确定为所有较短产物的总条带化强度相对于未切割条带的比率,并使用ImageQuant TL软件(GE Healthcare)针对各测量的底物内的背景进行归一化,并使用Prism(GraphPad)与单相指数关联进行拟合。
crRNA过滤结合测定。在RNA加工缓冲液(20mM HEPES pH 6.8、50mM KCl、5mMMgCl2、10μg/mL BSA、10μg/mL酵母tRNA、0.01%Igepal CA-630和5%甘油)中进行过滤结合测定。将LbuC2c2与放射性标记的crRNA(小于0.1nM)一起在37℃下孵育1小时。将Tufryn、Protran和Hybond-N+以上面列出的顺序组装到点印迹设备上。将膜用50μL的平衡缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2和5%甘油)洗涤两次,然后将样品施加到所述膜上。将膜再次用50μL的平衡缓冲液洗涤,干燥并通过磷光成像可视化。将数据用ImageQuant TL软件(GE Healthcare)定量,并使用Prism(GraphPad Software)与结合等温线拟合。所有实验一式三份地进行。图例中报告了解离常数和相关误差。
电泳迁移率变动测定。为了避免在ssRNA结合实验期间解离低浓度的LbuC2c2-dHEPN1/dHEPN2:crRNA复合物,结合反应含有恒定过量的LbuC22c2-dHEPN1/dHEPN2(200nM)以及不断增加浓度的crRNA-A和小于0.1nM的靶ssRNA。在C2c2电泳迁移率变动测定(EMSA)缓冲液(20mM HEPES pH 6.8、50mM KCl、10μg/mL BSA、100μg/mL酵母tRNA、0.01%IgepalCA-630和5%甘油)中进行测定。如上所述在37℃下预形成LbuC2c2-crRNA-A复合物10分钟,然后加入5'-放射性标记的ssRNA底物,并在37℃下进一步孵育45分钟。然后将样品通过4℃下的8%天然PAGE(0.5X TBE缓冲液)进行解析。将凝胶通过磷光成像而成像,使用ImageQuant TL软件(GE Healthcare)定量,并使用Prism(GraphPad Software)与结合等温线拟合。所有实验一式三份地进行。图例中报告了解离常数和相关误差。
荧光RNA检测测定。通过将1μM的Lbu-C2c2:C2c2与500nM的crRNA在37℃下孵育而预组装LbuC2c2:crRNA复合物。然后在存在185nM的RNA酶-Alert底物(Thermo-Fisher)、100ng的HeLa总RNA和不断增加量的ssRNA(0-1nM)的情况下,将这些复合物稀释至在RNA加工缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2、10μg/mL BSA、10μg/mL酵母tRNA、0.01%Igepal CA-630和5%甘油)中100nM的LbuC2c2:50nM的crRNA-λ2。将这些反应在荧光平板读数器中于37℃下孵育长达120分钟,其中每5分钟进行一次荧光测量(λex:485nm;λem:535nm)。通过减去在不存在靶ssRNA的情况下进行的反应获得的荧光值来获得经背景校正的荧光值。通过将50nM的RNA酶A与185nM的RNA酶-Alert底物一起孵育来测量最大荧光。对于耦合的pre-crRNA加工和RNA检测测定,通过将1μM的Lbu-C2c2:C2c2与500nM的pre-crRNA-A-λ2一起在37℃下孵育20分钟而预组装LbuCas9-sgRNA复合物,并在存在不断增加量的ssRNA A和ssRNAλ2(各自0-1nM)的情况下如上所述地进行反应。在每种情况下,误差条代表三次独立实验的标准偏差。
实施例8:C2c2家族加工前体crRNA转录物以产生成熟crRNA
VI型CRISPR基因座缺乏明显的Cas6或Cas5d样内切核酸酶或tracrRNA。问题是C2c2本身是否具有pre-crRNA加工活性。为了测试此点,将来自口腔纤毛菌(Lbu)、沙氏纤毛菌(Lsh)和斯氏李斯特菌(Lse)的重组C2c2同系物(所述重组C2c2同系物来源于C2c2蛋白家族的三个不同分支)在大肠杆菌中表达和纯化。图9A至图9B。
所有三种蛋白在60分钟内切割经5'末端放射性标记的pre-crRNA底物,所述底物由全长共有重复序列和20个核苷酸(nt)的间隔区序列组成。图9C.使用T1RNA酶梯带和氢氧化物水解梯带映射所有pre-crRNA同系物的切割位点;结果表明,加工取决于同系物而发生在所预测的发夹结构上游2nt或5nt的位置处。图9C。
细胞因子可能进一步加工crRNA,因为来自大肠杆菌中LseC2c2操纵子和LshC2c2操纵子的异源表达的测序数据发现是相似但不相同的加工事件。用LbuC2c2和含有串联发夹-重复序列阵列的pre-crRNA进行切割测定产生了两种对应于两种连续切割事件的产物(图16A至图16F),这与C2c2在加工初级crRNA转录物中的作用相符。这些结果表明,在VI型CRISPR系统中,C2c2同系物催化其相关crRNA的成熟。
图9A至图9C.C2c2家族加工前体crRNA转录物以产生成熟crRNA。图9A.C2c2蛋白的最大似然系统发生树。图22A中提供了包括种质、生物名称和自展值的完整细节。本研究中使用的同系物以黄色突出显示。图9B,三种不同的VI型CRISPR基因座的图。黑色矩形表示重复元件,而黄色菱形表示间隔区序列。Cas1和Cas2仅存在于Lsh C2c2附近的基因组中。图9C,CC2c2介导的对来源于LbuC2c2、LseC2c2和LshC2c2的pre-crRNA的切割。OH:碱水解梯带;T1:T1RNA酶水解梯带;用100nM的C2c2和大于1nM的pre-crRNA执行加工切割反应。右侧描绘了切割的示意图,并且下方示出了所预测的pre-crRNA二级结构,其中箭头指示了所映射的C2c2切割位点。
图22A至图22B.C2c2家族的完整系统发生树以及C2c2比对。图22A,C2c2蛋白的最大似然系统发生重建。叶包括GI蛋白数和来源生物;100个重新取样中的自展支持值被呈现用于内部分割。标尺是每个位点的取代。图22B,三种所分析的C2c2的同系物的多重序列比对,坐标基于LbuC2c2。
图23A至图23D.C2c2的纯化和生产。所有C2c2同系物在大肠杆菌(E.coli)中表达为His-MBP融合物,并通过亲和性、离子交换和尺寸排阻色谱的组合进行纯化。通过与TEV蛋白酶一起孵育去除Ni+亲和标签。色谱级分的代表性SDS-PAGE凝胶如上文在(图23A至图23B)中所示。图23C,来自Superdex 200(16/60)柱的色谱图表明,C2c2作为单峰洗脱、缺乏核酸。图23D,本稿图中使用的所有纯化蛋白的SDS PAGE分析。
图16A至图16F.由C2c2进行的pre-crRNA加工是不依赖于间隔区序列的,可以在串联crRNA阵列上发生,受pre-crRNA的5'侧翼区域中的突变影响并且是不依赖于金属的。a,pre-crRNA切割测定的代表性时间过程表明LbuC2c2、LshC2c2和LseC2c2进行的pre-crRNA加工具有相似速率。b,单个同源pre-crRNA阵列的LseC2c2切割和LshCC2c2切割的切割位点映射。OH:碱水解梯带;T1:T1RNA酶水解梯带。用100nM的Lbu C2c2和小于1nM的pre-crRNA进行切割反应。描绘了切割产物的示意图,其中箭头指示所映射的C2c2切割产物。c,串联pre-crRNA阵列的LbuCC2c2切割的切割位点映射。OH:碱水解梯带;T1:T1RNA酶水解梯带。用100nM的Lbu C2c2和小于1nM的pre-crRNA进行切割反应。右侧描绘了切割产物的示意图,其中箭头指示映射的C2c2切割产物。d,代表性的LbuC2c2pre-crRNA切割时间过程表明,相似的pre-crRNA加工速率不依赖于crRNA间隔区序列地发生。e,LbuC2c2 4聚突变体pre-crRNA加工数据表明了5'单链侧翼区域对于有效的pre-crRNA加工的重要性。60分钟后测量pre-crRNA加工的百分比(平均值±标准差,n=3)。f,变性凝胶示出了在一系列不同EDTA和EGTA浓度下的加工活性。高浓度的螯合剂改变产物的预期迁移模式
实施例9:LbuC2c2介导的crRNA生物发生取决于CRISPR重复序列的结构和序列。
其它pre-crRNA加工酶,诸如Cas6和Cas5d,以高度特异性的方式识别它们各自相应的CRISPR重复序列的发夹。确定LbuC2c2指导RNA加工的序列和结构要求。用在共有重复序列的茎环或单链侧翼区域中具有突变的pre-crRNA执行切割测定(图10A至图10C)。在改变重复区域中的茎长度后,pre-crRNA切割活性显著减弱;而重复共有的4碱基对(bp)茎在60分钟后导致85±0.7%的切割,-1bp和+1bp的茎分别导致仅54±1.3%和6±3.8%的切割(图10a)。类似地,茎环的倒置或环长度的缩短降低了加工活性。对包括或靠近易断裂键的连续4nt突变的初步研究完全消除了LbuC2c2加工pre-crRNA的能力(图16D)。对完整crRNA重复序列的更广泛突变分析揭示发夹两侧的两个不同区域对碱基变化具有显著的敏感性(图10B;图17)。加工活性完全不受二价金属离子螯合剂EDTA或EGTA的存在的影响(图10C;图16E)。总之,这些数据表明,C2c2pre-crRNA切割是一种不依赖于二价金属离子的过程,所述过程由对前体CRISPR转录物内的重复序列来源的发夹的结构特异性识别和序列特异性识别的组合的控制。
图10A至图10C.LbuC2c2介导的crRNA生物发生取决于CRISPR重复序列的结构和序列。图10A,在发夹的茎区域和环区域内含有结构突变的pre-crRNA的LbuC2c2加工的代表性凝胶。下面列出的加工百分比是在60分钟处针对每种条件定量的(平均值±标准差,n=3)。图10B,图形映射显示了pre-crRNA加工对CRISPR重复序列的依赖性。野生型重复序列如下方所示,其中单独的条代表上文以红色标示的2个核苷酸突变。切割位点用卡通剪刀指示。在60分钟后测量加工百分比(平均值±标准差,n=3)。所测试的突变体的图示发夹可以在图16A至图16F和图17中找到。图2C,通过向标准加工反应条件中加入10-100mM的EDTA来激发加工反应的二价金属依赖性。示出了60分钟处的反应终点。
图17.pre-crRNA双突变对pre-crRNA加工活性的影响的详细总结。根据方法,在60分钟后测量pre-crRNA加工百分比(平均值±标准差,n=3)。突变的核苷酸以黄色突出显示。关于图形表示,参见图10B。
实施例10:LbuC2c2催化顺式和反式靶上的指导依赖性ssRNA降解
成熟后,crRNA通常以高亲和力与Cas效应蛋白结合,以产生能够进行序列特异性核酸识别的RNA指导的监督复合物。为了测试经C2c2加工的crRNA的功能,使用LbuC2c2蛋白,其在初始切割实验中表现出最强的活性。对于多种ssRNA底物,观察到LbuC2c2仅在与互补crRNA结合时有效地切割,表明LbuC2c2:crRNA以RNA指导的方式切割ssRNA(图11b)。此活性在下文中称为在靶或顺式靶切割(图11a)。LbuC2c2介导的顺式切割导致多种产物的梯化,其中切割优先在尿嘧啶残基之前发生,类似于LshC2c2(图18A至图18B)9,这种活性不同于仅在由与crRNA的碱基配对所指定的限定区域内催化靶核酸切割的其它II类CRISPR效应子(诸如Cas9和Cpf1)。测试了LbuC2c2反式地充当经crRNA激活的非特异性RNA内切核酸酶(即,C2c2催化的对未由crRNA靶向的RNA分子的切割)的能力(图11A)。通过在存在未标记的在靶(与crRNA互补的)ssRNA的情况下重复非靶切割反应来研究该能力。观察到在这些反式切割条件下5'-标记的非靶RNA快速降解(图11B)。该结果表明,识别与crRNA的间隔区段互补的靶ssRNA激活C2c2以进行快速和非特异性的RNA反式降解。对于顺式在靶切割和反式非靶切割观察到相似的RNA切割速率和几乎相同的切割产物暗示两种活性中的相同核酸酶中心。此外,这些结果表明,观察为“顺式”活性的情况仅是当只有一种底物可用时发生的反式活性(图18A至图18B)。
图11A-11C.LbuC2c2催化顺式和反式靶上的指导依赖性ssRNA降解。图11A,C2c2指导依赖性ssRNA降解的两种模式的示意图。图11B,由LbuC2c2切割两种不同的放射性标记的ssRNA底物A和B。在37℃预形成100nM C2c2与50nM crRNA的复合物,并在25℃下加入大于1nM的5'-标记的靶RNA时开始反应。反式切割反应含有等摩尔(大于1nM)浓度的放射性标记的非指导互补底物和未标记的在靶ssRNA。图11C,在存在EDTA的情况下,激发负载有crRNA以及间隔区A的LbuC2c2以获得其在顺式(靶A经标记)和反式(在存在未标记的靶A的情况下,靶B经标记)切割条件下的切割活性。
图18A至图18B.LbuC2c2 ssRNA靶切割位点映射a,按照方法进行的ssRNA靶切割测定,证明LbuC2c2介导对具有相同的间隔区互补序列但不同的5'侧翼序列(具有不同长度和核苷酸组成)的若干个放射性标记的ssRNA底物的‘顺式’切割。ssRNA底物的序列示出在凝胶的右侧和底部,其中crRNA-A和crRNA-B的间隔互补序列分别以黄色和红色突出显示。箭头指示所预测的切割位点。为了清楚起见而裁剪了凝胶。应当注意的是,在不同底物上产生的切割产物的模式(例如A.1对比A.2对比A.3)表明,切割位点选择主要由尿嘧啶偏好性驱动,并且表现为明显缺乏‘基于crRNA标尺的’切割机制,这与关于其它II类CRISPR单效应复合物(诸如Cas9和Cpf1)<ref?>观察到的相反。有趣的是,针对底物A.0观察到的切割模式提示了对polyG序列的次要偏好性,所述次要偏好性可能可以设想地形成G-四链体或类似的二级结构。b,按照方法,使用一系列覆盖(tile)ssRNA靶的长度的crRNA进行的LbuC2c2ssRNA靶切割测定。在该实验中使用的ssRNA底物的序列示出在凝胶下方,其中每个crRNA的间隔区互补序列以黄色突出显示。箭头指示所预测的切割位点。同样地,应当注意的是,对于每种crRNA,切割产物长度分布是非常相似的,再次表明明显缺乏‘基于crRNA标尺的’切割机制。在反应的子集中不存在几种切割产物可以通过ssRNA靶上存在结合的C2c2:crRNA,从而通过任何顺式(分子内)或反式(分子间)LbuC2c2活性位点在空间上阻断了对尿嘧啶的可及来解释。虽然对LbuC2c2的PFS偏好性的适当分析超出了本研究的范围,但观察到了3'侧翼序列的最小影响。预测的PFS碱基在所测试的每个指导序列旁边的图表中以红色标示。
实施例11:LbuC2c2含有两种不同的核糖核酸酶活性
pre-crRNA加工活性以比crRNA介导的对靶RNA或非互补反式ssRNA切割慢80倍的表观速率发生(图12a)。在饱和酶条件下,1h后pre-crRNA加工仅达到约85%,而反式底物的RNA指导切割的速率由于反应在37℃下于1分钟内完成而几乎是不可测量的(图19A至图19C)。还发现,与pre-crRNA加工相对,在存在EDTA的情况下RNA指导的切割被完全消除,表明该活性是二价金属离子依赖性的(图11c)。鉴于pre-crRNA加工与RNA指导的切割之间在动力学和金属离子依赖性方面的明显差异,有理由认为C2c2可能代表具有两种正交RNA切割活性的新型CRISPR效应蛋白:一种用于crRNA成熟,并且另一种用于crRNA指导的非特异性RNA降解。为了测试该假设,将LbuC2c2的保守HEPN结构域内的几个残基(预测所述残基含有RNA切割活性位点)进行系统突变;并且评定突变体的pre-crRNA加工和RNA指导的RNA酶活性(图12b)。保守HEPN残基(R472A、R477A、R1048A和R1053)的双重突变体和四重突变体保留了强pre-crRNA切割活性(图12c)。相比之下,所有HEPN突变体都消除了RNA指导的切割活性,同时不影响与crRNA或ssRNA结合的能力(图20A至图20C)。切割速率差异和对点突变和EDTA的差别敏感性表明,pre-crRNA加工和RNA指导的RNA切割是由C2c2蛋白内的不同催化中心介导的,前者是不依赖于金属的,而后者需要二价金属依赖性HEPN结构域。
图12A至图12D.LbuC2c2含有两种不同的核糖核酸酶活性。图4A,由LbuC2c2在37℃下执行的对顺式ssRNA靶(黑色)和pre-crRNA(青色)切割的定量时间过程数据。指数拟合示出为实线(n=3),并且所计算的一级速率常数(kobs)对于顺式靶切割和pre-crRNA切割分别为9.74±1.15和0.12±0.02。图12B,LbuC2c2的结构域架构描绘了HEPN突变的位置。图12C和图12D,双重和四重HEPN结构域突变体对图12C中的pre-crRNA加工和图12D中的ssRNA靶向的核糖核酸酶活性。对于两种活性,利用crRNA靶向间隔物A,如图11c所示执行顺式和反式切割反应。
图19A至图19C crRNA间隔区长度、反应温度和crRNA的5'末端序列对靶RNA切割效率的依赖性。图19A,按照方法进行的LbuC2c2 ssRNA靶切割测定,其中crRNA具有16nt、20nt或24nt的间隔区。图19B,按照方法在25℃或37℃下进行的LbuC2c2 ssRNA靶切割的时间过程。图19C,按照方法进行的LbuC2c2 ssRNA靶切割时间过程,其中crRNA具有不同的5'-侧翼核苷酸突变。突变以红色突出显示。1-2个核苷酸的5'延伸可忽略不计地影响切割效率。相比之下,将侧翼区域缩短至3nt会减慢切割速率。关于代表性平行测定,指数拟合示出为实线。
图20A-20C.LbuC2c2与成熟crRNA和靶ssRNA的结合数据。图20A,如在方法中所描述地进行过滤结合测定以确定成熟crRNA-A与LbuC2c2-WT、LbuC2c2-dHEPN1、LbuC2c2-dHEPN2或LbuC2c2-dHEPN1/dHEPN2的结合亲和力。将定量的数据与标准结合同种型拟合。误差条代表三次独立实验的标准偏差。来自三个独立实验的测量的解离常数(平均值±标准差)为27.1±7.5nM(LbuC2c2-WT)、15.2±3.2nM(LbuC2c2-dHEPN1)、11.5±2.5nM(LbuC2c2-dHEPN2),以及43.3±11.5nM(LbuC2c2-dHEPN1/dHEPN2)。图20B,如所示,关于LbuC2c2-dHEPN1/dHEPN2:crRNA-A与‘在靶’A ssRNA或‘脱靶’BssRNA之间的结合反应的代表性电泳迁移率变动测定。如方法中所述进行三次独立实验。为了清楚起见而裁剪了凝胶。图20C,将来自(b)的定量结合数据与标准结合同种型拟合。误差条代表三次独立实验的标准偏差。从三个独立实验测量的解离常数(平均值±标准偏差)对于ssRNA A为1.62±0.43nM并且对于ssRNA B为未检测到的(>>10nM)。
实施例12:C2c2提供对复杂混合物中转录物的灵敏视觉检测。
C2c2对反式底物的强RNA刺激切割可用作检测转录物集合内的特定RNA的手段。迄今为止,最灵敏的RNA检测策略需要多轮基于聚合酶和/或逆转录酶的扩增。作为替代方案,测试了C2c2的RNA指导的反式内切核酸酶活性是否可用于切割用荧光团-猝灭剂标记的报告RNA底物,从而导致在靶RNA触发的RNA酶激活后荧光增加(图13a)。简而言之,使LbuC2c2负载有靶向细菌噬菌体λ的crRNA,并测试其检测掺入HeLa细胞总RNA的相应λssRNA靶的能力。如果LbuC2c2成功检测到互补靶,则反式切割活性应被激活以切割报告物,从而从猝灭剂中释放荧光团。加入少至1-10pM的互补λ靶RNA后,在30分钟后观察到显著的crRNA特异性荧光增加(图13b和图21)。单独使用C2c2:crRNA复合物或在存在crRNA和非互补靶RNA的情况下的对照实验导致相对于RNA酶A阳性对照的可忽略不计的荧光增加(图13b和图21)。在10pM的λ靶RNA浓度下,预测仅约0.02%的C2c2:crRNA复合物处于活性状态,但观察到的荧光信号反映了取决于RNA靶而对报告RNA底物的约25-50%切割,表明了LbuC2c2具有强大的多转换酶促活性。因此,即使在极低的活性蛋白水平下,crRNA指导的反式切割也是有效并且可检测的。
鉴于C2c2加工其自身的pre-crRNA,测试了pre-crRNA加工和RNA检测是否可以在单一反应中组合。为了测试该想法,设计了含有与靶RNA A和λ2互补的间隔区的串联crRNA重复序列,并测试了它们检测掺入HeLa总RNA中的不断减少量的A和λ2 RNA的能力。观察到了显著的荧光增加,这在量值和灵敏度方面与使用成熟crRNA的实验相似(图13b、图13c),表明串联的pre-crRNA可以由C2c2成功加工并用于RNA靶向。这些数据突出了在一个测定中使用单一串联pre-crRNA转录物对单个和/或多个RNA分子进行多重RNA检测的可能性。
不受理论束缚,提出当经由与crRNA的碱基配对而在宿主细胞内检测到侵入性转录物时,C2c2被激活以反式地进行混杂的RNA切割(图13d)。
图13A至图13D.C2c2提供对复杂混合物中转录物的灵敏视觉检测。图13A,使用猝灭的荧光RNA报告物通过C2c2进行的RNA检测方法的示意图。在互补的靶RNA结合后,C2c2催化报告RNA的降解,从而导致荧光信号的积累。图13B,在存在100ng总RNA的情况下,在30分钟后通过C2c2对不同浓度的靶RNA的荧光信号进行的定量。RNA酶A示出作为阳性RNA降解对照。数据显示为n=3个独立实验的平均值±标准差。图13C,串联pre-crRNA加工还使得能够进行RNA检测。数据显示为n=3个独立实验的平均值±标准差。图13D,VI型CRISPR途径的模型突显了C2c2的两种核糖核酸酶活性。
图21.RNA酶检测测定λ2-ssRNA的时程。在存在不断增加量的λ2ssRNA(0-1nM)的情况下,将LbuC2c2:crRNA-λ2与RNA酶-Alert底物(Thermo-Fisher))和100ng HeLa总RNA在37℃孵育120分钟。每5分钟进行荧光测量。1nM的λ2ssRNA反应在可以测量第一个时间点之前达到饱和。误差条代表三次独立实验的标准偏差。
实施例13
材料和方法
MEC2c2系统发生和候选选择。使用具有PROTGAMMALG进化模型和100个自展抽样的RAxML计算C2c2最大似然系统发生。通过MAFFT使用‘einsi’方法比对序列。
C2c2蛋白的生产和纯化.使用从Integrated DNA Technologies订购的合成gBlock组装用于蛋白纯化的表达载体。将密码子优化的C2c2基因组序列用His6-MBP-TEV切割位点进行N末端标记,其中表达由T7启动子驱动。经由野生型C2c2构建体的定点诱变来克隆突变蛋白。将表达载体转化到于37℃下在2xYT肉汤中生长的Rosetta2大肠杆菌细胞中。将大肠杆菌细胞在对数期期间用0.5M的ITPG诱导,并将温度降至16℃以过夜表达His-MBP-C2c2。随后收获细胞,重悬于裂解缓冲液(50mM Tris-HCl pH 7.0、500mM NaCl、5%甘油、1mM TCEP、0.5mM PMSF、以及不含EDTA的蛋白酶抑制剂(Roche))中,并通过超声裂解,并且将裂解物通过离心澄清。通过金属离子亲和色谱分离出可溶性His-MBP-C2c2,将含蛋白的洗脱物与TEV蛋白酶一起在4℃下孵育过夜,同时透析到离子交换缓冲液(50mM Tris-HClpH 7.0、250mM KCl、5%甘油、1mM TCEP)中以切除His6-MBP标签。将切割的蛋白上样到HiTrap SP柱上,并以线性KCl(0.25-1.5M)梯度洗脱。将阳离子交换色谱级分汇集,并用30kD的截留浓缩管(Thermo Fisher)浓缩。将C2c2蛋白经由在S200柱上进行尺寸排阻色谱而进一步纯化,并储存在凝胶过滤缓冲液(20mM Tris-HCl pH 7.0、200mM KCl、5%甘油、1mM TCEP)中以供后续酶测定。将表达质粒由Addgene保藏。
产生RNA。除了crRNA AES461是订购合成的(Integrated DNA Technologies)之外,本研究中使用的所有RNA都是在体外转录的[参见图33]。如前所述进行体外转录反应,具有以下改变:T7聚合酶浓度降至10μg/mL,并且UTP浓度降至2.5mM。将转录在37℃下孵育1-2小时以减少核苷酸的非模板加入,并经由用DNA酶I在37℃下处理0.5-1小时来进行猝灭。将转录反应通过15%变性聚丙烯酰胺凝胶电泳(PAGE)纯化,并将所有RNA重悬于切割缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2和5%甘油)中。对于放射性实验,在放射性标记之前用小牛肠磷酸盐(New England Biolabs)去除5'三磷酸酯,然后如前所述使用T4多核苷酸激酶(New EnglandBiolabs)和[γ-32P]-ATP(Perkin Elmer)对ssRNA底物进行5'末端标记。
pre-crRNA加工测定。在37℃下在RNA加工缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2、10μg/mL BSA、10μg/mL tRNA、0.05%Igepal CA-630和5%甘油)以及相对于5'-标记的pre-crRNA 100倍摩尔过量的C2c2(最终浓度分别为100nM和小于1nM)中执行Pre-crRNA切割测定。除非另有说明,否则在60分钟后用1.5X RNA上样染料(100%甲酰胺、0.025w/v%溴酚蓝和200μg mL-1的肝素)猝灭反应。猝灭后,将反应在95℃变性5分钟,然后通过12%或15%变性PAGE(0.5X TBE缓冲液)解析。通过向反应缓冲液中加入浓度范围为10-100mM的EDTA或EGTA来测试反应的金属依赖性。将条带通过磷光成像可视化,并用ImageQuant(GE Healthcare)定量。切割百分比被确定为产物条带强度与产物条带和未切割的pre-crRNA条带两者的总强度的比率,并使用ImageQuant TL软件(GE Healthcare)针对各测量的底物内的背景进行归一化,并使用Prism(GraphPad)与单相指数关联进行拟合。
产物尺寸映射和3'末端部分鉴别。通过使用得自Ambion的RNA酶T1试剂盒比较产物条带到碱水解梯带和RNA酶T1消化梯带的凝胶迁移,而生物化学地确定切割产物的长度。对于水解梯带,将15nM的全长RNA底物在95℃下于1X碱水解缓冲液(Ambion)中孵育5分钟。用1.5X RNA上样缓冲液猝灭反应,并冷却至-20℃以立即停止水解。对于RNA酶T1梯带,将15nM的全长RNA底物在65℃下在1X RNA测序缓冲液(Ambion)中解折叠。将反应冷却至环境温度,然后向反应中加入1U的RNA酶T1(Ambion)。15分钟后,通过苯酚-氯仿提取终止反应,并加入1.5X RNA上样缓冲液进行储存。将水解条带与切割样品平行地在15%变性PAGE上解析,并通过磷光成像可视化。对于3'末端部分鉴别,将来自加工反应的产物与10U的T4多核苷酸激酶(New England Biolabs)一起在37℃下于加工缓冲液中孵育1小时。用1.5X RNA上样缓冲液猝灭反应,在20%变性PAGE上解析,并通过磷光成像可视化。
小RNA测序分析。从SRA运行SRR3713697、SRR3713948和SRR3713950下载来自Smakov等人的RNA读段。使用具有以下选项的Bowtie2将配对末端读段局部映射到参考序列:“--重排--非常快速地定位--定位”。然后使用具有“-m 0-p两者”选项的mapped.py过滤映射以仅保留不包含错配的比对。所得映射的BAM文件是可用的。使用Geneious可视化读段覆盖,并使用Prism(GraphPad)绘图。
靶切割测定。在25℃或37℃下在切割缓冲液(20mM HEPES pH6.8、50mM KCl、5mMMgCl2和5%甘油)中执行靶切割测定。通过加热至65℃达5分钟,以及然后在切割缓冲液中缓慢冷却至环境温度而将crRNA指导物预折叠。在加入5'末端标记的靶和/或其它非放射性标记的RNA靶底物之前,通常以2:1的蛋白与crRNA摩尔比在切割缓冲液中于37℃下执行C2c2:crRNA复合物形成达10分钟。除非另有说明,否则对于所有反应,蛋白、指导物和靶的最终浓度分别为100nM、50nM和小于1nM。用1.5X RNA上样染料猝灭反应,并通过15%变性PAGE(0.5X TBE缓冲液)解析。将条带通过磷光成像可视化,并用ImageQuant(GEHealthcare)定量。切割百分比被确定为所有较短产物的总条带化强度相对于未切割条带的比率,并使用ImageQuant TL软件(GE Healthcare)针对各测量的底物内的背景进行归一化,并使用Prism(GraphPad)与单相指数关联进行拟合。
crRNA过滤结合测定。在RNA加工缓冲液(20mM HEPES pH 6.8、50mM KCl、5mMMgCl2、10μg/mL BSA、10μg/mL酵母tRNA、0.01%Igepal CA-630和5%甘油)中进行过滤结合测定。将LbuC2c2与放射性标记的crRNA(小于0.1nM)一起在37℃下孵育1小时。将Tufryn、Protran和Hybond-N+以上面列出的顺序组装到点印迹设备上。将膜用50μL的平衡缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2和5%甘油)洗涤两次,然后将样品施加到所述膜上。将膜再次用50μL的平衡缓冲液洗涤,干燥并通过磷光成像可视化。将数据用ImageQuant TL软件(GE Healthcare)定量,并使用Prism(GraphPad Software)与结合等温线拟合。所有实验一式三份地进行。图例中报告了解离常数和相关误差。
电泳迁移率变动测定。为了避免在ssRNA结合实验期间解离低浓度的LbuC2c2-dHEPN1/dHEPN2:crRNA复合物,结合反应含有恒定过量的LbuC22c2-dHEPN1/dHEPN2(200nM),以及不断增加浓度的crRNA-A和小于0.1nM的靶ssRNA。在C2c2EMSA缓冲液(20mMHEPES pH 6.8、50mM KCl、10μg/mL BSA、100μg/mL酵母tRNA、0.01%Igepal CA-630和5%甘油)中进行测定。如上所述在37℃下预形成LbuC2c2-crRNA-A复合物10分钟,然后加入5'-放射性标记的ssRNA底物,并在37℃下进一步孵育45分钟。然后将样品通过4℃下的8%天然PAGE(0.5X TBE缓冲液)进行解析。将凝胶通过磷光成像而成像,使用ImageQuant TL软件(GE Healthcare)定量,并使用Prism(GraphPad Software)与结合等温线拟合。所有实验一式三份地进行。图例中报告了解离常数和相关误差。
荧光RNA检测测定。通过将1μM的Lbu-C2c2:C2c2与500nM的crRNA在37℃下孵育10分钟而预组装LbuC2c2:crRNA复合物。然后在存在185nM的RNA酶-Alert底物(Thermo-Fisher)、100ng的HeLa总RNA和不断增加量的靶60nt ssRNA(0-1nM)的情况下,将这些复合物稀释至在RNA加工缓冲液(20mM HEPES pH 6.8、50mM KCl、5mM MgCl2、10μg/mL BSA、10μg/mL酵母tRNA、0.01%Igepal CA-630和5%甘油)中100nM的LbuC2c2:50nM的crRNA-λ2。将这些反应在荧光平板读数器中于37℃下孵育长达120分钟,其中每5分钟进行一次荧光测量(λex:485nm;λem:535nm)。通过减去在不存在靶ssRNA的情况下进行的反应获得的荧光值来获得经背景校正的荧光值。通过将50nM的RNA酶A与185nM的RNA酶-Alert底物一起孵育来测量最大荧光。对于用人总RNA中的β-肌动蛋白mRNA测量crRNA-ACTB介导的LbuC2c2激活,通过将1μM的LbuC2c2与500nM的crRNA-ACTB一起在37℃下孵育10分钟而预组装LbuCas9:crRNA复合物,并在上述条件下在存在不断增加量(0-1μg)的HeLa细胞总RNA或大肠杆菌总RNA(作为阴性对照)的情况下进行反应。将这些反应在荧光平板读数器中于37℃下孵育长达180分钟,其中每5分钟进行一次荧光测量(λex:485nm;λem:535nm)。通过减去在不存在靶ssRNA的情况下进行的反应获得的荧光值来获得经背景校正的荧光值。对于耦合的pre-crRNA加工和RNA检测测定,通过将1μM的LbuC2c2与500nM的pre-crRNA-A-λ2一起在37℃下孵育20分钟而预组装LbuCas9-crRNA复合物,并在存在不断增加量的ssRNA A和ssRNAλ2(各自0-1nM)的情况下如上所述地进行反应。在每种情况下,误差条代表三次独立实验的标准偏差。
总RNA中的背景切割。如先前关于荧光RNA检测测定所述地组装LbuC2c2:crRNAλ4复合物。在存在含有和不含10nM的λ4ssRNA靶的3μg总RNA的情况下,将复合物在RNA加工缓冲液中孵育。2小时后,通过trizol提取和乙醇沉淀分离RNA。使用制造商的方案,使用小RNA分析试剂盒(Small RNA Analysis Kit)(Agilent)在Bioanalyzer 2100(Agilent)上解析重悬样品的RNA片段尺寸分布。将荧光强度曲线在Prism(GraphPad Software)中针对曲线覆盖归一化。
结果
VI型CRISPR基因座缺乏明显的Cas6或Cas5d样内切核酸酶或tracrRNA。通过使用来自C2c2蛋白家族的三个不同分支的纯化的重组C2c2蛋白同系物(图24a至图24b和图28和图29),在此呈现的数据显示所有三种C2c2酶切割经5'末端放射性标记的pre-crRNA底物,所述底物由全长共有重复序列和20个核苷酸(nt)的间隔区序列组成(图24c)。映射每个pre-crRNA:C2c2同源对的切割位点,揭示加工取决于C2c2同系物而发生在所预测的重复序列发夹结构上游2个或5个核苷酸的位置处(图24c、图30A)。令人惊讶的是,在生物化学上映射的5'-切割位点与之前报道的沙氏纤毛菌(LshC2c2)或斯氏李斯特菌(LseC2c2)pre-crRNA的切割位点不一致。对Shmakov等人的RNA测序数据集表的重新分析表明体内切割位点与此处报道的体外位点一致(图30b至图30i)。此外,使用来自口腔纤毛菌(LbuC2c2)的C2c2和包含串联发夹-重复序列阵列的较大pre-crRNA的切割测定产生了来源于两种单独的切割事件的两种产物(图31a),这与C2c2在加工从VI型CRISPR基因座产生的前体crRNA转录物中的作用一致。
为了理解C2c2指导RNA加工的底物要求和机制,产生在共有重复序列的茎环或单链侧翼区域中具有突变的pre-crRNA,并测试其由LbuC2c2进行加工的能力(图25)。数据显示,在改变重复区域中的茎长度时,C2c2催化的切割减弱(图25a)。茎环的倒置或环长度的缩短也降低了C2c2的加工活性,而包括或靠近易断裂键的连续4nt突变完全消除了所述加工活性(图31b)。对全长crRNA重复序列的更广泛突变分析揭示发夹任一侧的两个不同区域对碱基变化具有显著的敏感性(图25b)。相比之下,加工动力学不存在对间隔区序列的依赖性(图31c)。对发夹的两个侧翼区域的这种敏感性使人联想到许多Cas6酶和Cas5d酶所需的序列和结构基序。相比之下,Cpf1不具有对3′发夹侧翼区域的任何依赖性,因为可变间隔区域邻接发夹茎。
LbuC2c2的机理研究揭示,加工活性不受二价金属离子螯合剂EDTA或EGTA存在的影响(图25c),表明了不依赖于金属离子的RNA水解机制。不依赖于金属离子的RNA水解的典型特征是分别在crRNA切割产物的5'和3'半部上形成2',3'-环磷酸酯和5'-氢氧化物。为了确定C2c2加工的底物的末端基团化学特性,将5'侧翼产物与T4多核苷酸激酶一起进一步孵育,此举去除2',3'-环磷酸酯以留下3'-羟基。在激酶处理后观察到了5'侧翼产物的改变的变性凝胶迁移,这与3'磷酸基团的去除一致(图31d)。C2c2的pre-crRNA加工活性的二价金属离子非依赖性与Cpf1的二价金属离子依赖性形成鲜明对比,Cpf1是唯一显示为执行指导加工的其它单蛋白CRISPR效应物。总的来说,这些数据表明,C2c2催化的pre-crRNA切割是一种不依赖于二价金属离子的过程,该过程可能使用一般的酸碱催化机制。
成熟后,crRNA通常以高亲和力与Cas效应蛋白结合,以产生能够进行序列特异性核酸识别的RNA指导的监督复合物。与先前使用LshC2c2的工作一致,LbuC2c2仅在此类底物可与crRNA中的互补序列碱基配对时催化有效的靶RNA切割(图32至图34)。鉴于观察到的C2c2混杂切割模式(图33),测试了LbuC2c2反式地充当经crRNA激活的非特异性RNA内切核酸酶的能力(图32b)。与顺式执行的非靶切割实验形成鲜明对比并且与先前对LshC2c2的观察一致,观察到了非靶RNA的反式快速降解(图32b)。该结果显示,靶识别激活C2c2进行RNA的一般非特异性降解。重要的是,对于相同RNA底物的顺式在靶切割和反式非靶切割观察到的相似的RNA切割速率和几乎相同的切割产物暗示两种活性中的相同核酸酶中心(图32b)。
值得注意的是,crRNA介导的靶ssRNA切割以比pre-crRNA加工快约80倍的速率发生(图26a),并且与pre-crRNA加工不同,在存在EDTA的情况下RNA指导的靶切割严重减少,表明该活性是二价金属离子依赖性的(图26a,(图32c、图34)。鉴于这些明显的差异,有理由认为C2c2可能具有两种正交RNA切割活性:一种用于crRNA成熟,并且另一种用于crRNA指导的非特异性RNA降解。为了测试该假设,将LbuC2c2的保守HEPN基序内的几个残基进行系统突变;并且评定突变体的pre-crRNA加工和RNA指导的RNA酶活性(图26、图34d)。保守HEPN残基(R472A、R477A、R1048A和R1053)的双重突变体和四重突变体保留了强pre-crRNA切割活性(图26c)。相比之下,所有HEPN突变体都消除了RNA指导的切割活性,同时不影响与crRNA或ssRNA结合的能力(图34d、图35)。
接下来,寻找可以在不破坏靶RNA切割的情况下消除pre-crRNA加工活性的突变。鉴于不能预测超出HEPN基序的任何其它潜在的RNA酶基序,并且C2c2蛋白与Cpf1没有同源性,所以整个LbuC2c2中的荷电残基被系统地突变。精氨酸残基(R1079A)被鉴别为在突变后导致严重减弱的pre-crRNA加工活性(图26c)。该C2c2突变酶保留了crRNA结合能力以及RNA靶切割活性(图35d、图26d)。总的来说,结果显示C2c2蛋白内的不同活性位点催化pre-crRNA加工和RNA指导的RNA切割。
接下来测试C2c2对反式底物的强RNA刺激切割是否可用作检测转录物集合内的特定RNA的手段。虽然已经开发了许多基于聚合酶的方法用于RNA扩增和随后的检测,但是基本上没有方法能够直接检测靶RNA而无需对每个新RNA靶进行大量工程化或严格的设计约束。作为一种易于编程的替代方案,测试了C2c2的RNA指导的反式内切核酸酶活性是否可用于切割用荧光团-猝灭剂标记的报告RNA底物,从而导致在靶RNA触发的RNA酶激活后荧光增加(图27a)。使LbuC2c2负载有靶向细菌噬菌体λ的crRNA,并测试其检测掺入HeLa细胞总RNA的相应λssRNA靶的能力。加入少至1-10pM的互补λ靶RNA后,在30分钟内发生了显著的crRNA特异性荧光增加(图27b和图36a)。单独使用C2c2:crRNA复合物或在存在crRNA和非互补靶RNA的情况下的对照实验导致相对于RNA酶A阳性对照的可忽略不计的荧光增加(图27b和图36a)。应当注意的是,在10pM的λ靶RNA浓度下,预测仅约0.02%的C2c2:crRNA复合物处于活性状态,但观察到的荧光信号反映了取决于RNA靶而对报告RNA底物的约25-50%切割。这些反应中背景RNA的片段尺寸解析揭示了显著的降解,即使是对高度结构化的tRNA也是如此(图36b)。由于报告RNA切割在存在大量过量的未标记RNA的情况下发生,因此推断LbuC2c2是一种强多转换酶,其能够识别每靶RNA至少104个转换。因此,与先前的观察结果不同,即使在极低的激活蛋白水平下,crRNA指导的反式切割也是有效并且可检测的。
为了扩展该LbuC2c2 RNA检测系统,将crRNA设计为靶向内源性β-肌动蛋白mRNA。相对于大肠杆菌总RNA,在存在人总RNA的情况下观察到了可测量的荧光增加,证明了该方法的特异性(图27c)。此外,鉴于C2c2加工其自身的指导物,所以通过设计含有与靶RNA A和λ2互补的间接区的串联crRNA重复序列而将pre-crRNA加工和RNA检测组合在单一反应中。在检测测定中将LbuC2c2与该未加工的串联指导RNA一起孵育产生了显著的荧光增加,这在量值和灵敏度方面与使用成熟crRNA的实验相似(图27b、图27d)。总的来说,这些数据突显了利用C2c2的两种不同RNA酶活性进行一系列生物技术应用的令人兴奋的机会(图27e)。
在细菌中,C2c2可能作为病毒RNA的前哨工作。不受理论束缚,提出当经由与crRNA的碱基配对而在宿主细胞内检测到侵入性转录物时,C2c2被激活以反式地进行混杂的RNA切割(图27e)。作为防御机制,这与真核生物中的RNA酶L和半胱天冬酶系统具有惊人的相似性,由此细胞信号分别在宿主细胞内引发混杂的核糖核酸降解或蛋白水解性降解,从而导致细胞凋亡。虽然III型CRISPR系统的RNA靶向机制通常导致原型间隔区-指导双链体内的RNA切割,但相关核酸酶Csx1和Csm6的最近实例提供了在VI型系统与多组分III型推断复合物之间令人信服的相似性。
在此描述的数据显示,CRISPR-C2c2蛋白代表一类新的酶,其能够具有两种单独的RNA识别和切割活性。有效的pre-crRNA加工需要CRISPR重复序列内的序列和结构基序,这阻止了非内源性crRNA负载并有助于降低该有效RNA酶的潜在毒性。C2c2和V型CRISPR效应蛋白Cpf1的完全不同的pre-crRNA加工机制表明,每个蛋白家族已经会聚于独立的活性,所述独立的活性涵盖它们各自相应的CRISPR途径的加工和干扰功能。此外,C2c2的两种不同催化能力可以一起用于RNA检测,因为激活C2c2以将每个检测到的靶RNA切割成数千个反式RNA使得能够实现有效的信号放大。C2c2从阵列加工其自身的指导RNA的能力允许使用组织特异性Pol II启动子来指导表达,以及用于广泛应用的多靶点混合检测(targetmultiplexing)。C2c2酶在细菌适应性免疫中因其双RNA酶活性而是独特的,并突显了利用CRISPR蛋白在细胞和无细胞系统中进行精确核酸操纵的实用性。
实施例14
在LbuC2c2中鉴别出了另外的氨基酸位置,所述另外的氨基酸位置在突变时导致严重减弱的pre-crRNA加工活性(图37)。氨基酸位置包括R1079(例如,R1079A)、R1072(例如,R1072A)和K1082(例如,K1082A)。
实施例15
Cas13a酶包含两种不同的官能团,这两种不同的官能团识别正交的crRNA组并具有不同的ssRNA切割特异性。Cas13a pre-crRNA加工对于ssRNA切割不是必需的,但是其增强了ssRNA对在CRISPR阵列内部编码的crRNA的靶向。定义了两种Cas13a蛋白亚家族,这些亚家族可以并行操作,以用于在细菌中进行RNA检测和破坏两者和用于诊断应用。
材料和方法
Cas13a系统发生和重复保守分析。使用具有PROTGAMMALG进化模型和100个自展值的RAxML(Stamatakis,Bioinformatics.2014年5月1日;30(9):1312-3)计算Cas13a最大似然系统发生。蛋白进化枝α和β被定义为自展值大于90的分支点,表明在具有共同祖先方面的高置信度。其余的蛋白被标记为模糊的祖先,因为它们之间的系统发生关系是低置信度的,反映为自展值小于90。通过MAFFT使用‘einsi’方法(Katoh和Standley,Mol BiolEvol.2013年4月;30(4):772-80)比对序列。选择候选者以代表Cas13a蛋白树的每个主要分支。对所有非冗余同系物(图41)和候选蛋白进行比对。使用Needleman-Wunsch算法,经由EMBL-EBI上的Needle工具计算逐对相似性得分而进行CRISPR-RNA(crRNA)重复序列的比较(McWilliam等人,Nucleic Acids Res.2013年7月;41(Web Server issue):W597-600)。使用相似性得分矩阵在R中进行CRISPR crRNA的分层聚类。
Cas13a蛋白的表达和纯化。使用从Integrated DNA Technologies(IDT)订购的合成gBlock组装用于蛋白纯化的表达载体。将密码子优化的Cas13a基因组序列用His6-MBP-TEV切割位点序列进行N末端标记,其中表达由T7启动子驱动。经由野生型Cas13a构建体的定点诱变来克隆突变蛋白。如上文实施例7和13中所述地进行所有同系物的纯化。简而言之,将表达载体转化到于37℃下在2xYT肉汤中生长的Rosetta2DE3或BL21大肠杆菌细胞中,在对数中期用0.5mM的ITPG诱导,然后将温度转变至16℃以进行过夜表达。将细胞沉淀物重悬于裂解缓冲液(50mM Tris-Cl pH 7.0、500mM NaCl、5%甘油、1mM TCEP、0.5mM PMSF、以及不含EDTA的蛋白酶抑制剂(Roche))中,通过超声裂解,并且通过以15,000g离心澄清。通过金属离子亲和色谱分离出可溶性His6-MBP-TEV-Cas13a,并且为了切除His6-MBP标签,将含蛋白的洗脱物与TEV蛋白酶一起在4℃下孵育过夜,同时透析到离子交换缓冲液(50mMTris-Cl pH 7.0、250mM KCl、5%甘油、1mM TCEP)中。将切割的蛋白上样到HiTrap SP柱(GEHealthcare)上,并以线性KCl(0.25-1.5M)梯度洗脱。将含有Cas13a的级分汇集、浓缩,并在S200柱(GE Healthcare)上于凝胶过滤缓冲液(20mM Tris-Cl pH 7.0、200mM KCl、5%甘油、1mM TCEP)中经由尺寸排阻色谱进一步纯化,随后在-80℃下储存。使用该方案纯化所有同系物,不同之处在于LwaCas13a结合到HiTrap肝素柱而不是SP柱,并且尺寸排阻色谱步骤由于样品在离子交换后的足够纯度而被省略。将所有表达质粒由Addgene保藏。
体外RNA转录。使用先前描述的方法(Sternberg等人,RNA.2012年4月;18(4):661-72)并且如在以上实施例中所述地在体外转录所有pre-crRNA、成熟crRNA和靶。简而言之,所有底物都从单链DNA寡核苷酸模板(IDT)转录,不同之处在于成熟crRNA需要非GR的5'末端。对于这些成熟crRNA,使用重叠PCR产生紧接在成熟crRNA序列上游的含有锤头型核酶序列的T7聚合酶模板,然后纯化以用作T7转录的模板(关于序列,参见图50(表5))。Lbu六聚CRISPR阵列体外转录模板由GeneArt(Thermofisher)合成以作为质粒。将T7启动子-CRISPR阵列区域在用作T7转录的模板之前进行PCR扩增和纯化。使用15%的尿素-PAGE纯化所有转录的RNA,不同之处在于使用6%的尿素-PAGE纯化阵列。随后用小牛碱性磷酸酶处理所有RNA以去除5'磷酸酯。使用先前描述的方法(Sternberg等人,RNA.2012年4月;18(4):661-72)并且如在以上实施例中所述地执行放射性标记。由IDT合成A、C、G和U均聚物,以及用于反式ssRNA切割的荧光标记的RNA报道基因。在放射性标记后使用25%的尿素-PAGE纯化均聚物,以降低底物异质性。
放射性标记的ssRNA核酸酶测定。在37℃下在RNA加工缓冲液(20mM HEPES-Na pH6.8、50mM KCl、5mM MgCl2、10μg/mL BSA、10μg/mL tRNA、0.05%Igepal CA-630和5%甘油)以及相对于5'-标记的pre-crRNA 100倍摩尔过量的Cas13a(最终浓度分别为100nM和小于1nM)中执行Pre-crRNA加工测定。除非另有说明,否则在60分钟后用1.5X RNA上样染料(100%甲酰胺、0.025%溴酚蓝和200μg mL-1肝素)猝灭反应。猝灭后,将反应在95℃变性5分钟,然后通过15%变性PAGE(0.5x TBE缓冲液)解析。在37℃下在切割缓冲液(20mM HEPES-Na pH 6.8、50mM KCl、5mM MgCl2和5%甘油)中执行靶切割测定。通常,在加入5'标记的靶和/或其它非放射性标记的RNA靶底物之前,以2:1的蛋白与crRNA摩尔比在切割缓冲液中于37℃下执行Cas13a:crRNA复合物形成达60分钟。除非另有说明,否则最终浓度为100nMCas13a、50nM crRNA或pre-crRNA、50nM的与crRNA互补的靶ssRNA(此后称为“激活物”)和小于1nM的反式ssRNA靶。将所有条带通过磷光成像(Typhoon,GE Healthcare)可视化,并用ImageQuant(GE Healthcare)定量。对于pre-crRNA加工,切割百分比被确定为产物条带强度与产物条带和未切割的pre-crRNA条带两者的总强度的比率,并针对各测量的底物内的背景进行归一化。对于反式ssRNA切割反应,切割百分比被确定为小于靶的所有片段与泳道内总强度的比率,并针对每个底物内的背景进行归一化。随后使用Prism7(GraphPad)将这些数据与单指数衰减拟合,并且在图例中报告切割率。
荧光ssRNA核酸酶测定。如上所述,在切割缓冲液中组装Cas13a:crRNA复合物。加入150nM的RNA酶Alert报告物(IDT)和各种最终浓度(0-1μM)的ssRNA激活物以引发反应。值得注意的是,这些反应是在没有竞争tRNA或总RNA的情况下,以更准确地测量反式切割活性。将这些反应在荧光平板读数器(Tecan Infinite Pro F2000)中于37℃下孵育长达120分钟,其中每5分钟进行一次荧光测量(λex:485nm;λem:535nm)。通过减去在不存在靶ssRNA激活物的情况下进行的反应获得的荧光值来获得经背景校正的荧光值。为了确定同系物敏感度和阵列加工效果,使用Prism7(GraphPad)将经背景校正的值与单指数衰减进行拟合,并且将所计算的速率和它们与n=3的相关标准偏差一起进行绘图。为了比较非同源crRNA指导的反式ssRNA切割,替代地计算初始反应速率,这是由于整个数据集的荧光平台值差异。然后将速率相对于同源crRNA进行缩放,以使速率针对同系物归一化。参见图52、图53和图54,分别给出了关于归一化值的表7、表8和表9。对于荧光均聚物ssRNA报告物研究,使用标准条件在37℃下预孵育Cas13a:crRNA复合物60分钟。在将反应放入平板读数器之前,立即加入激活物ssRNA和200nM的荧光ssRNA报告物以引发反应。对于具有荧光均聚物ssRNA报告物的含Lbu-Cas13a和Lba-Cas13a的样品,分别使用10pM和1nM的激活物。对于pre-crRNA阵列实验,首先将300nM的Cas13a与50nM的pre-crRNA阵列在切割缓冲液中孵育1小时,以实现阵列的结合和加工。对于每种间隔区序列,以生物一式三份的方式将100pM的每种ssRNA激活物与150nM的RNA酶Alert报告物(IDT)一起加入以引发反应。使用单指数衰减、使用Prism7(GraphPad)来计算表观速率,并将所计算的速率与它们的相关标准偏差一起进行绘图。
crRNA过滤结合测定。如上文实施例中所述地进行过滤结合测定。简而言之,将Cas13a和放射性标记的crRNA在37℃下在RNA加工缓冲液(20mM HEPES-Na pH 6.8、50mMKCl、5mM MgCl2、10μg/mL BSA、10μg/mL酵母tRNA、0.01%Igepal CA-630和5%甘油)中孵育1小时。将Tufryn、Protran和Hybond-N+以上面列出的顺序组装到点印迹设备上。将膜用50μL的平衡缓冲液(20mM HEPES-Na pH 6.8、50mM的KCl、5mM MgCl2和5%甘油)洗涤两次,然后将样品施加到所述膜上。将膜再次用50μL的平衡缓冲液洗涤,干燥并通过磷光成像可视化。将数据用ImageQuant TL软件(GE Healthcare)定量,并使用Prism(GraphPad Software)与结合等温线拟合。所有实验一式三份地进行。图例中报告了解离常数和相关误差。
结果
大多数Cas13a同系物具有pre-crRNA加工活性
为了探索Cas13a蛋白的功能多样性,对于它们从同源pre-crRNA产生成熟crRNA的能力,比较来自蛋白家族树的10种同系物的pre-crRNA加工活性(图38A;图39)。与上面讨论的三种同系物类似,另外七种Cas13a酶具有crRNA成熟活性(图38B和图38C)。迄今为止测试的十一种Cas13a蛋白中只有一种在广泛的测定条件下未表现出对其同源pre-crRNA的可检测的切割(HheCas13a)(图38;图39A)。在加工其天然crRNA的同系物中,除了LshCas13a之外全部都在保守crRNA-重复序列发夹上游四个核苷酸的磷酸二酯键处进行切割(图38B和图38C)。这些结果显示了在VI-A型CRISPR系统中Cas13a介导的crRNA生物发生活性的强保守性。
大多数Cas13a酶中的保守crRNA成熟中心
先前的研究已经暗示Cas13a的两个不同区域负责pre-crRNA加工。由LshCas13a晶体结构建立的一般Cas13a蛋白架构由N末端结构域和由两个螺旋结构域分开的两个HEPN(高等真核生物和原核生物核苷酸结合)结构域组成(图40A)(Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12)。对于LbuCas13a,HEPN2结构域内单个残基(R1079)的突变足以显著降低pre-crRNA加工活性。相比之下,位于螺旋1结构域中的两个位置R438和K441处的突变显示为减少由LshCas13a进行的pre-crRNA切割(Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12)。虽然这两个区域都可能参与pre-crRNA加工,但尚不清楚由LbuCas13a进行的加工是否被螺旋1结构域突变抑制,以及哪个结构域主要负责跨Cas13a蛋白家族的crRNA成熟。
跨19个Cas13a同系物检查了螺旋1结构域和HEPN2结构域两者的保守性。先前报道的比对(Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12;Shmakov等人,MolCell.2015年11月5日;60(3):385-97)在螺旋1域区域中有冲突,表明了同系物之间关系在该结构域方面的高度模糊性。观察到了参与pre-crRNA加工的螺旋1结构域的比对中的最小保守;相比之下,在HEPN2结构域内存在一致的保守(图40B至图40C;图41)。唯一的pre-crRNA加工缺陷型同系物HheCas13a,在两个结构域中保持大部分保守的荷电残基,表明蛋白或重复序列的其它部分可阻止pre-crRNA切割。在该研究中使用的同系物中,LshCas13a在HEPN2结构域中是最不同的,从而潜在地解释了该同系物的替代催化结构域和由该同系物进行的非典型切割位点选择。
测试了对LshCas13a pre-crRNA加工至关重要的螺旋1结构域残基对LbuCas13a的pre-crRNA加工活性的影响。测试了四种残基(E299、K310、R311和N314)在pre-crRNA切割中的作用(图40B和图40C)(Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12;Shmakov等人,Mol Cell.2015年11月5日;60(3):385-97)。这些残基突变为丙氨酸揭示了对pre-crRNA加工效率的以下一系列影响:N314A显著降低切割速率,R311A活性受损最小,并且E299A和K310对pre-crRNA加工没有影响(图40D)。并行地执行LbuCas13a的HEPN2结构域内的诱变。R1072和K1082处的丙氨酸取代显著减少了pre-crRNA切割,而同一区域中的其它突变(D1078A、K1080A和K1087A)具有对pre-crRNA加工的最小影响(图40E)。这些结果表明,HEPN2和(较小程度地)螺旋1结构域在LbuCas13a的crRNA生物发生中起重要作用,但是直接负责催化水解的残基仍然未知。LbuCas13a和LshCas13a在参与pre-crRNA加工的区域之间的差异(Liu等人,Cell2017年1月12日;168(1-2):121-134.e12)并不一定相互矛盾,因为crRNA的5'末端保持在LshCas13a结构中的HEPN2结构域与螺旋1结构域之间(Liu等人,Cell2017年1月12日;168(1-2):121-134.e12)。来自这两个结构域的残基可能通过使底物结合稳定化、促进适当的底物取向和/或催化水解而在pre-crRNA加工中起关键作用。
LshCas13a的HEPN2结构域内缺乏保守、其推定的pre-crRNA加工活性位点以及该酶的非典型pre-crRNA切割位点使我们假设,LshCas13a可利用螺旋1结构域内的不同区域来催化pre-crRNA加工。在缺乏与pre-crRNA结合的Cas13a同系物的三维结构的情况下,通过将LshCas13a切割位点映射到非同源pre-crRNA上来测试该假设(图40F)。LshCas13a能够加工来自LwaCas13a和LbuCas13a的pre-crRNA,从而产生相对于所预测的发夹碱基移位一个核苷酸的切割位点。与该观察结果一致,LwaCas13a和LbuCas13a对Lsh pre-crRNA的加工发生在距重复序列茎标准四核苷酸间隔处,不同于同源LshCas13a位点。这支持以下观察结果:不同的LshCas13a加工位点取决于蛋白架构而不是pre-crRNA序列,并且LshCas13a是Cas13a树内关于pre-crRNA加工的异常蛋白。
Cas13a酶在尿嘧啶或腺苷处引发ssRNA切割
先前的研究证实,Cas13a:crRNA复合物识别并结合互补的ssRNA靶,由此被称为ssRNA激活物,以触发在暴露的尿苷残基处的一般RNA酶活性(图42A)。测试同源组是否保留了由LbuCas13a和LshCas13a所表现出的非特异性降解活性。还测试HEPN活性位点内的尿苷偏好性是否在该家族中是普遍的。为了系统地测试一般RNA酶活性,监测包含Cas13a:crRNA以及结合的ssRNA激活物的三元复合物降解反式ssRNA靶的能力(图42A)。在一小时的过程中检测到十种同系物中的八种具有反式ssRNA切割活性(图42B;图43A)。最值得注意的是,具有反式ssRNA切割活性的Cas13a同系物是HheCas13a,其具有不可检测的pre-crRNA加工活性,但是催化由其同源全长pre-crRNA指导的底物的完全降解。虽然先前表征的同系物LshCas13a(Abudayyeh等人,Science.2016年8月5日;353(6299):aaf5573)和LbuCas13a都表现出对易断裂键的5'端尿苷的偏好性,但是由其它同系物产生的不同长度的产物表明,该蛋白家族中可能存在不同的活性位点核苷酸偏好性(图43B)。
为了进一步探测Cas13a同系物的反式ssRNA切割核苷酸偏好性,使用A、C、G和U的5聚体均聚物作为底物来测量这些酶的反式切割能力。六种同系物能够切割这些短底物(图42C;图43C;图50(表5))。虽然同系物中的四种LbuCas13a、LwaCas13a、HheCas13a和PprCas13a表现出对同型尿苷底物的偏好性切割,但是观察到了具有最高活性的同系物的次要偏好性(图42C;图43D)。相比之下,LbaCas13a和EreCas13a偏好性同型腺苷,这与较长靶上的生物化学映射的切割位点一致(图43B)。CamCas13a从这些长底物产生相同产物与Cas13a家族树的该进化枝的腺苷偏好性一致(图42、图39;图43)。
这些酶之间的一个显著区别是在等摩尔的ssRNA激活物和Cas13a:crRNA干扰复合物的测试条件下,反式ssRNA切割达到饱和的速率。这些酶差异可能对Cas13a的生物学作用具有巨大影响。定量Cas13a同源家族内在反式ssRNA切割方面的方差。开发考虑到ssRNA激活物结合和反式ssRNA切割两者(有助于总酶促输出的Cas13a酶的两种核心属性),利用短荧光ssRNA报告物进行的RNA切割高通量筛选。为了查询每种Cas13a同系物的灵敏度,加入不断减少量的互补ssRNA激活物以引发反应,并且根据所得时间过程中的每一者计算荧光ssRNA报告物切割的表观速率。虽然所计算的速率是所述酶中的每种酶的ssRNA激活物结合亲和力和催化转换速率的卷积,但是它们给出了同系物中相当的切割活性的相对量度。
五种同系物(LbuCas13a、LwaCas13a、LbaCas13a、HheCas13a和PprCas13a)在该测定中显示出足够用于可再现分析的可检测切割活性。在这五种同系物中,LbuCas13a表现出最高的灵敏度,在存在仅10fM互补激活物的情况下具有可检测的报告物切割(图42D)。只有两种同系物LwaCas13a和PprCas13a显示出足够用于在皮摩尔范围内检测激活物的活性,其中灵敏度分别为10pM和100pM。LbaCas13a和HheCas13a的灵敏度要低得多,仅在纳摩尔水平的报告物时变得有活性,该纳摩尔水平相对于Cas13a复合物接近等摩尔。由于该测定依赖于大量的反式切割事件以产生可检测的荧光,因此可以假设虽然具有相似的切割位点偏好性但不能产生高于背景的可检测信号的三种同系物(EreCas13a、CamCas13a和LshCas13a)具有灵敏性甚至更低的互补靶灵敏度。灵敏度范围非常广(约107倍)表明Cas13a酶具有保护宿主生物免受外来RNA影响的多样性能力。
CRISPR重复序列确定非同源pre-crRNA加工
Cas13a的双重活性提供了研究pre-crRNA加工与不同VI-A型CRISPR操纵子之间靶向的相互依赖性的机会。为了确定这两种活性的底物需求,测试了不同同系物可以识别非同源crRNA以进行指导加工和靶向的程度。最初,尝试经由对Cas13a家族和crRNA相似性的系统发生分析而生物信息学地预测可能的crRNA可交换性。该分析表明存在两种进化枝的同系物,为了清楚起见称为α和β(Stamatakis,Bioinformatics.2014年5月1日;30(9):1312-3)(图44A)。所述纯化的同系物中的五种存在于这些进化枝之外,具有模糊的祖先关系;有疑问的是pre-crRNA(CRISPR重复序列)序列是否可能决定功能正交性。由于CRISPR重复序列的短且结构化的内容物,所以使用逐对序列比对评分矩阵在CRISPR重复序列之间建立分层聚类关系以对整个家族的变异进行评分(Burstein等人,Nat Commun.2016年2月3日;7:10613)。令人惊讶的是,该分析指出存在两种crRNA聚类,该两种crRNA聚类重叠但不同于由氨基酸序列确定的蛋白进化枝(图44B和图44C)。虽然聚类1crRNA与α-进化枝蛋白的子集良好相关,并且所有β-进化枝相关的crRNA在聚类2内,但是具有模糊系统发生关系的同系物分散在两个聚类中(图44C)。
不能单独使用生物信息学分析容易地预测Cas13a:crRNA正交性,所以测试了非同源crRNA之间在由所述Cas13a同系物中的每一种进行加工和反式ssRNA靶切割两者方面功能可交换的程度(图44D和图44F)。对于pre-crRNA加工,发现由逐对序列比较定义的crRNA聚类预测了它们被它们的相关Cas13a蛋白加工的能力(图44D)。例如,来自聚类1的pre-crRNA仅由进化枝α的蛋白加工,并且对于聚类2和进化枝β反之亦然。相比之下,蛋白分类的预测性较差,因为大多数模糊分类的蛋白可加工来自重复聚类2的序列,而与它们的重复序列聚类的位置无关。
三种同系物(PprCas13a、HheCas13a和Rca13a)是关于它们在crRNA聚类内的位置方面异常的pre-crRNA加工同系物。HheCas13a不能切割任何非同源的pre-crRNA,并且反之,没有同系物(包括HheCas13a在内)加工Hhe pre-crRNA。这表明,HheCas13a不能加工其同源pre-crRNA不仅反映了不同的重复序列(图38;图39),还反映了该蛋白中pre-crRNA加工活性的丧失。相比之下,PprCas13a和RcaCas13a的偏离活性通过crRNA重复序列差异来解释。PprCas13a和RcaCas13a加工它们自己的crRNA,但是两者也加工crRNA重复聚类2非同源序列。PprCas13a crRNA重复序列与其它聚类2crRNA重复序列在5'侧翼区域上的切割位点方面不同,表明由PprCas13a进行的pre-crRNA加工具有更大的底物灵活性。类似地,RcaCas13a crRNA的不同序列特征是相对于存在于该家族其余部分的crRNA中的标准五碱基对茎环延伸的六碱基对茎环。值得注意的是,每个crRNA重复序列内对Cas13a pre-crRNA加工的位置取代耐受性与上文讨论的对LbuCas13a:crRNA复合物的突变研究,以及所获得的对LshCas13a:crRNA复合物的最近结构见解一致(Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12)。总的来说,这些结果表明,VI-A型CRISPR重复序列的序列决定了其被Cas13a家族进行pre-crRNA加工的能力。然而,在存在不同重复序列的情况下进化的同系物(PprCas13a和RcaCas13a)保留了加工其它聚类2序列的能力。
功能正交Cas13a酶的两个亚家族
对在图44D中定义的pre-crRNA加工可交换性聚类是否胜任于指导由非同源Cas13a同系物进行的反式ssRNA切割进行了研究。为了研究由非同源pre-crRNA和成熟crRNA指导的Cas13a介导反式ssRNA切割,对上述实施例中所描述的荧光测定进行修改,并且分析仅限于在ssRNA切割实验中表现出显著切割活性的五种同系物(参见图42C)。概括地说,这些结果反映了pre-crRNA加工结果,其中crRNA重复聚类身份确定了功能组,但是其中与加工和靶向一致的一些鲜明对比是与酶促活性无关的(图44E和图44F)。例如,Ppr pre-crRNA和成熟crRNA可以指导由非同源蛋白LwaCas13a和LbuCas13a进行的ssRNA切割,尽管它们不能加工这些pre-crRNA。另一惊喜是HheCas13a(其由所有的聚类2的pre-crRNA和成熟crRNA指导进行反式ssRNA切割)的混杂性,尽管其缺乏与对这些指导物中的任一者的pre-crRNA加工活性。这表明,crRNA成熟不是反式ssRNA切割所需要的,这是与以下发现相符的观察结果:LbuCas13a pre-crRNA加工缺陷型突变体具有不受影响的反式ssRNA切割能力。
关于pre-crRNA加工和反式ssRNA切割的crRNA可交换性比较限定了Cas13a蛋白家族中的两种功能正交的亚家族。第一组(例如,LbuCas13a)具有跨该蛋白家族的关于由crRNA指导的pre-crRNA加工和反式ssRNA切割两方面的广泛混杂性。此多源组也显示出对反式ssRNA切割活性位点内的尿苷的偏好性。由crRNA和蛋白序列两者限定的第二组(例如,LbaCas13a),具有不同的crRNA可交换特征并且在反式ssRNA靶切割期间优先在腺苷处进行切割。为了测试这些Cas13a亚家族的正交反应性,验证LbuCas13a和LbaCas13a分别切割同型AssRNA报告物或同型U ssRNA报告物(图45A和图45B)。虽然不同的探针产生相似量的荧光信号,但应当注意的是,由于同系物的不同灵敏度(对于LbuCas13a和LbaCas13a分别为10pM和1nM),所以加入了实质上不同量的ssRNA激活物。为了验证正交性,测试了一组具有在crRNA、激活物和报告物之间的所有可能非同源组合的对照反应,其中除了同源组合外没有检测到实质信号(图45C)。总的来说,这些结果限定了可以在相同系统内并行起作用的不同Cas13a同系物。
pre-crRNA加工增强CRISPR阵列情境中的靶向效率
这项研究的一个令人费解的发现是,触发随后由Cas13a进行的反式ssRNA靶切割反应缺乏对成熟crRNA的严格需要。此外,LbuCas13a的加工缺陷型突变体保持相似的反式ssRNA切割效率,甚至当由pre-crRNA代替成熟crRNA进行指导时也是如此(图46;图47)。这导致了以下假设:pre-crRNA加工在VI型CRISPR基因座中的作用不一定是用于有效的ssRNA靶向,而是替代地用于从长CRISPR阵列转录物的范围中释放每个crRNA。有疑问的是pre-crRNA加工是否可以缓解在crRNA负载和/或ssRNA靶向期间的RNA折叠约束以及相邻Cas13a:crRNA-间隔区物质的潜在空间位阻。为了测试此点,比较使用野生型LbuCas13a或无pre-crRNA加工活性的突变体进行的CRISPR阵列指导的ssRNA切割的效率。
由于LbuCas13a的所有加工缺陷型单点突变体(图40)保留低水平的pre-crRNA加工活性,所以建立了不具有可检测的加工活性,但保留了与野生型LbuCas13a相似或更高的反式ssRNA切割效率的双重突变体(R1079A/K1080A)(图46A和图46B)。在存在靶RNA和由六个不同的重复间隔区单元组成的小CRISPR阵列转录物的情况下测试该双重突变体和野生型LbuCas13a酶的ssRNA切割(图46C和图46D)。对于该阵列内的所有间隔区序列,由无crRNA加工活性的突变体进行的反式ssRNA切割的速率显著下降(单侧t检验;对于所有对p<0.001)。与野生型LbuCas13a相比活性降低对于该阵列内的各个连续间隔区更明显,其中最后一个间隔区以仅为由野生型酶催化的速率的15%的速率指导切割。该发现表明,虽然pre-crRNA加工对于靶向不是必需的,但是其通过从CRISPR阵列释放crRNA来增强活性,导致改进的VI型CRISPR系统模型(图55)。
图38A至图38C.Pre-crRNA加工在Cas13a蛋白家族中是广泛保守的。(A)Cas13a催化的crRNA生物发生途径的示意图。由Cas13a切割pre-crRNA转录物以产生成熟crRNA。下面是pre-crRNA的示意图,突出显示了重要的功能特征。(B)来自所研究的VI型CRISPR系统的CRISPR重复序列的5'部分的比对,突出显示了pre-crRNA切割位点。所映射的切割的切割位点示出为红色条。以黑色文本标示了与Lbu crRNA重复序列的偏差。小写g是转录目的所需要的,并且不是天然crRNA重复序列的部分。完整的CRISPR重复序列示于图39B中。(C)与5'-放射性标记的pre-crRNA底物一起孵育60分钟后,由9种Cas13a同系物进行的Cas13a介导pre-crRNA切割的代表性凝胶。
图39A至图39C.关于本研究中使用的Cas13a同系物的CRISPR基因座和crRNA重复结构(A)Cas13a蛋白的最大似然系统发生树,其中VI-A型基因座的图改编自(Shmakov等人,Mol Cell.2015年11月5日;60(3):385-97)。Cas13a ORF以青色示出。CRISPR阵列描绘为黑色框(重复序列)、黄色菱形(间隔区)和针对上面提到的较大阵列的间隔区阵列尺寸。基因座周围的所关注的ORF以以下缩写标示:T-毒素、AT-抗毒素,以及TP-转座酶。(B)对来自所用同系物的CRISPR重复序列的人工比对。pre-crRNA加工切割位点以红线标示。以黑色文本标示了与Lbu crRNA重复序列的偏差。小写g是转录目的所需要的,并且不是天然crRNA重复序列的部分。测试了两种单独的Hhe crRNA序列,第一种含有天然序列,而第二种具有四核苷酸延伸部以延长非典型短的天然重复序列。在任何研究条件下,HheCas13a都不切割crRNA重复序列。(C)在可变的盐和pH条件下,使用HheCas13a对天然crRNA重复序列进行的pre-crRNA加工测定。没有观察到切割产物。
图40A至图40F.对于由LbuCas13a进行的pre-crRNA切割重要的残基的鉴别(A)LbuCas13a结构域的组构示意图,其中结构域基于LshCas13a晶体结构注释(Liu等人,Cell2017年1月12日;168(1-2):121-134.e12)。(B)通过对LshCas13a的研究,对Cas13a的螺旋1结构域中参与pre-crRNA加工的局部区域,以及(C)通过对LbuCas13a的研究,对Cas13a的HEPN2结构域内参与pre-crRNA加工的区域进行多重序列氨基酸比对。关于这些区域的完整家族树比对参见图41,并且关于完整的蛋白比对参见图57。突变严重影响pre-crRNA加工的残基以黄色菱形标记,并且突变最低限度地影响pre-crRNA加工的残基以青色菱形标记。LbuCas13a序列上方的符号对应于对LbuCas13a进行的突变,并且LshCas13a序列下方的符号对应于由Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12对LshCas13a进行的突变。矩阵比对的着色表示使用ClustalX方案的残基保守,其中较暗的色调指示保守的强度。测量突变体的(D)螺旋1结构域和(E)HEPN2结构域中在单一转换条件下的pre-crRNA加工。将定量数据与单指数衰减拟合,其中所计算的伪一级速率常数(kob)(平均值±标准差,n=3)如下:Lbu WT为0.074±0.003分钟-1,E299A为0.071±0.005分钟-1,K310A为0.071±0.003分钟-1,R311A为0.054±0.007分钟-1,N314A为0.029±0.008分钟-1,R1079A为0.009±0.007分钟-1,D1078A为0.023±0.002分钟-1,K1080A为0.016±0.004分钟-1,并且K1087A为0.076±0.007分钟-1,而R1072A和K1082A无法进行拟合。(F)使用标准条件,通过LbuCas13a、LshCas13a和LwaCas13a蛋白对LshCas13a、LwaCas13a和LbuCas13a pre-crRNA进行pre-crRNA加工的代表性凝胶。最右边泳道中的水解梯带允许相对尺寸比较,尽管三种pre-crRNA之间的细微序列差异将改变这些小片段的迁移。
图41A至图41B.螺旋1结构域和HEPN结构域的完全比对(A-B)跨(A)螺旋1结构域和(B)HEPN2结构域对19种Cas13a家族成员的多重序列比对。GI登录号列在每个物种名称之前。下面列出了基于比对上方列出的LshCas13a序列的坐标和LbuCas13a序列的坐标。在该研究中测试的突变在比对上方以黄色和青色菱形标示,所述黄色和青色菱形分别对应于不利地影响pre-crRNA加工反应的丙氨酸取代或对pre-crRNA加工具有最小影响的丙氨酸取代。由(Liu等人,Cell 2017年1月12日;168(1-2):121-134.e12)测试的突变描绘于LshCas13a序列下方。通过Jalview,使用AMAS方法计算保守评分。
图42A至图42D.Cas13a蛋白家族的成员以一系列效率切割ssRNA(A)由Cas13a进行的ssRNA靶向的示意图。为简单起见,反式ssRNA切割是研究的重点。(B)在孵育60分钟后,由所有十种同系物进行的Cas13a介导反式ssRNA切割的代表性凝胶。如方法中所述,使用成熟crRNA产物形成Cas13a:crRNA复合物,其中最终RNP复合物浓度为50nM。在存在和不存在50nM未标记的与crRNA互补的ssRNA激活物的情况下,加入小于1nM的放射性标记的反式ssRNA靶以引发反应。使用LshCas13a观察到了弱的反式ssRNA切割活性,其中产物条带在右侧用双箭头指示。(C)热图,报告了对于六种不同的Cas13a,各5聚体均聚物ssRNA底物的Cas13a催化的反式ssRNA切割百分比。测定条件与部分(B)相同,不同的是LbuCas13a和LwaCas13a,它们孵育5分钟而不是60分钟。(n=3,具有相关误差的值在图51(表6)中示出。(D)在一系列ssRNA激活物浓度下,五种同系物对荧光ssRNA报告物的表观切割速率。将Cas13a:crRNA复合物分别以2:1的比率预孵育,其中最终活性复合物浓度为50nM。加入互补ssRNA激活物和荧光ssRNA切割报告物以引发反应。将归一化的报告物信号曲线的时间过程使用单指数衰减进行拟合,并且将表观速率绘图(n=3)。一些条件在第一测量时间点之前达到平台,因此它们的速率被最低限度地假设为0.5分钟-1,并在图表中用*标记。
图43A至图43D.由Cas13a同系物进行的反式ssRNA切割(A)对在存在和不存在ssRNA激活物的情况下由十种不同的Cas13a同系物进行的反式ssRNA切割的时间过程分析。时间点取在1分钟、10分钟和60分钟处。标示了LbuCas13a、LwaCas13a、LbaCas13a、EreCas13a、HheCas13a、PprCas13a、CamCas13a和LshCas13a的ssRNA激活物特异性切割产物。虚线表示单独的PAGE凝胶之间的边界。(B)针对四种Cas13a同系物的多个切割反应映射的反式ssRNA切割位点。不同的切割模式以红色箭头标示。似乎LbaCas13a和EreCas13a可具有腺苷偏好性,而LwaCas13a似乎在核苷酸偏好性方面更加混杂。(C-D)由5种Cas13a同系物进行的对均聚ssRNA底物的代表性反式ssRNA切割凝胶。
图44A至图44F.Cas13a家族中的crRNA可交换性(A)Cas13a蛋白的最大似然系统发生树。本研究中使用的同系物以粗体表示,并且进化枝被突出显示。自展值位于图39中。(B)关于来自本研究中使用的同系物的CRISPR重复序列的对称相似性得分矩阵。行和列是按照CRISPR重复序列聚类排序的。(C)关于来自本研究中使用的同系物的CRISPR重复序列的不对称相似性得分矩阵。在(B)中呈现了相同的逐对评分,不同之处为行被重新排序以对应于Cas13a系统发生树。(D-F)(D)由非同源蛋白进行的pre-crRNA加工、(E)由pre-crRNA指导的反式ssRNA切割,以及(F)由成熟crRNA指导的反式ssRNA切割的功能活性矩阵。使用标准条件执行加工测定,并分析60分钟的反应终点。使用荧光ssRNA报告物测定,以拟合的初始速率执行反式ssRNA切割测定。ssRNA激活物的浓度如下:LbuCas13a:100pM、LwaCas13a:100pM、PprCas13a:100nM、LbaCas13a:10nM以及HheCas13a:100nM。对三次平行测定的初始速率进行拟合以计算荧光平台值的差异,并针对每种Cas13a:crRNA同源对进行归一化。关于数值和相关误差(n=3),参见图52、图53和图54(分别为表7、表8和表9)。
图45A至图45C.对用于RNA检测的正交Cas13a亚家族的功能验证(A)RNA检测测定的示意图,所述RNA检测测定经改进以使用荧光均聚ssRNA报告底物来测定由LbuCas13a或LbaCas13a进行的反式ssRNA切割激活。(B)由与LbuCas13a:Lbu-crRNA:10pM ssRNA激活物或LbaCas13a:Lba-crRNA:1nM ssRNA激活物一起孵育的均聚报告物产生的原始荧光测量值的时间过程(平均值±标准差,n=3)。(C)对于一组crRNA、ssRNA激活物和Cas13a蛋白组合,由荧光均聚ssRNA报告物产生的原始荧光测量值(平均值±标准差,n=3)。
图46A至图46D.对LbuCas13a的crDNA阵列加工作用的解释(A)相较于野生型LbuCas13a的R1079A/K1080A突变体的pre-crRNA加工测定的定量时间过程数据。将定量数据与单指数衰减拟合,并且LbuCas13a WT的伪一级速率常数(kob)(平均值±标准差,n=3)为0.074±0.003分钟-1,而R1079A/K1080A突变体不能以足够的置信度拟合产生速率常数。(B)由pre-crRNA和成熟crRNA指导的LbuCas13a野生型和无R1079A/K1080A加工活性的突变体的荧光报告物表观比率。将Cas13a:RNA复合物以1:1的比率预孵育60分钟,然后加入10pM的激活物和150nM的报告物以引发反应。(平均值±标准差,n=3)(C)如由50nM的含有六个crRNA重复间隔区的CRISPR阵列指导的,由300nM野生型LbuCas13a或无R1079A/K1080Apre-crRNA加工活性的突变体进行的荧光ssRNA报告物切割的表观速率。每个条组代表加入100pM的不同ssRNA激活物序列,所述不同ssRNA激活物序列与在每个条组下方指示的CRISPR阵列内的示意位置(schematized position)互补。将每个速率根据来自三次生物平行测定的数据进行拟合,并描绘速率的标准偏差。对于所有间隔区位置,突变蛋白的速率与野生型LbuCas13a在统计学上不同(单侧t检验:p<0.001)。(D)来自(C)的数据被描述为野生型LbuCAs13a活性的百分比,证明了由无pre-crRNA加工活性的突变体降低反式ssRNA靶向效率的位置效应。
图47A至图47C.由LbuCas13a点突变体在参与pre-crRNA加工的区域中进行的反式切割。(A-C)由LbuCas13a的各种‘参与pre-crRNA加工的点突变体进行的反式ssRNA切割。如上所述,在25℃或37℃用0.2nM或1nM的ssRNA激活物使用50nM的Cas13a:crRNA执行切割反应。使用较低的温度和激活物浓度以减慢反应动力学,以进行更准确的测量。拟合的曲线是单指数衰减,其中所计算的伪一级速率常数(平均值±标准差,n=3)如下:25℃条件:LbuWT为1.76±0.24分钟-1,K299A为1.72±0.65分钟-1,K310A为3.19±0.27分钟-1,R1072A为2.95±0.53分钟-1,R1079A为0.93±0.28分钟-1,并且K1082A而2.64±0.63分钟-1,并且37℃条件:R311A为0.39±0.09分钟-1,并且N314A为0.54±0.11分钟-1,而野生型和无加工活性的突变体(R1079A/K1080A)过快地达到平台而无法进行准确的速率测量:WT为2.95±1.97分钟-1,并且R1079A/K1080A为4.86±4.99分钟-1。
图48A至图48B.无crRNA加工活性的突变体R1079A/K1080A保留相似的crRNA结合亲和力并且不加工pre-cRNA阵列(A)如方法中所述地进行过滤结合测定以确定成熟crRNA与LbuCas13a WT和LbuCas13a R1079A/K1080A的结合亲和力。将定量的数据与标准结合等温线拟合。从三个独立实验测量的解离常数(平均值±标准偏差)为1.21±0.57nM(LbuCas13a WT)和3.11±0.89nM(LbuCas13a R1079A/K1080A)。(B)使用六聚体CRISPR阵列作为底物、以及LbuCas13a和LbuCas13a R1079A/K1080A突变体以及各种尺寸的标记物进行的pre-cRNA加工测定。产物标识描绘在凝胶的右侧。由于偶尔未加工的另外前导区,如所标示的偶尔会存在其它尺寸的产物。
图49(表4).CRISPR重复共有序列:针对在含有Cas13a的操纵子(RcaCas13a、LbaCas13a和EreCas13a)的10kb内具有多个CRISPR基因座的同系物,或具有重复变异(PprCas13a)的长阵列,列出了多种crRNA重复序列,其中突变以红色文本突出显示。对于PprCas13a,选择阵列前导侧的第一crRNA重复序列用于该研究。对于RcaCas13a、LbaCas13a和EreCas13a,分析crRNA重复序列的以下两个因素以选择用于该研究的代表性crRNA(1):阵列的长度,以及(2)由同源Cas13a蛋白指导反式ssRNA切割的能力。以主要文本使用的序列在最后一列中注明。
图50(表5).*寡聚物编号-用于保持本研究中使用的RNA底物的一致性的指数。**来源缩写:SS-单链DNA寡核苷酸模板用于体外转录,HH PCR-体外转录模板是包含锤头型核酶模板序列的重叠寡核苷酸的PCR产物,IDT-由IDT合成的,PCR-从质粒扩增的体外转录模板。
图51表示表6。图52表示表7。图53表示表8。图54表示表9。
图55.VI-A型CRISPR系统功能的改进模型(A)本研究中的关键发现的图形概要。本研究中使用的同系物用粗体缩写表示,其中无反式ssRNA切割活性的同系物用灰色绘示。彩色圆圈突出显示两个正交的Cas13a酶组,所述两个正交的Cas13a酶组如由它们的广义crRNA可交换性和进行反式ssRNA切割的底物核苷酸偏好性所限定。(B)描绘了VI-A型CRISPR系统功能的改进模型的示意图。
虽然已经参考本发明的特定实施方案描述了本发明,但是本领域的技术人员应当理解,在不脱离本发明的真实精神和范围的情况下,可以进行各种改变并且可以替换等同物。另外,可以进行许多修改以使具体情况、材料、物质组成、过程、一个或多个过程步骤适应本发明的目的、精神和范围。所有此类修改都在所附权利要求书的范围内。
序列表
<110> Doudna, Jennifer A
O'Connell, Mitchell
Seletsky, Alexandra E
Knight, Spencer C
Cate, Jamie
<120> 用于检测靶RNA的方法和组合物
<130> BERK-337
<150> US 62/351,172
<151> 2016-06-16
<150> US 62/378,156
<151> 2016-08-22
<160> 26
<170> PatentIn 3.5版
<210> 1
<211> 1120
<212> PRT
<213> 斯氏李斯特菌
<400> 1
Met Trp Ile Ser Ile Lys Thr Leu Ile His His Leu Gly Val Leu Phe
1 5 10 15
Phe Cys Asp Tyr Met Tyr Asn Arg Arg Glu Lys Lys Ile Ile Glu Val
20 25 30
Lys Thr Met Arg Ile Thr Lys Val Glu Val Asp Arg Lys Lys Val Leu
35 40 45
Ile Ser Arg Asp Lys Asn Gly Gly Lys Leu Val Tyr Glu Asn Glu Met
50 55 60
Gln Asp Asn Thr Glu Gln Ile Met His His Lys Lys Ser Ser Phe Tyr
65 70 75 80
Lys Ser Val Val Asn Lys Thr Ile Cys Arg Pro Glu Gln Lys Gln Met
85 90 95
Lys Lys Leu Val His Gly Leu Leu Gln Glu Asn Ser Gln Glu Lys Ile
100 105 110
Lys Val Ser Asp Val Thr Lys Leu Asn Ile Ser Asn Phe Leu Asn His
115 120 125
Arg Phe Lys Lys Ser Leu Tyr Tyr Phe Pro Glu Asn Ser Pro Asp Lys
130 135 140
Ser Glu Glu Tyr Arg Ile Glu Ile Asn Leu Ser Gln Leu Leu Glu Asp
145 150 155 160
Ser Leu Lys Lys Gln Gln Gly Thr Phe Ile Cys Trp Glu Ser Phe Ser
165 170 175
Lys Asp Met Glu Leu Tyr Ile Asn Trp Ala Glu Asn Tyr Ile Ser Ser
180 185 190
Lys Thr Lys Leu Ile Lys Lys Ser Ile Arg Asn Asn Arg Ile Gln Ser
195 200 205
Thr Glu Ser Arg Ser Gly Gln Leu Met Asp Arg Tyr Met Lys Asp Ile
210 215 220
Leu Asn Lys Asn Lys Pro Phe Asp Ile Gln Ser Val Ser Glu Lys Tyr
225 230 235 240
Gln Leu Glu Lys Leu Thr Ser Ala Leu Lys Ala Thr Phe Lys Glu Ala
245 250 255
Lys Lys Asn Asp Lys Glu Ile Asn Tyr Lys Leu Lys Ser Thr Leu Gln
260 265 270
Asn His Glu Arg Gln Ile Ile Glu Glu Leu Lys Glu Asn Ser Glu Leu
275 280 285
Asn Gln Phe Asn Ile Glu Ile Arg Lys His Leu Glu Thr Tyr Phe Pro
290 295 300
Ile Lys Lys Thr Asn Arg Lys Val Gly Asp Ile Arg Asn Leu Glu Ile
305 310 315 320
Gly Glu Ile Gln Lys Ile Val Asn His Arg Leu Lys Asn Lys Ile Val
325 330 335
Gln Arg Ile Leu Gln Glu Gly Lys Leu Ala Ser Tyr Glu Ile Glu Ser
340 345 350
Thr Val Asn Ser Asn Ser Leu Gln Lys Ile Lys Ile Glu Glu Ala Phe
355 360 365
Ala Leu Lys Phe Ile Asn Ala Cys Leu Phe Ala Ser Asn Asn Leu Arg
370 375 380
Asn Met Val Tyr Pro Val Cys Lys Lys Asp Ile Leu Met Ile Gly Glu
385 390 395 400
Phe Lys Asn Ser Phe Lys Glu Ile Lys His Lys Lys Phe Ile Arg Gln
405 410 415
Trp Ser Gln Phe Phe Ser Gln Glu Ile Thr Val Asp Asp Ile Glu Leu
420 425 430
Ala Ser Trp Gly Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile
435 440 445
Ile His Leu Lys Lys His Ser Trp Lys Lys Phe Phe Asn Asn Pro Thr
450 455 460
Phe Lys Val Lys Lys Ser Lys Ile Ile Asn Gly Lys Thr Lys Asp Val
465 470 475 480
Thr Ser Glu Phe Leu Tyr Lys Glu Thr Leu Phe Lys Asp Tyr Phe Tyr
485 490 495
Ser Glu Leu Asp Ser Val Pro Glu Leu Ile Ile Asn Lys Met Glu Ser
500 505 510
Ser Lys Ile Leu Asp Tyr Tyr Ser Ser Asp Gln Leu Asn Gln Val Phe
515 520 525
Thr Ile Pro Asn Phe Glu Leu Ser Leu Leu Thr Ser Ala Val Pro Phe
530 535 540
Ala Pro Ser Phe Lys Arg Val Tyr Leu Lys Gly Phe Asp Tyr Gln Asn
545 550 555 560
Gln Asp Glu Ala Gln Pro Asp Tyr Asn Leu Lys Leu Asn Ile Tyr Asn
565 570 575
Glu Lys Ala Phe Asn Ser Glu Ala Phe Gln Ala Gln Tyr Ser Leu Phe
580 585 590
Lys Met Val Tyr Tyr Gln Val Phe Leu Pro Gln Phe Thr Thr Asn Asn
595 600 605
Asp Leu Phe Lys Ser Ser Val Asp Phe Ile Leu Thr Leu Asn Lys Glu
610 615 620
Arg Lys Gly Tyr Ala Lys Ala Phe Gln Asp Ile Arg Lys Met Asn Lys
625 630 635 640
Asp Glu Lys Pro Ser Glu Tyr Met Ser Tyr Ile Gln Ser Gln Leu Met
645 650 655
Leu Tyr Gln Lys Lys Gln Glu Glu Lys Glu Lys Ile Asn His Phe Glu
660 665 670
Lys Phe Ile Asn Gln Val Phe Ile Lys Gly Phe Asn Ser Phe Ile Glu
675 680 685
Lys Asn Arg Leu Thr Tyr Ile Cys His Pro Thr Lys Asn Thr Val Pro
690 695 700
Glu Asn Asp Asn Ile Glu Ile Pro Phe His Thr Asp Met Asp Asp Ser
705 710 715 720
Asn Ile Ala Phe Trp Leu Met Cys Lys Leu Leu Asp Ala Lys Gln Leu
725 730 735
Ser Glu Leu Arg Asn Glu Met Ile Lys Phe Ser Cys Ser Leu Gln Ser
740 745 750
Thr Glu Glu Ile Ser Thr Phe Thr Lys Ala Arg Glu Val Ile Gly Leu
755 760 765
Ala Leu Leu Asn Gly Glu Lys Gly Cys Asn Asp Trp Lys Glu Leu Phe
770 775 780
Asp Asp Lys Glu Ala Trp Lys Lys Asn Met Ser Leu Tyr Val Ser Glu
785 790 795 800
Glu Leu Leu Gln Ser Leu Pro Tyr Thr Gln Glu Asp Gly Gln Thr Pro
805 810 815
Val Ile Asn Arg Ser Ile Asp Leu Val Lys Lys Tyr Gly Thr Glu Thr
820 825 830
Ile Leu Glu Lys Leu Phe Ser Ser Ser Asp Asp Tyr Lys Val Ser Ala
835 840 845
Lys Asp Ile Ala Lys Leu His Glu Tyr Asp Val Thr Glu Lys Ile Ala
850 855 860
Gln Gln Glu Ser Leu His Lys Gln Trp Ile Glu Lys Pro Gly Leu Ala
865 870 875 880
Arg Asp Ser Ala Trp Thr Lys Lys Tyr Gln Asn Val Ile Asn Asp Ile
885 890 895
Ser Asn Tyr Gln Trp Ala Lys Thr Lys Val Glu Leu Thr Gln Val Arg
900 905 910
His Leu His Gln Leu Thr Ile Asp Leu Leu Ser Arg Leu Ala Gly Tyr
915 920 925
Met Ser Ile Ala Asp Arg Asp Phe Gln Phe Ser Ser Asn Tyr Ile Leu
930 935 940
Glu Arg Glu Asn Ser Glu Tyr Arg Val Thr Ser Trp Ile Leu Leu Ser
945 950 955 960
Glu Asn Lys Asn Lys Asn Lys Tyr Asn Asp Tyr Glu Leu Tyr Asn Leu
965 970 975
Lys Asn Ala Ser Ile Lys Val Ser Ser Lys Asn Asp Pro Gln Leu Lys
980 985 990
Val Asp Leu Lys Gln Leu Arg Leu Thr Leu Glu Tyr Leu Glu Leu Phe
995 1000 1005
Asp Asn Arg Leu Lys Glu Lys Arg Asn Asn Ile Ser His Phe Asn
1010 1015 1020
Tyr Leu Asn Gly Gln Leu Gly Asn Ser Ile Leu Glu Leu Phe Asp
1025 1030 1035
Asp Ala Arg Asp Val Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala
1040 1045 1050
Val Ser Lys Ser Leu Lys Glu Ile Leu Ser Ser His Gly Met Glu
1055 1060 1065
Val Thr Phe Lys Pro Leu Tyr Gln Thr Asn His His Leu Lys Ile
1070 1075 1080
Asp Lys Leu Gln Pro Lys Lys Ile His His Leu Gly Glu Lys Ser
1085 1090 1095
Thr Val Ser Ser Asn Gln Val Ser Asn Glu Tyr Cys Gln Leu Val
1100 1105 1110
Arg Thr Leu Leu Thr Met Lys
1115 1120
<210> 2
<211> 1159
<212> PRT
<213> 口腔纤毛菌
<400> 2
Met Lys Val Thr Lys Val Gly Gly Ile Ser His Lys Lys Tyr Thr Ser
1 5 10 15
Glu Gly Arg Leu Val Lys Ser Glu Ser Glu Glu Asn Arg Thr Asp Glu
20 25 30
Arg Leu Ser Ala Leu Leu Asn Met Arg Leu Asp Met Tyr Ile Lys Asn
35 40 45
Pro Ser Ser Thr Glu Thr Lys Glu Asn Gln Lys Arg Ile Gly Lys Leu
50 55 60
Lys Lys Phe Phe Ser Asn Lys Met Val Tyr Leu Lys Asp Asn Thr Leu
65 70 75 80
Ser Leu Lys Asn Gly Lys Lys Glu Asn Ile Asp Arg Glu Tyr Ser Glu
85 90 95
Thr Asp Ile Leu Glu Ser Asp Val Arg Asp Lys Lys Asn Phe Ala Val
100 105 110
Leu Lys Lys Ile Tyr Leu Asn Glu Asn Val Asn Ser Glu Glu Leu Glu
115 120 125
Val Phe Arg Asn Asp Ile Lys Lys Lys Leu Asn Lys Ile Asn Ser Leu
130 135 140
Lys Tyr Ser Phe Glu Lys Asn Lys Ala Asn Tyr Gln Lys Ile Asn Glu
145 150 155 160
Asn Asn Ile Glu Lys Val Glu Gly Lys Ser Lys Arg Asn Ile Ile Tyr
165 170 175
Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asp Ala Tyr Val Ser Asn Val
180 185 190
Lys Glu Ala Phe Asp Lys Leu Tyr Lys Glu Glu Asp Ile Ala Lys Leu
195 200 205
Val Leu Glu Ile Glu Asn Leu Thr Lys Leu Glu Lys Tyr Lys Ile Arg
210 215 220
Glu Phe Tyr His Glu Ile Ile Gly Arg Lys Asn Asp Lys Glu Asn Phe
225 230 235 240
Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Met Lys Glu
245 250 255
Leu Ile Glu Lys Val Pro Asp Met Ser Glu Leu Lys Lys Ser Gln Val
260 265 270
Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys Asn Ile
275 280 285
Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln Leu Leu
290 295 300
Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp Lys Ile
305 310 315 320
Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu Asn Lys
325 330 335
Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys Tyr Asn
340 345 350
Tyr Tyr Leu Gln Asp Gly Glu Ile Ala Thr Ser Asp Phe Ile Ala Arg
355 360 365
Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val Ser Ser
370 375 380
Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn Glu Asn
385 390 395 400
Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn Lys Gly
405 410 415
Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn Glu Asn
420 425 430
Lys Lys Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser Tyr Asp
435 440 445
Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala Asn Ile
450 455 460
Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe Asn Leu
465 470 475 480
Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala Pro Ser
485 490 495
Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys Lys Leu
500 505 510
Lys Leu Lys Ile Phe Arg Gln Leu Asn Ser Ala Asn Val Phe Arg Tyr
515 520 525
Leu Glu Lys Tyr Lys Ile Leu Asn Tyr Leu Lys Arg Thr Arg Phe Glu
530 535 540
Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys Leu Tyr
545 550 555 560
Ser Arg Ile Asp Asp Leu Lys Asn Ser Leu Gly Ile Tyr Trp Lys Thr
565 570 575
Pro Lys Thr Asn Asp Asp Asn Lys Thr Lys Glu Ile Ile Asp Ala Gln
580 585 590
Ile Tyr Leu Leu Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Tyr Phe
595 600 605
Met Ser Asn Asn Gly Asn Phe Phe Glu Ile Ser Lys Glu Ile Ile Glu
610 615 620
Leu Asn Lys Asn Asp Lys Arg Asn Leu Lys Thr Gly Phe Tyr Lys Leu
625 630 635 640
Gln Lys Phe Glu Asp Ile Gln Glu Lys Ile Pro Lys Glu Tyr Leu Ala
645 650 655
Asn Ile Gln Ser Leu Tyr Met Ile Asn Ala Gly Asn Gln Asp Glu Glu
660 665 670
Glu Lys Asp Thr Tyr Ile Asp Phe Ile Gln Lys Ile Phe Leu Lys Gly
675 680 685
Phe Met Thr Tyr Leu Ala Asn Asn Gly Arg Leu Ser Leu Ile Tyr Ile
690 695 700
Gly Ser Asp Glu Glu Thr Asn Thr Ser Leu Ala Glu Lys Lys Gln Glu
705 710 715 720
Phe Asp Lys Phe Leu Lys Lys Tyr Glu Gln Asn Asn Asn Ile Lys Ile
725 730 735
Pro Tyr Glu Ile Asn Glu Phe Leu Arg Glu Ile Lys Leu Gly Asn Ile
740 745 750
Leu Lys Tyr Thr Glu Arg Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu
755 760 765
Leu Asn His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr
770 775 780
Gln Ser Ala Asn Lys Glu Glu Ala Phe Ser Asp Gln Leu Glu Leu Ile
785 790 795 800
Asn Leu Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu
805 810 815
Glu Ala Asp Glu Ile Gly Lys Phe Leu Asp Phe Asn Gly Asn Lys Val
820 825 830
Lys Asp Asn Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe
835 840 845
Asp Gly Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys
850 855 860
Tyr Gly Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Gly Tyr
865 870 875 880
Lys Ile Ser Ile Glu Glu Leu Lys Lys Tyr Ser Asn Lys Lys Asn Glu
885 890 895
Ile Glu Lys Asn His Lys Met Gln Glu Asn Leu His Arg Lys Tyr Ala
900 905 910
Arg Pro Arg Lys Asp Glu Lys Phe Thr Asp Glu Asp Tyr Glu Ser Tyr
915 920 925
Lys Gln Ala Ile Glu Asn Ile Glu Glu Tyr Thr His Leu Lys Asn Lys
930 935 940
Val Glu Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Arg Ile
945 950 955 960
Leu His Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg
965 970 975
Phe Arg Leu Lys Gly Glu Phe Pro Glu Asn Gln Tyr Ile Glu Glu Ile
980 985 990
Phe Asn Phe Glu Asn Lys Lys Asn Val Lys Tyr Lys Gly Gly Gln Ile
995 1000 1005
Val Glu Lys Tyr Ile Lys Phe Tyr Lys Glu Leu His Gln Asn Asp
1010 1015 1020
Glu Val Lys Ile Asn Lys Tyr Ser Ser Ala Asn Ile Lys Val Leu
1025 1030 1035
Lys Gln Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His
1040 1045 1050
Phe Asn Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu
1055 1060 1065
Glu Asn Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn
1070 1075 1080
Ala Val Met Lys Ser Val Val Asp Ile Leu Lys Glu Tyr Gly Phe
1085 1090 1095
Val Ala Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Gly Ile Gln
1100 1105 1110
Thr Leu Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys
1115 1120 1125
Lys Lys Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Lys Leu
1130 1135 1140
Val Lys Ile Met Phe Glu Tyr Lys Met Glu Glu Lys Lys Ser Glu
1145 1150 1155
Asn
<210> 3
<211> 1389
<212> PRT
<213> 沙氏纤毛菌
<400> 3
Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys
1 5 10 15
Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp
20 25 30
Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys
35 40 45
Ile Asp Asn Asn Lys Phe Ile Arg Lys Tyr Ile Asn Tyr Lys Lys Asn
50 55 60
Asp Asn Ile Leu Lys Glu Phe Thr Arg Lys Phe His Ala Gly Asn Ile
65 70 75 80
Leu Phe Lys Leu Lys Gly Lys Glu Gly Ile Ile Arg Ile Glu Asn Asn
85 90 95
Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Ala Tyr
100 105 110
Gly Lys Ser Glu Lys Leu Lys Ala Leu Gly Ile Thr Lys Lys Lys Ile
115 120 125
Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile
130 135 140
Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg
145 150 155 160
Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg
165 170 175
Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile
180 185 190
Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile
195 200 205
Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His
210 215 220
Leu Arg Glu Lys Leu Leu Lys Asp Asp Lys Ile Asp Val Ile Leu Thr
225 230 235 240
Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Leu
245 250 255
Gly Phe Val Lys Phe Tyr Leu Asn Val Gly Gly Asp Lys Lys Lys Ser
260 265 270
Lys Asn Lys Lys Met Leu Val Glu Lys Ile Leu Asn Ile Asn Val Asp
275 280 285
Leu Thr Val Glu Asp Ile Ala Asp Phe Val Ile Lys Glu Leu Glu Phe
290 295 300
Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Val Asn Asn Glu
305 310 315 320
Phe Leu Glu Lys Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu
325 330 335
Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp
340 345 350
Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys
355 360 365
Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asp Glu Leu Ile
370 375 380
Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile
385 390 395 400
Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys
405 410 415
Phe Ser Lys Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr
420 425 430
Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys
435 440 445
Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn
450 455 460
Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr
465 470 475 480
Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Asp
485 490 495
Met Thr Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu
500 505 510
Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu
515 520 525
Leu Asn Lys Ile Phe Ser Arg Glu Asn Ile Asn Asn Asp Glu Asn Ile
530 535 540
Asp Phe Phe Gly Gly Asp Arg Glu Lys Asn Tyr Val Leu Asp Lys Lys
545 550 555 560
Ile Leu Asn Ser Lys Ile Lys Ile Ile Arg Asp Leu Asp Phe Ile Asp
565 570 575
Asn Lys Asn Asn Ile Thr Asn Asn Phe Ile Arg Lys Phe Thr Lys Ile
580 585 590
Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala Ile Ser Lys Glu Arg
595 600 605
Asp Leu Gln Gly Thr Gln Asp Asp Tyr Asn Lys Val Ile Asn Ile Ile
610 615 620
Gln Asn Leu Lys Ile Ser Asp Glu Glu Val Ser Lys Ala Leu Asn Leu
625 630 635 640
Asp Val Val Phe Lys Asp Lys Lys Asn Ile Ile Thr Lys Ile Asn Asp
645 650 655
Ile Lys Ile Ser Glu Glu Asn Asn Asn Asp Ile Lys Tyr Leu Pro Ser
660 665 670
Phe Ser Lys Val Leu Pro Glu Ile Leu Asn Leu Tyr Arg Asn Asn Pro
675 680 685
Lys Asn Glu Pro Phe Asp Thr Ile Glu Thr Glu Lys Ile Val Leu Asn
690 695 700
Ala Leu Ile Tyr Val Asn Lys Glu Leu Tyr Lys Lys Leu Ile Leu Glu
705 710 715 720
Asp Asp Leu Glu Glu Asn Glu Ser Lys Asn Ile Phe Leu Gln Glu Leu
725 730 735
Lys Lys Thr Leu Gly Asn Ile Asp Glu Ile Asp Glu Asn Ile Ile Glu
740 745 750
Asn Tyr Tyr Lys Asn Ala Gln Ile Ser Ala Ser Lys Gly Asn Asn Lys
755 760 765
Ala Ile Lys Lys Tyr Gln Lys Lys Val Ile Glu Cys Tyr Ile Gly Tyr
770 775 780
Leu Arg Lys Asn Tyr Glu Glu Leu Phe Asp Phe Ser Asp Phe Lys Met
785 790 795 800
Asn Ile Gln Glu Ile Lys Lys Gln Ile Lys Asp Ile Asn Asp Asn Lys
805 810 815
Thr Tyr Glu Arg Ile Thr Val Lys Thr Ser Asp Lys Thr Ile Val Ile
820 825 830
Asn Asp Asp Phe Glu Tyr Ile Ile Ser Ile Phe Ala Leu Leu Asn Ser
835 840 845
Asn Ala Val Ile Asn Lys Ile Arg Asn Arg Phe Phe Ala Thr Ser Val
850 855 860
Trp Leu Asn Thr Ser Glu Tyr Gln Asn Ile Ile Asp Ile Leu Asp Glu
865 870 875 880
Ile Met Gln Leu Asn Thr Leu Arg Asn Glu Cys Ile Thr Glu Asn Trp
885 890 895
Asn Leu Asn Leu Glu Glu Phe Ile Gln Lys Met Lys Glu Ile Glu Lys
900 905 910
Asp Phe Asp Asp Phe Lys Ile Gln Thr Lys Lys Glu Ile Phe Asn Asn
915 920 925
Tyr Tyr Glu Asp Ile Lys Asn Asn Ile Leu Thr Glu Phe Lys Asp Asp
930 935 940
Ile Asn Gly Cys Asp Val Leu Glu Lys Lys Leu Glu Lys Ile Val Ile
945 950 955 960
Phe Asp Asp Glu Thr Lys Phe Glu Ile Asp Lys Lys Ser Asn Ile Leu
965 970 975
Gln Asp Glu Gln Arg Lys Leu Ser Asn Ile Asn Lys Lys Asp Leu Lys
980 985 990
Lys Lys Val Asp Gln Tyr Ile Lys Asp Lys Asp Gln Glu Ile Lys Ser
995 1000 1005
Lys Ile Leu Cys Arg Ile Ile Phe Asn Ser Asp Phe Leu Lys Lys
1010 1015 1020
Tyr Lys Lys Glu Ile Asp Asn Leu Ile Glu Asp Met Glu Ser Glu
1025 1030 1035
Asn Glu Asn Lys Phe Gln Glu Ile Tyr Tyr Pro Lys Glu Arg Lys
1040 1045 1050
Asn Glu Leu Tyr Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly
1055 1060 1065
Asn Pro Asn Phe Asp Lys Ile Tyr Gly Leu Ile Ser Asn Asp Ile
1070 1075 1080
Lys Met Ala Asp Ala Lys Phe Leu Phe Asn Ile Asp Gly Lys Asn
1085 1090 1095
Ile Arg Lys Asn Lys Ile Ser Glu Ile Asp Ala Ile Leu Lys Asn
1100 1105 1110
Leu Asn Asp Lys Leu Asn Gly Tyr Ser Lys Glu Tyr Lys Glu Lys
1115 1120 1125
Tyr Ile Lys Lys Leu Lys Glu Asn Asp Asp Phe Phe Ala Lys Asn
1130 1135 1140
Ile Gln Asn Lys Asn Tyr Lys Ser Phe Glu Lys Asp Tyr Asn Arg
1145 1150 1155
Val Ser Glu Tyr Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr
1160 1165 1170
Leu Asn Lys Ile Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu
1175 1180 1185
Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val
1190 1195 1200
Asn Gly Leu Arg Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn
1205 1210 1215
Thr Gly Ile Ser Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly
1220 1225 1230
Phe Tyr Thr Thr Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser
1235 1240 1245
Tyr Lys Lys Phe Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu
1250 1255 1260
Ser Glu Asn Ser Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg
1265 1270 1275
Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp
1280 1285 1290
Tyr Ser Ile Ala Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser
1295 1300 1305
Tyr Ser Thr Arg Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu
1310 1315 1320
Val Phe Lys Lys Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys
1325 1330 1335
Lys Phe Lys Leu Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met
1340 1345 1350
Lys Pro Lys Lys Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser
1355 1360 1365
Asp Tyr Ile Lys Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu
1370 1375 1380
Asn Thr Asn Asp Thr Leu
1385
<210> 4
<211> 1285
<212> PRT
<213> 荚膜红细菌R121
<400> 4
Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp
1 5 10 15
Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg
20 25 30
Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly
35 40 45
Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg
50 55 60
Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln
65 70 75 80
Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser
85 90 95
Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg
100 105 110
Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys
115 120 125
Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg
130 135 140
Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala
145 150 155 160
Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly
165 170 175
Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val
180 185 190
Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met
195 200 205
Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe
210 215 220
Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val
225 230 235 240
Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser
245 250 255
Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val
260 265 270
Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val
275 280 285
Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala
290 295 300
Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu
305 310 315 320
Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met
325 330 335
Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp
340 345 350
Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys
355 360 365
Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala
370 375 380
Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn
385 390 395 400
Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln
405 410 415
Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly
420 425 430
Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly
435 440 445
Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg
450 455 460
Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile
465 470 475 480
Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu
485 490 495
His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile
500 505 510
Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser
515 520 525
Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu
530 535 540
Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser
545 550 555 560
Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg
565 570 575
Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr
580 585 590
Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr
595 600 605
Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg
610 615 620
Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala
625 630 635 640
Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr
645 650 655
Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Ser Ser Arg Leu Arg Pro
660 665 670
Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly
675 680 685
Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser
690 695 700
Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp
705 710 715 720
Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp
725 730 735
Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro
740 745 750
Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln
755 760 765
Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser
770 775 780
Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr
785 790 795 800
Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg
805 810 815
Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe
820 825 830
Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp
835 840 845
Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg
850 855 860
Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro
865 870 875 880
Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu
885 890 895
Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser
900 905 910
Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu
915 920 925
Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala
930 935 940
Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro
945 950 955 960
Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys
965 970 975
Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp
980 985 990
His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile
995 1000 1005
Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile
1010 1015 1020
Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr
1025 1030 1035
Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys
1040 1045 1050
Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro
1055 1060 1065
Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr
1070 1075 1080
Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met
1085 1090 1095
Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His
1100 1105 1110
Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu
1115 1120 1125
Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu
1130 1135 1140
Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe
1145 1150 1155
Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly
1160 1165 1170
Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln
1175 1180 1185
Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg
1190 1195 1200
Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val
1205 1210 1215
Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly
1220 1225 1230
Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile
1235 1240 1245
Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val
1250 1255 1260
Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala
1265 1270 1275
Ala Asp Leu Val Arg Ile Asp
1280 1285
<210> 5
<211> 1175
<212> PRT
<213> 鸡肉杆菌
<400> 5
Met Arg Ile Thr Lys Val Lys Ile Lys Leu Asp Asn Lys Leu Tyr Gln
1 5 10 15
Val Thr Met Gln Lys Glu Glu Lys Tyr Gly Thr Leu Lys Leu Asn Glu
20 25 30
Glu Ser Arg Lys Ser Thr Ala Glu Ile Leu Arg Leu Lys Lys Ala Ser
35 40 45
Phe Asn Lys Ser Phe His Ser Lys Thr Ile Asn Ser Gln Lys Glu Asn
50 55 60
Lys Asn Ala Thr Ile Lys Lys Asn Gly Asp Tyr Ile Ser Gln Ile Phe
65 70 75 80
Glu Lys Leu Val Gly Val Asp Thr Asn Lys Asn Ile Arg Lys Pro Lys
85 90 95
Met Ser Leu Thr Asp Leu Lys Asp Leu Pro Lys Lys Asp Leu Ala Leu
100 105 110
Phe Ile Lys Arg Lys Phe Lys Asn Asp Asp Ile Val Glu Ile Lys Asn
115 120 125
Leu Asp Leu Ile Ser Leu Phe Tyr Asn Ala Leu Gln Lys Val Pro Gly
130 135 140
Glu His Phe Thr Asp Glu Ser Trp Ala Asp Phe Cys Gln Glu Met Met
145 150 155 160
Pro Tyr Arg Glu Tyr Lys Asn Lys Phe Ile Glu Arg Lys Ile Ile Leu
165 170 175
Leu Ala Asn Ser Ile Glu Gln Asn Lys Gly Phe Ser Ile Asn Pro Glu
180 185 190
Thr Phe Ser Lys Arg Lys Arg Val Leu His Gln Trp Ala Ile Glu Val
195 200 205
Gln Glu Arg Gly Asp Phe Ser Ile Leu Asp Glu Lys Leu Ser Lys Leu
210 215 220
Ala Glu Ile Tyr Asn Phe Lys Lys Met Cys Lys Arg Val Gln Asp Glu
225 230 235 240
Leu Asn Asp Leu Glu Lys Ser Met Lys Lys Gly Lys Asn Pro Glu Lys
245 250 255
Glu Lys Glu Ala Tyr Lys Lys Gln Lys Asn Phe Lys Ile Lys Thr Ile
260 265 270
Trp Lys Asp Tyr Pro Tyr Lys Thr His Ile Gly Leu Ile Glu Lys Ile
275 280 285
Lys Glu Asn Glu Glu Leu Asn Gln Phe Asn Ile Glu Ile Gly Lys Tyr
290 295 300
Phe Glu His Tyr Phe Pro Ile Lys Lys Glu Arg Cys Thr Glu Asp Glu
305 310 315 320
Pro Tyr Tyr Leu Asn Ser Glu Thr Ile Ala Thr Thr Val Asn Tyr Gln
325 330 335
Leu Lys Asn Ala Leu Ile Ser Tyr Leu Met Gln Ile Gly Lys Tyr Lys
340 345 350
Gln Phe Gly Leu Glu Asn Gln Val Leu Asp Ser Lys Lys Leu Gln Glu
355 360 365
Ile Gly Ile Tyr Glu Gly Phe Gln Thr Lys Phe Met Asp Ala Cys Val
370 375 380
Phe Ala Thr Ser Ser Leu Lys Asn Ile Ile Glu Pro Met Arg Ser Gly
385 390 395 400
Asp Ile Leu Gly Lys Arg Glu Phe Lys Glu Ala Ile Ala Thr Ser Ser
405 410 415
Phe Val Asn Tyr His His Phe Phe Pro Tyr Phe Pro Phe Glu Leu Lys
420 425 430
Gly Met Lys Asp Arg Glu Ser Glu Leu Ile Pro Phe Gly Glu Gln Thr
435 440 445
Glu Ala Lys Gln Met Gln Asn Ile Trp Ala Leu Arg Gly Ser Val Gln
450 455 460
Gln Ile Arg Asn Glu Ile Phe His Ser Phe Asp Lys Asn Gln Lys Phe
465 470 475 480
Asn Leu Pro Gln Leu Asp Lys Ser Asn Phe Glu Phe Asp Ala Ser Glu
485 490 495
Asn Ser Thr Gly Lys Ser Gln Ser Tyr Ile Glu Thr Asp Tyr Lys Phe
500 505 510
Leu Phe Glu Ala Glu Lys Asn Gln Leu Glu Gln Phe Phe Ile Glu Arg
515 520 525
Ile Lys Ser Ser Gly Ala Leu Glu Tyr Tyr Pro Leu Lys Ser Leu Glu
530 535 540
Lys Leu Phe Ala Lys Lys Glu Met Lys Phe Ser Leu Gly Ser Gln Val
545 550 555 560
Val Ala Phe Ala Pro Ser Tyr Lys Lys Leu Val Lys Lys Gly His Ser
565 570 575
Tyr Gln Thr Ala Thr Glu Gly Thr Ala Asn Tyr Leu Gly Leu Ser Tyr
580 585 590
Tyr Asn Arg Tyr Glu Leu Lys Glu Glu Ser Phe Gln Ala Gln Tyr Tyr
595 600 605
Leu Leu Lys Leu Ile Tyr Gln Tyr Val Phe Leu Pro Asn Phe Ser Gln
610 615 620
Gly Asn Ser Pro Ala Phe Arg Glu Thr Val Lys Ala Ile Leu Arg Ile
625 630 635 640
Asn Lys Asp Glu Ala Arg Lys Lys Met Lys Lys Asn Lys Lys Phe Leu
645 650 655
Arg Lys Tyr Ala Phe Glu Gln Val Arg Glu Met Glu Phe Lys Glu Thr
660 665 670
Pro Asp Gln Tyr Met Ser Tyr Leu Gln Ser Glu Met Arg Glu Glu Lys
675 680 685
Val Arg Lys Ala Glu Lys Asn Asp Lys Gly Phe Glu Lys Asn Ile Thr
690 695 700
Met Asn Phe Glu Lys Leu Leu Met Gln Ile Phe Val Lys Gly Phe Asp
705 710 715 720
Val Phe Leu Thr Thr Phe Ala Gly Lys Glu Leu Leu Leu Ser Ser Glu
725 730 735
Glu Lys Val Ile Lys Glu Thr Glu Ile Ser Leu Ser Lys Lys Ile Asn
740 745 750
Glu Arg Glu Lys Thr Leu Lys Ala Ser Ile Gln Val Glu His Gln Leu
755 760 765
Val Ala Thr Asn Ser Ala Ile Ser Tyr Trp Leu Phe Cys Lys Leu Leu
770 775 780
Asp Ser Arg His Leu Asn Glu Leu Arg Asn Glu Met Ile Lys Phe Lys
785 790 795 800
Gln Ser Arg Ile Lys Phe Asn His Thr Gln His Ala Glu Leu Ile Gln
805 810 815
Asn Leu Leu Pro Ile Val Glu Leu Thr Ile Leu Ser Asn Asp Tyr Asp
820 825 830
Glu Lys Asn Asp Ser Gln Asn Val Asp Val Ser Ala Tyr Phe Glu Asp
835 840 845
Lys Ser Leu Tyr Glu Thr Ala Pro Tyr Val Gln Thr Asp Asp Arg Thr
850 855 860
Arg Val Ser Phe Arg Pro Ile Leu Lys Leu Glu Lys Tyr His Thr Lys
865 870 875 880
Ser Leu Ile Glu Ala Leu Leu Lys Asp Asn Pro Gln Phe Arg Val Ala
885 890 895
Ala Thr Asp Ile Gln Glu Trp Met His Lys Arg Glu Glu Ile Gly Glu
900 905 910
Leu Val Glu Lys Arg Lys Asn Leu His Thr Glu Trp Ala Glu Gly Gln
915 920 925
Gln Thr Leu Gly Ala Glu Lys Arg Glu Glu Tyr Arg Asp Tyr Cys Lys
930 935 940
Lys Ile Asp Arg Phe Asn Trp Lys Ala Asn Lys Val Thr Leu Thr Tyr
945 950 955 960
Leu Ser Gln Leu His Tyr Leu Ile Thr Asp Leu Leu Gly Arg Met Val
965 970 975
Gly Phe Ser Ala Leu Phe Glu Arg Asp Leu Val Tyr Phe Ser Arg Ser
980 985 990
Phe Ser Glu Leu Gly Gly Glu Thr Tyr His Ile Ser Asp Tyr Lys Asn
995 1000 1005
Leu Ser Gly Val Leu Arg Leu Asn Ala Glu Val Lys Pro Ile Lys
1010 1015 1020
Ile Lys Asn Ile Lys Val Ile Asp Asn Glu Glu Asn Pro Tyr Lys
1025 1030 1035
Gly Asn Glu Pro Glu Val Lys Pro Phe Leu Asp Arg Leu His Ala
1040 1045 1050
Tyr Leu Glu Asn Val Ile Gly Ile Lys Ala Val His Gly Lys Ile
1055 1060 1065
Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu Leu Ser
1070 1075 1080
Met Ile Glu Ser Met Asn Asn Leu Arg Asp Leu Met Ala Tyr Asp
1085 1090 1095
Arg Lys Leu Lys Asn Ala Val Thr Lys Ser Met Ile Lys Ile Leu
1100 1105 1110
Asp Lys His Gly Met Ile Leu Lys Leu Lys Ile Asp Glu Asn His
1115 1120 1125
Lys Asn Phe Glu Ile Glu Ser Leu Ile Pro Lys Glu Ile Ile His
1130 1135 1140
Leu Lys Asp Lys Ala Ile Lys Thr Asn Gln Val Ser Glu Glu Tyr
1145 1150 1155
Cys Gln Leu Val Leu Ala Leu Leu Thr Thr Asn Pro Gly Asn Gln
1160 1165 1170
Leu Asn
1175
<210> 6
<211> 1285
<212> PRT
<213> Herbinix hemicellulosilytica
<400> 6
Met Lys Leu Thr Arg Arg Arg Ile Ser Gly Asn Ser Val Asp Gln Lys
1 5 10 15
Ile Thr Ala Ala Phe Tyr Arg Asp Met Ser Gln Gly Leu Leu Tyr Tyr
20 25 30
Asp Ser Glu Asp Asn Asp Cys Thr Asp Lys Val Ile Glu Ser Met Asp
35 40 45
Phe Glu Arg Ser Trp Arg Gly Arg Ile Leu Lys Asn Gly Glu Asp Asp
50 55 60
Lys Asn Pro Phe Tyr Met Phe Val Lys Gly Leu Val Gly Ser Asn Asp
65 70 75 80
Lys Ile Val Cys Glu Pro Ile Asp Val Asp Ser Asp Pro Asp Asn Leu
85 90 95
Asp Ile Leu Ile Asn Lys Asn Leu Thr Gly Phe Gly Arg Asn Leu Lys
100 105 110
Ala Pro Asp Ser Asn Asp Thr Leu Glu Asn Leu Ile Arg Lys Ile Gln
115 120 125
Ala Gly Ile Pro Glu Glu Glu Val Leu Pro Glu Leu Lys Lys Ile Lys
130 135 140
Glu Met Ile Gln Lys Asp Ile Val Asn Arg Lys Glu Gln Leu Leu Lys
145 150 155 160
Ser Ile Lys Asn Asn Arg Ile Pro Phe Ser Leu Glu Gly Ser Lys Leu
165 170 175
Val Pro Ser Thr Lys Lys Met Lys Trp Leu Phe Lys Leu Ile Asp Val
180 185 190
Pro Asn Lys Thr Phe Asn Glu Lys Met Leu Glu Lys Tyr Trp Glu Ile
195 200 205
Tyr Asp Tyr Asp Lys Leu Lys Ala Asn Ile Thr Asn Arg Leu Asp Lys
210 215 220
Thr Asp Lys Lys Ala Arg Ser Ile Ser Arg Ala Val Ser Glu Glu Leu
225 230 235 240
Arg Glu Tyr His Lys Asn Leu Arg Thr Asn Tyr Asn Arg Phe Val Ser
245 250 255
Gly Asp Arg Pro Ala Ala Gly Leu Asp Asn Gly Gly Ser Ala Lys Tyr
260 265 270
Asn Pro Asp Lys Glu Glu Phe Leu Leu Phe Leu Lys Glu Val Glu Gln
275 280 285
Tyr Phe Lys Lys Tyr Phe Pro Val Lys Ser Lys His Ser Asn Lys Ser
290 295 300
Lys Asp Lys Ser Leu Val Asp Lys Tyr Lys Asn Tyr Cys Ser Tyr Lys
305 310 315 320
Val Val Lys Lys Glu Val Asn Arg Ser Ile Ile Asn Gln Leu Val Ala
325 330 335
Gly Leu Ile Gln Gln Gly Lys Leu Leu Tyr Tyr Phe Tyr Tyr Asn Asp
340 345 350
Thr Trp Gln Glu Asp Phe Leu Asn Ser Tyr Gly Leu Ser Tyr Ile Gln
355 360 365
Val Glu Glu Ala Phe Lys Lys Ser Val Met Thr Ser Leu Ser Trp Gly
370 375 380
Ile Asn Arg Leu Thr Ser Phe Phe Ile Asp Asp Ser Asn Thr Val Lys
385 390 395 400
Phe Asp Asp Ile Thr Thr Lys Lys Ala Lys Glu Ala Ile Glu Ser Asn
405 410 415
Tyr Phe Asn Lys Leu Arg Thr Cys Ser Arg Met Gln Asp His Phe Lys
420 425 430
Glu Lys Leu Ala Phe Phe Tyr Pro Val Tyr Val Lys Asp Lys Lys Asp
435 440 445
Arg Pro Asp Asp Asp Ile Glu Asn Leu Ile Val Leu Val Lys Asn Ala
450 455 460
Ile Glu Ser Val Ser Tyr Leu Arg Asn Arg Thr Phe His Phe Lys Glu
465 470 475 480
Ser Ser Leu Leu Glu Leu Leu Lys Glu Leu Asp Asp Lys Asn Ser Gly
485 490 495
Gln Asn Lys Ile Asp Tyr Ser Val Ala Ala Glu Phe Ile Lys Arg Asp
500 505 510
Ile Glu Asn Leu Tyr Asp Val Phe Arg Glu Gln Ile Arg Ser Leu Gly
515 520 525
Ile Ala Glu Tyr Tyr Lys Ala Asp Met Ile Ser Asp Cys Phe Lys Thr
530 535 540
Cys Gly Leu Glu Phe Ala Leu Tyr Ser Pro Lys Asn Ser Leu Met Pro
545 550 555 560
Ala Phe Lys Asn Val Tyr Lys Arg Gly Ala Asn Leu Asn Lys Ala Tyr
565 570 575
Ile Arg Asp Lys Gly Pro Lys Glu Thr Gly Asp Gln Gly Gln Asn Ser
580 585 590
Tyr Lys Ala Leu Glu Glu Tyr Arg Glu Leu Thr Trp Tyr Ile Glu Val
595 600 605
Lys Asn Asn Asp Gln Ser Tyr Asn Ala Tyr Lys Asn Leu Leu Gln Leu
610 615 620
Ile Tyr Tyr His Ala Phe Leu Pro Glu Val Arg Glu Asn Glu Ala Leu
625 630 635 640
Ile Thr Asp Phe Ile Asn Arg Thr Lys Glu Trp Asn Arg Lys Glu Thr
645 650 655
Glu Glu Arg Leu Asn Thr Lys Asn Asn Lys Lys His Lys Asn Phe Asp
660 665 670
Glu Asn Asp Asp Ile Thr Val Asn Thr Tyr Arg Tyr Glu Ser Ile Pro
675 680 685
Asp Tyr Gln Gly Glu Ser Leu Asp Asp Tyr Leu Lys Val Leu Gln Arg
690 695 700
Lys Gln Met Ala Arg Ala Lys Glu Val Asn Glu Lys Glu Glu Gly Asn
705 710 715 720
Asn Asn Tyr Ile Gln Phe Ile Arg Asp Val Val Val Trp Ala Phe Gly
725 730 735
Ala Tyr Leu Glu Asn Lys Leu Lys Asn Tyr Lys Asn Glu Leu Gln Pro
740 745 750
Pro Leu Ser Lys Glu Asn Ile Gly Leu Asn Asp Thr Leu Lys Glu Leu
755 760 765
Phe Pro Glu Glu Lys Val Lys Ser Pro Phe Asn Ile Lys Cys Arg Phe
770 775 780
Ser Ile Ser Thr Phe Ile Asp Asn Lys Gly Lys Ser Thr Asp Asn Thr
785 790 795 800
Ser Ala Glu Ala Val Lys Thr Asp Gly Lys Glu Asp Glu Lys Asp Lys
805 810 815
Lys Asn Ile Lys Arg Lys Asp Leu Leu Cys Phe Tyr Leu Phe Leu Arg
820 825 830
Leu Leu Asp Glu Asn Glu Ile Cys Lys Leu Gln His Gln Phe Ile Lys
835 840 845
Tyr Arg Cys Ser Leu Lys Glu Arg Arg Phe Pro Gly Asn Arg Thr Lys
850 855 860
Leu Glu Lys Glu Thr Glu Leu Leu Ala Glu Leu Glu Glu Leu Met Glu
865 870 875 880
Leu Val Arg Phe Thr Met Pro Ser Ile Pro Glu Ile Ser Ala Lys Ala
885 890 895
Glu Ser Gly Tyr Asp Thr Met Ile Lys Lys Tyr Phe Lys Asp Phe Ile
900 905 910
Glu Lys Lys Val Phe Lys Asn Pro Lys Thr Ser Asn Leu Tyr Tyr His
915 920 925
Ser Asp Ser Lys Thr Pro Val Thr Arg Lys Tyr Met Ala Leu Leu Met
930 935 940
Arg Ser Ala Pro Leu His Leu Tyr Lys Asp Ile Phe Lys Gly Tyr Tyr
945 950 955 960
Leu Ile Thr Lys Lys Glu Cys Leu Glu Tyr Ile Lys Leu Ser Asn Ile
965 970 975
Ile Lys Asp Tyr Gln Asn Ser Leu Asn Glu Leu His Glu Gln Leu Glu
980 985 990
Arg Ile Lys Leu Lys Ser Glu Lys Gln Asn Gly Lys Asp Ser Leu Tyr
995 1000 1005
Leu Asp Lys Lys Asp Phe Tyr Lys Val Lys Glu Tyr Val Glu Asn
1010 1015 1020
Leu Glu Gln Val Ala Arg Tyr Lys His Leu Gln His Lys Ile Asn
1025 1030 1035
Phe Glu Ser Leu Tyr Arg Ile Phe Arg Ile His Val Asp Ile Ala
1040 1045 1050
Ala Arg Met Val Gly Tyr Thr Gln Asp Trp Glu Arg Asp Met His
1055 1060 1065
Phe Leu Phe Lys Ala Leu Val Tyr Asn Gly Val Leu Glu Glu Arg
1070 1075 1080
Arg Phe Glu Ala Ile Phe Asn Asn Asn Asp Asp Asn Asn Asp Gly
1085 1090 1095
Arg Ile Val Lys Lys Ile Gln Asn Asn Leu Asn Asn Lys Asn Arg
1100 1105 1110
Glu Leu Val Ser Met Leu Cys Trp Asn Lys Lys Leu Asn Lys Asn
1115 1120 1125
Glu Phe Gly Ala Ile Ile Trp Lys Arg Asn Pro Ile Ala His Leu
1130 1135 1140
Asn His Phe Thr Gln Thr Glu Gln Asn Ser Lys Ser Ser Leu Glu
1145 1150 1155
Ser Leu Ile Asn Ser Leu Arg Ile Leu Leu Ala Tyr Asp Arg Lys
1160 1165 1170
Arg Gln Asn Ala Val Thr Lys Thr Ile Asn Asp Leu Leu Leu Asn
1175 1180 1185
Asp Tyr His Ile Arg Ile Lys Trp Glu Gly Arg Val Asp Glu Gly
1190 1195 1200
Gln Ile Tyr Phe Asn Ile Lys Glu Lys Glu Asp Ile Glu Asn Glu
1205 1210 1215
Pro Ile Ile His Leu Lys His Leu His Lys Lys Asp Cys Tyr Ile
1220 1225 1230
Tyr Lys Asn Ser Tyr Met Phe Asp Lys Gln Lys Glu Trp Ile Cys
1235 1240 1245
Asn Gly Ile Lys Glu Glu Val Tyr Asp Lys Ser Ile Leu Lys Cys
1250 1255 1260
Ile Gly Asn Leu Phe Lys Phe Asp Tyr Glu Asp Lys Asn Lys Ser
1265 1270 1275
Ser Ala Asn Pro Lys His Thr
1280 1285
<210> 7
<211> 30
<212> RNA
<213> 斯氏李斯特菌
<400> 7
gacuaccucu auaugaaaga ggacuaaaac 30
<210> 8
<211> 29
<212> RNA
<213> 沙氏纤毛菌
<400> 8
ccaccccaau aucgaagggg acuaaaaca 29
<210> 9
<211> 31
<212> RNA
<213> 口腔纤毛菌
<400> 9
gaccacccca aaaaugaagg ggacuaaaac a 31
<210> 10
<211> 50
<212> RNA
<213> 斯氏李斯特菌
<400> 10
gacuaccucu auaugaaaga ggacuaaaac caaacaugau cugggucauc 50
<210> 11
<211> 55
<212> RNA
<213> 斯氏李斯特菌
<400> 11
uaagagacua ccucuauaug aaagaggacu aaaaccaaac augaucuggg ucauc 55
<210> 12
<211> 49
<212> RNA
<213> 沙氏纤毛菌
<400> 12
ccaccccaau aucgaagggg acuaaaacag gggcagagau gaugacccu 49
<210> 13
<211> 58
<212> RNA
<213> 沙氏纤毛菌
<400> 13
ggauuuagac caccccaaua ucgaagggga cuaaaacagg ggcagagaug augacccu 58
<210> 14
<211> 51
<212> RNA
<213> 口腔纤毛菌
<400> 14
gaccacccca aaaaugaagg ggacuaaaac aggggcagag augaugaccc u 51
<210> 15
<211> 56
<212> RNA
<213> 口腔纤毛菌
<400> 15
auuuagacca ccccaaaaau gaaggggacu aaaacagggg cagagaugau gacccu 56
<210> 16
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 16
agauagccca agaaagaggg caauaac 27
<210> 17
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 17
guaacaaucc ccguagacag gggaacugca ac 32
<210> 18
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 18
caucaccgcc aagacgacgg cggacugaac c 31
<210> 19
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 19
aauuauccca aaauugaagg gaacuacaac 30
<210> 20
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 20
gaguaccuca aaacaaaaga ggacuaaaac 30
<210> 21
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 21
gaccacccca auaucgaagg ggacuaaaac uu 32
<210> 22
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 22
caccccaaua ucgaagggga cuaaaac 27
<210> 23
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 23
aaguagcccg auauagaggg caauaac 27
<210> 24
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 24
auacagcucg auauagugag caauaag 27
<210> 25
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 25
ucacaucacc gccaagacga cggcggacug aacc 34
<210> 26
<211> 28
<212> RNA
<213> 人工序列
<220>
<223> 合成序列
<400> 26
gaacagcccg auauagaggg caauagac 28

Claims (90)

1.一种检测包含多种RNA的样品中的单链靶RNA的方法,所述方法包括:
a)使所述样品与以下接触:
(i)C2c2指导RNA,其与所述单链靶RNA杂交;和
(ii)C2c2蛋白,其切割所述样品中存在的RNA;以及
b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。
2.一种检测包含多种RNA的样品中的单链靶RNA的方法,所述方法包括:
(a)使所述样品与以下接触:
(i)前体C2c2指导RNA阵列,其包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列;和
(ii)C2c2蛋白,其将所述前体C2c2指导RNA阵列切割成单独的C2c2指导RNA,并且还切割所述样品的RNA;以及
(b)测量由C2c2蛋白介导的RNA切割产生的可检测信号。
3.根据权利要求1或权利要求2所述的方法,其中所述C2c2蛋白在所述接触1小时内切割所述样品中存在的所述RNA的至少50%。
4.根据权利要求3所述的方法,其中所述C2c2蛋白在所述接触40分钟内切割所述样品中存在的所述RNA的至少50%。
5.根据权利要求4所述的方法,其中所述C2c2蛋白在所述接触5分钟内切割所述样品中存在的所述RNA的至少50%。
6.根据权利要求5所述的方法,其中所述C2c2蛋白在所述接触1分钟内切割所述样品中存在的所述RNA的至少50%。
7.根据权利要求1所述的方法,其中所述C2c2蛋白在所述接触1分钟内切割所述样品中存在的所述RNA的50%至多于90%。
8.根据权利要求1-7中任一项所述的方法,其中可以检测到所述单链靶RNA的最小浓度在500fM至1nM的范围内。
9.根据权利要求1-7中任一项所述的方法,其中可以在低至800fM的浓度下检测到所述单链靶RNA。
10.根据权利要求1-9中任一项所述的方法,其中所述C2c2蛋白不是包含与SEQ ID NO:3所示的氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列的沙氏纤毛菌(Lsh)C2c2蛋白。
11.根据权利要求10所述的方法,其中所述C2c2蛋白比包含与SEQ ID NO:3所示的氨基酸序列至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的沙氏纤毛菌(Lsh)C2c2蛋白至少1.2倍有效地切割非靶RNA。
12.根据权利要求11所述的方法,其中所述C2c2蛋白比包含SEQ ID NO:3所示的氨基酸序列的沙氏纤毛菌(Lsh)C2c2蛋白至少1.5倍有效地切割非靶RNA。
13.根据权利要求1-9中任一项所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:4至SEQ ID NO:6中任一者所示的氨基酸序列具有80%或更多氨基酸序列同一性的氨基酸序列。
14.根据权利要求1-9中任一项所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的口腔纤毛菌(Lbu)C2c2氨基酸序列具有80%或更多氨基酸序列同一性的氨基酸序列。
15.根据权利要求1-9中任一项所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:1所示的斯氏李斯特菌C2c2氨基酸序列具有80%或更多氨基酸序列同一性的氨基酸序列。
16.根据权利要求1-9中任一项所述的方法,其中所述C2c2蛋白包含SEQ ID NO:1至SEQID NO:2和SEQ ID NO:4至SEQ ID NO:6中任一者所示的氨基酸序列。
17.根据权利要求1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对R472、H477、R1048和H1053中的一者或多者的取代。
18.根据权利要求1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472和H477的取代。
19.根据权利要求1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R1048和H1053的取代。
20.根据权利要求1所述的方法,其中所述C2c2蛋白包含与SEQ ID NO:2所示的C2c2氨基酸序列具有至少80%氨基酸序列同一性的氨基酸序列,并且包含对氨基酸R472、H477、R1048和H1053的取代。
21.根据权利要求1-20中任一项所述的方法,其中在所述测量之前使所述样品接触2小时或更短时间。
22.根据权利要求21所述的方法,其中在所述测量之前使所述样品接触60分钟或更短时间。
23.根据权利要求22所述的方法,其中在所述测量之前使所述样品接触30分钟或更短时间。
24.根据权利要求23所述的方法,其中在所述测量之前使所述样品接触10分钟或更短时间。
25.根据权利要求24所述的方法,其中在所述测量之前使所述样品接触1分钟或更短时间。
26.根据权利要求1-25中任一项所述的方法,其包括确定在所述样品中存在的靶RNA的量。
27.根据权利要求26所述的方法,其中所述确定包括:
测量所述可检测信号以产生测试测量值;
测量由参考样品产生的可检测信号以产生参考测量值;以及
将所述测试测量值与所述参考测量值进行比较以确定所述样品中存在的靶RNA的量。
28.根据权利要求26所述的方法,其包括:
测量所述可检测信号以产生测试测量值,
测量由两个或更多个参考样品中的每一个产生的可检测信号,其中所述两个或更多个参考样品各自包括不同量的阳性对照RNA,以产生两个或更多个参考测量值,以及
将所述测试测量值与所述两个或更多个参考测量值进行比较以确定所述样品中存在的靶RNA的量。
29.根据权利要求1-28中任一项所述的方法,其中所述样品包含5至107个序列彼此不同的RNA。
30.根据权利要求1-28中任一项所述的方法,其中所述样品包含10至106个序列彼此不同的RNA。
31.根据权利要求1-30中任一项所述的方法,其中所述样品包含来自细胞裂解物的RNA。
32.根据权利要求1-31中任一项所述的方法,其中测量可检测信号包括以下中的一者或多者:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
33.根据权利要求1-32中任一项所述的方法,其中(i)所述方法包括使所述样品与包含荧光发射染料对的经标记的检测RNA接触,(ii)所述C2c2蛋白切割所述经标记的检测RNA,以及(iii)所述可检测信号由所述荧光发射染料对产生。
34.根据权利要求33所述的方法,其中所述经标记的检测RNA在被切割之前产生一定量的可检测信号,并且当所述经标记的检测RNA被切割时可检测信号的量减少。
35.根据权利要求33所述的方法,其中所述经标记的检测RNA在被切割之前产生第一可检测信号,并且当所述经标记的检测RNA被切割时产生第二可检测信号。
36.根据权利要求35所述的方法,其中所述经标记的检测RNA包含荧光发射染料对。
37.根据权利要求33-36中任一项所述的方法,其中所述经标记的检测RNA包含荧光共振能量转移(FRET)对。
38.根据权利要求33所述的方法,其中在所述经标记的检测RNA被切割时产生可检测信号。
39.根据权利要求33所述的方法,其中当所述经标记的检测RNA被切割时,可检测信号的量增加。
40.根据权利要求38或权利要求39所述的方法,其中所述经标记的检测RNA包含猝灭剂/荧光剂对。
41.根据权利要求33-40中任一项所述的方法,其中所述经标记的检测RNA包含经修饰的核碱基、经修饰的糖部分和/或经修饰的核酸键。
42.根据权利要求1-41中任一项所述的方法,其中所述接触在无细胞样品中进行。
43.根据权利要求1-41中任一项所述的方法,其中所述接触在体外、离体或体外细胞中进行。
44.一种将前体C2c2指导RNA阵列切割成两个或更多个C2c2指导RNA的方法,所述方法包括:
使包含两个或更多个C2c2指导RNA的前体C2c2指导RNA阵列与C2c2蛋白接触,每个所述C2c2指导RNA阵列具有不同的指导序列,其中所述C2c2蛋白将所述前体C2c2指导RNA阵列切割成单独的C2c2指导RNA。
45.根据权利要求44所述的方法,其中所述C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。
46.根据权利要求44或权利要求45所述的方法,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向相同靶RNA分子内的不同靶序列。
47.根据权利要求44-46中任一项所述的方法,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向不同靶RNA分子。
48.根据权利要求44-47中任一项所述的方法,其中所述接触不在细胞内发生。
49.根据权利要求44-48中任一项所述的方法,其中所述指导RNA和/或所述前体C2c2指导RNA阵列中的至少一者是可检测地标记的。
50.一种用于检测包含多种RNA的样品中的靶RNA的试剂盒,所述试剂盒包含:
(a)前体C2c2指导RNA阵列,和/或编码所述前体C2c2指导RNA阵列的核酸,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列和/或所选择的指导序列的插入位点;以及
(b)C2c2蛋白。
51.根据权利要求50所述的试剂盒,其中所述C2c2蛋白缺乏催化活性的HEPN1结构域和/或缺乏催化活性的HEPN2结构域。
52.根据权利要求50或权利要求51所述的试剂盒,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向相同靶RNA分子内的不同靶序列。
53.根据权利要求50-52中任一项所述的试剂盒,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,所述两个或更多个C2c2指导RNA靶向不同靶RNA分子。
54.根据权利要求50-53中任一项所述的试剂盒,其中所述指导RNA和/或所述前体C2c2指导RNA阵列中的至少一者是可检测地标记的。
55.根据权利要求50-54中任一项所述的试剂盒,其还包含经标记的检测RNA,所述经标记的检测RNA包含荧光发射染料对。
56.一种用于检测包含多种RNA的样品中的靶RNA的试剂盒,所述试剂盒包含:
(a)经标记的检测RNA,其包含荧光发射染料对;以及
(b)C2c2蛋白。
57.根据权利要求56所述的试剂盒,其包含阳性对照靶RNA。
58.根据权利要求57所述的试剂盒,其中所述阳性对照靶RNA以不同的量在两个或更多个容器中的每一个中存在。
59.根据权利要求56-58中任一项所述的试剂盒,其包含以下中的至少一者:
(c)C2c2指导RNA和/或编码所述C2c2指导RNA的核酸;
(d)前体C2c2指导RNA和/或编码所述前体C2c2指导RNA的核酸;以及
(e)前体C2c2指导RNA阵列,和/或编码所述前体C2c2指导RNA阵列的核酸,其中所述前体C2c2指导RNA阵列包含两个或更多个C2c2指导RNA,每个所述C2c2指导RNA具有不同的指导序列和/或所选择的指导序列的插入位点。
60.根据权利要求56-59中任一项所述的试剂盒,其包含DNA,所述DNA包含编码具有或不具有指导序列的C2c2指导RNA的核苷酸序列。
61.根据权利要求60所述的试剂盒,其中所述DNA包含用于插入指导序列的插入序列。
62.根据权利要求60或权利要求61所述的试剂盒,其中所述DNA是表达载体,并且所述C2c2指导RNA与启动子可操作地连接。
63.根据权利要求62所述的试剂盒,其中所述启动子是T7启动子。
64.根据权利要求56-63中任一项所述的试剂盒,其包含缺乏核酸酶活性的C2c2内切核糖核酸酶变体。
65.根据权利要求56-64中任一项所述的试剂盒,其中所述经标记的检测RNA包含FRET对。
66.根据权利要求56-65中任一项所述的试剂盒,其中所述经标记的检测RNA包含猝灭剂/荧光剂对。
67.根据权利要求56-66中任一项所述的试剂盒,其中所述经标记的检测RNA包含产生第一可检测信号的FRET对和产生第二可检测信号的猝灭剂/荧光剂对。
68.一种变体C2c2多肽,其包含:
a)与SEQ ID NO:2所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R472和H477;ii)氨基酸R1048和H1053;或iii)氨基酸R472、H477、R1048和H1053;
b)与SEQ ID NO:1所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R445和H450;ii)氨基酸R1016和H1021;或iii)氨基酸R445、H450、R1016和H1021;
c)与SEQ ID NO:4所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R464和H469;ii)氨基酸R1052和H1057;或iii)氨基酸R464、H469、R1052和H1057;
d)与SEQ ID NO:5所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R467和H472;ii)氨基酸R1069和H1074;或iii)氨基酸R467、H472、R1069和H1074;或者
e)与SEQ ID NO:6所示氨基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的氨基酸序列同一性的氨基酸序列,并且包含对以下的取代:i)氨基酸R472和H477;ii)氨基酸R1044和H1049;或iii)氨基酸R472、H477、R1044和H1049。
69.根据权利要求68所述的变体C2c2多肽,其中所述变体C2c2多肽具有减少的或不可检测的ss RNA切割(例如,RNA指导的切割活性),但保留了结合C2c2指导RNA和ssRNA的能力,并且保留了切割前体C2c2指导RNA的能力。
70.一种核酸,其包含编码根据权利要求68或69所述的变体C2c2多肽的核苷酸序列。
71.根据权利要求70所述的核酸,其中所述核苷酸序列与组成型启动子或可调控的启动子可操作地连接。
72.一种重组表达载体,其包含根据权利要求70或71所述的核酸。
73.一种宿主细胞,其用根据权利要求70或71所述的核酸或用根据权利要求72所述的重组表达载体遗传修饰。
74.根据权利要求73所述的宿主细胞,其中所述宿主细胞是真核细胞。
75.根据权利要求73所述的宿主细胞,其中所述宿主细胞是原核细胞。
76.根据权利要求73-75中任一项所述的宿主细胞,其中所述宿主细胞是体外的、离体的或体内的。
77.一种检测包含多种RNA的样品中的至少两种不同单链靶RNA的方法,所述方法包括:
a)使所述样品与以下接触:
(i)第一C2c2蛋白,其切割包括至少一个A的单链RNA(ssRNA);
(ii)第二C2c2蛋白,其切割包括至少一个U的ssRNA;
(iii)第一C2c2指导RNA,其包含与所述第一单链靶RNA杂交的第一核苷酸序列和与所述第一C2c2蛋白结合的第二核苷酸序列;以及
(iv)第二C2c2指导RNA,其包含与所述第二单链靶RNA杂交的第一核苷酸序列和与所述第二C2c2蛋白结合的第二核苷酸序列;
其中所述第一C2c2蛋白不被所述第二C2c2指导RNA激活,并且其中所述第一C2c2蛋白切割包括至少一个A的ssRNA,并且
其中所述第二C2c2蛋白不被所述第一C2c2指导RNA激活,并且其中所述第二C2c2蛋白切割包括至少一个U的ssRNA;以及
b)测量由所述第一C2c2蛋白和所述第二C2c2蛋白介导的RNA切割产生的可检测信号,其中第一可检测信号在所述第一C2c2蛋白被激活时产生,并且第二可检测信号在所述第二C2c2蛋白被激活时产生,其中检测到所述第一信号表明所述第一靶ssRNA存在于所述样品中,并且其中检测到所述第二信号表明所述第二靶ssRNA存在于所述样品中。
78.根据权利要求77所述的方法,其中:
a)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
b)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
c)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
d)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
e)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
f)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
g)所述第一C2c2蛋白包含与图56F所示的Lba Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56D所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
h)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
i)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
j)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
k)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
l)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
m)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
n)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56D所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
o)所述第一C2c2蛋白包含与图56J所示的Ere Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56A所示的Lse Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
p)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56K所示的Hhe Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
q)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56G所示的Rca Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
r)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56B所示的Ppr Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
s)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56I所示的Lne Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
t)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56C所示的Lbu Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
u)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56E所示的Lwa Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;
v)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56F所示的Lsh Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;或者
w)所述第一C2c2蛋白包含与图56H所示的Cam Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列;并且所述第二C2c2蛋白包含与图56A所示的Lse Cas13a氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
79.根据权利要求77或78所述的方法,其中所述方法包括使所述样品与以下接触:
i)第一经标记的检测RNA,其包含第一荧光发射染料对,其中所述第一经标记的检测RNA包含至少一个A并且不包含U;和
ii)第二经标记的检测RNA,其包含第二荧光发射染料对,其中所述第二经标记的检测RNA包含至少一个U并且不包含A,
其中所述第一C2c2蛋白切割所述第一经标记的检测RNA,并且所述第一可检测信号由所述第一荧光发射染料对产生,并且
其中所述第一C2c2蛋白切割所述第二经标记的检测RNA,并且所述第二可检测信号由所述第二荧光发射染料对产生。
80.根据权利要求79所述的方法,其中所述第一经标记的检测RNA包含2至15个连续的A的段和/或所述第二经标记的检测RNA包含2至15个连续的U的段。
81.根据权利要求79所述的方法,其中所述第一经标记的检测RNA包含4至15个连续的A的段和/或所述第二经标记的检测RNA包含4至15个连续的U的段。
82.根据权利要求79所述的方法,其中所述第一经标记的检测RNA包含至少3个连续的A的段和/或所述第二经标记的检测RNA包含至少3个连续的U的段。
83.根据权利要求79所述的方法,其中所述第一经标记的检测RNA包含至少4个连续的A的段和/或所述第二经标记的检测RNA包含至少4个连续的U的段。
84.一种试剂盒,其包含:
(a)第一经标记的检测RNA,其缺乏U并且包含至少一个A且包含第一荧光发射染料对;
(b)第二经标记的检测RNA,其缺乏A并且包含至少一个U且包含第二荧光发射染料对;
(c)第一C2c2蛋白,和/或编码所述第一C2c2蛋白的核酸,其中所述第一C2c2蛋白可切割所述第一经标记的检测RNA但不切割所述第二经标记的检测RNA;以及
(d)第二C2c2蛋白,和/或编码所述第二C2c2蛋白的核酸,其中所述第二C2c2蛋白可切割所述第二经标记的检测RNA但不切割所述第一经标记的检测RNA。
85.根据权利要求84所述的试剂盒,其包含以下中的至少一者:
(e)第一C2c2指导RNA和/或编码所述第一C2c2指导RNA的核酸,其中所述第一C2c2指导RNA包含与所述第一C2c2蛋白结合的恒定区序列;
(f)第二C2c2指导RNA和/或编码所述第二C2c2指导RNA的核酸,其中所述第二C2c2指导RNA包含与所述第二C2c2蛋白结合的恒定区序列;
(g)核酸,其包含编码与所述第一C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点;
(h)核酸,其包含编码与所述第二C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点。
86.根据权利要求84所述的试剂盒,其包含核酸,所述核酸包含编码第一C2c2指导RNA的核苷酸序列,其中所述第一C2c2指导RNA包含与所述第一C2c2蛋白结合的恒定区序列。
87.根据权利要求84所述的试剂盒,其包含核酸,所述核酸包含编码第二C2c2指导RNA的核苷酸序列,其中所述第二C2c2指导RNA包含与所述第二C2c2蛋白结合的恒定区序列。
88.根据权利要求84所述的试剂盒,其包含核酸,所述核酸包含编码与所述第一C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点。
89.根据权利要求84所述的试剂盒,其包含核酸,所述核酸包含编码与所述第二C2c2蛋白结合的恒定区序列的核苷酸序列和所选择的指导序列的插入位点。
90.根据权利要求86-89中任一项所述的试剂盒,其中所述核酸是表达载体,并且所述核苷酸序列与启动子可操作地连接。
CN201780048641.6A 2016-06-16 2017-06-13 用于检测靶rna的方法和组合物 Active CN109641026B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211656487.XA CN116287127A (zh) 2016-06-16 2017-06-13 用于检测靶rna的方法和组合物

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201662351172P 2016-06-16 2016-06-16
US62/351,172 2016-06-16
US201662378156P 2016-08-22 2016-08-22
US62/378,156 2016-08-22
US15/467,922 2017-03-23
US15/467,922 US10337051B2 (en) 2016-06-16 2017-03-23 Methods and compositions for detecting a target RNA
PCT/US2017/037308 WO2017218573A1 (en) 2016-06-16 2017-06-13 Methods and compositions for detecting a target rna

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211656487.XA Division CN116287127A (zh) 2016-06-16 2017-06-13 用于检测靶rna的方法和组合物

Publications (2)

Publication Number Publication Date
CN109641026A true CN109641026A (zh) 2019-04-16
CN109641026B CN109641026B (zh) 2023-01-03

Family

ID=60661224

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211656487.XA Pending CN116287127A (zh) 2016-06-16 2017-06-13 用于检测靶rna的方法和组合物
CN201780048641.6A Active CN109641026B (zh) 2016-06-16 2017-06-13 用于检测靶rna的方法和组合物

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211656487.XA Pending CN116287127A (zh) 2016-06-16 2017-06-13 用于检测靶rna的方法和组合物

Country Status (11)

Country Link
US (6) US10337051B2 (zh)
EP (2) EP4036249A1 (zh)
JP (2) JP2019522472A (zh)
CN (2) CN116287127A (zh)
AU (2) AU2017283538B2 (zh)
CA (1) CA3024883A1 (zh)
DE (3) DE212017000062U1 (zh)
DK (1) DK3471749T3 (zh)
ES (1) ES2908484T3 (zh)
GB (1) GB2557153B (zh)
WO (1) WO2017218573A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110732028A (zh) * 2019-11-01 2020-01-31 南开大学 一种可限制激活CRISPR/Cas13a的双锁纳米粒子的制备方法和应用
CN112813179A (zh) * 2020-12-09 2021-05-18 广州市第一人民医院(广州消化疾病中心、广州医科大学附属市一人民医院、华南理工大学附属第二医院) 一种用于尿路感染病原菌检测的试剂盒及其使用方法
CN113293198A (zh) * 2020-09-18 2021-08-24 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
CN116814627A (zh) * 2023-07-11 2023-09-29 深圳市辰景生命科技有限公司 sgRNA组合物、检测新型冠状病毒SARS-CoV-2的试剂盒以及检测方法

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3012631A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US10337051B2 (en) * 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
JP7267013B2 (ja) * 2016-06-17 2023-05-01 ザ・ブロード・インスティテュート・インコーポレイテッド Vi型crisprオルソログ及び系
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
WO2018064371A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
EP4119663A1 (en) * 2016-12-09 2023-01-18 The Broad Institute, Inc. Crispr effector system based diagnostics
US11174515B2 (en) * 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
BR112019019087A2 (pt) * 2017-03-15 2020-05-12 The Broad Institute, Inc. Diagnóstico baseado em sistema efetor de crispr para detecção de vírus
US11021740B2 (en) * 2017-03-15 2021-06-01 The Broad Institute, Inc. Devices for CRISPR effector system based diagnostics
US11104937B2 (en) * 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
WO2018195545A2 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
US10392616B2 (en) 2017-06-30 2019-08-27 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US20200165594A1 (en) * 2017-07-07 2020-05-28 The Broad Institute, Inc. Crispr system based antiviral therapy
US20190218532A1 (en) * 2017-09-19 2019-07-18 Massachusetts Institute Of Technology Streptococcus Canis Cas9 as a Genome Engineering Platform with Novel PAM Specificity
US11633732B2 (en) 2017-10-04 2023-04-25 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
CA3080493A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
US11661599B1 (en) 2017-12-14 2023-05-30 National Technology & Engineering Solutions Of Sandia, Llc CRISPR-Cas based system for targeting single-stranded sequences
EP3765616B1 (en) 2018-03-14 2023-07-19 Arbor Biotechnologies, Inc. Novel crispr dna and rna targeting enzymes and systems
EP4257696A3 (en) 2018-03-14 2024-01-24 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
WO2019204210A1 (en) * 2018-04-16 2019-10-24 Georgia Tech Research Corporation Mrna driven expression of rna editors for treatment of pathologies
CN110551800B (zh) * 2018-06-03 2022-08-19 上海吐露港生物科技有限公司 一种耐高温Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒
US11608519B2 (en) 2018-07-30 2023-03-21 Tokitae Llc Specific detection of deoxyribonucleic acid sequences using novel CRISPR enzyme-mediated detection strategies
SG11202101934SA (en) * 2018-07-30 2021-03-30 Readcoor Llc Methods and systems for sample processing or analysis
EP3830301A1 (en) 2018-08-01 2021-06-09 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
CN109055499B (zh) * 2018-08-30 2021-01-19 杭州杰毅生物技术有限公司 基于CRISPR-Cas的等温核酸检测方法及试剂盒
WO2020051452A2 (en) * 2018-09-07 2020-03-12 The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone Hiv or hcv detection with crispr-cas13a
US20210396756A1 (en) * 2018-10-03 2021-12-23 The Broad Institute, Inc. Crispr effector system based diagnostics for hemorrhagic fever detection
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
CN113811607A (zh) 2019-03-07 2021-12-17 加利福尼亚大学董事会 CRISPR-Cas效应子多肽和其使用方法
KR20210142690A (ko) 2019-03-21 2021-11-25 셜록 바이오사이언스, 인크. 시스템
JPWO2021002476A1 (zh) * 2019-07-04 2021-01-07
US20220364159A1 (en) * 2019-07-26 2022-11-17 Mammoth Biosciences, Inc. Compositions for detection of dna and methods of use thereof
WO2021062201A1 (en) * 2019-09-25 2021-04-01 Spotlight Therapeutics Compositions and methods for nucleoprotein targeting and expression
US20230139524A1 (en) * 2020-02-27 2023-05-04 Lsk Technologies Inc. Systems and methods for characterization of an assay from regions of interest using optical reactions
EP4121568A2 (en) * 2020-03-19 2023-01-25 The J. David Gladstone Institutes, A Testamentary Trust Established under The Will of J. David Gladstone Rapid field-deployable detection of sars-cov-2 virus
CN113549605B (zh) * 2020-04-26 2023-03-31 生物岛实验室 用于抑制SARS-CoV-2的组合物及载体系统
CN116157536A (zh) * 2020-05-19 2023-05-23 加利福尼亚大学董事会 用于核酸检测的核酸酶链反应的组合物和方法
WO2021243276A1 (en) * 2020-05-29 2021-12-02 University Of Florida Research Foundation Crispr/cas chain reaction systems and methods for amplifying the detection sensitivity of crispr-based target detection
CA3186580A1 (en) 2020-06-12 2021-12-16 Sherlock Biosciences, Inc. Crispr-based sars-cov-2 detection
WO2022068912A1 (en) 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
WO2022188039A1 (en) 2021-03-09 2022-09-15 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
CN112143821A (zh) * 2020-09-30 2020-12-29 北京师范大学 Fret检测白色念珠菌,新生隐球菌和肺炎克雷伯杆菌的试剂及其应用
WO2022122689A1 (en) * 2020-12-09 2022-06-16 BioNTech SE Rna manufacturing
EP4291678A1 (en) 2021-02-09 2023-12-20 Sherlock Biosciences, Inc. Nucleic acid amplification using promoter primers
WO2022241032A1 (en) * 2021-05-12 2022-11-17 Mammoth Biosciences, Inc. Enhanced guide nucleic acids and methods of use
US20220389418A1 (en) 2021-06-01 2022-12-08 Helmholtz-Institut Für Rna-Basierte Nfektionsforschung (Hzi) Rna-guided cas nucleases and uses thereof in diagnostics and therapy
WO2023287669A2 (en) * 2021-07-12 2023-01-19 Labsimply, Inc. Nuclease cascade assay
WO2023004391A2 (en) 2021-07-21 2023-01-26 Montana State University Nucleic acid detection using type iii crispr complex
WO2023114090A2 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Signal boost cascade assay
US11820983B2 (en) 2021-12-13 2023-11-21 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
WO2023112886A1 (ja) * 2021-12-16 2023-06-22 国立研究開発法人理化学研究所 1本鎖rnaの製造方法
WO2024020352A1 (en) * 2022-07-18 2024-01-25 Vertex Pharmaceuticals Incorporated Tandem guide rnas (tg-rnas) and their use in genome editing
WO2024059197A1 (en) * 2022-09-14 2024-03-21 Revvity Health Sciences, Inc. Methods and compositions for single-stranded nucleic acid ladders by guided cleavage

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103088128A (zh) * 2013-01-09 2013-05-08 华中科技大学 一种microRNA的二次循环扩增检测方法及试剂盒
US20130123129A1 (en) * 2011-11-11 2013-05-16 Agilent Technologies, Inc. Use of dnazymes for analysis of an rna sample
US20140273226A1 (en) * 2013-03-15 2014-09-18 System Biosciences, Llc Crispr/cas systems for genomic modification and gene modulation
CN104620107A (zh) * 2012-07-17 2015-05-13 通用电气公司 检测生物样品中dna、rna和蛋白质的方法
EP3009511A2 (en) * 2015-06-18 2016-04-20 The Broad Institute, Inc. Novel crispr enzymes and systems

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
CN1273476C (zh) 1997-09-12 2006-09-06 埃克西康有限公司 寡核苷酸类似物
ATE270344T1 (de) 1999-11-16 2004-07-15 Atto Tec Gmbh Farbstoffmarkiertes oligonukleotid zum markieren eines nukleinsäuremoleküls
US6727356B1 (en) 1999-12-08 2004-04-27 Epoch Pharmaceuticals, Inc. Fluorescent quenching detection reagents and methods
US7019129B1 (en) 2000-05-09 2006-03-28 Biosearch Technologies, Inc. Dark quenchers for donor-acceptor energy transfer
JP2004521606A (ja) * 2000-05-24 2004-07-22 サード・ウェーブ・テクノロジーズ・インク Rnaの検出法
US6773885B1 (en) 2000-09-29 2004-08-10 Integrated Dna Technologies, Inc. Compositions and methods for visual ribonuclease detection assays
US6818420B2 (en) 2002-02-27 2004-11-16 Biosource International, Inc. Methods of using FET labeled oligonucleotides that include a 3′-5′ exonuclease resistant quencher domain and compositions for practicing the same
CN1886512A (zh) 2002-04-23 2006-12-27 斯克里普斯研究所 多肽在叶绿体中的表达以及用于表达多肽的组合物和方法
DE10259374A1 (de) 2002-12-18 2004-07-08 Atto-Tec Gmbh Carboxamid-substituierte Farbstoffe für analytische Anwendungen
DE10329860A1 (de) 2003-07-02 2005-01-20 Atto-Tec Gmbh Sulfonamidderivate polycyclischer Farbstoffe für analytische Anwendungen
EP1580273A1 (en) 2004-03-26 2005-09-28 Friedrich-Alexander-Universität Erlangen-Nürnberg Peptide-based method for monitoring gene expression in a host cell
US8586718B2 (en) 2004-09-14 2013-11-19 Applied Biosystems, Llc Multi-chromophoric quencher constructs for use in high sensitivity energy transfer probes
CN101283089A (zh) 2005-10-07 2008-10-08 加利福尼亚大学董事会 修饰细胞色素p450酶的编码核酸和其应用方法
US9689031B2 (en) 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
EP2268608A4 (en) 2008-04-01 2012-01-11 Biosearch Technologies Inc DARK NUCLEIC ACID STABILIZED FLUOROPHORE DEACTIVATOR PROBES
WO2011053871A2 (en) 2009-10-30 2011-05-05 Life Technologies Corporation Multi-primer assay for mycoplasma detection
WO2011100749A2 (en) 2010-02-15 2011-08-18 Cascade Biosystems, Inc. Methods and materials for detecting viral or microbial infections
EP2580354A4 (en) 2010-06-11 2013-10-30 Pathogenica Inc NUCLEIC ACIDS FOR MULTIPLEX DETECTION OF ORGANISMS AND METHOD FOR THEIR USE AND MANUFACTURE
DE102010042634A1 (de) 2010-10-19 2012-04-19 Atto-Tec Gmbh Neue Amin-substituierte tricyclische Fluoreszenzfarbstoffe
US9730967B2 (en) 2011-02-04 2017-08-15 Katherine Rose Kovarik Method and system for treating cancer cachexia
ES2755934T3 (es) 2011-10-31 2020-04-24 Eiken Chemical Método para detectar ácido nucleico diana
LT3401400T (lt) 2012-05-25 2019-06-10 The Regents Of The University Of California Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui
EP3138911B1 (en) 2012-12-06 2018-12-05 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
KR101780885B1 (ko) 2013-03-14 2017-10-11 카리부 바이오사이언시스 인코포레이티드 핵산-표적화 핵산의 조성물 및 방법
EP3071695A2 (en) 2013-11-18 2016-09-28 Crispr Therapeutics AG Crispr-cas system materials and methods
US9994831B2 (en) 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
EP3126498A4 (en) 2014-03-20 2017-08-23 Université Laval Crispr-based methods and products for increasing frataxin levels and uses thereof
EP3129488B1 (en) 2014-04-10 2019-06-12 The Regents of The University of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
KR20170036801A (ko) 2014-08-19 2017-04-03 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산의 프로빙 및 맵핑을 위한 rna-가이드된 시스템
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
US11180792B2 (en) 2015-01-28 2021-11-23 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
AU2016280893B2 (en) 2015-06-18 2021-12-02 Massachusetts Institute Of Technology CRISPR enzyme mutations reducing off-target effects
CA3012631A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
US20170211142A1 (en) 2015-10-22 2017-07-27 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3400299B1 (en) 2016-01-08 2020-11-11 University of Georgia Research Foundation, Inc. Methods for cleaving dna and rna molecules
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
US20190024075A1 (en) 2016-02-23 2019-01-24 Arc Bio, Llc Methods and compositions for target detection
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
WO2017205668A1 (en) 2016-05-25 2017-11-30 Arizona Board Of Regents On Behalf Of Arizona State University Portable, low-cost pathogen detection and strain identification platform
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
JP7267013B2 (ja) 2016-06-17 2023-05-01 ザ・ブロード・インスティテュート・インコーポレイテッド Vi型crisprオルソログ及び系
AU2017280353B2 (en) 2016-06-24 2021-11-11 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
US20210166783A1 (en) 2016-08-17 2021-06-03 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
WO2018064371A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
CN106701830B (zh) 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
EP4119663A1 (en) 2016-12-09 2023-01-18 The Broad Institute, Inc. Crispr effector system based diagnostics
AU2018240515A1 (en) * 2017-03-24 2019-08-01 CureVac SE Nucleic acids encoding CRISPR-associated proteins and uses thereof
WO2018195545A2 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
ES2960390T3 (es) 2017-08-09 2024-03-04 Ricetec Inc Composiciones y métodos para modificar genomas
US20200255858A1 (en) 2017-11-01 2020-08-13 Jillian F. Banfield Casy compositions and methods of use
CA3080493A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
GB2582100B (en) 2017-11-01 2023-05-17 Univ California CAS12C Compositions and methods of use
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
CN111836903A (zh) 2017-12-22 2020-10-27 博德研究所 基于crispr效应系统的多重诊断

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130123129A1 (en) * 2011-11-11 2013-05-16 Agilent Technologies, Inc. Use of dnazymes for analysis of an rna sample
CN104620107A (zh) * 2012-07-17 2015-05-13 通用电气公司 检测生物样品中dna、rna和蛋白质的方法
CN103088128A (zh) * 2013-01-09 2013-05-08 华中科技大学 一种microRNA的二次循环扩增检测方法及试剂盒
US20140273226A1 (en) * 2013-03-15 2014-09-18 System Biosciences, Llc Crispr/cas systems for genomic modification and gene modulation
EP3009511A2 (en) * 2015-06-18 2016-04-20 The Broad Institute, Inc. Novel crispr enzymes and systems

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
OMAR O. ABUDAYYEH,等: "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector", 《SCIENCE》 *
SERGEY SHMAKOV,等: "Discovery and functional characterization of diverse Class 2 CRISPR-Cas systems", 《MOLECULAR CELL》 *
无: "NCBI Reference Sequence: WP_012985477.1", 《GENBANK》 *
无: "NCBI Reference Sequence: WP_015770004.1", 《GENBANK》 *
无: "NCBI Reference Sequence: WP_023911507.1", 《GENBANK》 *
无: "NCBI Reference Sequence: WP_034560163.1", 《GENBANK》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110732028A (zh) * 2019-11-01 2020-01-31 南开大学 一种可限制激活CRISPR/Cas13a的双锁纳米粒子的制备方法和应用
CN110732028B (zh) * 2019-11-01 2022-07-26 南开大学 一种可限制激活CRISPR/Cas13a的双锁纳米粒子的制备方法和应用
CN113293198A (zh) * 2020-09-18 2021-08-24 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
CN113293198B (zh) * 2020-09-18 2022-12-02 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
CN112813179A (zh) * 2020-12-09 2021-05-18 广州市第一人民医院(广州消化疾病中心、广州医科大学附属市一人民医院、华南理工大学附属第二医院) 一种用于尿路感染病原菌检测的试剂盒及其使用方法
CN116814627A (zh) * 2023-07-11 2023-09-29 深圳市辰景生命科技有限公司 sgRNA组合物、检测新型冠状病毒SARS-CoV-2的试剂盒以及检测方法

Also Published As

Publication number Publication date
US11840725B2 (en) 2023-12-12
AU2017283538A1 (en) 2018-12-13
DE212017000062U1 (de) 2018-11-29
US10494664B2 (en) 2019-12-03
US20180208977A1 (en) 2018-07-26
US20180208976A1 (en) 2018-07-26
EP4036249A1 (en) 2022-08-03
JP2019522472A (ja) 2019-08-15
DK3471749T3 (da) 2022-02-07
EP3471749A1 (en) 2019-04-24
JP7437474B2 (ja) 2024-02-22
GB201804822D0 (en) 2018-05-09
EP3471749B1 (en) 2022-01-12
CA3024883A1 (en) 2017-12-21
US20200010879A1 (en) 2020-01-09
US20200010878A1 (en) 2020-01-09
US11827919B2 (en) 2023-11-28
US11459600B2 (en) 2022-10-04
GB2557153A (en) 2018-06-13
US11459599B2 (en) 2022-10-04
AU2017283538B2 (en) 2022-07-21
CN116287127A (zh) 2023-06-23
US20170362644A1 (en) 2017-12-21
CN109641026B (zh) 2023-01-03
WO2017218573A1 (en) 2017-12-21
US20190177775A1 (en) 2019-06-13
EP3471749A4 (en) 2020-01-08
AU2022256169A1 (en) 2022-11-24
US10337051B2 (en) 2019-07-02
DE212017000061U1 (de) 2018-12-04
ES2908484T3 (es) 2022-04-29
GB2557153B (en) 2019-03-20
DE212017000056U1 (de) 2018-11-21
JP2022185083A (ja) 2022-12-13

Similar Documents

Publication Publication Date Title
CN109641026A (zh) 用于检测靶rna的方法和组合物
CN104357546B (zh) 用于核酸指数式扩增的切口和延长扩增反应
US5665572A (en) Polymerase chain reaction amplification method using a single primer which randomly anneals
US11274333B2 (en) Compositions and methods for preparing sequencing libraries
EA006066B1 (ru) Способы амплификации нуклеиновых кислот
EP4153772A1 (en) Compositions and methods of a nuclease chain reaction for nucleic acid detection
JP2008161165A (ja) 競合オリゴヌクレオチドを用いた遺伝子検出法
JP6074036B2 (ja) 拡大された基質範囲を有する新規のdnaポリメラーゼ
CN107641664B (zh) 检测鱼神经坏死病毒的引物组及其应用
CN107002146A (zh) 用于检测耐药性结核分枝杆菌的组合物和方法
KR101737318B1 (ko) 노랑머리병 바이러스 검출용 유전자 마커, 및 이를 이용한 바이러스의 검출 방법
US20230357761A1 (en) Activators of type iii cas proteins
CN108291252A (zh) 稳定特定rna的通用方法
JP2008161164A (ja) 人工ミスマッチ核酸を含むプライマーを用いた遺伝子検出法
KR101737313B1 (ko) 전염성 근괴사증 바이러스 검출용 유전자 마커, 및 이를 이용한 바이러스의 검출 방법
CN107922980A (zh) 用于检测结核分枝杆菌的组合物和方法
Hipolito Improving DNAzyme catalysis through synthetically modified DNAzymes and probing DNA polymerase function to improve selection methodology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant