CN116157536A - 用于核酸检测的核酸酶链反应的组合物和方法 - Google Patents

用于核酸检测的核酸酶链反应的组合物和方法 Download PDF

Info

Publication number
CN116157536A
CN116157536A CN202180060056.4A CN202180060056A CN116157536A CN 116157536 A CN116157536 A CN 116157536A CN 202180060056 A CN202180060056 A CN 202180060056A CN 116157536 A CN116157536 A CN 116157536A
Authority
CN
China
Prior art keywords
nucleic acid
sequence
rna
detection system
acid detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180060056.4A
Other languages
English (en)
Inventor
D·萨瓦奇
P·许
N·普里韦斯
E·J·查尔斯
G·J·克诺特
J·J·德斯马莱斯
S·金
E·杜甘
M·卢卡斯卡
S·S·钱德拉塞卡兰
N·C·拉默斯
T·Y·刘
A·莫克
L·拉罗
B·W-L·桑顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of CN116157536A publication Critical patent/CN116157536A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文描述了包含用于信号放大的内部核酸酶链反应(NCR)的核酸检测组合物和系统,以及使用这些含NCR组合物和系统的方法。

Description

用于核酸检测的核酸酶链反应的组合物和方法
对相关申请的交叉引用
本申请要求于2020年5月19日提交的美国专利申请序列号63/027,175的权益。在先申请的公开视为本申请的公开的部分(并通过引用并入)。
技术领域
本发明涉及用于检测核酸的方法和组合物,包括包含内部核酸酶链反应(NCR)的检测系统,用于快速且灵敏地检测任何靶核酸序列。
政府支持
本发明是在政府支持下完成的,拨款号为OD021369,由美国国立卫生研究院授予。政府对本发明享有一定的权利。
背景技术
成簇的规律间隔的短回文重复(Clustered regularly interspaced shortpalindromic repeats,CRISPR)在20世纪80年代末发现。虽然这些序列参与细菌防御系统的概念在随后的几十年里提出,但直到21世纪中期到后期才被更广泛地接受。在此期间,若干论文阐明了这种获得性免疫系统的基础知识:将侧翼为回文重复的外来DNA序列(例如,来自质粒和病毒)掺入宿主基因组,并且其RNA产物指导Cas复合物切开含有互补序列的核酸。
与工程化向导RNA组合的CRISPR相关(Cas)蛋白的简化复合物后来显示能够定位和切割特定的DNA序列。这导致了新技术的爆发,特别是基因组编辑。进一步的研究表明,这些蛋白质可以用于在体内编辑基因组。CRISPR系统在古生物和一些细菌中找到。除了其更广泛认可的靶向DNA的能力外,一些类型的Cas蛋白还具有靶向RNA的活性。例如,Cas13酶家族,诸如Cas13a、Cas13b、Cas13c和Cas13d,具有两个RNA内切核酸酶(RNA酶)域。
一些CRISPR相关蛋白的非特异性核糖核酸酶(RNA酶)或脱氧核糖核酸酶(DNA酶)活性可能处于休眠状态,直到由其他因子与蛋白质或蛋白复合物结合而激活。因此,Cas13或Cas12酶可以用识别期望靶序列的向导RNA进行程序化(programme),激活非特异性RNA酶或DNA酶活性。这可以用来释放可检测标记物,诸如淬灭的荧光报告物,导致可检测的信号,诸如荧光。例如,SHERLOCK(特异性高灵敏性酶促报告解锁(Specific High-sensitivityEnzymatic Report UnLOCKing))使用Cas13蛋白检测RNA靶标,并且DETECTR系统使用Cas12蛋白检测DNA靶标,以仅在存在指定RNA或DNA靶序列的情况下切割淬灭的报告分子。参见例如Li et al.(2019)Trends in Biotech.37(7):730-743;Petri&Pattanayak(2018)TheCRISPR Journal 1(3):209-211;Gootenberg et al.(2017)Science 356(6336):438-442;和美国公布号20180274017和20190241954。
然而,目前的基于Cas的检测系统可能在灵敏性方面具有局限性,此外,在对病毒和其他病原体的广泛扩散暴露时,期望快速的测试结果。也高度期望如下的测试,其能够产生灵敏、特异和快速结果,而不需要专门的设备,使得测试可以在现场、在“护理点(point-of care)”或POC环境中或在消费者的“在家”使用中进行。
因此,仍然需要允许用于直接、灵敏、快速和易于使用的核酸检测的方法和组合物,包含用于检测样品中的病原体。
发明内容
本文公开了用于检测RNA或DNA的组合物和方法。本文所述系统提供了全合一(all-in-one)检测模式的高灵敏性、定量和快速的测定法,其具有内部核酸酶链反应(Nuclease Chain Reaction,NCR),该内部核酸酶链反应提供了放大、前馈回路以在检测靶核酸时生成指数信号。
本文描述了用于检测核酸的系统。系统通常包含至少两个组分:(1)第一组分,其检测核酸并且另外地,在检测任何样品中的靶核酸时,其本身能够生成信号,或替代地经由一个或多个其他分子(例如,报告物)生成信号;和(2)第二组分,其放大在检测时由第一组分生成的信号。该系统可以包含“前馈(feed forward)”系统,其中第一组分(例如初级激活剂复合物)在激活时能够作用于无活性第二识别复合物的组分,以激活第二识别复合物成为激活的信号放大器,从而进一步放大信号(例如,释放可检测标记物)。组分中的每一者可以包含一种或多种分子(例如,一种或多种融合蛋白、一种或多种酶、一种或多种核酸、核酸和核酸的一种或多种融合物等)。与不包含放大器组分的系统相比,本文所述系统包含放大检测信号并且可以增加任意量的核酸检测的组分,包括但不限于1至10倍、1至50倍、1至100倍、1至500倍、1至1000倍(或其间的任何值)或更多。
在某些方面,本文描述了核酸检测系统,其包含:报告分子,其包含可检测标记物,其中在切割报告分子时释放可检测标记物用于检测;初级激活剂复合物,其包含第一识别复合物(“靶传感器”),其中第一识别复合物识别样品中的一个或多个靶序列(“初级激活剂”),其中在识别靶序列时,初级激活剂复合物被激活并且能够作用于报告分子并释放可检测标记物;以及次级放大器复合物,其包含第二无活性识别复合物,其中继在第二识别复合物的组分上激活的初级激活剂复合物的活性之后,第二识别复合物被激活并且识别一个或多个放大器序列(“激活剂”),并且作用于报告分子并释放可检测标记物,并且作用于其他无活性第二识别复合物,使得其被激活。因此,本发明涉及核酸检测系统,其包含:(i)报告分子,其包含可检测标记物,其中在切割报告分子时释放可检测标记物用于检测;(ii)初级激活剂复合物,其包含第一识别复合物,和(iii)无活性次级复合物,其中;(a)第一识别复合物识别样品中的一个或多个初级激活剂,其中;(b)在识别初级激活剂时,初级激活剂复合物被激活并且能够作用于报告分子以释放可检测标记物,并且;(c)激活的初级激活剂复合物能够作用于无活性第二识别复合物的组分以激活第二识别复合物成为激活的信号放大器,其中;(d)所述激活的信号放大器能够作用于报告分子以释放可检测标记物;并且;(e)所述激活的信号放大器能够作用于无活性第二识别复合物的组分,以激活第二识别复合物成为激活的信号放大器,从而启动前馈回路。
在其他方面,本文描述了核酸检测系统,其包含:报告分子,其包含可检测标记物,其中在切割报告分子时释放可检测标记物用于检测;初级激活剂复合物,其包含用第一向导RNA程序化的第一Cas效应物酶(“靶传感器”),其中第一向导RNA识别样品中的一个或多个靶序列(“初级激活剂”),其中第一向导RNA与靶序列杂交后,初级激活剂复合物被激活,展示切割报告分子并释放可检测标记物的非特异性核酸酶活性;以及信号放大器复合物,其包含第二Cas效应物酶和第二向导RNA,其中第二向导RNA识别一个或多个放大器序列(“激活剂”),其中在第二向导RNA与放大器序列杂交时信号放大器被激活,展示切割报告分子并释放可检测标记物的非特异性核酸酶活性,并且能够作用于额外的第二Cas效应物酶以激活它们成为信号放大器。因此,本发明涉及核酸检测系统,其包含:报告分子,其包含可检测标记物,其中在切割报告分子时释放可检测标记物用于检测;初级激活剂复合物,其包含用第一向导RNA程序化的第一Cas效应物酶,其中第一向导RNA识别样品中的一个或多个初级激活剂,其中在第一向导RNA与初级激活剂杂交时,初级激活剂复合物被激活并且是切割报告分子并释放可检测标记物的非特异性核酸酶;以及信号放大器,其包含第二Cas效应物酶和第二向导RNA,其中初级激活复合物的激活导致由第二向导RNA识别的一个或多个激活剂序列的激活,其中在第二向导RNA与激活剂序列杂交时,信号放大器复合物被激活并且是切割报告分子并释放可检测标记物的非特异性核酸酶。
本文所述的核酸检测系统优选涉及“前馈”回路,其中初级激活剂的检测触发初级激活复合物的激活,其进而导致次级激活剂复合物的激活以在存在靶标(最初由靶传感器/初级激活剂检测)的情况下放大可检测信号,例如,如下的系统,其中激活的初级激活剂复合物激活激活剂分子和/或次级向导RNA(例如,通过释放激活剂分子和/或次级向导RNA上的笼形(cage)结构),使得次级放大器复合物的第二向导RNA与释放的激活剂分子杂交,使得进一步淬灭的报告分子被切割并释放进一步可检测标记物。
在本文所述的核酸检测系统中的任一者中,第一和/或第二Cas效应物酶可以包含RNA酶和/或DNA酶,例如任何组合的一个或多个Cas13蛋白、一个或多个Cas12蛋白、一个或多个Cas14蛋白、一个或多个Csm6蛋白和/或一个或多个Csx1蛋白,任选地如所附表、图或实施例中的任一者所示列出的一个或多个蛋白(SEQ ID NO:115-268)。在某些实施方案中,第一和/或第二Cas效应物酶包含相同或不同的Cas13d蛋白中的一个或多个。一种或多种Cas效应物酶可以是相同或不同的蛋白质。此外,本文所述系统的第一和/或第二向导RNA可以包含一个或多个恒定区,包括但不限于所附表(例如表4)、图或实施例(SEQ ID NO:42-85)中的任一者中所示的相同或不同RNA中的一个或多个。
在本文所述的核酸检测系统中的任一者中,报告物可以包含与可检测标记物可操作地连接的淬灭剂,任选地其中可检测标记物可以包含一个或多个荧光分子(例如荧光染料)。报告分子可以包含连接淬灭剂和荧光团的寡核苷酸,其中寡核苷酸任选地包含笼锁的结构(caged structure),任选地具有茎环结构。报告分子可以包含表8所示的序列。在某些实施方案中,报告分子与反式笼形分子复合。
在本文所述的核酸检测系统中的任一者中,组分(例如激活剂、一种或多种向导分子、放大器序列和/或报告物)中的一种或多种可以是笼锁的(例如通过笼锁结构或分子)。在某些实施方案中,笼包含或创建具有茎环结构的分子(例如,寡核苷酸序列)。以激活剂一起包含的寡核苷酸序列可以包含DNA和/或RNA碱基并且另外地,DNA和/或RNA碱基中的一个或多个可以是修饰的核苷酸碱基,任选地包含一个或多个锁核酸(LNA)或部分和/或2’-OMeRNA。可以使用一种或多种笼锁结构,例如,其中放大器序列中的一个或多个在其3’和/或5’末端包含笼锁结构。一个或多个反式笼锁分子也可以用于本文所述的核酸系统中的任一者。
在本文所述的核酸检测系统中的任一者中,组分中的一个或多个之间的相互作用可以仅限于一定量的时间(例如,秒、分钟或更长),例如其中第一和第二向导RNA中的一个或两者和/或放大器序列中的一个或多个被修饰,以允许在最佳时间框内与Cas效应物酶进行条件性相互作用。在某些实施方案中,第一和第二向导RNA中的一个或两个和/或放大器序列中的一个或多个经修饰,以允许在最佳时间框内与Cas效应物酶进行条件性相互作用。在本文所述的核酸检测系统中的任一者中,一个或多个放大器序列包含聚U和/或聚A序列,任选地A4-Un、A5-Un和/或A6-Un序列。
本文所述的系统中的任一者的靶序列和/或放大器序列可以与第一和/或第二向导RNA是100%互补,或替代地,可以与第一和/或第二向导RNA不是100%互补。本文所述的系统中的任一者中的靶序列可以是来自一种或多种哺乳动物、病毒、细菌和/或真菌的DNA和/或RNA。在某些实施方案中,靶序列在RNA病毒,例如冠状病毒,任选地SARS-Cov-2冠状病毒中。
在本文所述的核酸检测系统中的任一者中,样品可以是生物样品或环境样品。生物样品可能包括从个体收集的血液、唾液、尿液、生检、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,口腔拭子、宫颈拭子、鼻拭子)、间质液、滑液、鼻排出物(discharge)、泪液、血沉棕黄层、粘膜样品和/或上皮细胞样品(例如,上皮细胞刮片)等。样品可以是液体样品,并且可以是无细胞的,或者是包含细胞的液体。
还描述了检测核酸(例如,靶序列)的方法,该方法包括:(a)使包含核酸(例如,靶序列)的样品与以下接触:(i)本文所述的核酸检测系统,和(b)测量来自可检测标记物的可检测信号,从而检测靶序列。在某些实施方案中,方法进一步包括定量可检测标记物的水平。接触步骤可以是在二价金属离子存在下,在无细胞环境或在细胞内在体外或体内进行。接触步骤可以进行任何长度的时间,包含秒、分钟或小时或更长(或其间的任何时间),任选地数秒至2小时(或其间的任何时间)。
因此,本发明的方法和组合物包含至少以下编号的实施方案:
实施方案
1.用于检测核酸的系统,其包含第一组分和第二组分,所述第一组分包含用于检测核酸的第一组合物,其在检测核酸时生成信号,所述第二组分包含第二组合物,其放大由所述第一组分生成的信号。
2.实施方案1的系统,其中所述第一和第二组分包含本文所述的任何组合物,包括如实施方案4-41中的任何组合物。
3.检测核酸的方法,所述方法包括使用如实施方案4至41中所述的一个或多个系统。
4.核酸检测系统,其包含:
i)报告分子,其包含可检测标记物,其中在切割所述报告分子时释放所述可检测标记物用于检测;
ii)初级激活剂复合物,其包含第一识别复合物,和;
iii)无活性次级复合物,其中;
a)所述第一识别复合物识别样品中的一个或多个初级激活剂,其中;
b)在识别所述初级激活剂时,所述初级激活剂复合物被激活并且能够作用于所述报告分子以释放所述可检测标记物,并且;
c)所述激活的初级激活剂复合物能够作用于无活性第二识别复合物的组分,以激活所述第二识别复合物成为激活的信号放大器,其中;
d)所述激活的信号放大器能够作用于所述报告分子以释放所述可检测标记物,并且;
e)所述激活的信号放大器能够作用于无活性第二识别复合物的组分,以激活所述第二识别复合物成为激活的信号放大器,从而启动前馈回路。
5.核酸检测系统,其包含:
报告分子,其包含可检测标记物,其中在切割所述报告分子时释放所述可检测标记物用于检测。
初级激活剂复合物,其包含用第一向导RNA程序化的第一Cas效应物酶,其中所述第一向导RNA识别样品中的一个或多个初级激活剂,其中在所述第一向导RNA与所述初级激活剂杂交时,所述初级激活剂复合物被激活并且是切割所述报告分子并释放所述可检测标记物的非特异性核酸酶;和
信号放大器,其包含第二Cas效应物酶和第二向导RNA,其中所述初级激活复合物的激活导致由所述第二向导RNA识别的一个或多个激活剂序列的激活,其中在所述第二向导RNA与所述激活剂序列杂交时,所述信号放大器复合物被激活并且是切割所述报告分子并释放所述可检测标记物的非特异性核酸酶。
6.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物酶包含RNA酶或DNA酶。
7.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物酶包含一个或多个Cas13蛋白、一个或多个Cas12蛋白、一个或多个Cas14蛋白、一个或多个Csm6蛋白和/或一个或多个Csx1蛋白,任选地如所附表、实施例或图中的任一者所示列出的一个或多个蛋白(例如,SEQ ID NO:115-268)。
8.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物包含一个或多个Cas13蛋白,任选地如所附表、实施例或图中的任一者所示列出的一个或多个Cas13蛋白(例如,SEQ ID NO:115-135)。
9.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物包含一个或多个Cas13d蛋白。
10.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物包含以任何组合的一个或多个Cas12蛋白、一个或多个Cas13蛋白、一个或多个Cas14蛋白和/或一个或多个Csm6蛋白。
11.前述实施方案中任一项的核酸检测系统,其中所述第一和第二Cas效应物酶包含相同或不同蛋白质中的一个或多个。
12.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二向导RNA包含一个或多个恒定区。
13.前述实施方案中任一项的核酸检测系统,其中所述第一和/或第二向导RNA包含所附表、图或实施例中的任一者的相同和/或不同RNA,任选地其中所述第一和/或第二向导RNA选自SEQ ID NO:42-85,如表4所示。
14.前述实施方案中任一项的核酸检测系统,其中所述报告分子包含与所述可检测标记物可操作地连接的淬灭剂,任选地其中所述可检测标记物包含一个或多个荧光分子。
15.前述实施方案中任一项的核酸检测系统,其中所述报告分子包含连接所述淬灭剂和所述荧光团的寡核苷酸,其中所述寡核苷酸任选地包含笼锁的结构,任选地具有或创建茎环结构。
16.前述实施方案中任一项的核酸检测系统,其中所述报告分子包含如表8所示的序列。
17.前述实施方案中任一项的核酸系统,其中所述报告分子与反式笼形分子复合。
18.前述实施方案中任一项的核酸检测系统,其中所述报告分子所述可检测标记物包含一个或多个荧光染料。
19.前述实施方案中任一项的核酸检测系统,其中所述激活剂分子是笼锁的,任选地包含或创建具有茎环结构的分子(例如,寡核苷酸)。
20.前述实施方案中任一项的核酸检测系统,其中所述激活剂分子进一步包含寡核苷酸序列,其中所述寡核苷酸序列包含修饰的核苷酸碱基。
21.前述实施方案中任一项的核酸检测系统,其中所述激活剂分子进一步包含寡核苷酸序列,其中所述寡核苷酸序列包含RNA和DNA碱基两者。
22.前述实施方案中任一项的核酸检测系统,其中所述向导分子是笼锁的,例如笼锁结构或笼锁分子,任选地包含或创建茎环结构。
23.前述实施方案中任一项的核酸检测系统,其中所述放大器序列中的一个或多个和/或所述向导序列中的一个或两个是笼锁的,任选地其中所述笼包含或创建一个或多个结构,诸如环结构和/或对所述放大器序列中的一个或多个的修饰,所述修饰包含一个或多个锁核酸(LNA)或部分和/或2’-OMe RNA。
24.前述实施方案中任一项的核酸检测系统,其中所述放大器序列中的一个或多个在其3’和/或5’末端包含笼锁结构。
25.前述实施方案中任一项的核酸检测系统,其进一步包含反式笼锁分子。
26.前述实施方案中任一项的核酸检测系统,其中所述组分中的一个或多个之间的相互作用限于一定量的时间(例如,秒,分钟或更长),例如其中所述第一和第二向导RNA中的一个或两个和/或所述放大器序列中的一个或多个经修饰以允许在最佳时间框内与Cas效应物酶进行条件性相互作用。
27.前述实施方案中任一项的核酸检测系统,其中所述放大器序列中的一个或多个包含聚U和/或聚A序列,任选地A4-Un、A5-Un和A6-Un序列。
28.前述实施方案中任一项的核酸检测系统,其中所述靶序列和/或放大器序列与第一和/或第二向导RNA是100%互补。
29.前述实施方案中任一项的核酸检测系统,其中所述靶序列和/或放大器序列与第一和/或第二向导RNA不是100%互补。
30.前述实施方案中任一项的核酸检测系统,其中所述靶序列是来自一种或多种哺乳动物、病毒、细菌或真菌的DNA或RNA。
31.前述实施方案中任一项的核酸检测系统,其中所述靶序列在RNA病毒中。
32.前述实施方案中任一项的核酸检测系统,其中所述靶序列在冠状病毒,任选地SARS-Cov-2冠状病毒中。
33.前述实施方案中任一项的核酸检测系统,其中所述样品是生物样品或环境样品。
34.前述实施方案中任一项的核酸检测系统,其中所述生物样品包括从个体收集的血液、唾液、尿液、生检、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,口腔拭子、宫颈拭子、鼻拭子)、间质液、滑液、鼻排出物、泪液、血沉棕黄层、粘膜样品、上皮细胞样品(例如,上皮细胞刮片)等。
35.前述实施方案中任一项的核酸检测系统,其中所述样品包括无细胞液体样品。
36.前述实施方案中任一项的核酸检测系统,其中所述样品包括无细胞液体环境样品。
37.前述实施方案中任一项的核酸检测系统,其中所述样品包括包含细胞的液体。
38.检测样品中靶序列的方法,所述方法包括
(a)使怀疑包含所述靶序列的样品与以下接触:
(i)前述权利要求中任一项的核酸检测系统,和
(b)测量来自所述可检测标记物的可检测信号,从而检测所述靶序列。
39.实施方案38的方法,其进一步包含定量所述可检测标记物的水平。
40.前述实施方案中任一项的方法,其中所述接触步骤在二价金属离子存在下,在无细胞环境中或在细胞内在体外或体内进行。
41.前述实施方案中任一项的方法,其中所述接触步骤是数秒至2小时。
根据整篇公开,这些和其他方面对于熟练技术人员来说将是显而易见的。
附图简述
图1A至1J是描绘了本文所述的示例性NCR系统的示意图。将理解的是,本发明的方法和组合物包括所有“混合搭配(mix and match)”变化,包括这些示例性NCR系统的组分的任何组合。图1A显示了初级激活剂复合物(1)包含用识别样品(例如,病毒DNA或RNA)中的期望靶核酸序列的向导RNA程序化的Cas效应物酶(Cas效应物酶和向导物是“靶传感器”,它识别“靶”核酸,也称为“初级激活剂”)(2)。在靶序列与靶传感器的向导RNA(也称为“crRNA”)杂交时,靶传感器被激活为Cas核酸酶,并展示非特异性RNA酶(例如,Cas13效应蛋白)或DNA酶(例如,Cas12效应蛋白)活性(“激活的传感器”)。激活的传感器切割报告分子(3)以释放可检测标记物(例如,从淬灭剂中释放荧光报告物),从而产生可检测信号(诸如荧光)。在该初级信号传导途径中,信号作为来自检测靶核酸的传感器的直接响应生成,其然后激活传感器(激活的传感器)。然后激活的传感器能够参与单链核酸的非特异性切割活性(“反式切割”)。如图1B所示,本文所述的NCR系统包括包含信号放大器(4)的额外信号放大途径,在某些实施方案中,该信号放大器包含用识别放大器RNA(5)的激活剂向导RNA程序化的第二Cas效应蛋白,该放大器RNA与信号放大器的向导RNA杂交以激活信号放大器成为能够切割报告分子(3)并放大从报告物检测到的信号(6)的非特异性核酸酶。如所示,放大器RNA(5)可以是笼锁的,使得其将不与放大器复合物相互作用。通过激活的传感器或放大器复合物的反式切割活性对笼形复合物中的单链环进行的切割释放笼并允许放大器RNA与放大器复合物相互作用。在一些实施方案中,向导物或crRNA也可以包含笼形复合物。在一些实施方案中,添加短的反式笼形分子以与激活剂或crRNA相互作用并且充当笼。在一些实施方案中,通过其他机制诸如通过使用适体、核酶等释放笼。图1C描绘了在信号放大途径中具有Cas12的初级激活剂复合物中Cas13的使用。图1D显示了在信号放大途径中在具有Cas12的初级激活剂复合物中Cas12的使用。在这种情况下,RT-LAMP(逆转录回路介导的等温扩增,(Fu et al(2011)Appl.BioChem.Biotechnol.163(7):845-50)用于扩增靶RNA。可以使用其他扩增技术,包括例如错配耐受LAMP、LAMP-T7、链置换扩增(SDA)、解旋酶依赖性扩增(HDA、重组酶聚合酶扩增(RPA)、基于核酸序列的扩增(NASBA)、转录介导的扩增(TMA)等(见下文)。图1E显示了在信号放大途径中在具有Cas13的初级激活剂复合物中的Cas13使用,并且图1F显示了在信号放大途径中在具有Cas13的初级激活剂复合物中的Cas12使用。在一些实施方案中,RT-LAMP-T7扩增用于扩增初级放大器,以增加由Cas13靶传感器复合物感测的靶分子的数量。这种情况在Cas13传感器复合物和Cas13扩增复合物的背景下(图1E)或在具有Cas13传感器复合物和Cas12传感器复合物的系统中(图1F)进行例示。图1G显示了使用示例性笼锁向导RNA,其中笼存在于向导RNA的5’(顶部)或3’(底部)末端。图1H描绘了使用笼锁的放大器和笼锁的向导物的两种策略,其中放大器可以包含RNA和DNA核苷酸两者。在一些实施方案中,可以使用不与放大器或向导RNA共价连接的寡核苷酸序列,其能够与放大器或向导物相互作用并充当笼(反式笼形分子)。图1I和图1J显示了使用Csm6放大信号的途径。在这些图中,术语“NCR”是指合成核酸,NCR后的数字代码鉴定特定核酸(例如,如所附表、实施例或图中的任一者所示)。“RNP”是指核糖核苷酸蛋白复合物,通常是Cas蛋白和crRNA或向导RNA。
图2描绘了在存在初级激活剂RNA(“有初级”显示为在每种条件下的右侧条)和不存在初级激活剂RNA(“无初级”显示为在每种条件下的左侧条)的情况下对若干激活剂RNA检测到的信号。“无次级”显示了在不存在初级或次级系统的情况下的信号。所指示的为在存在或不存在初级激活剂RNA的情况下展示差异信号的两个序列(NCR_061和NCR_064)。
图3A至3D描绘了显示4种激活剂RNA,NCR_045(图3A)、NCR_042(图3B)、NCR_061(图3C)和NCR_067(图3D)的信号随时间的变化的4副图。对于NCR_045和NCR_042,“单独的笼”是在仅存在扩增RNA的情况下观察到的信号;“初级”指示在没有任何二次扩增的情况下观察到的信号;并且“笼+初级”指示在存在所有组分时观察到的信号。对于NCR_061和NCR_067,数据曲线如图所示。“RNP2”是指次级放大器复合物。
图4A至4D是描绘了在一系列优化反应中观察到的信号的图。图4A显示了初级激活剂RNA浓度在200pM至20fM范围内变化时观察到的信号。在这些条件下,20pM处的信号在不存在NCR的情况下与存在NCR_061扩增的情况下相比展示出信号之间的最大差异。图4B描绘了信号随时间的生成证明在200pM时,NCR信号显现最快。图4C描绘了使用优化的向导RNA的信号。图4D显示了这些结果随时间的变化,并证明对于该向导物,20pM初级激活剂RNA的浓度显现最快。
图5A至5E显示了来自测试激活剂RNA的修饰的实验的结果。图5A显示了当激活剂包含反TAG序列时获得的信号,并且图5B显示了当反TAG不存在时的信号。“正常”指示当使用缺乏反TAG序列的激活剂RNA时观察到的数据。当包含反TAG序列时,观察到差异信号。图5C至5E显示了激活剂RNA中的变化对信号放大的作用。图5C描绘了在激活剂RNA上没有任何笼的情况下随时间的信号生成。图5D和图5E显示了当激活剂在笼形结构中具有更多尿苷时对信号生成的作用。
图6A至6C描绘了与使用笼锁的向导RNA相关的序列和数据。图6A描绘了向导RNA(NCR_018,SEQ ID NO:21)。图6B描绘了当使用笼锁的NCR_018或其关联的解笼锁的等同物(NCR_009)时观察到的数据。使用两种浓度(10pM和10nM)的NCR_009。图6C描绘了在存在初级激活剂和次级激活的情况下,当从信号中减去背景信号时观察到的结果。
图7描绘了用替代的笼锁向导RNA获得的数据的图。描绘的数据是当在存在初级和次级(笼)的情况下获得的数据时观察到的信号具有从仅初级信号中观察到的信号并且从其减去从仅次级(笼)信号中观察到的信号。
图8是显示当使用包含不同单链环结构的笼锁向导RNA时观察到的信号动力学的图。向导物的茎环部分通过所指示的其熔解温度表征。使用包含具有较低熔解温度的茎环的向导物观察到更快的信号动力学。
图9A至9F显示了使用反式笼形分子的实验的结果。图9A描绘了向导RNA(NCR_004),其缺乏其自身笼形结构,但在顶部显示与反式笼形分子NCR_271复合。下面较低处显示NCR_004与从上到下包括NCR_268、NCR_269、NCR_270、NCR_271和NCR_272的一系列反式笼形分子比对。图9B(NCR_269)、图9C(NCR_268)、图9D(NC%_270)、图9E(NCR_271)和图9F(NCR_272)描绘了使用不同反式笼形分子以反式笼与向导RNA的不同比率生成的信号。
发明详述
目前涉及Cas蛋白的基于CRISPR的核酸检测方法利用了以下事实:Cas13或Cas12酶可以用识别期望靶序列的向导RNA进行程序化,激活非特异性RNA酶或DNA酶活性。非特异性核酸酶用于释放可检测标记物,诸如淬灭的荧光报告物,导致可检测的信号,诸如荧光。然而,目前的方法在灵敏性上可能受到限制。目前的方法还可以需要特定的设备(例如PCR仪)、专门的条件(例如,温度)、重复的手动技术,诸如多个移液步骤或导致长报告时间的其他复杂化的步骤。
因此,本文描述了核酸检测组合物、系统和方法,其通过提供包含内部核酸酶链反应(NCR)的全合一检测模式克服了目前方法的局限性,该反应赋予放大的前馈回路以在检测靶核酸时生成指数信号并提供靶序列的高效检测。本文所述的NCR组合物、系统和方法提供任何靶DNA或RNA的灵敏且快速检测,包括用于检测转录状态、癌症或病原体,诸如细菌或病毒,包括冠状病毒,诸如SARS-CoV-2(与COVID-19疾病相关)。
概述
除非另有说明,否则这些方法的实践以及本文公开的组合物的制备和用途均采用了本领域技术范围内的分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和相关领域的常规技术。
定义
“寡核苷酸”、“多核苷酸”和“核酸”在本文中可互换使用。这些术语可以指任何长度、链型(双或单)的核酸的聚合物形式,以及核糖核苷酸(RNA)或脱氧核糖核苷酸(DNA)和杂交分子(包含DNA和RNA)。所公开的核酸还可以包括天然存在的和合成的或非天然的核碱基。天然核碱基包含腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)、鸟嘌呤(G)和尿嘧啶(U)。
“互补性”是指允许其与第二核酸“碱基配对”、“结合”、“退火”或“杂交”的具有第一序列的第一核酸。结合可能受到互补的量和某些外部条件(诸如环境的离子强度、温度等)的影响。碱基配对规则在本领域是众所周知的(DNA中A与T配对,RNA中A与U配对;以及G与C配对)。在一些情况下,RNA可能包含G可能与U配对的配对。在所有情况下,互补性并不表明完全或100%互补。例如,互补性可能低于100%并且超过约60%。
“蛋白质”、“肽”、“多肽”可互换使用。这些术语是指任何长度的氨基酸是聚合物形式,其可能包括天然和非天然残基。残基也可以在掺入多肽之前或之后进行修饰。在一些实施方案中,多肽可以是分支的以及线性的。
“程序化”,在提及Cas蛋白时,是指包含含有与靶序列互补的序列的向导RNA的Cas蛋白。通常,程序化Cas蛋白包含工程化向导RNA。
“Cas蛋白”是CRISPR相关蛋白。目前公开的Cas蛋白具有核酸酶活性,在靶序列与由Cas蛋白结合的向导RNA结合时可能被激活。如下文更详细的公开,向导RNA可能与其他序列一起构成crRNA,在一些实施方案中,它可能从前crRNA序列加工。在实施方案中,向导RNA序列可能包括天然或合成核酸,例如修饰的核酸,诸如但不限于锁核酸(LNA)、2’-去甲基化碱基,甚至ssDNA(单链DNA)。Cas蛋白可能来自Cas12或Cas13组,这可能衍生自本领域技术人员已知的各种来源。
Cas蛋白可以是天然存在的Cas蛋白的“功能性衍生物”。天然序列多肽的“功能衍生物”是与天然序列多肽具有共同定性生物学特性的化合物。“功能性衍生物”包括但不限于天然序列的片段和天然序列多肽及其片段的衍生物,前提是它们具有与相应天然序列多肽相同的生物活性。本文考虑的生物活性是功能性衍生物将DNA底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体、共价修饰及其融合物。Cas多肽或其片段的适当衍生物包括但不限于Cas蛋白或其片段的突变体、融合物、共价修饰。Cas蛋白包括Cas蛋白或其片段,以及Cas蛋白或其片段的衍生物,其可从细胞中获得或化学合成或通过这两种规程的组合合成。细胞可以是天然产生Cas蛋白的细胞,或天然产生Cas蛋白并且经基因工程化改造以产生较高表达水平的内源性Cas蛋白,或者由外源性引入的核酸产生Cas蛋白的细胞,其核酸编码与内源性Cas相同或不同的Cas。在一些情况下,该细胞不天然产生Cas蛋白并且经基因工程化改造以产生Cas蛋白。
“编码序列”是编码多肽序列或RNA序列的DNA序列,例如向导RNA。编码多肽的编码序列首先转录为RNA,其进而可以编码多肽的氨基酸序列。一些RNA序列,诸如向导RNA可能不编码氨基酸序列。
“天然”、“天然存在”、“未修饰”或“野生型”,除了别的之外,描述了自然界中发现的蛋白质、氨基酸、细胞、核碱基、核酸、多核苷酸和生物体。例如,与自然界中发现的相同且尚未由人修饰的核酸序列是天然序列。
“可杂交”或“互补”或“基本上互补”,是指在适当的体外和/或体内温度和溶液离子强度条件下,核酸(例如RNA、DNA)包含使其能够与另一种核酸以序列特异性、反平行的方式(即核酸与互补核酸特异性结合)非共价结合,即形成Watson-Crick碱基对和/或g/U碱基对、“退火”或“杂交”的核苷酸序列。标准Watson-Crick碱基配对包含:腺嘌呤/腺苷)(A)与胸苷/胸苷(T)配对,A与尿嘧啶/尿苷(U)配对,以及鸟嘌呤/鸟苷)(G)与胞嘧啶/胞苷(C)配对。此外,对于两个RNA分子(例如dsRNA)之间的杂交,以及对于DNA分子与RNA分子的杂交(例如,当DNA靶核酸与向导RNA碱基配对等):G也可以与U碱基配对。例如,在tRNA反密码子与mRNA中的密码子碱基配对的背景下,G/U碱基配对部分负责遗传密码的简并性(即冗余性)。因此,在本公开的背景下,认为G(例如,向导RNA分子的蛋白结合区段(例如,dsRNA双链体)的G;与向导RNA碱基配对的靶核酸(例如,靶DNA)的G)与U和C两者互补。例如,当可以在向导RNA分子的蛋白结合区段(例如,dsRNA双链体)的给定核苷酸位置进行G/U碱基配对时,该位置不认为是非互补的,而认为是互补的。
杂交要求两个核酸含有互补序列,尽管碱基之间的错配是可能的。适用于两种核酸之间杂交的条件取决于核酸的长度和互补程度,这是本领域众所周知的变量。两个核苷酸序列之间的互补程度越大,具有这些序列的核酸的杂交体的熔解温度(Tm)值越大。通常,可杂交核酸的长度为8个核苷酸或更多(例如,10个核苷酸或更多、12个核苷酸或更多、15个核苷酸或更多、20个核苷酸或更多、22个核苷酸或更多、25个核苷酸或更多或30个核苷酸或更多)。
应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补才能特异性杂交。此外,多核苷酸可以在一个或多个区段上杂交,使得间插或相邻的区段不参与杂交事件(例如,环状结构或发夹结构、“凸起”等)。多核苷酸可以包含与其将杂交的靶核酸序列内的靶区域的60%或更多、65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多或100%序列互补性。例如,反义核酸,其中反义化合物的20个核苷酸中的18个与靶区域互补并因此将特异性杂交,将代表90%互补性。其余的非互补核苷酸可能聚集或散布有互补核苷酸,并且不需要彼此相邻或与互补核苷酸相邻。可以使用任何方便的方法确定核酸内特定核酸序列延展段(stretch)之间的互补百分比。示例方法包括BLAST程序(局部比对检索基本工具)和PowerBLAST程序(Altschul et al.,J.Mol.Biol.,1990,215,403-410;Zhang and Madden,Genome Res.,1997,7,649-656)或通过使用Gap程序(Wisconsin Sequence AnalysisPackage,Version 8for Unix,Genetics Computer Group,University Research Park,Madison Wis.),例如使用默认设置,其使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489)。
如本文所用,“结合”(例如,参考多肽的RNA结合域、与靶核酸的结合等)是指大分子之间(例如,蛋白质和核酸之间;向导RNA和靶核酸之间;以及等等)的非共价相互作用。而在非共价相互作用状态下,大分子被称为“缔合”或“相互作用”或“结合”(例如,当分子X被称为与分子Y相互作用时,它意指分子X以非共价方式与分子Y结合)。并非结合相互作用的所有组分均需要有序列特异性(例如,与DNA主链中的磷酸盐残基接触),但结合相互作用的一些部分可能有序列特异性。结合相互作用通常通过小于10-6M、小于10-7M、小于10-8M、小于10-9M、小于10-10M、小于10-11M、小于10-12M、小于10-13M、小于10-14M或小于10-15M的解离常数(Kd)表征。“亲和力”是指结合的强度,结合亲和力增加与Kd降低相关。
“结合域”是指能够与另一个分子非共价结合的蛋白质域。结合域可以与例如RNA分子(RNA结合域)和/或蛋白质分子(蛋白质结合域)结合。对于具有蛋白质结合域的蛋白质,其可以在一些情况下与自身结合(以形成同源二聚体、同源三聚体等)和/或其可以与一种或多种不同蛋白质的一个或多个区域结合。
术语“保守氨基酸取代”是指具有相似侧链的氨基酸残基的蛋白质中的可互换性。例如,一组具有脂肪族侧链的氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;一组具有脂肪族-羟基侧链的氨基酸由丝氨酸和苏氨酸组成;一组具有含酰胺侧链的氨基酸由天冬酰胺和谷氨酰胺组成;一组具有芳香族侧链的氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;一组具有碱性侧链的氨基酸由赖氨酸、精氨酸和组氨酸组成;一组具有酸性侧链的氨基酸由谷氨酸和天冬氨酸组成;一组具有含硫侧链的氨基酸由半胱氨酸和甲硫氨酸组成。示例性保守氨基酸取代基团为:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸-甘氨酸和天冬酰胺-谷氨酰胺。
本文中可互换使用的术语“DNA调控序列”、“控制元件”和“调控元件”是指转录和翻译控制序列,诸如启动子、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号等,其提供和/或调控非编码序列(例如向导RNA)或编码序列(例如蛋白质编码)的转录和/或调控所编码多肽的翻译。
如本文所用,“启动子序列”是能够结合RNA聚合酶并启动下游(3’方向)编码或非编码序列的转录的DNA调控区域。真核启动子将通常(但并不总是)含有“TATA”框和“CAT”框。各种启动子,包含可诱导型启动子,可以用于驱动本公开的各种核酸(例如载体)。
如本文所用,用于核酸、多肽、细胞或生物体的术语“天然存在”或“未修饰”或“野生型”是指自然界中发现的核酸、多肽、细胞或生物体。
如本文所用,“重组体”意指特定核酸(DNA或RNA)是克隆、限制性、聚合酶链反应(PCR)和/或连接步骤的各种组合的产物,产生具有可与天然系统中发现的内源性核酸区分的结构性编码或非编码序列的构建体。编码多肽的DNA序列可以由cDNA片段或一系列合成的寡核苷酸组装,以提供合成的核酸,该核酸能够由细胞中含有的重组转录单元或无细胞转录和翻译系统表达。包含相关序列的基因组DNA也可以用于重组基因或转录单元的形成。非翻译DNA的序列可能存在于开放阅读框的5’或3’,其中此类序列不干扰编码区的操纵或表达,并且确实可能通过各种机制作用以调节期望产物的产生(参见下文“DNA调控序列”)。替代地,编码未翻译的RNA(例如向导RNA)的DNA序列也可视为重组体。因此,例如,术语“重组”核酸是指非天然存在的核酸,例如,通过人工干预将两个另外分离的序列区段的人工组合制成。这种人工组合通常通过化学合成手段,或通过人工操纵分离的核酸区段,例如通过基因工程技术来完成。这通常是用编码相同氨基酸、保守氨基酸或非保守氨基酸的密码子替换密码子来完成。替代地,将期望功能的核酸区段连接在一起,以生成期望的功能组合。这种人工组合通常通过化学合成手段,或通过人工操纵分离的核酸片段,例如通过基因工程技术来完成。当重组多核苷酸编码多肽时,所编码多肽的序列可以是天然存在的(“野生型”),或可以是天然存在序列的变体(例如,突变体)。因此,术语“重组”多肽不一定是指其序列不天然存在的多肽。相反,“重组”多肽由重组DNA序列编码,但多肽的序列可以是天然存在的(“野生型”)或非天然存在的(例如,变体、突变体等)。因此,“重组”多肽是人干预的结果,但可以是天然存在的氨基酸序列。
“载体”或“表达载体”是复制子,诸如质粒、噬菌体、病毒或粘粒,可以将另一个DNA区段(即“插入物”)附接到该复制子上,从而引起所附接区段在细胞中的复制。
“表达盒”包含与启动子可操作地连接的DNA编码序列。“可操作地连接”是指并置,其中如此描述的组分处于允许它们以其预期的方式发挥功能的关系中。举例来说,如果启动子影响编码序列转录或表达,则该启动子与该编码序列可操作地连接。
术语“重组表达载体”或“DNA构建体”在本文中可互换使用,指包含载体和一个插入物的DNA分子。通常生成重组表达载体用于表达和/或繁殖插入物,或用于构建其他重组核苷酸序列的目的。插入物可能或可能不与启动子序列可操作地连接,可能或可能不与DNA调控序列可操作地连接。
任何给定组分或组分的组合均可以是未标记的,或可以是具有标记部分的可检测标记物。在一些情况下,当两个或更多个组分经标记时,它们可以用彼此可区分的标记部分进行标记。
“标记物”或“标记”是指通过一种或多种技术使得组分可鉴定的具有分子的组分。标记物的非限制性实例包括链霉亲和素和荧光分子。术语“荧光剂”是指能够在可检测范围内展示荧光的物质或其部分。可通过与标记物的结合相互作用(例如,生物素结合链霉亲和素)或通过使用荧光计检测荧光信号来检测标记物。其他可检测标记物包括酶标记物,诸如萤光素酶、过氧化物酶或碱性磷酸酶。“报告基因”或“报告序列”是指产生易于测量的蛋白质产物的任何序列,优选地尽管在常规测定中不必需。合适的报告基因包括但不限于编码有色或荧光或发光蛋白(例如,绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白)的序列。在一些实施方案中,酶标记物通过分裂成两个或更多个碎片的方式失活,这些碎片通过可由CRISPR酶活性靶向的核酸接头连接(例如,在初级激活剂存在下的激活后的反式切割)。在切割接头时,酶报告基因的碎片将能够组装成活性酶,其可以作用于底物以生成可检测信号。
如本文所用,术语“样品”是指包含RNA或DNA的任何样品(例如,为了确定多核苷酸序列群体中是否存在靶序列)。样品可以衍生自任何来源,例如,样品可以是纯化RNA/DNA的合成组合;样品可以是细胞裂解物、RNA/DNA富集细胞裂解物或从细胞裂解物中分离和/或纯化的RNA/DNA。样品可以是环境样品、农业样品或食品样品。样品可以来自患者(例如,用于诊断目的)。样品可以选自或衍生自血液、汗液、血浆、血清、痰液、唾液、粘液、细胞、排泄物、尿液、脑脊液(CSF)、乳汁、精液、阴道液、组织等中的一种或多种中。样品可以来自透化细胞。样品可以来自交联细胞。样品可以是组织切片。样品可以来自通过交联、继而脱脂和调整以使折射率均匀来制备的组织。通过交联,继而脱脂和调整以使折射率均匀进行的组织制备的实例已描述于例如,Shah et al.,Development(2016)143,2862-2867doi:10.1242/dev.138560中。
当提供一系列值时,除非上下文另有明确规定,否则应理解为在该范围的上限和下限与该范围内的任何其他规定值或中间值之间的每个中间值(至下限单位的十分之一)涵盖在本发明中。这些较小范围的上限和下限可以单独包括在较小范围内,并且也涵盖在本发明中,受制于规定范围中任何特定排除的限度。如果规定范围包含限度中的一个或两个,则排除那些所包括限度中的一个或两个的范围也包括在本发明中。
除非另有规定,否则本文中使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。尽管与本文描述的任何方法和材料类似或相当的那些也可以用于本发明的实践或试验,但现在描述了优选方法和材料。本文提及的所有出版物均通过引用并入本文,以公开和描述与所引用出版物相关的方法和/或材料。
必须指出的是,如本文和所附权利要求中所用,单数形式“一个”、“一种”和“该”包含复数指代,除非上下文另有明确规定。因此,举例来说,提及“CRISPR/Cas效应蛋白”包括多个CRISPR/Cas效应蛋白(包括相同或不同的Cas效应蛋白),提及“向导RNA”包括提及一种或多种向导RNA和本领域技术人员熟知的其等效物,以及等等。进一步指出的是,可以起草权利要求以排除任何任选要素。因此,本声明旨在充当使用“仅有地”、“仅”等排他性术语的前提基础,以便与权利要求要素的陈述或使用“负”限制相关。
应当理解,为清楚起见,在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为简洁起见,在单个实施方案的上下文中描述的本发明的各种特征,也可以单独提供或在任何适当的子组合中提供。本发明特别包含与本发明有关的实施方案的所有组合,并在本文中进行公开,就像各个和每个组合均单独且明确公开一样。此外,本发明还特别包含了各种实施方案及其要素的所有子组合,并在本文中进行公开,就像各个和每个此类子组合均在本文中单独且明确公开一样。
本文讨论的出版物仅提供其在本申请的提交日期之前的公开。本文中的任何内容均不应解释为承认,根据先前发明,本发明无权在此类出版物之前。此外,提供的出版日期可能与实际出版日期不同,可能需要独立确认。用于检测样品中是否存在特定靶核酸序列(例如,RNA或DNA)的组合物、方法和系统,允许通过由一种或多种特定核酸序列的存在进行鉴定,以具有成本效益地诊断患有病毒、细菌、寄生物或真菌感染或病况、疾病或病症的患者或样品。本发明的组合物、方法和系统也可用于遗传筛查、癌症筛查、突变分析、microRNA分析、mRNA分析、单核苷酸多态性分析等。
组合物和系统
提供了用于检测样品中靶RNA或DNA序列(双链或单链)的组合物、系统和方法。特别地,本文描述了包含内部NCR的系统,其生成放大的前馈回路,以在检测靶核酸时提供信号的指数增加。系统和方法可以包含任何数量和类型的检测和/或放大组分,例如,如下的系统,其包括包含能够检测感兴趣的核酸并在检测后生成信号的检测器的至少第一组分和包含增加(放大)在感兴趣的核酸的存在下生成的信号的放大器的第二组分。组分(例如检测器和/或放大器)可以包含任意数量的相同或不同分子,包括但不限于核酸结合分子,诸如分裂酶(split-enzymes)、Ttago(argonaute)蛋白、可程序化单向导RNA等。
本文所述的组合物和系统可以包含(i)靶传感器,其包含与第一向导RNA缔合的第一Cas效应蛋白(例如用于检测RNA的Cas13蛋白、用于检测DNA的Cas12蛋白或Cas14),该第一向导RNA识别(杂交)样品的RNA或DNA靶序列(初级激活剂);(ii)无活性报告分子(复合物),其包含经由不由第一向导RNA识别的序列与淬灭剂连接的可检测标记物(例如,荧光部分),该报告物在切割时,例如通过从复合物中释放可检测标记物的核酸酶进行切割(例如反式切割)(例如对将标记物与淬灭剂或笼连接的序列进行切割)时被激活,使得其可以被测量;(iii)信号放大器,其包含与第二向导RNA缔合的第二Cas效应蛋白,或信号放大器,其包含在笼锁向导RNA的存在下的第二Cas效应蛋白,使得信号放大器无活性,直到已释放笼;以及(iv)激活剂分子(本文中也称为“放大激活剂”),其包含由信号放大器的第二向导RNA识别的序列,任选地其中激活剂分子是无活性报告物复合物的部分,其中激活剂与信号放大器的结合(例如,激活剂与信号放大器的向导RNA杂交)激活信号放大器,使得其成为能够切割报告物以释放可检测标记物的非特异性核酸酶。
如图1A-1J所示,在第一Cas效应蛋白与初级激活剂序列(经由第一向导RNA)杂交(结合)成靶传感器时,形成包含非特异性RNA酶(Cas13效应物)或DNA酶(Cas12效应物或Cas14效应物)的激活的初级激活剂复合物。该激活的初级激活剂复合物展示反式、非特异性核酸酶活性,其然后通过切割无活性报告物复合物来激活报告物(可检测标记物),使得标记物可检测(不再淬灭),其中该反应仅在存在靶标的情况下发生。此外,激活的初级激活剂复合物可以释放激活剂分子,使得次级放大器复合物的第二向导RNA与释放的激活剂分子杂交,或者释放次级向导RNA以与缺乏复合向导RNA的Cas蛋白(apo Cas蛋白)和游离激活剂结合。当与激活剂分子杂交时,次级放大器复合物变成能够切割无活性报告物复合物的激活的非特异性反式RNA酶或反式DNA酶,从而进一步的可检测标记物得到释放或反式切割活性起作用,使得释放笼,从而允许笼锁的激活剂RNA和/或笼锁的向导RNA与次级放大器复合物相互作用。该过程被称为“前馈放大”。两个激活的传感器(初级激活剂复合物和次级放大器复合物)的存在放大在初级激活剂序列存在下获得的信号,用于快速和灵敏的检测。在该系统中,初级激活剂复合物导致来自初级激活剂复合物检测的信号的线性扩增,而次级扩增系统的添加导致指数扩增。在一些情况下,笼包含一个或多个茎环结构。在一些情况下,环结构通过添加互补序列在RNA上引起,该互补序列将在RNA上折回,在一些情况下留下单链环。通过这种方法,笼序列的添加引起RNA上一个或多个茎环的形成。
因此,所公开的系统提供了多种来源的核酸靶序列的廉价和快速的检测,该来源包括哺乳动物、病毒、细菌、真菌等,具有最小样品制备,并且具体地不需要从样品中扩增核酸。样品可以是来自人或非人患者的生物样品,也可以是来自水、食物等的环境样品。
Cas和Csm6传感器和信号放大器
任何Cas蛋白均可以用于组合物和系统的Cas效应分子(靶传感器和/或信号放大器),包括但不限于来自任何类型CRISPR/Cas系统的Cas蛋白(例如II型、III型、V型、VI型)、Csm6蛋白、Csx1蛋白等。
Cas蛋白可以衍生自任何合适的来源,包含古细菌和细菌。在一些实施方案中,天然Cas蛋白可以衍生自Paludibacter、肉杆菌属(Carnobacterium)、李斯特氏菌属(Listeria)、Herbinix、红细菌属(Rhodobacter)、纤毛菌属(Leptotrichia)、毛螺菌科(Lachnospiraceae)、真杆菌(Eubacterium)或梭菌属(Clostridium)。在一些实施方案中,天然Cas蛋白可以衍生自Paludibacter propionicigenes、鸡肉杆菌(Carnobacteriumgallinarum)、斯氏李斯特氏菌(Listeria seeligeri)、纽约李斯特氏菌(Listerianewyorkensis)、Herbinix hemicellulosilytica、夹膜红细菌(Rhodobactercapsulatus)、Leptotrichia wadei、口腔纤毛菌(Leptotrichia buccalis)、Leptotrichiashahii、毛螺菌科细菌NK4A179、毛螺菌科细菌MA2020、直肠真杆菌(Eubacteriumrectale)、毛螺菌科细菌NK4A144和嗜胺梭菌(Clostridium aminophilum)。
本文所述的Cas蛋白可以与天然Cas蛋白同源。在一些实施方案中,所公开的Cas蛋白与天然Cas蛋白序列大于75%、80%、85%、90%、95%、97%、98%或99%,和小于约100%、99%、98%、97%、95%、90%、85%、80%或75%相同。所公开的Cas蛋白可以具有一个或多个HEPN域,并且在激活后可以能够切割单链RNA,包括前体向导RNA和指示RNA。
Cas蛋白的激活可以包含将一个或多个靶序列和与Cas蛋白缔合的向导RNA序列接触。在一些实施方案中,Cas蛋白的向导RNA可以有助于通过与互补靶RNA序列杂交来激活Cas蛋白的RNA酶活性。
所公开的Cas蛋白可以是任何Cas蛋白,包括但不限于V型(例如,Cas12和/或Cas14)、VI型(例如,Cas13)和/或III型(例如,Csm6)蛋白。
在某些实施方案中,组合物、系统和方法包括具有4个当前表征的亚型的一个或多个Cas13蛋白(Cas13a-d),除了两个共有HEPN(高等真核生物和原核生物核苷酸结合域)RNA酶基序R-X4–6-H外,各自表现出显著的序列差异。为了防御病毒感染,Cas13酶以HEPN非依赖性方式将precrRNA加工成成熟crRNA向导物,然后顺式进行HEPN依赖性切割互补“激活剂”靶RNA。在靶标依赖性激活时,Cas13也能够反式切割旁观者RNA,反映了能够顺式和反式切割两者的一般RNA酶活性。(参见,例如,美国公布号20200032324和WO2017218573,Konnermann et al(2018)Cell Apr 19;173(3):665-676;Zhang et al(2018)Cell 175(1),212-223)。VI-A型CRISPR-Cas系统的特征蛋白Cas13a(以前称为C2c2)是双重核酸酶,负责crRNA成熟和RNA激活的ssRNA切割两者(East-Seletsky et al.,(2016)Nature 538(7624):270-273)。Cas13a与前体crRNA(pre-crRNA)转录物结合,并在重复区域内切割它们以产生成熟的crRNA。当将pre-crRNA加工成个别的成熟crRNA时,在CRISPR阵列中分隔间隔物区中的每一个的重复区的8个核苷酸的片保持附接至成熟crRNA并且被称为“标签”。与具有对crRNA的互补性的ssRNA激活剂(靶)序列的结合激活Cas13a进行反式ssRNA切割,潜在触发宿主生物体的细胞死亡或休眠。然而,如果靶标或激活剂RNA包含与标签序列互补的序列(称为“反标签”),则复合物被抑制而不被激活。认为这是参与预防自身免疫的机制(Meeske&Marriffini(2018)Mol Cell 71:791)。Cas13a的反式ssRNA活性可以用于释放RNA上的笼形结构;该活性可以通过使用与不同Cas13a同系物偏好相对应的笼序列进行微调。
在一些实施方案中,Cas13蛋白是Cas13a多肽,其包含与任何Cas13a氨基酸序列,例如表1和/或实施例3中所示的Cas13a序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%氨基酸序列同一性的氨基酸序列。
表1:示例性Cas13a蛋白
Figure BDA0004113726330000231
Figure BDA0004113726330000241
其他Cas13蛋白包含BzoCas13b(动物溃疡伯杰氏菌(Bergeyella zoohelcum);WP_002664492);PinCas13b(中间普雷沃氏菌(Prevotella intermedia);WP_036860899);PbuCas13b(颊普雷沃氏菌(Prevotella buccae);WP_004343973);CasAsp13b(另枝菌属种(Alistipes sp.)ZOR0009;WP_047447901);PsmCas13b(普雷沃氏菌属种(Prevotella sp.)MA2016;WP_036929175);RanCas13b(鸭疫里默氏杆菌(Riemerella anatipestifer);WP_004919755);PauCas13b(桔红色普雷沃氏菌(Prevotella aurantiaca);WP_025000926);PsaCas13b(解糖普雷沃氏菌(Prevotella saccharolytica),WP_051522484);Pin2Cas13b(中间普雷沃氏菌;WP_061868553);CcaCas13b(犬咬二氧化碳嗜纤维菌(Capnocytophagacanimorsus);WP_013997271);PguCas13b(古卟啉单胞菌(Porphyromonas gulae);WP_039434803);PspCas13b(普雷沃氏菌种P5-125,WP_0440652940);PgiCas13b(牙龈卟啉单胞菌(Porphyromonas gingivalis);WP_053444417);FbrCas13b(嗜枝黄杆菌(Flavobacterium branchiophilum);WP_014084666);和Pin3Cas13b(中间普雷沃氏菌;WP_050955369);FnsCas13c(坏死梭杆菌基形亚种(Fusobacterium necrophorumsubsp.funduliforme)ATCC 51357contig00003;WP_005959231.1);FndCas13c(坏死梭杆菌(Fusobacterium necrophorum)DJ-2contig0065,全基因组鸟枪序列;WP_035906563.1);FnfCas13c(坏死梭杆菌基形亚种1_1_36Scont1.14;EHO19081.1);FpeCas13c(极臭梭杆菌(Fusobacterium perfoetens)ATCC 29250T364DRAFT_scaffold00009.9_C;WP_027128616.1);FulCas13c(溃疡梭杆菌(Fusobacterium ulcerans)ATCC 49185cont2.38;WP_040490876.1);AspCas13c(厌氧小杆菌属种(Anaerosalibacter sp.)ND1基因组组装Anaerosalibacter massiliensis ND1;WP_042678931.1);瘤胃球菌属种(Ruminococcussp)Cas13d,(GI:1690532978);EsCas13d(惰性真杆菌([Eubacterium]siraeum)DSM 15702;GI:1486942132或GI:1486942131)和Cas13d同系物在美国专利公布20190062724中公开。
在某些实施方案中,组合物、系统和方法包括一种或多种V型Cas蛋白。V型CRISPR/Cas蛋白的非限制性实例包括Cas12和Cas14蛋白。参见,例如美国公布号20190241954。在一些实施方案中,Cas12蛋白是Cas12多肽,其包含与任何Cas12氨基酸序列例如,如图6A-6C所示的Cas12序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%氨基酸序列同一性的氨基酸序列。参见,例如,PCT/US2020/021213、WO2020023529、WO2019104058和WO2019089796。
在一些实施方案中,Cas14蛋白是Cas14多肽,其包含与任何Cas14氨基酸序列,例如,如图6所示的Cas14序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%氨基酸序列同一性的氨基酸序列。参见Harringtonetal等人(Harrington LB,(2018)Science362(6416):839–842)和PCT/US2020/021214(Cas14)。参见,例如,PCT/US2020/021214。
在某些实施方案中,本文所述的系统、组成和方法包括Csm6蛋白。Csm6是与III型CRISPR-Cas系统相关的单链核糖核酸(ssRNA)内切核酸酶家族。Csm6的RNA切割活性可以通过环状寡腺苷酸(cAn)或携带末端2’-3’环状磷酸盐的短线性寡腺苷酸(an>P)的结合而被别构激活。Csm6已在SHERLOCK系统中用于放大病毒RNA的检测。在一些实施方案中,使用EiCasm6(意大利肠球菌(Enterococcus italicus);WP_007208953.1)、LsCsm6(唾液乳杆菌(Lactobacillus salivarius);WP_081509150.1)和/或TtCsm6(嗜热栖热菌(Thermusthermophilus);WP_011229148.1)。在一个实施方案中,TtCsm6被具有四个腺苷(cA4或a4>P)长度的寡腺苷酸特异性激活,并表现出对具有A和C的RNA序列的切割偏好。在一个实施方案中,EiCsm6和/或LsCsm6与包含A6长度的导引器一起使用,以在切割受保护(笼锁)放大器RNA后放大信号。因此,Csm6变体可以用于在存在靶标的情况下放大可检测信号,例如通过纳入包含此类优选序列的合适底物(例如触发底物)。例如,在一些实施方案中,将包含RNA的A6U5添加到包含Cas13和EiCsm6的反应混合物中,使得Cas13与其初级RNA激活剂相互作用后被激活时,A6U6 RNA的Cas13的反式切割将产生EiCsm6的激活剂,导致EiCsm6切割报告分子,从而放大由Cas13与其初级激活剂的原始相互作用所启动的信号。在另一个实施方案中,在包含TtCsm6而不是EiCsm6的反应中使用A5Ux RNA(Gootenberg et al,(2018)Science360(6387):439)。
在实施方案中,Cas蛋白是修饰的蛋白质,对其进行修饰、工程化或突变,以改变其与向导或靶序列的相互作用和/或改变其核酸酶活性,例如特异性、翻转、核苷酸偏好等。在其他实施方案中,Cas蛋白可以与另一种蛋白质、肽或标志物融合,以帮助分离、鉴定、分开、核酸酶活性、靶序列结合等。
在一些情况下,使用包含野生型和/或修饰Cas13蛋白的系统直接检测(不需要逆转录酶)RNA(病毒RNA、mRNA、小RNA等),而使用包含野生型和/或工程化Cas12或Cas14蛋白的系统直接检测DNA(病毒DNA等)。在其他情况下,可以将RNA逆转录为使用Cas12或Cas14效应蛋白检测到的DNA。
相同或不同的Cas效应蛋白中的一个或多个可以用于本文所述的系统。在一些情况下,靶传感器和信号放大器均包含一个或多个Cas12蛋白和/或Cas14蛋白,例如用于检测DNA靶序列。一个或多个Cas12和/或Cas14蛋白可能本身是相同或不同(修饰或工程化)的蛋白。在其他情况下,靶传感器和信号放大器均包含一个或多个Cas13蛋白,例如用于检测RNA靶序列。Cas13蛋白可能本身是相同的蛋白,可能是不同(修饰或工程化)的Cas13蛋白。在其他实施方案中,靶传感器和信号放大器可能包含不同类型的Cas效应蛋白,包括Cas12、Cas13、Cas14和Csm6蛋白,例如,其中靶传感器包含用于检测RNA靶序列的一个或多个Cas13蛋白,并且信号放大器包含一个或多个Cas12和/或Cas14蛋白。在一些情况下,信号放大器还包含Csm6蛋白(酶)。在某些实施方案中,靶传感器包含用于检测核酸靶序列的一个或多个Cas12和/或Cas14蛋白,并且信号放大器包含一个或多个Cas13蛋白。在一些情况下,信号放大器还包含Csm6蛋白(酶)。
向导RNA序列
本文所述的NCR系统和组合物还包含分子(通常为向导RNA),用于程序化一种或多种Cas蛋白,使得其在向导RNA与关联(靶标、激活剂等)序列结合时被激活为核酸酶。
核酸分子与Cas效应蛋白(例如Cas13或Cas12蛋白)缔合(结合),形成核糖核蛋白复合物(RNP),并将复合物靶向至多核苷酸内的特定靶序列,本文称为“向导RNA”。应当理解,在一些情况下,可以制成杂交DNA/RNA,使得向导RNA除了RNA碱基外还包含DNA碱基——但本文中仍然使用术语“向导RNA”来涵盖此类杂交分子。主题向导RNA可以包含向导序列(也称为“间隔物”)(与靶RNA或DNA的靶序列杂交)和恒定区(例如,与向导序列相邻并与Cas效应蛋白结合的区)。“恒定区”也可以在本文中称为“蛋白结合区段”。在一些情况下,恒定区是向导序列的5’。
向导RNA包含与靶RNA序列互补的至少一个序列。在一些实施方案中,这种靶标互补序列可以称为间隔物序列,额外的序列可以称为支架序列。在一些实施方案中,间隔物序列衍生自人(例如,基因组DNA或逆转录RNA)或非人来源(例如,病原体)。在一些实施方案中,选择的病原体可以来自细菌、病毒、真菌和寄生物。在一些实施方案中,病原体可以是病毒(例如,正冠状病毒亚科(Orthocoronavirinae)、依赖病毒属(Dependovirus)、小RNA病毒科(Picornaviridae)、痘病毒科(Poxviridae)、黄病毒科(Flaviviridae)、弹状病毒科(Rhabdoviridae)、披膜病毒科(Togaviridae)、丝状病毒科(Filoviridae)、疱疹病毒科(Herpesviridae)、布尼亚病毒科(Bunyaviridae)、嗜肝DNA病毒科(Hepadnaviridae)、腺病毒科(Adenoviridae)、逆转录病毒科(Retroviridae)、乳头瘤病毒科(Papillomaviridae)、肺病毒科(Pneumoviridae)、正粘病毒科(Orthomyxoviridae)、沙粒病毒科(Arenaviridae)和副粘病毒科(Paramyxoviridae)、杯状病毒科(Caliciviridae))或细菌(例如,分枝杆菌属(Mycobacterium)、链球菌属(Streptococcus)、假单胞菌属(Pseudomonas)、志贺菌属(Shigella)、弯曲杆菌属(Campylobacter)、沙门氏菌属(Salmonella)、梭菌属和棒状杆菌属(Corynebacterium))。在一些实施方案中,病毒可以选自DNA或RNA病毒,包括正冠状病毒亚科、腺病毒科、小RNA病毒科、疱疹病毒科、嗜肝DNA病毒科、黄病毒科、逆转录病毒科、正粘病毒科、副粘病毒科、乳多泡病毒科(Papovaviridae)、多瘤病毒属(Polyomavirus)、弹状病毒科和披膜病毒科。在一些实施方案中,致病性真菌包括念珠菌属(Candida)、曲霉属(Aspergillus)、隐球菌属(Cryptococcus)、组织浆菌属(Histoplasma)、肺孢子虫(Pneumosystis)和葡萄穗霉属(Stachybotrys)。
在其他实施方案中,间隔物RNA序列与非病原体互补。例如,间隔物RNA序列可以工程化改造为与任何感兴趣的核酸序列杂交。在一些实施方案中,向导RNA序列可以工程化改造为与感兴趣的哺乳动物序列互补,例如基因组序列,或转录的序列(mRNA、microRNA等)。在各种实施方案中,向导RNA可以包括与哺乳动物生物学状态、病况、疾病或病症,诸如败血症、癌症、病毒感染、细菌感染、真菌感染相关联的序列互补的序列。在一些实施方案中,向导RNA可以与mRNA或microRNA互补,例如microRNA签名(signature)中的microRNA序列。在一些实施方案中,向导RNA序列可以在前体RNA内,这继而可以是具有多个向导RNA序列的阵列的部分。在一些实施方案中,前体RNA序列可以由Cas蛋白加工以提供向导RNA序列。
向导RNA序列包含与靶序列互补的间隔物序列和为间隔物序列5’的更恒定的序列。该恒定序列可以称为支架序列、重复、手柄(handle)或恒定区,并有助于向导RNA与Cas蛋白的结合。在一些实施方案中,恒定序列可以用进化上相关的恒定序列替换。正如本领域所知的,Cas蛋白可以分组为不同的家族,包括识别正交crRNA集并具有不同ssRNA切割特异性的官能团。在一些实施方案中,可以通过包括天然存在和合成或非天然的核碱基或主链修饰来修饰恒定序列以提高亲和力和稳定性。在一些实施方案中,恒定序列可以包含前体序列。在实施方案中,可以对前crRNA序列进行加工以形成crRNA序列,其包含向导序列。
与靶RNA或DNA序列的靶序列具有互补性(与之杂交)的向导序列可以有任何合适的长度。在一些情况下,向导序列的长度为15-28个核苷酸(nt)(例如,长度为15-26、15-24、15-22、15-20、15-18、16-28、16-26、16-24、16-22、16-20、16-18、17-26、17-24、17-22、17-20、17-18、18-26、18-24或18-22nt)。在一些情况下,向导序列的长度为18-24个核苷酸(nt)。在一些情况下,向导序列为至少15nt长(例如,至少16、18、20或22nt长)。在一些情况下,向导序列为至少17nt长。在一些情况下,向导序列为至少18nt长。在一些情况下,向导序列为至少20nt长。
在一些情况下,向导序列与靶序列的靶序列具有80%或更多(例如,85%或更多、90%或更多、95%或更多或100%的互补性)。在一些情况下,向导序列与靶序列100%互补。在一些情况下,靶序列包含与向导RNA的向导序列具有互补性的至少15个核苷酸(nt)。
向导RNA可以作为RNA或编码向导RNA的核酸(例如,DNA,诸如重组表达载体)提供。Cas效应蛋白(例如,Cas13蛋白,诸如LshCas13a、LwaCas13a、LseCas13a、LbmCas13a、LbnCas13a、CamCas13a、CgaCas13a、Cga2Cas13a、Pprcas13a、LweCas13a、LneCas13a、Lwa2cas13a、RcsCas13a、RcrCas13a、RcdCas13a、LbuCas13a、RcaCas13a、EreCas13a、BzoCas13b、PinCas13b、PbuCas13b、AspCas13b、PsmCas13b、RanCas13b、PauCas13b、PsaCas13b、Pin2Cas13b、CcaCas13b、PguCas13b、PigCas13b、Pin3Cas13b和HheCas13a、EsCas13d(惰性真杆菌DSM 15702、UrCas13d、分离自瘤胃球菌属种的Cas13d、分离自肠道宏基因组的Cas13、来自新_flavefaciens,_株_XPD3002的Cas13d(参见例如美国专利申请20190062724),和/或Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e和/或Cas14蛋白,诸如Cas14a、Cas14b、Cas14c、Cas14i、Cas14j、Cas14k、Cas14u)可以作为蛋白质或作为编码蛋白质的核酸(例如mRNA、DNA,诸如重组表达载体)提供(Harrington et al(2018)Science 362(6416):839-842)。在一些情况下,两个或更多(例如,3个或更多、4个或更多、5个或更多或6个或更多)向导RNA可以通过(例如使用前体向导RNA阵列,其可以由Cas效应蛋白切割为个别(“成熟”)向导RNA)提供。
包含向导RNA的Cas蛋白可以称为“程序化”Cas蛋白。向导RNA序列可以引入至Cas蛋白并由其结合。例如,向导RNA可以在细胞内或细胞外接触Cas蛋白。可以使用各种方法使向导RNA与Cas蛋白接触以产生程序化Cas蛋白。在一些实施方案中,接触需要小于约2小时,例如小于约90min、60min、40min、30min、20min、10min、5min、4min、3min、2min或1min。
恒定区
任何恒定区均可以用于本发明的向导RNA。恒定区的非限制性实例在美国公布号20190241954中公开。
在一些情况下,向导RNA包括双链RNA双链体(dsRNA双链体)。在一些情况下,向导RNA包括长度为2至12bp(例如,2至10bp、2至8bp、2至6bp、2至5bp、2至4bp、3至12bp、3至10bp、3至8bp、3至6bp、3至5bp、3至4bp、4至12bp、4至10bp、4至8bp、4至6bp,或4至5bp)的dsRNA双链体。在一些情况下,向导RNA包括长度为2个或更多bp(例如,长度为3个或更多、4个或更多、5个或更多、6个或更多,或7个或更多bp)的dsRNA双链体。在一些情况下,向导RNA包括比相应野生型向导RNA的dsRNA双链体更长的dsRNA双链体。在一些情况下,向导RNA包含比相应野生型向导RNA的dsRNA双链体更短的dsRNA双链体。
在一些情况下,向导RNA的恒定区长度为15个或更多核苷酸(nt)(例如,18个或更多、20个或更多、21个或更多、22个或更多、23个或更多、24个或更多、25个或更多、26个或更多、27个或更多、28个或更多、29个或更多、30个或更多、31个或更多nt、32个或更多、33个或更多、34个或更多或35个或更多nt)。在一些情况下,向导RNA的恒定区长度为18个或更多nt。
在一些情况下,向导RNA的恒定区具有12至100nt(例如,12至90、12至80、12至70、12至60、12至50、12至40、15至100、15至90、15至80、15至70、15至60、15至50、15至40、20至100、20至90、20至80、20至70、20至60、20至50、20至40、25至100、25至90、25至80、25至70、25至60、25至50、25至40、28至100、28至90、28至80、28至70、28至60、28至50、28至40、29至100、29至90、29至80、29至70、29至60、29至50,或29至40nt)的长度范围。在一些情况下,向导RNA的恒定区具有28至100nt的长度范围。在一些情况下,为向导序列5’的该向导RNA的区具有28至40nt的长度范围。
在一些情况下,向导RNA的恒定区相对于(短于)相应野生型向导RNA的相应区截短。在一些情况下,向导RNA的恒定区相对于(长于)相应野生型向导RNA的相应区延伸。在一些情况下,主题向导RNA的长度为30个或更多个核苷酸(nt)(例如,长度为34个或更多、40个或更多、45个或更多、50个或更多、55个或更多、60个或更多、65个或更多、70个或更多或80个或更多nt)。在一些情况下,向导RNA的长度为35个或更多nt。
前体向导RNA阵列
Cas效应蛋白可以将前体向导RNA切割为成熟的向导RNA,例如通过前体的内切核糖核水解切割,例如通过将前体向导RNA阵列(其包含超过一个串联排列的向导RNA)切割为两个或更多个个别的向导RNA。因此,在一些情况下,前体向导RNA阵列包含两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、2、3、4或5)向导RNA(例如,作为前体分子串联排列)。换言之,在一些情况下,两个或更多个向导RNA可以存在于阵列(前体向导RNA阵列)上。本文所述的Cas效应蛋白可以将前体向导RNA阵列切割为个别的向导RNA。
在一些情况下,主题向导RNA阵列包含2个或更多个向导RNA(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个或7个或更多个向导RNA)。给定阵列的向导RNA可以靶向相同靶RNA/DNA的不同靶位点(例如,其可以增加检测的灵敏性)(即可以包含与之杂交的向导序列)和/或可以靶向不同的靶RNA/DNA分子(例如,单核苷酸多态性(SNP)、特定病毒的不同株等),并且其可以用于例如检测病毒的多个株。在一些情况下,前体向导RNA阵列的每个向导RNA具有不同的向导序列。在一些情况下,前体向导RNA阵列的两个或更多个向导RNA具有相同的向导序列。
在一些情况下,前体向导RNA阵列包含靶向相同靶序列内的不同靶位点的两个或更多个向导RNA。在一些情况下,前体向导RNA阵列包含靶向不同靶序列的两个或更多个向导RNA。例如,当潜在靶RNA/DNA家族中的任一者存在时,此类场景可以导致阳性信号。此类阵列可以用于靶向转录物家族,例如基于变异,诸如单核苷酸多态性(SNP)(例如,用于诊断目的)。其也可用于检测是否存在许多不同病毒株中的任一者。其也可用于检测是否存在病毒或细菌的许多不同种、株、分离株(isolate)或变体中的任一者。因此,在一些情况下,如主题组合物(例如,试剂盒)或方法包括两个或更多个向导RNA(在前体向导RNA阵列的背景下,或不在前体向导RNA阵列的背景下,例如,向导RNA可以是成熟的向导RNA)。
前间隔序列相邻基序(Protospacer Adjacent Motif,PAM)
在靶序列为dsDNA的情况下,可能需要鉴定靶标中的PAM序列。V型CRISPR/Cas效应蛋白在由DNA靶向RNA和靶DNA之间互补的区域定义的靶序列上与靶DNA结合。与许多CRISPR/Cas内切核酸酶的情况一样,双链靶DNA的位点特异性结合(和/或切割)发生在由(i)向导RNA和靶DNA之间的碱基配对互补性;和(ii)靶DNA中的短基序[称为前间隔序列相邻基序(PAM)]两者决定的位置处。
在一些情况下,V型CRISPR/Cas效应蛋白的PAM紧邻靶序列的5’(例如,靶DNA的非互补链的5’——互补链与向导RNA的向导序列杂交,而非互补链不与向导RNA直接杂交并且是非互补链的反向互补物)。在一些情况下(例如,当使用本文所述的Cas12a或Cas12b时),PAM序列为5’-TTN-3’。在一些情况下,PAM序列为5’-TTTN-3’。
在一些情况下,不同的V型CRISPR/Cas效应蛋白(即,来自各种物种的V型CRISPR/Cas效应蛋白)可能有利于在提供的各种方法中使用,以便利用期望的特征(例如,不同V型CRISPR/Cas效应蛋白的特定酶特性)。来自不同物种的V型CRISPR/Cas效应蛋白可以需要靶DNA中的不同PAM序列。因此,对于选择的特定V型CRISPR/Cas效应蛋白,PAM序列要求可以与上述5’-TTN-3’或5’-TTTN-3’序列不同。用于鉴定适当PAM序列的各种方法(包括计算机中和/或湿实验室方法)在本领域是已知的并且是常规的,并且可以使用任何方便的方法。
CRISPR-Cas13系统的成员作为双组分系统起作用,其中crRNA与Cas13蛋白形成复合物,而不涉及任何tracrRNA。前间隔序列的侧翼区包含影响Cas13a介导的靶向的功效的3’前间隔序列侧翼位点(PFS)(Abudayyeh et al(2016)Science.353(6299))。尽管PFS与前间隔序列靶标相邻,但未使用常用的前间隔序列相邻基序(PAM)命名法,因为其旨在暗示用于自我与非自我区分的序列,这在RNA靶向系统中是不相关的。因此,在一些情况下,可以需要鉴定靶标中的PFS序列。
报告物
任何报告分子(也称为检测器序列)均可以用于本文所述的系统。
报告分子(复合物)包含可检测标记物(也称为信号部分)。可检测标记物的非限制性实例包括荧光标记物、酶标记物和/或生物发光标记物。报告物通常进一步包含分子(也称为“淬灭剂”或“淬灭剂分子”或“淬灭剂部分”),当其与可检测标记物非常接近(连接)时,防止标记物被检测到,例如通过发出信号检测到。
在一些情况下,当切割报告分子(例如,淬灭剂/荧光剂(fluor)对也称为F/Q报告物)时,产生可检测的信号。信号淬灭对的一个信号伴侣产生可检测信号,并且另一个信号伴侣是淬灭第一信号伴侣的可检测信号的淬灭剂部分(即,淬灭剂部分淬灭信号部分的信号,使得当信号伴侣彼此靠近时,例如当信号对的信号伴侣非常接近时,降低(淬灭)来自信号部分的信号)。
例如,在一些情况下,当切割标记的报告物时,可检测信号的量增加。例如,在一些情况下,一个信号伴侣(信号部分)展示的信号由另一个信号伴侣(淬灭剂信号部分)淬灭,例如,当两者在由激活的Cas非特异性核酸酶(例如,激活的传感器和信号放大器)切割前存在于同一分子上时。此类信号对在本文中称为“淬灭剂/荧光剂对”、“淬灭对”或“信号淬灭对”。例如,在一些情况下,一个信号伴侣(例如,第一信号伴侣)是产生由第二信号伴侣(例如,淬灭剂部分)淬灭的可检测信号的信号部分。因此,当伴侣分离时(例如,通过激活的传感器或信号放大器切割报告分子后),此类淬灭剂/荧光剂对的信号伴侣将产生可检测的信号,但当伴侣非常接近时(例如,在切割报告物前),信号将被淬灭。
报告物通常包含本文所述的放大器激活剂底物。在一些情况下,放大器激活剂序列位于F/Q对之间并且可以包含A或C,但也容纳Cas13(U)、Cas12(脱氧核糖核苷酸)、Csm6等活性所必需的额外核苷酸,即信号放大器的Cas效应蛋白结合的序列。例如,包含响应于A6>P的Csm6同系物,如表皮葡萄球菌(S.epidermidis)Csm6(SeCsm6)的报告物可以通过将笼锁crRNA的发夹环中A的数量从4变为6来生成。
可检测标记物可以包含一个或多个修饰以降低背景活性和/或提高灵敏性。在一些实施方案中,可检测标记物由通过寡核苷酸序列连接的荧光团和淬灭剂分子组成。可以利用茎环结构来增加荧光团与淬灭剂的接近度,并且可以结合环长度和序列(诸如U和A碱基)来通过Cas核酸酶活性调节其释放的效率。在一些情况下,连接荧光团与淬灭剂的寡核苷酸的序列包含对由特异性反式核酸酶活性释放敏感的笼锁结构。在一些情况下,报告分子与反式笼锁分子缔合。“反式笼锁分子”可以包含与另一种核酸结合,从而形成或产生双链体结构的任何核酸。在一些情况下,双链体结构包含一个或多个环(例如,茎环)。
淬灭剂部分可以不同程度地淬灭来自信号部分的信号(例如,切割前)。在一些情况下,淬灭剂部分淬灭来自信号部分的信号,其中在存在淬灭剂部分的情况下(当信号伴侣彼此靠近时)检测到的信号是不存在淬灭剂部分的情况下(当信号伴侣分离时)检测到的信号的95%或更低。例如,在一些情况下,在存在淬灭基团的情况下检测到的信号可以是不存在淬灭基团的情况下检测到的信号的90%或更低、80%或更低、70%或更低、60%或更低、50%或更低、40%或更低、30%或更低、20%或更低、15%或更低、10%或更低或5%或更低。在一些情况下,在存在淬灭基团的情况下未检测到信号(例如,高于背景)。
在一些情况下,不存在淬灭基团(当信号伴侣分离时)的情况下检测到的信号比在存在淬灭基团(当信号伴侣彼此接近时)的情况下检测到的信号高至少1.2倍(例如,高至少1.3倍、至少1.5倍、至少1.7倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少7倍、至少10倍、至少20倍或至少50倍)。
在一些情况下,信号部分是荧光标记物。在一些情况下,淬灭剂部分淬灭来自荧光标记物的信号(光信号)(例如,通过吸收标记物的发射光谱中的能量)。因此,当淬灭剂部分不接近信号部分时,来自荧光标记物的发射(信号)可检测,因为信号不被淬灭剂部分吸收。可以使用任何方便的供体接受体对(信号部分/淬灭部分对)并且在本领域已知许多合适的对。
在一些情况下,淬灭剂部分吸收来自信号部分(本文也称为“可检测标记物”)的能量,然后发射信号(例如,不同波长的光)。因此,在一些情况下,淬灭剂部分本身是信号部分(例如,信号部分可以是6-羧基荧光素,而淬灭剂部分可以是6-羧基-四甲基罗丹明),并且在一些情况下,该对也可以是FRET对。在一些情况下,淬灭剂部分是暗淬灭剂。暗淬灭剂可以吸收激发能量,并以不同的方式耗散能量(例如,作为热量)。因此,暗淬灭剂本身具有极小或无荧光(不发出荧光)。暗淬灭剂的实例进一步描述于美国专利号8,822,673和8,586,718;美国专利出版物20140378330、20140349295和20140194611;和国际专利申请:WO200142505和WO200186001,所有这些申请均通过引用以其整体并入本文。
荧光标记的实例包括但不限于:Alexa FluorTM染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTORho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、异硫氰酸荧光素(FITC)、四甲基若丹明(TRITC)、德克萨斯红(Texas Red)、俄勒冈州绿(Oregon Green)、Pacific Blue、Pacific Green、Pacific Orange、量子点(quantumdots),和栓系荧光蛋白。
在一些情况下,可检测标记物是选自以下的荧光标记物:Alexa FluorTM染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈州绿、Pacific Blue、Pacific Green和Pacific Orange。
在一些情况下,可检测标记物是选自以下的荧光标记物:Alexa FluorTM染料、ATTO染料(例如,ATTO 390,ATTO 425,ATTO 465,ATTO 488,ATTO 495,ATTO 514,ATTO 520,ATTO532,ATTO Rho6G,ATTO 542,ATTO 550,ATTO 565,ATTO Rho3B,ATTO Rho11,ATTO Rho12,ATTO Thio12,ATTO Rho101,ATTO 590,ATTO 594,ATTO Rho13,ATTO 610,ATTO 620,ATTORho14,ATTO 633,ATTO 647,ATTO 647N,ATTO 655,ATTO Oxa12,ATTO 665,ATTO 680,ATTO700,ATTO 725,ATTO 740)、DyLight染料、花青染料(例如,Cy2,Cy3,Cy3.5,Cy3b,Cy5,Cy5.5,Cy7,Cy7.5)、FluoProbes染料、Flufo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈州绿、Pacific Blue、Pacific Green、Pacific Orange、量子点和栓系荧光蛋白。
ATTO染料的实例包括但不限于:ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTORho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTORho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTOOxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725和ATTO 740。
AlexaFluor染料的实例包括但不限于:Alexa FluorTM 350、Alexa FluorTM 405、Alexa FluorTM 430、Alexa FluorTM 488、Alexa FluorTM 500、Alexa FluorTM 514、AlexaFluorTM 532、Alexa FluorTM 546、Alexa FluorTM 555、Alexa FluorTM 568、Alexa FluorTM594、Alexa FluorTM 610、Alexa FluorTM 633、Alexa FluorTM 635、Alexa FluorTM 647、Alexa FluorTM 660、Alexa FluorTM 680、Alexa FluorTM 700、Alexa FluorTM 750、AlexaFluorTM 790等。
淬灭剂部分的实例包括但不限于:暗淬灭剂、Black Hole QuencherTM(BHQTM)(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qx1淬灭剂、ATTO淬灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲基氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、a QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇诸如金纳米颗粒等。
在一些情况下,淬灭剂部分选自:暗淬灭剂、Black Hole QuencherTM(BHQTM)(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qx1淬灭剂、ATTO淬灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲基氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇。
ATTO淬灭剂的实例包括但不限于:ATTO 540Q、ATTO 580Q和ATTO 612Q。BlackHole QuencherTM.(BHQTM)的实例包括但不限于:BHQ-0(493nm)、BHQ-1(534nm)、BHQ-2(579nm)和BHQ-3(672nm)。
一些可检测标记物(例如,荧光染料)和/或淬灭剂部分的实例,参见,例如,Bao etal.,Annu Rev Biomed Eng.2009;11:25-47;以及美国专利号8,822,673和8,586,718;美国专利出版物20140378330、20140349295、20140194611、20130323851、20130224871、20110223677、20110190486、20110172420、20060179585和20030003486;以及国际专利申请:WO200142505和WO200186001,所有这些均通过引用以其整体并入本文。
在一些情况下,可以通过测量比色读出来检测标记的检测器的切割。例如,荧光团的释放(例如,从FRET对中释放、从淬灭剂/荧光剂对中释放等)可以导致可检测信号的波长偏移(并因此颜色偏移)。因此,在一些情况下,可通过颜色偏移来检测主题标记物的检测器ssDNA的切割。此类偏移可以表示为一种颜色(波长)的信号的量丢失、另一种颜色的量增加、一种颜色与另一种颜色的配给的变化等。
在一些情况下,使用侧流色谱法检测信号。在简单的夹心型系统中,将样品应用到充当吸收过程的第一阶段的侧流装置中的垫上,并且在一些情况下含有过滤器以确保样品的准确和受控流动。储存缀合标记物和抗体的缀合垫将接收样品。如果存在靶标,则固定化缀合抗体和标记物将与靶标结合,并在测试过程中继续迁移。当样品沿着装置移动时,位于硝酸纤维素膜上的结合试剂将在检测线上与靶标结合。将形成彩色线,并且线的密度将根据存在的靶标的量而变化。一些靶标可能需要定量以测定靶标浓度。这是快速检测可以与读数器结合以提供定量结果的地方。
在一些情况下,用经由侧流检测的报告分子进行该方法。如果存在初级激活剂,则系统被激活,并发生NCR。激活的Cas蛋白表现出包含可检测信号的报告物的反式切割。将反应混合物加载到侧流装置上,并且未切割的报告分子流至对照线,而包含检测器的任何切割的报告物的部分流过对照至包含捕获分子的区域,以与检测器结合。在一些情况下,使用Milenia Genline HybriDetect 1(TwistDxTM)检测试纸(dipstick)。例如,在一些情况下,测量步骤可以包括以下的一项或多项:基于金纳米颗粒的检测(例如,参见Xu et al.,(2017)Angew Chem Int Ed Engl.;46(19):3468-70;和Xia et al.,(2010)Proc NatlAcad Sci U S A.Jun 15;107(24):10837-41)、荧光偏振、胶体相变/分散(例如,Baksh etal.,(2004)Nature.Jan 8;427(6970):139-41)、电化学检测、基于半导体的传感(例如,Rothberg et al.,(2011)Nature Jul 20;475(7356):348-52;例如,通过打开2’-3’环磷酸盐,并通过将无机磷酸盐释放到溶液中,可以在ssDNA切割反应后使用磷酸酶生成pH变化),以及标记的检测器ssDNA的检测。此类检测方法的读出可以是任何方便的读出。可能读出的实例包括但不限于:可检测荧光信号的测量量;凝胶上条带的目视分析(例如,代表切割产物与未切割底物的条带)、颜色存在与否的目视或基于传感器的检测(即,颜色检测方法),以及电信号的存在与否(或特定量)。
在一些情况下,测量的可检测信号由发射荧光的染料对产生。例如,在一些情况下,主题方法包括使样品与标记的检测器ssDNA接触,该标记的检测器ssDNA包含荧光共振能量转移(FRET)对或淬灭剂/荧光剂对,或两者。
在一些情况下,主题方法包括使样品与包含FRET对的标记检测器ssDNA接触。在一些情况下,主题方法包括使样品与包含荧光/淬灭剂对的标记检测ssDNA接触。荧光发射染料对包含FRET对或淬灭剂/荧光剂对。在FRET对和淬灭剂/荧光剂对的两种情况下,染料之一的发射光谱与对中另一种染料的吸收光谱的区域重叠。如本文所用,术语“荧光发射染料对”是通用术语,用于涵盖“荧光共振能量转移(FRET)对”和“淬灭剂/荧光剂对”两者,下文将更详细地讨论这两个术语。术语“荧光发射染料对”可与短语“FRET对和/或淬灭剂/荧光剂对”互换使用。在一些情况下(例如,当检测器ssDNA包含FRET对时),标记的检测器ssDNA在切割前产生一定量的可检测信号,并且当切割标记的检测器ssDNA时,测量的可检测信号的量减少。在一些情况下,标记的检测器ssDNA在切割前产生第一可检测信号(例如,来自FRET对),并且当切割标记的检测器ssDNA时产生第二可检测信号(例如,来自淬灭剂/荧光剂对)。因此,在一些情况下,标记的检测器ssDNA包含FRET对和淬灭剂/荧光剂对。在一些情况下,标记的检测器ssDNA包含FRET对。FRET是能量从激发态荧光团无辐射转移到靠近的第二发色团的过程。可以发生能量转移的范围限于大约10纳米(100埃),并且转移的效率对荧光团之间的分离距离极为敏感。因此,如本文所用,术语“FRET”(“荧光共振能量转移”;也称为“福斯特共振能量转移(Forster resonance energy transfer)”)是指涉及供体荧光团和选择的匹配接受体荧光团的物理现象,使得供体的发射光谱与接受体的激发光谱重叠,并进一步选择,使得当供体和接受体彼此非常接近(通常为10nm或更小)时,供体的激发将引起接受体的激发和发射,因为一些能量经由量子耦合效应从供体传递到接受体。因此,FRET信号充当供体和接受体的接近量规;只有当它们彼此靠近时,才生成信号。FRET供体基团(例如供体荧光团)和FRET接受体基团(例如接受体荧光团)在本文中统称为“FRET对”。供体-接受体对(FRET供体部分和FRET接受体部分)在本文中称为“FRET对”或“信号FRET对”。因此,在一些情况下,当一个信号伴侣为FRET供体部分而另一个信号伴侣为FRET接受体部分时,主题标记的检测器ssDNA包含两个信号伴侣(信号对)。因此,当信号伴侣非常接近时(例如,在相同的RNA分子上时),包含此类FRET对(FRET供体部分和FRET接受体部分)的主题标记的检测器ssDNA将表现出可检测信号(FRET信号),但当伴侣分离时,信号将降低(或不存在)。FRET供体和接受体部分(FRET对)将是本领域普通技术人员已知的并且可以使用任何方便的FRET对(例如,任何方便的供体和接受体部分对)。参见:Bajar et al.(2016)Sensors(Basel).Sep 14;16(9);和Abraham et al.(2015)PLoS One.Aug 3;l0(8):e0l34436。
核酸信号放大器
任何核酸放大器激活剂(也称为“RNA放大器”(如果是RNA)、“激活剂”或“底物”)可以用于本文所述的NCR组合物、系统和方法。在用Cas12或Cas13检测靶核酸(例如冠状病毒序列)之前,本文所述系统的激活剂不能与(激活信号放大器)结合,例如,其被笼锁,使得其不能与信号放大器杂交(或使之激活)。然而,在存在待检测靶序列的情况下激活靶传感器时,放大器底物被释放,并变得可用于与信号放大器杂交(并使之激活)。因此,释放的底物激活信号放大器,并发动Cas酶活性的次级级联以生成更多可检测标记物,从而在相同的反应中生成指数信号。
因此,激活剂底物包含激活信号放大器成为非特异性核酸酶的任何序列,该非特异性核酸酶能够切割报告复合物并释放可检测标记物。合适序列的非限制性实例包括向导RNA或其关联激活剂核酸(例如,在Cas13的背景下为RNA,在Cas12的背景下为DNA)。
本文所述的核苷酸序列中的任一者可以包含一种或多种修饰,例如碱基修饰、主链修饰、糖修饰等,以给核酸提供新的或增强的特征(例如改善的稳定性)。本领域中已知,核苷是碱基-糖组合。核苷的碱基部分通常是杂环碱基。此类杂环碱基中最常见的两类是嘌呤和嘧啶。核苷酸是进一步包含与核苷的糖部分共价连接的磷酸基团的核苷。对于包含戊呋喃糖基糖的那些核苷,磷酸基团可以与糖的2’、3’或5’羟基部分连接。在形成寡核苷酸时,磷酸基团将相邻的核苷彼此共价连接以形成线性聚合物化合物。继而,这种线性聚合物化合物的各自末端可以进一步连接以形成环形化合物,然而,线性化合物一般是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以以产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸基团通常称为形成寡核苷酸的核苷间主链。RNA和DNA的正常连接或主链是3’-5’磷酸二酯连接。美国公布号20190241954中描述了额外的核苷酸修饰,包括主链的修饰、核苷间连接、模拟物的使用、锁核酸(LNA)的使用和/或取代的碱基修饰,诸如纳入一个或多个核碱基。
本文所述的核酸中的一个或多个也可以包含一个或多个取代糖部分。
一个或多个RNA放大器可以包含在报告分子中,例如作为连接可检测标记物和报告复合物的淬灭部分的序列的部分和/或位于可检测标记物和/或淬灭剂的一个或两个的远端。在一些情况下,一个或多个放大器激活剂包括在可检测标记物和淬灭剂之间。替代地和或除报告分子包含触发底物序列的实施方案外,触发物可以是本文所述组合物、系统和方法中的单独组分。
放大器激活剂可以包含聚U或聚A序列,以允许选择性切割。Cas13酶产生具有2’,3’-环磷酸盐/酯的切割的RNA片段,并且其子集偏好在U处切割。因此,通过使用具有A4-Un序列的底物,Cas13生成激活TtCsm6的核糖核酸酶(RNA酶)活性的A4>P。具有A5-Un和A6-Un的序列先前已用于将Csm6与Cas13偶联(Gootenberg et al.(2017)Science 356(6336):438-442),但其不产生识别A4的Csm6酶(如TtCsm6)的最佳激活。此外,尚无Csm6酶被证明在前馈回路中起作用,其提供比现有的核酸检测方法更高的检测速度和灵敏性。
在一些实施方案中,可以对向导RNA和/或激活剂RNA进行修饰,以允许与Cas蛋白的条件性相互作用,使得仅在最佳时间框内发生相互作用,诸如在靶核酸的检测后。有许多不同的机制能够实现条件相互作用,包括使用可切割的反义DNA作为gRNA活性的保护剂(Jain et al,(2016)Angew Chem Int Ed Engl 55(40)12440-4);配体依赖性RNA切割和去保护(Ferry et al(2017)Nat Commun 8:14633),转录激活剂对dCas的配体依赖性招募(Maji et al(2017)Nat Chem Biol 13(1):9-11)和小分子诱导的Cas:向导RNP复合物的重组装(Kunert et al(2019)Nat Commun.10(1):2127)和使用光直接调节RNP和dsDNA之间的相互作用的光笼锁gRNA设计(Zhou et al(2020)Angew Chem Int Ed Engl doi:10.1002/anie.201914575)。另一种方法依赖于不同Cas酶独特的切割偏好。在一些实施方案中,激活剂不与其同源向导RNA完美反义匹配。在一些实施方案中,使用不匹配的核苷酸以去调谐与向导物的相互作用,使其灵敏性更低,并且不太可能导致非特异性信号。在一些实施方案中,将不匹配的核苷酸引入互补区内的“摆动”位置。
在一些实施方案中,激活剂分子包含RNA和DNA序列两者。
在一些情况下,激活剂RNA分子是笼锁的。可以通过任何物理或化学方法完成笼锁。例如,触发物可以使用5’和3’序列延伸笼锁,该延伸可以调节Cas酶结合或切割的关键特征。在这方面,可以通过采用序列延伸来利用Cas12和Cas13非特异性核酸酶活性对单链核酸的选择性,所述序列延伸可以与向导RNA的直接重复、向导RNA间隔物、向导RNA间隔物内的种子序列(已知对与激活序列的错配敏感的向导RNA内的序列,参见Abudayyeh et al(2016)Science 353:aaf5573),和/或激活剂核酸中的种子序列的关联物碱基配对。此类笼锁序列可以是线性的,或可以在环中或在其他形成中。这些5’和3’序列延伸可以在相同的笼锁底物上组合。序列延伸的不同组合可以跨过向导RNA和激活剂核酸对使用。
在一些情况下,底物笼也可以是与向导RNA或激活剂碱基配对的单独分子。该笼可以经由内切核酸酶或外切核酸酶活性,诸如Xrn1或Csm6来释放。在一些实施方案中,笼可以含有化学修饰,诸如本文所述的锁核酸(LNA)部分或2’-OMe RNA。另见美国公布号20190241954。
底物可以以任何方式激活(解笼锁)。在一些情况下,序列延伸中的笼锁序列(例如暴露的环区域)被设计为可由Cas蛋白的不同亚型(Cas13或Cas12)特异性切割,导致笼的释放以及功能性向导RNA或激活剂的产生。同聚体报告物底物上Cas12和Cas13蛋白的切割偏好的概况分析(profiling)表明,大多数直系同源物偏好尿苷、碱基组合或腺嘌呤(East-Seletsky(2017)Mol Cell 66(3);373-383;Gootenberg et al(2018)Science 360(6387):439–444)。例如,LmaCas13a、LbuCas13a和PprCas13a表现出对聚U的强偏好,而CcaCas13b表现出对聚U的中等偏好。Pin2Cas13b表现出对聚U和聚C的中等偏好。PbuCas13b和PguCas13b均显示出对聚U的轻微偏好,而LbaCas13a对聚A具有强偏好。最后,BzoCas13b表现出对聚U和聚A的轻微偏好。此外,测试的Cas13直系同源物中的一些显示出依赖于离子浓度和/或向导RNA长度的不同活性。因此,笼形结构可以添加到向导RNA中,使得当完整时,该笼阻止引导与其关联的靶标相互作用。当释放笼时,例如在由Cas13a复合物反式切割后,向导物自由地与靶标相互作用,引起RNP复合物的激活。在一些实施方案中,激活剂核酸是DNA,其中DNA序列包含RNA笼。在一些实施方案中,使用RNA和DNA激活剂核酸,例如当使用次级放大器复合物与Cas13和Cas12RNP复合物放大器时。然后,激活的RNP复合物切割更多的笼锁底物。除了产生荧光信号外,每个额外的激活Cas复合物还可以激活更多的笼锁底物,导致Cas定向核酸酶活性的前馈循环。随着反应的进行,这些酶能够切割更多可检测标记物,导致信号的指数放大。
在一些实施方案中,Csm6用于进一步放大检测反应。在该系统中,受保护的向导RNA放大器包含聚A延展段和后面的保护性聚U延展段,其可以由尿嘧啶偏好Cas13酶切割,使得Cas13在向导物中将所有尿苷降解至同聚体A延展段。在一些实施方案中,使用受保护的Csm6激活剂RNA,其包含例如聚A延展段和后面的保护性聚U延展段,其可以由尿嘧啶偏好Cas13酶切割,使得Cas13在向导物中将所有尿苷降解至同聚体A延展段。受保护的向导RNA放大器和受保护的激活剂RNA可在Cas13切割后具有2’3’环状磷酸盐/酯,并因此将激活Csm6。已知(A)6多核苷酸激活Csm6,并且显示EiCsm6和LsCsm6均在靶核酸的初始结合后放大检测信号(Gootenberg et al(2018)Science 360(6387):439-444)。
Csm6也可以用作第二酶,其由Cas13激活以启动前馈回路。Csm6的笼锁激活剂可在序列的5’末端包含4、5或6个腺苷(A4、A5或A6),其可以修饰为防止由自身或Cas13进行的过早切割(例如2’-OMe、2’-H、2’-F)。在其3’末端还可具有将底物进行笼锁的额外可切割A或U。通过由Cas13修剪掉3’RNA核苷酸生成A4>P、A5>P或A6>P以激活Csm6来完成解笼锁。用于将底物进行笼锁的3’-核苷酸的身份可以随用于解笼锁的Cas酶的核苷酸偏好而变化。例如,一种潜在底物可以是5’-fA-fA-AAAAAAA-3’(SEQ ID NO:1),其中3个fA核苷酸具有2’-F修饰,并且5个末端A可以由Csm6或LbaCas13切去。
在用Csm6进行NCR扩增的一个实施方案中,Cas酶LbaCas13将感测互补RNA,并变为激活的,用于反式RNA切割。然后,它将修剪笼锁的Csm6激活剂3’端处的腺苷,留下将结合并激活Csm6酶的修饰的A4>P、A5>P或A6>P。然后,激活的Csm6将解笼锁额外的笼锁的激活剂,这然后将导致Csm6分子的进一步激活,在初始检测后触发前馈回路。激活的Csm6分子也将切割荧光报告底物,导致可检测的信号。该策略与在Cas13情况下Csm6的先前使用不同(Gootenberg et al.,2018,Science,同上),因为修饰的底物在Csm6的情况下实现前馈回路,这提供更高的灵敏性。
该策略也适用于通过U切割Cas13直系同源物,以及通过在其3’末端用U而不是A对激活剂进行笼锁(例如5’-AAAAUUUUUU-3’,SEQ ID NO:2)来放大初级RNA检测。例如,LbuCas13将切割A4-U6笼锁的激活剂以生成A4>P。此解笼锁的底物将激活TtCsm6,然后TtCsm6将解笼锁第二激活剂(例如5’-fA-fA-AAAAAAA-3’,SEQ ID NO:1)以及切割报告物。这将启动放大主要检测事件的前馈回路。包含激活剂序列的核苷酸的2’-OH的修饰将用于防止由Csm6降解激活剂。
可以测试各种型式的激活剂,包含A4、A5或A6激活剂序列后笼锁核苷酸的非修饰型式或不同数量或序列。描述的所有方法均可能潜在应用于任何Csm6或Csx1酶。基于Cas酶的切割偏好的差异,该策略也可以用于与涉及Cas13或Cas12的其他NCR途径多路复用以同时检测多个RNA靶标。
在一些实施方案中,Csm6激活剂序列包含在笼序列中,例如在向导RNA上(图1I,顶部)。Csm6激活剂序列的任一侧的序列被Cas13(例如LbuCas13a)反式切割时,Csm6序列被释放并能够与Csm6相互作用并激活Csm6,所述Cas13已通过其与初级激活剂RNA的相互作用而被激活。然后,激活的Csm6能够作用于笼锁的向导RNA,使更可用于与Cas13酶复合,然后与初级激活剂复合以继续初级激活剂的更多检测。同时,激活的Csm6也将切割报告分子并放大信号。在一些实施方案中,使用笼锁的激活剂RNA,其包含Csm6激活剂序列,使得在由激活的Csm6切割后,解笼锁的RNA可以与基于Cas12的扩增系统相互作用。在一些实施方案中,使用包含Csm6激活剂的笼锁向导物和包含Csm6激活剂的笼锁激活剂RNA两者。检测到的所有信号均取决于Cas13与初级激活剂的初始相互作用。
在一些实施方案中,受保护的Csm6特异性激活剂RNA包含在系统中(图1I,底部)。在此实施方案中,受保护的Csm6激活剂受到由Cas13修剪的核苷酸的保护,该Cas13已通过其与初级激活剂的相互作用而被激活。经修剪的Csm6特异性激活剂RNA现在可以与Csm6酶相互作用并激活Csm6酶,其现在可以作用于分子,诸如笼锁的向导RNA、笼锁的激活剂RNA和RNA报告分子以放大检测,使得检测依赖于Cas13与初级激活剂的初始相互作用。
在一些实施方案中,受保护的Csm6特异性激活剂RNA包含在系统中(图1J,顶部),并且Csm6扩增充当唯一的放大器(例如,没有其他的Cas12放大步骤)。在此实施方案中,受保护的Csm6特异性激活剂RNA包含在系统中,其中保护包括使用聚A序列,其中Csm6特异性激活剂的5’末端的A中的一些包含2’-F(氟)。Cas13酶可能使用经典的金属非依赖性切割机制,并因此不能切割包含2’-F的A(Gootenberg et al.,(2018)同上;Yang,W.(2011)Q.Rev.Biophys.44,1–93)。然后,Cas13修剪除了包含2’F的A段的直接3’的A外的所有包含2’-OH的A核苷酸,所述Cas13已通过其与初级激活剂的相互作用而激活。该所得的修剪的序列将具有激活Csm6所需的2’3’环状磷酸盐/酯。激活的Csm6现在可以作用于分子,诸如笼锁的向导RNA和报告分子以放大检测,使得检测依赖于Cas13与初级激活剂的初始相互作用。在一些实施方案中,包含具有2’-F的5’A的Csm6特异性激活剂RNA用于包含次级Cas12放大系统的系统中。
在一些实施方案中,Csm6的激活通过使用长聚A RNA来完成(图1J,底部)。在此实施方案中,Csm6激活在Cas13对长聚A RNA的切割后。这些长聚A分子在反应中提供并由Cas13切割,该Cas13已在与初级激活剂RNA相互作用后被激活,使得Cas13的反式切割活性有活性。聚A RNA将以随机长度被切割,并将在长度的3’末端具有2’3’环状磷酸盐/酯。那些长度中的一些将是激活Csm6的正确大小(例如A4>P、A5>P或A6>P)。激活的Csm6酶现在可以作用于分子,诸如笼锁的向导RNA、笼锁的激活剂RNA和报告分子以放大检测,使得检测依赖于Cas13与初级激活剂的初始相互作用。在一些实施方案中,还包括上文讨论的Csm6特异性的受保护的激活剂,使得一旦聚A的正确长度已刺激Csm6,激活的Csm6然后可以释放受保护的Csm6特异性激活剂RNA(如上所述),导致信号的放大。
在一些情况下,例如,当使用Cas13时,反标签序列包含在激活剂RNA中,诸如在3’末端的可切割环中,以在Cas酶在没有切割笼的情况下变为激活时抑制背景核酸酶活性。
由正交靶向系统生成的信号,诸如Cas12和Cas13,或U特异性和A特异性切割性Cas13的不同亚家族可以组合用于信号转导级联。也可以掺入逻辑门,其中需要检测多个不同的序列用于扩增。不同的Cas酶也可以表现出不同的核苷酸基序偏好,诸如二核苷酸基序,其可以掺入用于多路复用信号读出。
在一些情况下,Cas酶的活性可以被抑制,例如以降低背景信号(其可以导致假阳性放大)。这可以通过任何适当的手段完成,例如经由使用降低酶活性的突变。合适的突变可以使用已知的技术通过实验获得,可以商业获得或从文献中鉴定。
也可以采用环介导等温扩增(LAMP)方法和/或核酸扩增。参见,例如adkar et al.(2018)Scientific Methods 8:5548;Notomi et al.(2006)Nucleic Acids Research 28(12):e63;Piepenburg et al.(2000)PLoS Biology 4(7):1115-1121。LAMP是已在实验室和即时环境中广泛使用的简单且准确的等温核酸扩增技术(Gadkar et al(2018)SciReports 8(5548))。该技术在单一温度(60-65℃)下进行并且能够在短时间内(15分钟)产生约50倍的扩增产物的量。LAMP通常使用四种引物(FIP(正向内引物)、BIP(反向内引物)、F3(正向引物)和B3(反向引物)来识别靶序列的六个不同区域。LAMP可以与逆转录酶步骤组合用于检测RNA分子(参见Shen(2020)J Pharm Anal 10(2):97)。
在一些情况下,使用了错配耐受LAMP技术。错配耐受LAMP包括向反应混合物中添加高保真DNA聚合酶,其去除在扩增过程中LAMP引物的3’末端处的错配。使用错配耐受LAMP可以有助于自遗传多样性病毒株扩增序列(Zhou et al(2019)Front Micro 10,art1056)。
基于核酸序列的扩增和转录介导的扩增(分别为NASBA和TMA)是通过RNA进行并可以使用的类似等温扩增技术。NASBA利用两种RNA靶标特异性引物和三种酶(即禽成髓细胞瘤病毒逆转录酶、T7 DNA依赖性RNA聚合酶(DdRp)和RNA酶H)。RNA扩增的标准NASBA方案要求65℃ RNA温育步骤以在添加酶前使靶标变性。在起始阶段,具有对应于T7 DdRp启动子的5’序列的特异性正向引物(P1)与样品中存在的任何靶RNA杂交,并通过逆转录酶延伸。随后,所得RNA:DNA异源双链体的RNA部分由RNA酶H降解,而特异性反向引物(P2)与互补序列杂交,并由逆转录酶延伸,导致与靶序列和T7启动子形成dsDNA。然后,T7 DdRp产生与原始靶RNA互补的许多RNA分子。在扩增阶段,每个新合成的RNA均可以得到复制,导致与靶标互补的RNA的指数扩增。
将引物设计为靶向感兴趣的区域,但重要的是,一种引物包含在5’末端的T7 RNA聚合酶的启动子序列。这使得能够产生单链RNA种类,其通过反应中包含的逆转录酶而逆转录为cDNA。DNA-RNA杂交体中的RNA由RNA酶H活性(来自NASBA中的外源性蛋白,或通过TMA中的RNA酶H+RT)破坏,并且dsDNA由RT产生。然后,该模板通过T7 RNAP而转录为RNA并且导致指数扩增(Compton(1991)Nature.350(6313):91–2;美国专利5480784)。
链置换扩增(SDA)或切口酶扩增反应(NEAR)是可用于DNA扩增的两种类似方法并且可以与本发明的方法和组合物一起使用。这两种技术均依赖于链置换DNA聚合酶,通常是Bst DNA聚合酶、大片段或Klenow片段(3’-5’exo–),以在引物中所含的位点处由链限制的限制性内切核酸酶或切口生成酶创建的切口处启动。切口生成位点用每个聚合酶置换步骤再生,导致指数扩增。NEAR是极快速和灵敏的,使得能够在数分钟内检测到小靶标量(VanNess et al(2003)Proc Natl Acad Sci USA 100(8):4504-9)。SDA和NEAR通常用于临床和生物安全应用中。
在一些情况下,使用解旋酶依赖性扩增(HDA)。HDA利用DNA解旋酶的活性来分离双链(ds)DNA的互补链,从而避免温度循环来产生用于引物杂交和随后通过DNA聚合酶进行引物延伸的单链模板。它模拟复制叉并且使得能当它装载于dsDNA模板上并沿着靶DNA穿行时在存在ATP的情况下进行DNA合成,从而破坏连接两条链的氢键。两个序列特异性引物与每个ssDNA模板的3’末端杂交,并且DNA聚合酶通过产生dsDNA来延伸与靶标退火的引物。然后,两个新合成的dsDNA产物在下一轮反应中充当DNA解旋酶的底物,从而导致所选靶序列的指数扩增(Jeong,Y-J.et al;(2009)Cell.Mol.Life Sci.66,3325–3336)。
重组酶聚合酶扩增(RPA)是通过相对的寡核苷酸引物与模板或靶DNA结合以及其由DNA聚合酶的延伸实现的特定DNA片段的等温扩增。扩增模板的全局熔解是待引导至其互补靶序列的引物不需要的。取而代之,RPA利用重组酶-引物复合物扫描双链DNA并促进关联位点处的链交换。如下将所得结构稳定化:通过单链DNA结合蛋白与置换的模板链相互作用,从而阻止引物通过分支迁移的弹出。重组酶解组装使寡核苷酸的3’末端可进入链置换DNA聚合酶,在这种情况下是枯草芽孢杆菌Pol I(Bsu)的大片段,并且引物延伸接踵而至。指数放大通过此过程的循环重复来完成。因此,在一些实施方案中,可以使用LAMP、RPA或其他等温扩增技术来进行靶核酸的预扩增,所述等温扩增技术包括链置换扩增(SDA,Walkeret al(1992)PNAS USA 89:392-396)和解旋酶依赖性扩增(Vincent et al(2004)EMBO Rep5:795-800)。
扩增技术可以在微流控装置中进行(Zanoli and Spoto(2013)Biosensors3(1),18-43)。
在一些实施方案中,系统检测利用多路复用的向导RNA来检测靶初级激活剂。可以使用识别靶核酸初级激活剂的不同部分的多个向导物。在一些实施方案中,可以完成多路复用来识别不同的靶初级激活剂。切割不同核酸底物和/或多路复用的向导物的不同Cas直系同源物(Csm6或Csx1酶)可以与不同的荧光团-淬灭剂报告物一起使用用于检测。这将允许在单个反应中鉴定一个或多个初级激活剂。在一些情况下,该系统设计为检测多个初级激活剂,使得可以测定多个靶标的存在或缺乏。例如,可以使用一种Cas/荧光团组合来检测一种类型的病毒(例如流感),而另一种可以检测另一种类型的病毒(例如,冠状病毒),或者可以使用系统来检测是否存在病毒(例如冠状病毒)以及任何共同感染的病原体,诸如甲型和乙型流感、呼吸道合胞病毒(RSV)、非COVID-19冠状病毒、腺病毒、副流感病毒1至4、人偏肺病毒、鼻病毒/肠病毒、肺炎衣原体(Chlamydia pneumoniae)和肺炎支原体(Mycoplasmapneumoniae)(Kim et al(2020)JAMA doi:10.1001/jama.2020.6266)。
靶(初级激活剂)序列
初级靶序列的来源可以是任何来源,包括哺乳动物、病毒、细菌和真菌。在一些实施方案中,靶序列是微生物或病毒序列,例如冠状病毒序列诸如COVID-19。在其他实施方案中,靶序列是哺乳动物基因组或转录序列。在一些实施方案中,来源可以是人、非人或动物。在一些实施方案中,动物来源可以是驯养或非驯养动物,例如野味。在一些实施方案中,驯养动物是服务或伴侣动物(例如犬、猫、鸟、鱼或爬行动物),或驯养的农场动物。
对于来自致病性来源的初级靶序列,病原体可以具有显著的公共卫生意义,诸如细菌、真菌或原生动物,并且不作为限制,靶序列可以在冠状病毒(例如,严重急性呼吸综合征相关冠状病毒(SARS)、中东呼吸综合征相关冠状病毒(MERS)、COVID-19等)、丙型肝炎病毒、日本脑炎、登革热或寨卡病毒中的一种或多种中发现。可以检测任何病原体(例如病毒、细菌等)。
初级靶序列可以是单链(ss)或双链(ds)DNA或RNA(例如,病毒RNA、mRNA、tRNA、rRNA、iRNA、miRNA等)。当靶序列为单链时,对靶标中的PAM序列没有偏好或要求。然而,当靶DNA为dsDNA时,PAM通常存在于靶DNA的靶序列附近(例如,参见本文他处对PAM的讨论)。靶DNA的来源可以与样品的来源相同,例如如下所述。
在一些情况下,初级靶序列是病毒序列(例如,RNA病毒的基因组RNA或DNA病毒的DNA)。因此,主题方法可以用于检测核酸群体中(例如,样品中)病毒序列的存在。
可能的初级RNA靶标的非限制性实例包括病毒RNA,诸如冠状病毒(SARS、MERS、SARS-CoV-2)、正粘病毒、丙型肝炎病毒(HCV)、埃博拉病、流感、脊髓灰质炎麻疹和逆转录病毒,包括成人T细胞嗜淋巴细胞病毒1型(HTLV-1)和人免疫缺陷病毒(HIV)。
可能的靶DNA的非限制性实例包括但不限于病毒DNA,诸如:乳多泡病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒);嗜肝DNA病毒属(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、嗜淋巴细胞疱疹病毒(herpes lymphotropic virus)、玫瑰糠疹(PityriasisRosea)、卡波西肉瘤相关疱疹病毒);腺病毒(例如,腺胸腺病毒属(atadenovirus)、禽类腺病毒(aviadenovirus)、肌腺病毒(ichtadenovirus)、哺乳动物腺病毒属(mastadenovirus)、唾液酸酶同源性腺病毒(siadenovirus));痘病毒属(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒(orf virus)、假牛痘(pseudocowpox)、牛丘疹性口炎病毒(bovine papular stomatitis virus);塔那痘病毒(tanapox virus)、亚巴猴肿瘤病毒(yaba monkey tumor virus);传染性软疣病毒(molluscum contagiosum virus,MCV);细小病毒属(parvovirus)(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒(humanbocavirus)、bufavirus、人parv4 G1);双生病毒科(Geminiviridae);矮缩病毒科(Nanoviridae);藻类DNA病毒科(Phycodnaviridae);等等。在一些情况下,靶DNA是寄生物DNA。在一些情况下,靶DNA是细菌DNA,例如致病细菌的DNA。
在一些实施方案中,靶核酸是与癌症相关的DNA或RNA序列。这些可以包括在DNA甲基化、组蛋白修饰、信息剪接和microRNA表达中发挥作用的基因。除了众所周知的实例,诸如与慢性髓性白血病相关的所谓费城染色体,在一些实施方案中,靶标是与易位相关的DNA,诸如t(8;14)(q24;q32)、t(2;8)(p12;q24)、t(8;22)(q24;q11)、t(8;14)(q24;q11)和t(8;12)(q24;q22),各自与C-Myc的改变相关,并且与急性淋巴细胞性白血病相关。其他实例包括t(10;14)(q24;q32),其影响LYT10基因并与B细胞淋巴瘤相关联(参见Nambiar(2008)Biochim Biophys Acta 1786:139-152)。其他靶标包括与癌症相关的突变基因,诸如BRCA2(卵巢癌)、BMP2、3、4、7(子宫内膜癌)、CAGE(宫颈癌)、HOXA10(卵巢癌)等(参见Jeong et al(2014)Front Oncol 4(12))。
在一些情况下,使用本发明的方法和组合物来检查展示改变的转录状态的其他病症。实例包括糖尿病、代谢综合征(Hawkins et al(2018)Peer J 6;e5062)、亨廷顿综合征和其他神经系统疾病(Xiang et al,(2018)Front Mol Neurosci 11:153)和癌症。在一些情况下,使用该方法和组合物来监测通过改变的转录状态来表征对施用用于治疗病症的疗法的响应。在一些情况下,使用该方法和组合物来监测非疾病条件下(诸如青春期、妊娠或绝经的开始)改变的转录活性。
样品
包含核酸(例如,多个核酸)的任何样品均可以用于本文所述的组合物、系统和方法中。本文所用的术语“多个”是指两个或更多个。因此,在一些情况下,样品包含两个或更多个(例如,3个或更多个、5个或更多个、10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1000个或更多个或5000个或更多个)核酸(例如,RNA或DNA)。主题方法可以用作检测样品中(例如,在核酸诸如RNA或DNA的复杂混合物中)存在的靶序列的非常灵敏的方法。在一些情况下,样品包含在序列上彼此不同的5个或更多个RNA或DNA(例如,10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1000个或更多个或5000个或更多个RNA或DNA)。在一些情况下,样品包含0个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、103个或更多个、5x103个或更多个、104个或更多个、5x104个或更多个、105个或更多个、5x105个或更多个、106个或更多个5x106个或更多个,或107个或更多个RNA或DNA。在一些情况下,样品包含10至20、20至50、50至100、100至500、500至103、103至5x103、5x103至104、104至5x104、5x104至105、105至5x105、5x105至106、106至5x106,或5x106至107,或超过107个RNA或DNA。在一些情况下,样品包含5至107个RNA或DNA(例如,在序列上彼此不同)(例如,5至106、5至105、5至50,000、5至30,000、10至106、10至10.sup.5、10至50,000、10至30,000、20至106、20至105、20至50,000,或20至30,000个RNA或DNA)。在一些情况下,样品包含在序列上彼此不同的20个或更多个RNA或DNA。在一些情况下,样品包含来自细胞裂解物(例如,真核细胞裂解物、哺乳动物细胞裂解物、人细胞裂解物、原核细胞裂解物、植物细胞裂解物等)的RNA或DNA。例如,在一些情况下,样品包含来自细胞诸如真核细胞,例如哺乳动物细胞诸如人体细胞的RNA或DNA。
合适的样品包括但不限于唾液、血液、血清、血浆、尿液、抽吸物和生检样品。因此,患者相关术语“样品”涵盖血液和其他生物来源的液体样品、实体组织样品诸如生检标本或组织培养物或由此衍生的细胞及其子代)。该定义还包括已在采购后以任何方式操作的样品,诸如通过用试剂处理;清洗;或富集某些细胞群,诸如癌细胞。该定义还包括已富集特定类型分子,例如DNA的样品。术语“样品”包括生物样品,诸如临床样品,诸如血液、血浆、血清、抽吸物、脑脊液(CSF),并且还包括通过手术切除获得的组织、通过生检获得的组织、培养中的细胞、细胞上清液、细胞裂解物、组织样品、器官、骨髓等。“生物样品”包括其中衍生的生物体液(例如,癌细胞、感染细胞等),例如,包含获得自此类细胞的DNA的样品(例如,包含DNA的细胞裂解物或其他细胞提取物)。
样品可以包含或可以获得自多种细胞、组织、器官或无细胞流体中的任一种。合适的样品来源包括真核细胞、细菌细胞和古细菌细胞。合适的样品来源包括单细胞生物和多细胞生物。合适的样品来源包括单细胞真核生物;植物或植物细胞;藻类细胞,例如,布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、拟微球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens)、短丝藻(C.agardh)等;真菌细胞(例如酵母细胞);动物细胞、组织或器官;来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫、昆虫、蛛形纲动物等)的细胞、组织或器官;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、组织、液体或器官;来自哺乳动物(例如,人;非人灵长类动物;有蹄类动物;猫科动物;牛科动物;绵羊;山羊等)的细胞、组织、液体或器官。合适的样品来源包括线虫、原生动物等。合适的样品来源包括寄生物诸如蠕虫、疟疾寄生物等。
合适的样品来源包括六个界,例如细菌界(例如真细菌界);古细菌界;原生生物界;真菌界;植物界和动物界中的任一者的细胞、组织或生物体。合适的样品来源包括原生生物界的植物样成员,包括但不限于藻类(例如绿藻、红藻、灰藻(glaucophytes)、蓝细菌);原生生物界的真菌样成员,例如粘菌类、水霉等;原生生物界的动物样成员,例如鞭毛虫(例如,眼虫属(Euglena))、变形虫样的(例如变形虫)、孢子虫(例如,顶复动物亚门(Apicomplexa)、黏体动物门(Myxozoa)、微孢子虫(Microsporidia))和纤毛虫(例如,草履虫)。合适的样品来源包括真菌界的成员,包括但不限于以下门中的任一者的成员:担子菌门(Basidiomycota)(珊瑚菌(club fungi);例如,伞菌属(Agaricus)、鹅膏属(Amanita)、牛肝菌属(Boletus)、鸡油菌属(Cantherellus)等的成员);子囊菌门(Ascomycota)(子囊菌(Ascomycota),包括,例如,酵母菌属(Saccharomyces));菌藻门(Mycophycophyta)(地衣);接合菌门(Zygomycota)(接合菌);和半知菌门(Deuteromycota)。合适的样品来源包括植物界的成员,包括但不限于以下分支中的任一者的成员:苔藓植物门(Bryophyta)(例如藓类)、角苔门(Anthocerotophyta)(例如角苔类)、地钱门(Hepaticophyta)(例如地钱)、石松植物门(Lycophyta)(例如石松类)、楔叶植物门(Sphenophyta)(例如楔叶类)、裸蕨类(Psilophyta)(例如松叶蕨)、瓶尔小草门(Ophioglossophyta)、蕨类门(Pterophyta)(例如蕨类植物)、苏铁门(Cycadophyta)、银杏门(Gingkophyta)、松柏门(Pinophyta)、买麻藤门(Gnetophyta)和木兰门(Magnoliophyta)(例如显花植物)。合适的样品来源包括动物界的成员,包括但不限于以下门中的任一者的成员:多孔动物门(Porifera)(海绵动物);扁盘动物门(Placozoa);直泳虫门(Orthonectida)(海洋无脊椎动物的寄生物);菱形虫门(Rhombozoa);刺胞动物门(Cnidaria)(珊瑚、海葵、水母、海笔、海肾、海黄蜂);栉水母类(Ctenophora)(栉水母);扁形动物门(Platyhelminthes)(扁形虫);纽形动物门(Nemertina)(纽形动物类);颚胃动物门(Ngathostomulida)(颚胃动物);腹毛纲(Gastrotricha);轮虫纲(Rotifera);三部虫门(Priapulida);动吻纲(Kinorhyncha);铠甲动物门(Loricifera);棘头动物门(Acanthocephala);内肛动物门(Entoprocta);线虫门(Nemotoda);线形虫动物门(Nematomorpha);环口动物门(Cycliophora);软体动物门(Mollusca)(软体动物);星虫动物门(Sipuncula)(花生蠕虫);环节动物门(Annelida)(分节蠕虫);缓步动物门(Tardigrada)(北极熊);有爪动物门(Onychophora)(天鹅绒虫);节肢动物门(Arthropoda)(包括以下亚门:有螯肢亚门(Chelicerata)、多足纲(Myriapoda)、六足纲(Hexapoda)和甲壳纲(Crustacea),其中有螯肢亚门包括:例如,蛛形纲(arachnids)、肢口纲(Merostomata)和海蜘蛛亚门(Pycnogonida),其中多足纲包括:例如,唇足纲(Chilopoda)(唇足类)、倍足纲(Diplopoda)(千足虫)、少足纲(Paropoda)和综合纲(Symphyla),其中六足纲包括昆虫,以及其中甲壳纲包括虾、磷虾、贝属动物等);帚虫动物门(Phoronida);外肛动物门(Ectoprocta)(苔藓虫);腕足动物门(Brachiopoda);棘皮动物门(Echinodermata)(例如海星、海菊花、毛头星、海胆、海参、海蛇尾、brittle baskets等);毛颚动物门(Chaetognatha)(矢虫);半索动物门(Hemichordata)(囊舌虫);以及脊索动物门(Chordata)。脊索动物门的合适的成员包括以下亚门的任何成员:尾索动物(Urochordata)(海鞘;包括海鞘纲(Ascidiacea)、海樽纲(Thaliacea)和幼形纲(Larvacea));头索亚门(Cephalochordata)(文昌鱼);盲鳗纲(Myxini)(粘盲鳗);以及脊椎动物门(Vertebrata),其中脊椎动物门的成员包括:例如,七鳃鳗纲(Petromyzontida)(七鳃鳗)、软骨鱼纲(Chondrichthyces)(软骨鱼)、辐鳍亚纲(Actinopterygii)(辐鳍鱼(ray-finned fish))、腔棘鱼类(Actinista)(腔棘鱼(coelocanths))、肺鱼亚纲(Dipnoi)(肺鱼)、爬行纲(Reptilia)(爬行类,例如蛇、短吻鳄、鳄鱼、蜥蜴等)、鸟纲(Ayes)(鸟类)和哺乳纲(哺乳动物)的成员。合适的植物包括任何单子叶植物和任何双子叶植物。
样品的合适来源包括取自生物体的细胞、流体、组织或器官;取自从生物体分离的特定细胞或细胞群等。例如,生物体为植物时,合适的来源包括木质部、韧皮部、形成层、叶、根等。生物体为动物时,合适的来源包括特定组织(例如,肺、肝、心、肾、脑、脾、皮肤、胎儿组织等),或特定细胞类型(例如,神经元细胞、上皮细胞、内皮细胞、星形胶质细胞、巨噬细胞、胶质细胞、胰岛细胞、T淋巴细胞、B淋巴细胞等)。
在一些情况下,样品的来源是(或怀疑是例如人受试者的病变细胞、流体、组织或器官)。在一些情况下,样品的来源是正常(无疾病)细胞、流体、组织或器官。在一些情况下,样品的来源是(或怀疑是病原体感染的细胞、组织或器官)。例如,样品的来源可以是可能感染或未感染的个体,并且样品可以是从个体收集的任何生物样品(例如,血液、唾液、生检、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,口腔拭子、宫颈拭子、鼻拭子)、间质液、滑液、鼻排出物、泪液、血沉棕黄层、粘膜样品、上皮细胞样品(例如,上皮细胞刮片)等。在一些情况下,样品为无细胞液体样品。在一些情况下,样品是可以包含细胞的液体样品。
样品中待检测的病原体包括病毒、细菌、真菌、蠕虫、原虫、疟原虫、疟原虫属(Plasmodium)寄生物、弓虫属(Toxoplasma)寄生物、血吸虫属(Schistosoma)寄生物等。“蠕虫”包括蛔虫、心虫和植食性线虫(线虫纲(Nematoda))、吸虫(吸虫纲(Tematoda))、棘头纲(Acanthocephala)和绦虫(多节绦虫亚纲(Cestoda))。原生动物感染包含来自贾第虫属种、毛滴虫属种、非洲锥虫病、阿米巴痢疾、巴贝虫病、小袋虫痢疾(balantidial dysentery)、恰加斯病(Chaga's disease)、球虫病、疟疾和弓形虫病的感染。病原体诸如寄生物/原生动物病原体的实例包括但不限于:恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、克氏锥虫(Trypanosoma cruzi)和刚地弓形虫(Toxoplasmagondii)。真菌病原体包括但不限于:新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、粗球孢子菌(Coccidioides immitis)、皮炎芽生菌(Blastomyces dermatitidis)、沙眼衣原体(Chlamydia trachomatis)和白色念珠菌(Candida albicans)。致病性病毒包括,例如,冠状病毒属(例如,COVID-19、MERS、SARS等);免疫缺陷病毒(例如,HIV);流感病毒;登革热;西尼罗河病毒;疱疹病毒;黄热病毒;丙型肝炎病毒;甲型肝炎病毒;乙型肝炎病毒;乳头瘤病毒等。致病性病毒可以包括DNA病毒,诸如:乳多泡病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒);嗜肝DNA病毒属(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、嗜淋巴细胞疱疹病毒、玫瑰糠疹、卡波西肉瘤相关疱疹病毒);腺病毒(例如,腺胸腺病毒、禽类腺病毒、肌腺病毒、哺乳动物腺病毒属、唾液酸酶同源性腺病毒);痘病毒属(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘、牛丘疹性口炎病毒;塔那痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV);细小病毒属(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮缩病毒科;藻类DNA病毒科;以及等等。病原体可能包括,例如,DNA病毒[例如:乳多泡病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒);嗜肝DNA病毒属(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、嗜淋巴细胞疱疹病毒、玫瑰糠疹、卡波西肉瘤相关疱疹病毒);腺病毒(例如,腺胸腺病毒属、禽类腺病毒、肌腺病毒、哺乳动物腺病毒属、唾液酸酶同源性腺病毒);痘病毒属(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘、牛丘疹性口炎病毒;塔那痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV);细小病毒属(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮缩病毒科;藻类DNA病毒科;以及等等]、结核分枝杆菌(Mycobacterium tuberculosis)、无乳链球菌(Streptococcusagalactiae)、耐甲氧西林金黄色葡萄球菌(methicillin-resistant Staphylococcusaureus)、嗜肺军团菌(Legionella pneumophila)、酿脓链球菌(Streptococcuspyogenes)、大肠埃希氏菌(Escherichia coli)、淋病奈瑟氏菌(Neisseria gonorrhoeae)、脑膜炎奈瑟氏菌(Neisseria meningitidis)、肺炎球菌属(Pneumococcus)、新型隐球菌、荚膜组织胞浆菌、流感嗜血杆菌B(Hemophilus influenzae B)、梅毒密螺旋体(Treponemapallidum)、莱姆病螺旋体(Lyme disease spirochetes)、铜绿假单胞菌(Pseudomonasaeruginosa)、麻风分枝杆菌(Mycobacterium leprae)、流产布鲁氏菌(Brucellaabortus)、狂犬病毒、流感病毒、巨细胞病毒、单纯疱疹病毒I型、单纯疱疹病毒II型、人血清细小病毒样病毒、呼吸道合胞病毒、水痘带状疱疹病毒、乙型肝炎病毒、丙型肝炎病毒、麻疹病毒、腺病毒、人T细胞白血病病毒、爱泼斯坦-巴尔病毒、鼠白血病病毒、流行性腮腺炎病毒、水疱性口炎病毒、辛德比斯病毒、淋巴细胞性脉络丛脑膜炎病毒、疣病毒、蓝舌病毒、仙台病毒、猫白血病病毒、呼肠孤病毒、脊髓灰质炎病毒、猿猴病毒40、小鼠乳腺肿瘤病毒、登革热病毒、风疹病毒、西尼罗河病毒、恶性疟原虫、间日疟原虫、刚地弓形虫、让氏锥虫(Trypanosoma rangeli)、克氏锥虫、罗得西亚锥虫(Trypanosoma rhodesiense)、布氏锥虫(Trypanosoma brucei)、曼氏裂体吸虫(Schistosoma mansoni)、日本裂体吸虫(Schistosoma japonicum)、牛巴贝虫(Babesia bovis)、柔嫩艾美耳球虫(Eimeriatenella)、旋盘尾丝虫(Onchocerca volvulus)、热带利什曼虫(Leishmania tropica)、结核分枝杆菌(Mycobacterium tuberculosis)、旋毛虫(Trichinella spiralis)、小泰勒虫(Theileria parva)、泡状带绦虫(Taenia hydatigena)、羊带绦虫(Taenia ovis)、牛带绦虫(Taenia saginata)、细粒棘球绦虫(Echinococcus granulosus)、科氏中殖孔绦虫(Mesocestoides corti)、关节炎支原体(Mycoplasma arthritidis)、猪鼻支原体(M.hyorhinis)、口腔支原体(M.orale)、精氨酸支原体(M.arginini)、莱氏无胆甾支原体(Acholeplasma laidlawii)、唾液支原体(M.salivarium)和肺炎支原体(M.pneumoniae)。
方法
因此,本发明的方法包括(a)使潜在包含靶序列的样品与(i)本文所述的组合物或系统中的任一者接触,和(b)测量可检测的信号,从而检测靶序列(DNA或RNA)。
在一些情况下,方法包括接触包含由一种或多种向导RNA程序化的一种或多种Cas效应物酶的靶标传感器,该向导RNA识别样品中期望的靶核酸序列(例如病毒DNA或RNA),使得将靶传感器激活为非特异性核酸酶(例如,当靶传感器包含Cas13效应蛋白时为非特异性RNA酶,或当靶传感器包含Cas12效应蛋白时为非特异性DNA酶)。在某些情况下,靶传感器包含一个Cas效应蛋白和一个向导RNA。该方法还包括使激活的靶传感器(非特异性核酸酶)与报告分子接触,该报告分子包含可检测标记物和放大器激活剂序列,其中可检测标记物被掩盖(淬灭)并且放大器激活剂分子在由非特异性核酸酶切割前被笼锁(不可用于杂交)。切割后,释放可检测标记物(例如荧光标记物)和放大器激活剂分子两者。随后,释放的放大器激活剂与包含程序化Cas效应蛋白和向导RNA的信号放大器的向导RNA结合(杂交),激活能够切割报告分子并从报告复合物中释放可检测标记物和放大器激活剂分子的另外的非特异性核酸酶。该方法还包括测量可检测标记物,并任选地定量水平。
接触步骤和测量步骤可以在相同或不同容器以及液体和/或固体支持物中进行。例如,可以在相同容器中进行接触并转移用于检测,或替代地,可以在相同容器中进行接触和测量步骤。
可以在各种条件下温育检测混合物,以允许靶核酸序列(如果存在于样品中)与向导RNA杂交。在一些实施方案中,这些条件设计为帮助RNA序列的杂交,其中序列是100%互补的。在其他实施方案中,测定混合物的温育条件可能不同,以允许向导RNA序列和靶序列之间的互补性小于100%,例如靶核酸和向导RNA之间的1个错配,或少于约2个错配、3个错配、4个错配或5个错配。在一些实施方案中,当互补性大于约80%时,靶RNA和向导RNA之间的杂交可以激活Cas效应蛋白的非特异性RNA酶活性。
主题方法的接触步骤可以在包含二价金属离子的组合物中进行。接触步骤可以在无细胞环境中进行,例如在细胞外。接触步骤可以在细胞内进行。接触步骤可以在体外细胞中进行。接触步骤可以在离体细胞中进行。接触步骤可以在体内细胞中进行。
接触步骤可以持续任何长度的时间,包括但不限于测量步骤前2小时或更短(例如,1.5小时或更短、1小时或更短、40分钟或更短、30分钟或更短、20分钟或更短、10分钟或更短,或5分钟或更短,或1分钟或更短)。例如,在一些情况下,在测量步骤之前接触样品40分钟或更短。在一些情况下,在测量步骤之前接触样品20分钟或更短。在一些情况下,在测量步骤之前接触样品10分钟或更短。在一些情况下,在测量步骤之前接触样品5分钟或更短。在一些情况下,在测量步骤之前接触样品1分钟或更短。在一些情况下,在测量步骤之前接触样品50秒至60秒。在一些情况下,在测量步骤之前接触样品40秒至50秒。在一些情况下,在测量步骤之前接触样品30秒至40秒。在一些情况下,在测量步骤之前接触样品20秒至30秒。在一些情况下,在测量步骤之前接触样品10秒至20秒。在一些实施方案中,将样品与Cas蛋白一起温育少于约2小时、90分钟、60分钟、40分钟、30分钟、20分钟、10分钟、5分钟、4分钟、3分钟、2分钟、1分钟、55秒、50秒、40秒、30秒、20秒,或10秒,和超过约5秒、10秒、20秒、30秒、40秒、50秒、60秒、2分钟、3分钟、4分钟、5分钟、10分钟、20分钟、30分钟、40分钟、50分钟、60分钟,或90分钟。
该方法可以在任何温度下,包含约30℃至约30℃(或其中的任何温度)进行。在一些实施方案中,测定(方法)在生理温度下,例如约37℃进行。这允许这些方法在任何地点容易地实践,包含医师的办公室或家里(例如,通过使用体温进行测定(例如,将测定保持在手臂下、皮肤上等)。在一些实施方案中,测定(方法)在60-65℃下进行。
本文所述的方法可以以高度灵敏性检测靶序列(RNA或DNA)。在一些情况下,本公开的方法可以用于检测在包含多个核苷酸(包括靶序列和多个非靶序列)的样品中存在的靶序列,其中靶序列以一个或多个拷贝/107个非靶序列(例如,一个或多个拷贝/106个非靶序列、一个或多个拷贝/105个非靶序列、一个或多个拷贝/104个非靶序列、一个或多个拷贝/103个非靶序列、一个或多个拷贝/102个非靶序列、一个或多个拷贝/50个非靶序列、一个或多个拷贝/20个非靶序列、一个或多个拷贝/10个非靶序列,或一个或多个拷贝/5个非靶序列)存在。在一些情况下,本公开的方法可以用于检测在包含多个序列(包括靶序列和多个非靶序列)的样品中存在的靶序列,其中靶序列以一个或多个拷贝/1018个非靶序列(例如,一个或多个拷贝/1015个非靶序列、一个或多个拷贝/1012个非靶序列、一个或多个拷贝/109个非靶序列、一个或多个拷贝/106个非靶序列、一个或多个拷贝/105个非靶序列、一个或多个拷贝/104个非靶序列、一个或多个拷贝/103个非靶序列、一个或多个拷贝/102个非靶序列、一个或多个拷贝/50个非靶序列、一个或多个拷贝/20个非靶序列、一个或多个拷贝/10个非靶序列,或一个或多个拷贝/5个非靶序列)存在。
在一些情况下,本公开的方法可以检测样品中存在的靶序列(DNA或RNA),其中靶序列以一个拷贝/107个非靶序列至一个拷贝/10个非靶序列(例如,1拷贝/107个非靶序列至1拷贝/102个非靶序列、1拷贝/107个非靶序列至1拷贝/103个非靶序列、1拷贝/107个非靶序列至1拷贝/104个非靶序列、1拷贝/107个非靶序列至1拷贝/105个非靶序列、1拷贝/107个非靶序列至1拷贝/106个非靶序列、1拷贝/106个非靶序列至1拷贝/10个非靶序列、1拷贝/10.sup.6个非靶序列至1拷贝/102个非靶序列、1拷贝/106个非靶序列至1拷贝/103个非靶序列、1拷贝/106个非靶序列至1拷贝/104个非靶序列、1拷贝/106个非靶序列至1拷贝/105个非靶序列、1拷贝/105个非靶序列至1拷贝/10个非靶序列、1拷贝/105个非靶序列至1拷贝/102个非靶序列、1拷贝/105个非靶序列至1拷贝/103个非靶序列,或1拷贝/105个非靶序列至1拷贝/104个非靶序列)存在。
在一些情况下,本公开的方法可以检测样品中存在的靶序列(RNA或DNA),其中靶序列以一个拷贝/1018个非靶序列至一个拷贝/10个非靶序列(例如,1拷贝/1018个非靶序列至1拷贝/102个非靶序列、1拷贝/1015个非靶序列至1拷贝/102个非靶序列、1拷贝/1012个非靶序列至1拷贝/102个非靶序列、1拷贝/109个非靶序列至1拷贝/102个非靶序列、1拷贝/107个非靶序列至1拷贝/102个非靶序列、1拷贝/107个非靶序列至1拷贝/103个非靶序列、1拷贝/107个非靶序列至1拷贝/104个非靶序列、1拷贝/107个非靶序列至1拷贝/105个非靶序列、1拷贝/107个非靶序列至1拷贝/106个非靶序列、1拷贝/106个非靶序列至1拷贝/10个非靶序列、1拷贝/106个非靶序列至1拷贝/10.sup.2个非靶序列、1拷贝/10.sup.6个非靶序列至1拷贝/103个非靶序列、1拷贝/106个非靶序列至1拷贝/104个非靶序列、1拷贝/106个非靶序列至1拷贝/105个非靶序列、1拷贝/105个非靶序列至1拷贝/10个非靶序列、1拷贝/105个非靶序列至1拷贝/102个非靶序列、1拷贝/105个非靶序列至1拷贝/103个非靶序列,或1拷贝/105个非靶序列至1拷贝/104个非靶序列)存在。
在一些情况下,本公开的方法可以检测样品中存在的靶序列(RNA或DNA),其中靶序列以一个拷贝/107个非靶序列至一个拷贝/100个非靶序列(例如,1拷贝/107个非靶序列至1拷贝/102个非靶序列、1拷贝/107个非靶序列至1拷贝/103个非靶序列、1拷贝/107个非靶序列至1拷贝/104个非靶序列、1拷贝/107个非靶序列至1拷贝/105个非靶序列、1拷贝/107个非靶序列至1拷贝/106个非靶序列、1拷贝/106个非靶序列至1拷贝/100个非靶序列、1拷贝/106个非靶序列至1拷贝/102个非靶序列、1拷贝/106个非靶序列至1拷贝/103个非靶序列、1拷贝/106个非靶序列至1拷贝/104个非靶序列、1拷贝/106个非靶序列至1拷贝/105个非靶序列、1拷贝/105个非靶序列至1拷贝/100个非靶序列、1拷贝/105个非靶序列至1拷贝/102个非靶序列、1拷贝/105个非靶序列至1拷贝/103个非靶序列,或1拷贝/105个非靶序列至1拷贝/104个非靶序列)存在。
在一些情况下,对于检测样品中靶序列(RNA或DNA)的主题方法,检测阈值为10nM或更低。本文使用术语“检测阈值”来描述样品中必须存在以便进行检测的靶序列的最小量。因此,作为说明性实例,当检测阈值为10nM时,那么当样品中存在浓度为10nM或更高的靶序列时,可以检测到信号。在一些情况下,本公开的方法具有5nM或更低的检测阈值。在一些情况下,本公开的方法具有1nM或更低的检测阈值。在一些情况下,本公开的方法具有0.5nM或更低的检测阈值。在一些情况下,本公开的方法具有0.1nM或更低的检测阈值。在一些情况下,本公开的方法具有0.05nM或更低的检测阈值。在一些情况下,本公开的方法具有0.01nM或更低的检测阈值。在一些情况下,本公开的方法具有0.005nM或更低的检测阈值。在一些情况下,本公开的方法具有0.001nM或更低的检测阈值。在一些情况下,本公开的方法具有0.0005nM或更低的检测阈值。在一些情况下,本公开的方法具有0.0001nM或更低的检测阈值。在一些情况下,本公开的方法具有0.00005nM或更低的检测阈值。在一些情况下,本公开的方法具有0.00001nM或更低的检测阈值。在一些情况下,本公开的方法具有10pM或更低的检测阈值。在一些情况下,本公开的方法具有1pM或更低的检测阈值。在一些情况下,本公开的方法具有500fM或更低的检测阈值。在一些情况下,本公开的方法具有250fM或更低的检测阈值。在一些情况下,本公开的方法具有100fM或更低的检测阈值。在一些情况下,本公开的方法具有50fM或更低的检测阈值。在一些情况下,本公开的方法具有500aM(渺摩尔)或更低的检测阈值。在一些情况下,本公开的方法具有250aM或更低的检测阈值。在一些情况下,本公开的方法具有100aM或更低的检测阈值。在一些情况下,本公开的方法具有50aM或更低的检测阈值。在一些情况下,本公开的方法具有10aM或更低的检测阈值。在一些情况下,本公开的方法具有1aM或更低的检测阈值。
在一些情况下,检测阈值(用于检测主题方法中的靶序列)的范围为500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM,或1pM至10pM)(其中浓度是指可以检测到靶序列的靶序列的阈值浓度)。在一些情况下,本公开的方法具有范围为800fM至100pM的检测阈值。在一些情况下,本公开的方法具有范围为1pM至10pM的检测阈值。在一些情况下,本公开的方法具有范围为10fM至500fM,例如,10fM至50fM、50fM至100fM、100fM至250fM,或250fM至500fM的检测阈值。
在一些情况下,样品中可以检测到靶序列(DNA或RNA)的最低浓度范围为500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM,或1pM至10pM)。在一些情况下,样品中可以检测到靶序列的最低浓度范围为800fM至100pM。在一些情况下,样品中可以检测到靶序列的最低浓度范围为1pM至10pM。
在一些情况下,检测阈值(用于检测靶序列)的范围为1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM,或1pM至10pM)(其中浓度是指可以检测到靶序列的靶序列的阈值浓度)。在一些情况下,本公开的方法具有范围为1aM至800aM的检测阈值。在一些情况下,本公开的方法具有范围为50aM至1pM的检测阈值。在一些情况下,本公开的方法具有范围为50aM至500fM的检测阈值。
在一些情况下,样品中可以检测到靶序列的最低浓度范围为1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM,或1pM至10pM)。在一些情况下,样品中可以检测到靶序列的最低浓度范围为1aM至500pM。在一些情况下,样品中可以检测到靶序列的最低浓度范围为100aM至500pM。
在一些情况下,主题组合物或方法表现出检测的渺摩尔(aM)灵敏性。在一些情况下,主题组合物或方法表现出检测的飞摩尔(fM)灵敏性。在一些情况下,主题组合物或方法表现出检测的皮摩尔(pM)灵敏性。在一些情况下,主题组合物或方法表现出检测的纳摩尔(nM)灵敏性。
在一些情况下,测量可以是定量的,例如,在检测到的信号量可以用于确定样品中存在的靶序列的量的意义上。在一些情况下,测量可以是定性的,例如,在可检测信号的存在或不存在可以指示靶向序列(例如,病毒、SNP等)的存在或不存在的意义上。在一些情况下,除非靶定序列(例如病毒、SNP等)以高于特定阈值的浓度存在,否则将不存在可检测信号(例如,高于给定阈值水平)。在一些情况下,可以通过修改系统的Cas效应蛋白(例如传感器或放大器)、向导RNA、样品体积和/或检测器(如果使用)的量来滴定检测阈值。因此,例如,正如本领域普通技术人员所理解的,如果期望,可以使用许多对照来设置一个或多个反应,每个反应设置用于检测靶序列的不同阈值水平,因此此一系列反应可以用于确定样品中存在的靶序列的量(例如,可以使用此一系列反应来确定靶序列“至少X的浓度”存在于样品中)。
在一些情况下,本公开的方法可以用于确定样品(例如,包含靶序列和多个非靶序列的样品)中靶序列(RNA或DNA)的量。确定样品中靶序列的量包括比较测试样品生成的可检测信号的量与参考样品生成的可检测信号的量。确定样品中的靶序列量可以包括:测量可检测信号以生成测试测量值;测量参考样品产生的可检测信号以生成参考测量值;比较测试测量值与参考测量值,以确定样品中存在的靶序列的量。
RNA酶抑制剂可以用于本文所述的方法中。在一些实施方案中,测定混合物可能包含抑制非Cas13a依赖性RNA酶活性的一个或多个分子,但不由激活的Cas13a蛋白影响RNA酶活性。例如,该抑制剂可能抑制哺乳动物、细菌或病毒的RNA酶,诸如但不限于RNA酶A和RNA酶H。在一些实施方案中,可以向样品中添加RNA酶抑制剂以帮助保存靶核酸序列。在这些实施方案中,该方法可能包括向样品中添加一种或多种RNA保存化合物,例如一种或多种RNA酶抑制剂的步骤。
检测标记物可以以本领域已知的各种方式实现。例如,比色、荧光或发光标记物的检测可以通过测量特定波长下的吸光度或光发射来完成。在一些实施方案中,可以通过目视检查、显微镜或光检测器检测信号。
试剂盒
本公开提供了用于检测靶核苷酸序列的试剂盒,例如在包含多个序列的样品中。在一些情况下,试剂盒包含本文所述的一个或多个NCR组合物或系统。还可以包含阳性和/或阴性对照和/或还可以包含使用说明书。
实施例
实施例1:冠状病毒DNA的核酸酶链反应检测
进行了实验以比较使用合成靶序列(“初级激活剂”)的不用核酸酶链反应(NCR)或用本文所述的NCR系统的检测。特别地,使用由初级激活剂复合物检测的初级激活剂序列用本文所述的NCR系统进行测定,所述初级激活剂复合物触发导致荧光信号的非特异性切割活性(参见图1A)。在初级激活剂复合物的激活外,当非特异性切割活性从笼锁的激活剂RNA中释放笼时,也可以发生信号放大复合物的激活(图1B)。在一些情况下,经由Csm6发生额外的激活。在一些情况下,初级激活剂复合物是包含Cas13蛋白的RNP(图1C),而在其他情况下,初级激活剂复合物包含Cas12蛋白(图1D)。当Cas12用于初级激活剂方法时,如果初级激活剂分子是RNA,则初级激活剂核酸可以经受RT-LAMP。这些系统中的任一者可以包括使用Csm6来加强信号。Csm6的笼锁激活剂将在序列5’末端包含四个或六个腺苷(A4或A6),其可以经修饰以防止由自身或Cas13的过早切割(例如,2’-OMe、2’-H、2’-F)。Csm6激活剂在其3’末端也具有额外的可切割的A或U,其对底物进行笼锁。如下完成解笼锁:通过修剪掉3’RNA核苷酸生成A4>P或A6>P来激活Csm6。用于对底物进行笼锁的3’-核苷酸的身份可以随用于解笼锁的Cas酶的核苷酸偏好而变化。例如,一个潜在的底物可以是5’-fA-fA-fA-AAAA-3’(SEQ ID NO:1),其中fA核苷酸具有2’-F修饰,并且6个末端A可以由Csm6或LbaCas13切割。
在一些情况下,初级激活剂复合物是包含Cas13蛋白和对初级激活剂RNA特异性的向导物的RNP,而信号放大复合物也包括包含Cas13蛋白和对激活剂RNA特异性的向导物的RNP(图1E)。在一些情况下,初级激活剂复合物是包含Cas12蛋白和对初级激活剂RNA特异性的向导物的RNP,该初级激活剂RNA是使用RT-LAMP制成的。信号激活复合物也包含Cas12蛋白和对激活剂DNA特异性的向导物(图1F)。在任一情况下,也可以利用Csm6扩增。
在一些情况下,初级激活复合物包含Cas13,并使用笼锁的向导RNA。在一些情况下,笼在向导分子的3’末端,其中在其他情况下,笼在向导物的5’末端(图1E)。在一些情况下,激活剂RNA是笼锁的(图1F,策略1),而在其他情况下,激活剂RNA和/或放大器向导物是笼锁的(图1F,策略2)。在所有情况下,笼可以存在于分子的5’、3’或5’和3’末端。笼也可以用在与Csm6扩增一起使用的核酸激活剂上。
在存在或不存在初级激活剂的情况下测试了各种激活剂RNA。此外,也在缺乏激活剂RNA序列和初级激活剂复合物的实验中进行了无NCR能力的测定(图2中的“无次级”)。在这些实验中,初级激活剂和激活剂RNA序列是相同的,在对照实验中下表2A中的序列R004。所测试的激活剂RNA均含有与不同的笼锁序列连接的相同序列以确定笼形结构,该笼形结构将导致扩增途径的最佳诱导,而在不存在初级激活剂的情况下阻止激活。本实验中使用的序列在下表2A中展示。注:名称“-nc”标识缺乏任何笼形结构的核酸。
表2A:合成靶标、检测器和放大器核酸
Figure BDA0004113726330000631
对于所指示的所有反应,1x缓冲液:20mM HEPES(pH 6.8)、50mM KCL、100ug/mlBSA、0.01% Igepal。Integrated Detection Technologies(IDT)合成的向导RNA和激活剂RNA在5μM反应物中使用1x缓冲液进行组装,并在热循环仪中以95℃煮沸3分钟进行折叠,然后立即在冰上冷却。使用2:1蛋白质与crRNA比率,用1μM Cas13和0.5μM crRNA,在1x缓冲液中室温下分别将靶向初级激活剂的Cas13-crRNA复合物和放大器RNA组装10分钟。然后将靶向笼锁放大器的RNP复合物与靶向初级激活剂的RNP混合,并在200nM RNA酶警报(alert)底物(IDT DNA)、20nM放大器RNA和不同量的初级激活剂(1nM-1aM)存在下,使用1x缓冲液进一步稀释。使用50nM靶向初级激活剂的RNP,以及1nM-50nM靶向放大器RNA的RNP的最终浓度。反应在荧光读板器中在37℃下温育长达120分钟,每30s进行荧光测量(λex:485nm;λem:535nm)。
如图2所示,在所评估的不同激活剂RNA间,NCR_061在存在激活剂的情况下的信号和在没有激活剂的情况下的信号之间显示最大差异。此外,与缺乏初级激活剂的实验中的信号相比,NCR系统显示来自合成靶序列的可检测信号的差异增加。在不存在扩增(“单独的初级”)的情况下以及当激活及扩增过程均发生时(“笼+初级”)的信号之间,NCR_45和NCR_42显示出信号中的一些差异。NCR_67没有展示任何差异的信号。NCR_061在初级和扩增均存在时给出快速扩增的信号(“NCR061_amp”),其与从仅初级信号(“仅初级激活剂”)可观察到的数据分开。使用仅NCR_061扩增途径(“NCR061仅笼”)给出信号,其与激活+扩增相比是延迟的。
图3A-3D显示了使用所测试的四种激活剂RNA随时间的实验结果,(NCR_42、NCR_45、NCR_61和NCR_67)显示了一系列的不同结果(图3)。
通过改变添加的初级激活RNP复合物的浓度,完成信号的进一步优化(图4A)。当在本实验中使用200pM的初级激活复合物时,随时间的测量显示出信号快速开始(图4B)。在终点时间点,使用NCR检测到的仅初级激活剂和初级加扩增的信号显示出相似的信号(图4C),但当随时间进行测量时,用初级+NCR进行的实验显示信号上升更快(图4D)。
还测试了包含反TAG序列的激活剂RNA。反TAG序列包含在NCR_061中,使得来自初级激活的信号和激活剂RNA单独驱动的信号远低于初级激活+NCR(图5A-5E)。
设计和测试了包含替代笼锁结构的基于NCR_061序列的激活剂RNA。NCR_176激活剂RNA包含多3倍的聚U序列,并且NCR_177包含多6倍的聚U序列。在这些实验中,Cas12用于初级传感复合物,而Cas13用于扩增复合物。LbuCas13a用于Cas13组分,并且包括增加的聚U序列,实现潜在更多的识别和由其反式RNA酶活性进行的切割。结果(图5A-5E)显示,使用更容易由LbuCas13a释放的笼锁的激活剂,信号增加。
还使用另一个笼锁放大器crRNA进行了NCR反应测试。解笼锁和笼锁的向导物的序列以及所测试的其他序列显示于下表2B。
表2B:所使用的核酸
Figure BDA0004113726330000651
与解笼锁的放大器crRNA NCR_009相比,笼锁的放大器crRNA NCR_018的使用显示出信号的加强(参见图6A-6C)。当减去背景信号(不存在初级激活剂的情况下的信号和仅笼锁放大器crRNA的信号)时,观察到检测的大幅增加。
此外,为了减少在单独的笼锁放大器crRNA和Cas13存在下观察到的背景信号,测试了各种替代的笼锁结构。示例性结果显示在图7中,其中观察到减去背景的信号的一些改善。
还测试了笼锁的结构中的环的大小。测试了包含具有不同熔解温度的环的笼锁的crRNA(参见图8)。结果表明,具有最低熔解温度的那些笼形结构显示出最快速的信号生成。例如,NCR_038包含具有34℃的熔解温度的14个核苷酸的单链环,并且表现出与解笼锁的激活RNA(NCR_035)类似的信号动力学。NCR_039(12个核苷酸环)和NCR_036(12个核苷酸环)在本实验中表现出较慢的信号动力学。
还在该系统中测试了反式笼。针对Cas13a crRNA合成了若干反式笼(参见表2B),所述Cas13a crRNA包含不同单链区,用于通过激活的Cas复合物的反式核酸酶活性的潜在切割。构建反式笼以在与crRNA复合时具有出现在不同位置中的单链环(参见图9A)。然后,相对于所使用的crRNA以不同比率测试反式笼形分子(例如,反式笼:crRNA的20:1、2:1、1:1和1:2比率)。结果表明,在2:1、1:1和1:2的比率下,仍然检测到背景信号,因此在本实验中仅在20:1的比率下检测到对非特异性背景信号的抑制(参见图9B)。
实施例2:
Cas13向导RNA复合物识别靶ssRNA序列,激活其进行RNA切割。靶ssRNA是对SARS-Co-V2特异性的序列。还包括用泛冠状病毒特异性(“泛冠状(Pan-corona)”)的靶ssRNA运行的实验。这些序列的实例显示在下面的表3中。还显示了可以用于鉴定特定靶序列的SARS-CoV-2N和E基因的序列。
表3:冠状病毒特异性靶核酸
Figure BDA0004113726330000661
Figure BDA0004113726330000671
*来自Metsky et al(2020)BioRxiv doi.org/10.1101/2020.02.26.967026.
**来自Broughton et al(2020)Nature doi.org/10.1038/s41587-020-0513-4对于其他SARS Co-V-2靶序列,参见Abbott et al(2020)BioRxiv doi.org/10.1101/2020.03.13.991307;Rauch et al(2020)BioRxiv doi.org/10.1101/2020.04.20.052159。
制备向导RNA(crRNA)用于与靶向SARS-CoV-2基因组的Cas13a一起使用。示例性向导序列显示于下表4中。
表4:用于与Cas13a一起使用的向导RNA
Figure BDA0004113726330000672
/>
Figure BDA0004113726330000681
/>
Figure BDA0004113726330000691
为了测试来自表4的向导序列的子集(NCR_273至NCR_282),根据标准方案,通过体外转录制备一系列向导RNA。这些序列还包含T7启动子序列,以允许RPA和RT-LAMP-T7扩增。示例性序列(NCR_317至NCR_326)显示于表5,其中下划线部分标识T7启动子序列。此外,还生成了合成初级激活剂或靶序列来测试该系统。表6显示的是用于测试来自表5的向导RNA的示例性序列(NCR_327至NCR_336)。
表5:用于与RPA/RT-LAMP-T7一起使用的向导序列
Figure BDA0004113726330000701
表6:合成的初级激活剂序列
Figure BDA0004113726330000702
Figure BDA0004113726330000711
/>
实验在实施例1所述的条件下,使用合成的初级激活剂序列和合成的crRNA在体外进行,并且证明NCR系统检测初级激活剂序列。
在一些情况下,使用经修饰的报告分子,其包含笼锁结构以保护报告寡核苷酸,然后由特定的激活剂复合物(例如,包含Cas13)切割。示例性序列显示于下表7。“/56-FAM”是指5’6-FAM(荧光素)分子,并且“/3IABkFQ”是3’Iowa
Figure BDA0004113726330000712
FQ淬灭剂(IDT)。该序列与本发明的方法和组合物一起使用并且展示出降低的背景信号。
表7:报告序列
Figure BDA0004113726330000713
在使用合成试剂对系统进行演示后,按照标准方案对患者样品进行处理。例如,从健康的供体和患者采集鼻咽拭子。在一些实施方案中,获得唾液样品。按照CDC EUA批准的方案(疾病控制与预防中心(Centers of Disease Control and Prevention)。用于检测2019-nCoV的实时RT-PCR组(美国疾病控制与预防中心,2020);输入120μL,洗脱120μL)中描述的说明,使用Qiagen DSP Viral RNA Mini试剂盒(Qiagen)和MagNA Pure 24仪器(RocheLife Science)提取SARS-CoV-2的样品RNA。在一些情况下,将患者拭子插入特定的病毒灭活缓冲液(例如,DNA/RNA Shield(Zymo Research)或QuickExtractTM(Lucigen))或转运缓冲液(例如,PBS-叠氮化物)中。Cas13传感器复合物的初始相互作用导致笼锁的激活剂或笼锁的向导分子的切割事件,其启动NCR事件。在此,Csm6的A4激活剂序列包含在放大器Cas酶的笼锁crRNA的发夹环中,侧翼为尿嘧啶。
Cas13对环的额外切割事件释放了A4>P,其结合并激活TtCsm6的RNA酶活性。在激活Csm6后,它切割可检测标记物以及任何剩余的解笼锁的crRNA的单链发夹环两者,进一步激活NCR。
使用以下情况进行类似实验,其中具有侧翼U的A4序列存在于Cas12而不是Cas13的笼锁的crRNA中以检测DNA靶标。
可检测标记物可以是F/Q报告物。所使用的荧光报告物可以包含A或C,但也可以容纳Cas13(U)或Cas12(脱氧核糖核苷酸)活性所必需的额外核苷酸。通过将笼锁的crRNA的发夹环中A的数量从4个变为6个,此策略也可以在响应于A6>P的Csm6同系物如表皮葡萄球菌Csm6(SeCsm6)的情况下使用。
实施例3
可以与本发明的方法和组合物一起使用的蛋白质的序列。
Cas13a序列
LshCas13a,WP_018451595.1(Abudayyeh,O.O.,(2016)Science 353(6299),aaf5573)
Figure BDA0004113726330000721
Figure BDA0004113726330000731
LwaCas13a,WP_021746774.1,假定蛋白
Figure BDA0004113726330000732
LseCas13a,WP_012985477.1.(Liu,L.et al(2017)Cell 170(4),714-726)
Figure BDA0004113726330000733
LbmCas13a,WP_044921188.1(假定蛋白)
Figure BDA0004113726330000734
/>
Figure BDA0004113726330000741
LbnCas13a,WP_022785443.1(Liu,L.et al,Cell 170(4),714-726)
Figure BDA0004113726330000742
CamCas13a,WP_031473346.1(假定蛋白)
Figure BDA0004113726330000743
/>
Figure BDA0004113726330000751
CgaCas13a,WP_034560163.1(假定蛋白)
Figure BDA0004113726330000752
Cga2Cas13a,WP_034563842.1(假定蛋白)
Figure BDA0004113726330000753
Pprcas13a,WP_013443710.1(Liu,L.et al,Cell 170(4),714-726)
Figure BDA0004113726330000754
/>
Figure BDA0004113726330000761
LweCas13a,WP_036059185.1(假定蛋白)
Figure BDA0004113726330000762
LneCas13a,WP_036091002.1(假定蛋白)
Figure BDA0004113726330000763
Lwa2cas13a,WP_021746774.1(假定蛋白)
Figure BDA0004113726330000771
RcsCas13a,WP_013067728.1(假定蛋白)
Figure BDA0004113726330000772
RcrCas13a,WP_023911507.1(假定蛋白)
Figure BDA0004113726330000773
/>
Figure BDA0004113726330000781
RcdCas13a,WP_023911507.1(假定蛋白)
Figure BDA0004113726330000782
LbuCas13a,WP_015770004,(Liu,L.et al,Cell 170(4),714-726)
Figure BDA0004113726330000783
RcaCas13a,ETD76934.1(Ding,H.et al(2014)Genome Announc 2(1),e00050-14)
Figure BDA0004113726330000784
/>
Figure BDA0004113726330000791
EreCas13a,WP_055061018.1(假定蛋白)
Figure BDA0004113726330000792
HheCas13a,CRZ35554.1(Wibberg,Daniel,直接提交)
Figure BDA0004113726330000793
/>
Figure BDA0004113726330000801
LbcCas13a,WP_022785443.1((Liu,L.et al,Cell 170(4),714-726
Figure BDA0004113726330000803
Cas13d
惰性真杆菌DSM 15702 ESCas13d
Figure BDA0004113726330000804
未培养的瘤胃球菌属种(Ruminococcus sp.)URCas13d(PDB:6IV9_A)
Figure BDA0004113726330000805
/>
Figure BDA0004113726330000811
Cas12a序列
毛螺菌科细菌(LbCas12a)
Figure BDA0004113726330000812
氨基酸球菌属种(Acidaminococcus sp.)BV3L6(Cas12a)
MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN(SEQ ID NO:137)
凶手弗朗西斯菌(Francisella novicida)(FnCas12a)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN(SEQ ID NO:138)猕猴卟啉单胞菌(Porphyromonas macacae)Cas12a
MKTQHFFEDFTSLYSLSKTIRFELKPIGKTLENIKKNGLIRRDEQRLDDYEKLKKVIDEYHEDFIANILSSFS
FSEEILQSYIQNLSESEARAKIEKTMRDTLAKAFSEDERYKSIFKKELVKKDIPVWCPAYKSLCKKFDNFTTS
LVPFHENRKNLYTSNEITASIPYRIVHVNLPKFIQNIEALCELQKKMGADLYLEMMENLRNVWPSFVKTPDDL
CNLKTYNHLMVQSSISEYNRFVGGYSTEDGTKHQGINEWINIYRQRNKEMRLPGLVFLHKQILAKVDSSSFIS
DTLENDDQVFCVLRQFRKLFWNTVSSKEDDAASLKDLFCGLSGYDPEAIYVSDAHLATISKNIFDRWNYISDA
IRRKTEVLMPRKKESVERYAEKISKQIKKRQSYSLAELDDLLAHYSEESLPAGFSLLSYFTSLGGQKYLVSDG
EVILYEEGSNIWDEVLIAFRDLQVILDKDFTEKKLGKDEEAVSVIKKALDSALRLRKFFDLLSGTGAEIRRDS
SFYALYTDRMDKLKGLLKMYDKVRNYLTKKPYSIEKFKLHFDNPSLLSGWDKNKELNNLSVIFRQNGYYYLGI
MTPKGKNLFKTLPKLGAEEMFYEKMEYKQIAEPMLMLPKVFFPKKTKPAFAPDQSVVDIYNKKTFKTGQKGFN
KKDLYRLIDFYKEALTVHEWKLFNFSFSPTEQYRNIGEFFDEVREQAYKVSMVNVPASYIDEAVENGKLYLFQ
IYNKDFSPYSKGIPNLHTLYWKALFSEQNQSRVYKLCGGGELFYRKASLHMQDTTVHPKGISIHKKNLNKKGE
TSLFNYDLVKDKRFTEDKFFFHVPISINYKNKKITNVNQMVRDYIAQNDDLQIIGIDRGERNLLYISRIDTRG
NLLEQFSLNVIESDKGDLRTDYQKILGDREQERLRRRQEWKSIESIKDLKDGYMSQVVHKICNMVVEHKAIVV
LENLNLSFMKGRKKVEKSVYEKFERMLVDKLNYLVVDKKNLSNEPGGLYAAYQLTNPLFSFEELHRYPQSGIL
FFVDPWNTSLTDPSTGFVNLLGRINYTNVGDARKFFDRFNAIRYDGKGNILFDLDLSRFDVRVETQRKLWTLT
TFGSRIAKSKKSGKWMVERIENLSLCFLELFEQFNIGYRVEKDLKKAILSQDRKEFYVRLIYLFNLMMQIRNS
DGEEDYILSPALNEKNLQFDSRLIEAKDLPVDADANGAYNVARKGLMVVQRIKRGDHESIHRIGRAQWLRY(SEQ ID NO:139)
牛眼莫拉氏菌(Moraxella bovoculi)237Cas12a
MLFQDFTHLYPLSKTVRFELKPIDRTLEHIHAKNFLSQDETMADMHQKVKVILDDYHRDFIADMMGEVKLTKL
AEFYDVYLKFRKNPKDDELQKQLKDLQAVLRKEIVKPIGNGGKYKAGYDRLFGAKLFKDGKELGDLAKFVIAQ
EGESSPKLAHLAHFEKFSTYFTGFHDNRKNMYSDEDKHTAIAYRLIHENLPRFIDNLQILTTIKQKHSALYDQ
IINELTASGLDVSLASHLDGYHKLLTQEGITAYNTLLGGISGEAGSPKIQGINELINSHHNQHCHKSERIAKL
RPLHKQILSDGMSVSFLPSKFADDSEMCQAVNEFYRHYADVFAKVQSLFDGFDDHQKDGIYVEHKNLNELSKQ
AFGDFALLGRVLDGYYVDVVNPEFNERFAKAKTDNAKAKLTKEKDKFIKGVHSLASLEQAIEHYTARHDDESV
QAGKLGQYFKHGLAGVDNPIQKIHNNHSTIKGFLERERPAGERALPKIKSGKNPEMTQLRQLKELLDNALNVA
HFAKLLTTKTTLDNQDGNFYGEFGVLYDELAKIPTLYNKVRDYLSQKPFSTEKYKLNFGNPTLLNGWDLNKEK
DNFGVILQKDGCYYLALLDKAHKKVFDNAPNTGKSIYQKMIYKYLEVRKQFPKVFFSKEAIAINYHPSKELVE
IKDKGRQRSDDERLKLYRFILECLKIHPKYDKKFEGAIGDIQLFKKDKKGREVPISEKDLFDKINGIFSSKPK
LEMEDFFIGEFKRYNPSQDLVDQYNIYKKIDSNDNRKKENFYNNHPKFKKDLVRYYYESMCKHEEWEESFEFS
KKLQDIGCYVDVNELFTEIETRRLNYKISFCNINADYIDELVEQGQLYLFQIYNKDFSPKAHGKPNLHTLYFK
ALFSEDNLADPIYKLNGEAQIFYRKASLDMNETTIHRAGEVLENKNPDNPKKRQFVYDIIKDKRYTQDKFMLH
VPITMNFGVQGMTIKEFNKKVNQSIQQYDEVNVIGIDRGERHLLYLTVINSKGEILEQCSLNDITTASANGTQ
MTTPYHKILDKREIERLNARVGWGEIETIKELKSGYLSHVVHQISQLMLKYNAIVVLEDLNFGFKRGRFKVEK
QIYQNFENALIKKLNHLVLKDKADDEIGSYKNALQLTNNFTDLKSIGKQTGFLFYVPAWNTSKIDPETGFVDL
LKPRYENIAQSQAFFGKFDKICYNADKDYFEFHIDYAKFTDKAKNSRQIWTICSHGDKRYVYDKTANQNKGAA
KGINVNDELKSLFARHHINEKQPNLVMDICQNNDKEFHKSLMYLLKTLLALRYSNASSDEDFILSPVANDEGVFFNSALADDTQPQNADANGAYHIALKGLWLLNELKNSDDLNKVKLAIDNQTWLNFAQNR(SEQ ID NO:140)硫微螺菌属种(Thiomicrospira sp.)XS5 Cas12a
MGIHGVPAATKTFDSEFFNLYSLQKTVRFELKPVGETASFVEDFKNEGLKRVVSEDERRAVDYQKVKEIIDDY
HRDFIEESLNYFPEQVSKDALEQAFHLYQKLKAAKVEEREKALKEWEALQKKLREKVVKCFSDSNKARFSRID
KKELIKEDLINWLVAQNREDDIPTVETFNNFTTYFTGFHENRKNIYSKDDHATAISFRLIHENLPKFFDNVIS
FNKLKEGFPELKFDKVKEDLEVDYDLKHAFEIEYFVNFVTQAGIDQYNYLLGGKTLEDGTKKQGMNEQINLFK
QQQTRDKARQIPKLIPLFKQILSERTESQSFIPKQFESDQELFDSLQKLHNNCQDKFTVLQQAILGLAEADLK
KVFIKTSDLNALSNTIFGNYSVFSDALNLYKESLKTKKAQEAFEKLPAHSIHDLIQYLEQFNSSLDAEKQQST
DTVLNYFIKTDELYSRFIKSTSEAFTQVQPLFELEALSSKRRPPESEDEGAKGQEGFEQIKRIKAYLDTLMEA
VHFAKPLYLVKGRKMIEGLDKDQSFYEAFEMAYQELESLIIPIYNKARSYLSRKPFKADKFKINFDNNTLLSG
WDANKETANASILFKKDGLYYLGIMPKGKTFLFDYFVSSEDSEKLKQRRQKTAEEALAQDGESYFEKIRYKLL
PGASKMLPKVFFSNKNIGFYNPSDDILRIRNTASHTKNGTPQKGHSKVEFNLNDCHKMIDFFKSSIQKHPEWG
SFGFTFSDTSDFEDMSAFYREVENQGYVISFDKIKETYIQSQVEQGNLYLFQIYNKDFSPYSKGKPNLHTLYW
KALFEEANLNNVVAKLNGEAEIFFRRHSIKASDKVVHPANQAIDNKNPHTEKTQSTFEYDLVKDKRYTQDKFF
FHVPISLNFKAQGVSKFNDKVNGFLKGNPDVNIIGIDRGERHLLYFTVVNQKGEILVQESLNTLMSDKGHVND
YQQKLDKKEQERDAARKSWTTVENIKELKEGYLSHVVHKLAHLIIKYNAIVCLEDLNFGFKRGRFKVEKQVYQ
KFEKALIDKLNYLVFKEKELGEVGHYLTAYQLTAPFESFKKLGKQSGILFYVPADYTSKIDPTTGFVNFLDLR
YQSVEKAKQLLSDFNAIRFNSVQNYFEFEIDYKKLTPKRKVGTQSKWVICTYGDVRYQNRRNQKGHWETEEVN
VTEKLKALFASDSKTTTVIDYANDDNLIDVILEQDKASFFKELLWLLKLTMTLRHSKIKSEDDFILSPVKNEQGEFYDSRKAGEVWPKDADANGAYHIALKGLWNLQQINQWEKGKTLNLAIKNQDWFSFIQEKPYQE(SEQ IDNO:141)
丁酸弧菌属种(Butyrivibrio sp.)NC3005 Cas12a
MGIHGVPAAYYQNLTKKYPVSKTIRNELIPIGKTLENIRKNNILESDVKRKQDYEHVKGIMDEYHKQLINEAL
DNYMLPSLNQAAEIYLKKHVDVEDREEFKKTQDLLRREVTGRLKEHENYTKIGKKDILDLLEKLPSISEEDYN
ALESFRNFYTYFTSYNKVRENLYSDEEKSSTVAYRLINENLPKFLDNIKSYAFVKAAGVLADCIEEEEQDALF
MVETFNMTLTQEGIDMYNYQIGKVNSAINLYNQKNHKVEEFKKIPKMKVLYKQILSDREEVFIGEFKDDETLL
SSIGAYGNVLMTYLKSEKINIFFDALRESEGKNVYVKNDLSKTTMSNIVFGSWSAFDELLNQEYDLANENKKK
DDKYFEKRQKELKKNKSYTLEQMSNLSKEDISPIENYIERISEDIEKICIYNGEFEKIVVNEHDSSRKLSKNI
KAVKVIKDYLDSIKELEHDIKLINGSGQELEKNLVVYVGQEEALEQLRPVDSLYNLTRNYLTKKPFSTEKVKL
NFNKSTLLNGWDKNKETDNLGILFFKDGKYYLGIMNTTANKAFVNPPAAKTENVFKKVDYKLLPGSNKMLPKV
FFAKSNIGYYNPSTELYSNYKKGTHKKGPSFSIDDCHNLIDFFKESIKKHEDWSKFGFEFSDTADYRDISEFY
REVEKQGYKLTFTDIDESYINDLIEKNELYLFQIYNKDFSEYSKGKLNLHTLYFMMLFDQRNLDNVVYKLNGE
AEVFYRPASIAENELVIHKAGEGIKNKNPNRAKVKETSTFSYDIVKDKRYSKYKFTLHIPITMNFGVDEVRRF
NDVINNALRTDDNVNVIGIDRGERNLLYVVVINSEGKILEQISLNSIINKEYDIETNYHALLDEREDDRNKAR
KDWNTIENIKELKTGYLSQVVNVVAKLVLKYNAIICLEDLNFGFKRGRQKVEKQVYQKFEKMLIEKLNYLVID
KSREQVSPEKMGGALNALQLTSKFKSFAELGKQSGIIYYVPAYLTSKIDPTTGFVNLFYIKYENIEKAKQFFD
GFDFIRFNKKDDMFEFSFDYKSFTQKACGIRSKWIVYTNGERIIKYPNPEKNNLFDEKVINVTDEIKGLFKQY
RIPYENGEDIKEIIISKAEADFYKRLFRLLHQTLQMRNSTSDGTRDYIISPVKNDRGEFFCSEFSEGTMPKDADANGAYNIARKGLWVLEQIRQKDEGEKVNLSMTNAEWLKYAQLHLL(SEQ ID NO:142)
橙色寒冷微菌(Brumimicrobium aurantiacum)Cas12a
Figure BDA0004113726330000831
Figure BDA0004113726330000841
狗口腔红棕色单胞菌(Porphyromonas crevioricanis)Cas12a
Figure BDA0004113726330000842
土拉热弗朗西斯菌(Francisella tularensis)Cas12a(Ft Cas12a)
Figure BDA0004113726330000843
凸腹真杆菌(Eubacterium ventriosum)Cas12a
Figure BDA0004113726330000844
Figure BDA0004113726330000851
Cas12b序列
酸土脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)Cas12b
Figure BDA0004113726330000852
脂环酸芽孢杆菌(Alicyclobacillus kakegawensis)Cas12b
Figure BDA0004113726330000853
大孢脂环酸芽孢杆菌(Alicyclobacillus macrosporangiidus)Cas12b
Figure BDA0004113726330000861
/>
神话脂环酸芽孢杆菌(Alicyclobacillus hesperidum)Cas12b
Figure BDA0004113726330000862
耐温氧化硫化杆菌(Sulfobacillus thermotolerans)Cas12b
Figure BDA0004113726330000863
Figure BDA0004113726330000871
Cas12c(c2c3)序列
Cas12c1(参见Yan et al(2019)Science Vol.363,Issue 6422,pp.88-91)
MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN**(SEQ ID NO:152)
Cas12c2(参见Yan et al(2019)Science Vol.363,Issue 6422,pp.88-91)
MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK**(SEQ IN NO:153)
Cas12c3(参见Yan et al(2019)Science Vol.363,Issue 6422,pp.88-91)
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL**(SEQ ID NO:154)
Cas12d(CasY)序列
Candidatus Katanobacteria Cas12d(CasY.1)MOEH01000029
MRKKLFKGYILHNKRLVYTGKAAIRSIKYPLVAPNKTALNNLSEKIIYDYEHLFGPLNVASYARNSNRYSLVDFWIDSLRAGVIWQSKSTSLIDLISKLEGSKSPSEKIFEQIDFELKNKLDKEQFKDIILLNTGIRSSSNVRSLRGRFLKCFKEEFRDTEEVIACVDKWSKDLIVEGKSILVSKQFLYWEEEFGIKIFPHFKDNHDLPKLTFFVEPSLEFSPHLPLANCLERLKKFDISRESLLGLDNNFSAFSNYFNELFNLLSRGEIKKIVTAVLAVSKSWENEPELEKRLHFLSEKAKLLGYPKLTSSWADYRMIIGGKIKSWHSNYTEQLIKVREDLKKHQIALDKLQEDLKKVVDSSLREQIEAQREALLPLLDTMLKEKDFSDDLELYRFILSDFKSLLNGSYQRYIQTEEERKEDRDVTKKYKDLYSNLRNIPRFFGESKKEQFNKFINKSLPTIDVGLKILEDIRNALETVSVRKPPSITEEYVTKQLEKLSRKYKINAFNSNRFKQITEQVLRKYNNGELPKISEVFYRYPRESHVAIRILPVKISNPRKDISYLLDKYQISPDWKNSNPGEVVDLIEIYKLTLGWLLSCNKDFSMDFSSYDLKLFPEAASLIKNFGSCLSGYYLSKMIFNCITSEIKGMITLYTRDKFVVRYVTQMIGSNQKFPLLCLVGEKQTKNFSRNWGVLIEEKGDLGEEKNQEKCLIFKDKTDFAKAKEVEIFKNNIWRIRTSKYQIQFLNRLFKKTKEWDLMNLVLSEPSLVLEEEWGVSWDKDKLLPLLKKEKSCEERLYYSLPLNLVPATDYKEQSAEIEQRNTYLGLDVGEFGVAYAVVRIVRDRIELLSWGFLKDPALRKIRERVQDMKKKQVMAVFSSSSTAVARVREMAIHSLRNQIHSIALAYKAKIIYEISISNFETGGNRMAKIYRSIKVSDVYRESGADTLVSEMIWGKKNKQMGNHISSYATSYTCCNCARTPFELVIDNDKEYEKGGDEFIFNVGDEKKVRGFLQKSLLGKTIKGKEVLKSIKEYARPPIREVLLEGEDVEQLLKRRGNSYIYRCPFCGYKTDADIQAALNIACRGYISDNAKDAVKEGERKLDYILEVRKLWEKNGAVLRSAKFL(SEQ IDNO:155)
Candidatus Vogelbacteria Cas12d(CasY.2)MOEJ01000028
MQKVRKTLSEVHKNPYGTKVRNAKTGYSLQIERLSYTGKEGMRSFKIPLENKNKEVFDEFVKKIRNDYISQVGLLNLSDWYEHYQEKQEHYSLADFWLDSLRAGVIFAHKETEIKNLISKIRGDKSIVDKFNASIKKKHADLYALVDIKALYDFLTSDARRGLKTEEEFFNSKRNTLFPKFRKKDNKAVDLWVKKFIGLDNKDKLNFTKKFIGFDPNPQIKYDHTFFFHQDINFDLERITTPKELISTYKKFLGKNKDLYGSDETTEDQLKMVLGFHNNHGAFSKYFNASLEAFRGRDNSLVEQIINNSPYWNSHRKELEKRIIFLQVQSKKIKETELGKPHEYLASFGGKFESWVSNYLRQEEEVKRQLFGYEENKKGQKKFIVGNKQELDKIIRGTDEYEIKAISKETIGLTQKCLKLLEQLKDSVDDYTLSLYRQLIVELRIRLNVEFQETYPELIGKSEKDKEKDAKNKRADKRYPQIFKDIKLIPNFLGETKQMVYKKFIRSADILYEGINFIDQIDKQITQNLLPCFKNDKERIEFTEKQFETLRRKYYLMNSSRFHHVIEGIINNRKLIEMKKRENSELKTFSDSKFVLSKLFLKKGKKYENEVYYTFYINPKARDQRRIKIVLDINGNNSVGILQDLVQKLKPKWDDIIKKNDMGELIDAIEIEKVRLGILIALYCEHKFKIKKELLSLDLFASAYQYLELEDDPEELSGTNLGRFLQSLVCSEIKGAINKISRTEYIERYTVQPMNTEKNYPLLINKEGKATWHIAAKDDLSKKKGGGTVAMNQKIGKNFFGKQDYKTVFMLQDKRFDLLTSKYHLQFLSKTLDTGGGSWWKNKNIDLNLSSYSFIFEQKVKVEWDLTNLDHPIKIKPSENSDDRRLFVSIPFVIKPKQTKRKDLQTRVNYMGIDIGEYGLAWTIINIDLKNKKINKISKQGFIYEPLTHKVRDYVATIKDNQVRGTFGMPDTKLARLRENAITSLRNQVHDIAMRYDAKPVYEFEISNFETGSNKVKVIYDSVKRADIGRGQNNTEADNTEVNLVWGKTSKQFGSQIGAYATSYICSFCGYSPYYEFENSKSGDEEGARDNLYQMKKLSRPSLEDFLQGNPVYKTFRDFDKYKNDQRLQKTGDKDGEWKTHRGNTAIYACQKCRHISDADIQASYWIALKQVVRDFYKDKEMDGDLIQGDNKDKRKVNELNRLIGVHKDVPIINKNLITSLDINLL(SEQ ID NO:156)
Candidatus Vogelbacteria Cas12d(CasY.3)MOEK01000006
MKAKKSFYNQKRKFGKRGYRLHDERIAYSGGIGSMRSIKYELKDSYGIAGLRNRIADATISDNKWLYGNINLNDYLEWRSSKTDKQIEDGDRESSLLGFWLEALRLGFVFSKQSHAPNDFNETALQDLFETLDDDLKHVLDRKKWCDFIKIGTPKTNDQGRLKKQIKNLLKGNKREEIEKTLNESDDELKEKINRIADVFAKNKSDKYTIFKLDKPNTEKYPRINDVQVAFFCHPDFEEITERDRTKTLDLIINRFNKRYEITENKKDDKTSNRMALYSLNQGYIPRVLNDLFLFVKDNEDDFSQFLSDLENFFSFSNEQIKIIKERLKKLKKYAEPIPGKPQLADKWDDYASDFGGKLESWYSNRIEKLKKIPESVSDLRNNLEKIRNVLKKQNNASKILELSQKIIEYIRDYGVSFEKPEIIKFSWINKTKDGQKKVFYVAKMADREFIEKLDLWMADLRSQLNEYNQDNKVSFKKKGKKIEELGVLDFALNKAKKNKSTKNENGWQQKLSESIQSAPLFFGEGNRVRNEEVYNLKDLLFSEIKNVENILMSSEAEDLKNIKIEYKEDGAKKGNYVLNVLARFYARFNEDGYGGWNKVKTVLENIAREAGTDFSKYGNNNNRNAGRFYLNGRERQVFTLIKFEKSITVEKILELVKLPSLLDEAYRDLVNENKNHKLRDVIQLSKTIMALVLSHSDKEKQIGGNYIHSKLSGYNALISKRDFISRYSVQTTNGTQCKLAIGKGKSKKGNEIDRYFYAFQFFKNDDSKINLKVIKNNSHKNIDFNDNENKINALQVYSSNYQIQFLDWFFEKHQGKKTSLEVGGSFTIAEKSLTIDWSGSNPRVGFKRSDTEEKRVFVSQPFTLIPDDEDKERRKERMIKTKNRFIGIDIGEYGLAWSLIEVDNGDKNNRGIRQLESGFITDNQQQVLKKNVKSWRQNQIRQTFTSPDTKIARLRESLIGSYKNQLESLMVAKKANLSFEYEVSGFEVGGKRVAKIYDSIKRGSVRKKDNNSQNDQSWGKKGINEWSFETTAAGTSQFCTHCKRWSSLAIVDIEEYELKDYNDNLFKVKINDGEVRLLGKKGWRSGEKIKGKELFGPVKDAMRPNVDGLGMKIVKRKYLKLDLRDWVSRYGNMAIFICPYVDCHHISHADKQAAFNIAV(SEQ ID NO:157)
Candidatus Parcubacteria Cas12d(CasY.4)KY040242
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI(SEQ ID NO:158)
Candidatus Komeilibacteria Cas12d(CasY.5)MOEI01000022
MAESKQMQCRKCGASMKYEVIGLGKKSCRYMCPDCGNHTSARKIQNKKKRDKKYGSASKAQSQRIAVAGALYPDKKVQTIKTYKYPADLNGEVHDSGVAEKIAQAIQEDEIGLLGPSSEYACWIASQKQSEPYSVVDFWFDAVCAGGVFAYSGARLLSTVLQLSGEESVLRAALASSPFVDDINLAQAEKFLAVSRRTGQDKLGKRIGECFAEGRLEALGIKDRMREFVQAIDVAQTAGQRFAAKLKIFGISQMPEAKQWNNDSGLTVCILPDYYVPEENRADQLVVLLRRLREIAYCMGIEDEAGFEHLGIDPGALSNFSNGNPKRGFLGRLLNNDIIALANNMSAMTPYWEGRKGELIERLAWLKHRAEGLYLKEPHFGNSWADHRSRIFSRIAGWLSGCAGKLKIAKDQISGVRTDLFLLKRLLDAVPQSAPSPDFIASISALDRFLEAAESSQDPAEQVRALYAFHLNAPAVRSIANKAVQRSDSQEWLIKELDAVDHLEFNKAFPFFSDTGKKKKKGANSNGAPSEEEYTETESIQQPEDAEQEVNGQEGNGASKNQKKFQRIPRFFGEGSRSEYRILTEAPQYFDMFCNNMRAIFMQLESQPRKAPRDFKCFLQNRLQKLYKQTFLNARSNKCRALLESVLISWGEFYTYGANEKKFRLRHEASERSSDPDYVVQQALEIARRLFLFGFEWRDCSAGERVDLVEIHKKAISFLLAITQAEVSVGSYNWLGNSTVSRYLSVAGTDTLYGTQLEEFLNATVLSQMRGLAIRLSSQELKDGFDVQLESSCQDNLQHLLVYRASRDLAACKRATCPAELDPKILVLPVGAFIASVMKMIERGDEPLAGAYLRHRPHSFGWQIRVRGVAEVGMDQGTALAFQKPTESEPFKIKPFSAQYGPVLWLNSSSYSQSQYLDGFLSQPKNWSMRVLPQAGSVRVEQRVALIWNLQAGKMRLERSGARAFFMPVPFSFRPSGSGDEAVLAPNRYLGLFPHSGGIEYAVVDVLDSAGFKILERGTIAVNGFSQKRGERQEEAHREKQRRGISDIGRKKPVQAEVDAANELHRKYTDVATRLGCRIVVQWAPQPKPGTAPTAQTVYARAVRTEAPRSGNQEDHARMKSSWGYTWGTYWEKRKPEDILGISTQVYWTGGIGESCPAVAVALLGHIRATSTQTEWEKEEVVFGRLKKFFPS(SEQ ID NO:159)
Candidatus Kerfeldbacteria Cas12d(CasY.6)MHKD01000036
MAESKQMQCRKCGASMKYEVIGLGKKSCRYMCPDCGNHTSARKIQNKKKRDKKYGSASKAQSQRIAVAGALYPDKKVQTIKTYKYPADLNGEVHDRGVAEKIEQAIQEDEIGLLGPSSEYACWIASQKQSEPYSVVDFWFDAVCAGGVFAYSGARLLSTVLQLSGEESVLRAALASSPFVDDINLAQAEKFLAVSRRTGQDKLGKRIGECFAEGRLEALGIKDRMREFVQAIDVAQTAGQRFAAKLKIFGISQMPEAKQWNNDSGLTVCILPDYYVPEENRADQLVVLLRRLREIAYCMGIEDEAGFEHLGIDPGALSNFSNGNPKRGFLGRLLNNDIIALANNMSAMTPYWEGRKGELIERLAWLKHRAEGLYLKEPHFGNSWADHRSRIFSRIAGWLSGCAGKLKIAKDQISGVRTDLFLLKRLLDAVPQSAPSPDFIASISALDRFLEAAESSQDPAEQVRALYAFHLNAPAVRSIANKAVQRSDSQEWLIKELDAVDHLEFNKAFPFFSDTGKKKKKGANSNGAPSEEEYTETESIQQPEDAEQEVNGQEGNGASKNQKKFQRIPRFFGEGSRSEYRILTEAPQYFDMFCNNMRAIFMQLESQPRKAPRDFKCFLQNRLQKLYKQTFLNARSNKCRALLESVLISWGEFYTYGANEKKFRLRHEASERSSDPDYVVQQALEIARRLFLFGFEWRDCSAGERVDLVEIHKKAISFLLAITQAEVSVGSYNWLGNSTVSRYLSVAGTDTLYGTQLEEFLNATVLSQMRGLAIRLSSQELKDGFDVQLESSCQDNLQHLLVYRASRDLAACKRATCPAELDPKILVLPAGAFIASVMKMIERGDEPLAGAYLRHRPHSFGWQIRVRGVAEVGMDQGTALAFQKPTESEPFKIKPFSAQYGPVLWLNSSSYSQSQYLDGFLSQPKNWSMRVLPQAGSVRVEQRVALIWNLQAGKMRLERSGARAFFMPVPFSFRPSGSGDEAVLAPNRYLGLFPHSGGIEYAVVDVLDSAGFKILERGTIAVNGFSQKRGERQEEAHREKQRRGISDIGRKKPVQAEVDAANELHRKYTDVATRLGCRIVVQWAPQPKPGTAPTAQTVYARAVRTEAPRSGNQEDHARMKSSWGYTWSTYWEKRKPEDILGISTQVYWTGGIGESCPAVAVALLGHIRATSTQTEWEKEEVVFGRLKKFFPS(SEQ ID NO:160)
Cas12e(CasX)
>δ-变形菌纲(Deltaproteobacteria)细菌GWA2_43_19 Cas12e1(CasX1)
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPEKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVDRGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFENLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITTADYDGMLVRLKKTSDGWATTLNNKELKAEGQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHADEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA(SEQ ID NO:161)
>浮霉菌门(Plantomycetes)细菌Cas12e(CasX2)
MQEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQPISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVAQPAPKNIDQRKLIPVKDGNERLTSSGFACSQCCQPLYVYKLEQVNDKGKPHTNYFGRCNVSEHERLILLSPHKPEANDELVTYSLGKFGQRALDFYSIHVTRESNHPVKPLEQIGGNSCASGPVGKALSDACMGAVASFLTKYQDIILEHQKVIKKNEKRLANLKDIASANGLAFPKITLPPQPHTKEGIEAYNNVVAQIVIWVNLNLWQKLKIGRDEAKPLQRLKGFPSFPLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALLPYLSSEEDRKKGKKFARYQFGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAENSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLDSSNIKPMNLIGIDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAAKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTCSNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETHADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV(SEQ ID NO:162)
>Cas12e3(CasX3)
MDNANKPSTKSLVNTTRISDHFGVTPGQVTRVFSFGIIPTKRQYAIIERWFAAVEAARERLYGMLYAHFQENPPAYLKEKFSYETFFKGRPVLNGLRDIDPTIMTSAVFTALRHKAEGAMAAFHTNHRRLFEEARKKMREYAECLKANEALLRGAADIDWDKIVNALRTRLNTCLAPEYDAVIADFGALCAFRALIAETNALKGAYNHALNQMLPALVKVDEPEEAEESPRLRFFNGRINDLPKFPVAERETPPDTETIIRQLEDMARVIPDTAEILGYIHRIRHKAARRKPGSAVPLPQRVALYCAIRMERNPEEDPSTVAGHFLGEIDRVCEKRRQGLVRTPFDSQIRARYMDIISFRATLAHPDRWTEIQFLRSNAASRRVRAETISAPFEGFSWTSNRTNPAPQYGMALAKDANAPADAPELCICLSPSSAAFSVREKGGDLIYMRPTGGRRGKDNPGKEITWVPGSFDEYPASGVALKLRLYFGRSQARRMLTNKTWGLLSDNPRVFAANAELVGKKRNPQDRWKLFFHMVISGPPPVEYLDFSSDVRSRARTVIGINRGEVNPLAYAVVSVEDGQVLEEGLLGKKEYIDQLIETRRRISEYQSREQTPPRDLRQRVRHLQDTVLGSARAKIHSLIAFWKGILAIERLDDQFHGREQKIIPKKTYLANKTGFMNALSFSGAVRVDKKGNPWGGMIEIYPGGISRTCTQCGTVWLARRPKNPGHRDAMVVIPDIVDDAAATGFDNVDCDAGTVDYGELFTLSREWVRLTPRYSRVMRGTLGDLERAIRQGDDRKSRQMLELALEPQPQWGQFFCHRCGFNGQSDVLAATNLARRAISLIRRLPDTDTPPTP(SEQ ID NO:163)
Cas12J
Cas12J_1947455
MADTPTLFTQFLRHHLPGQRFRKDILKQAGRILANKGEDATIAFLRGKSEESPPDFQPPVKCPIIACSRPLTEWPIYQASVAIQGYVYGQSLAEFEASDPGCSKDGLLGWFDKTGVCTDYFSVQGLNLIFQNARKRYIGVQTKVTNRNEKRHKKLKRINAKRIAEGLPELTSDEPESALDETGHLIDPPGLNTNIYCYQQVSPKPLALSEVNQLPTAYAGYSTSGDDPIQPMVTKDRLSISKGQPGYIPEHQRALLSQKKHRRMRGYGLKARALLVIVRIQDDWAVIDLRSLLRNAYWRRIVQTKEPSTITKLLKLVTGDPVLDATRMVATFTYKPGIVQVRSAKCLKNKQGSKLFSERYLNETVSVTSIDLGSNNLVAVATYRLVNGNTPELLQRFTLPSHLVKDFERYKQAHDTLEDSIQKTAVASLPQGQQTEIRMWSMYGFREAQERVCQELGLADGSIPWNVMTATSTILTDLFLARGGDPKKCMFTSEPKKKKNSKQVLYKIRDRAWAKMYRTLLSKETREAWNKALWGLKRGSPDYARLSKRKEELARRCVNYTISTAEKRAQCGRTIVALEDLNIGFFHGRGKQEPGWVGLFTRKKENRWLMQALHKAFLELAHHRGYHVIEVNPAYTSQTCPVCRHCDPDNRDQHNREAFHCIGCGFRGNADLDVATHNIAMVAITGESLKRARGSVASKTPQPLAAE*(SEQ ID NO:164)
Cas12J_2071242
MPKPAVESEFSKVLKKHFPGERFRSSYMKRGGKILAAQGEEAVVAYLQGKSEEEPPNFQPPAKCHVVTKSRDFAEWPIMKASEAIQRYIYALSTTERAACKPGKSSESHAAWFAATGVSNHGYSHVQGLNLIFDHTLGRYDGVLKKVQLRNEKARARLESINASRADEGLPEIKAEEEEVATNETGHLLQPPGINPSFYVYQTISPQAYRPRDEIVLPPEYAGYVRDPNAPIPLGVVRNRCDIQKGCPGYIPEWQREAGTAISPKTGKAVTVPGLSPKKNKRMRRYWRSEKEKAQDALLVTVRIGTDWVVIDVRGLLRNARWRTIAPKDISLNALLDLFTGDPVIDVRRNIVTFTYTLDACGTYARKWTLKGKQTKATLDKLTATQTVALVAIDLGQTNPISAGISRVTQENGALQCEPLDRFTLPDDLLKDISAYRIAWDRNEEELRARSVEALPEAQQAEVRALDGVSKETARTQLCADFGLDPKRLPWDKMSSNTTFISEALLSNSVSRDQVFFTPAPKKGAKKKAPVEVMRKDRTWARAYKPRLSVEAQKLKNEALWALKRTSPEYLKLSRRKEELCRRSINYVIEKTRRRTQCQIVIPVIEDLNVRFFHGSGKRLPGWDNFFTAKKENRWFIQGLHKAFSDLRTHRSFYVFEVRPERTSITCPKCGHCEVGNRDGEAFQCLSCGKTCNADLDVATHNLTQVALTGKTMPKREEPRDAQGTAPARKTKKASKSKAPPAEREDQTPAQEPSQTS(SEQ ID NO:165)
Cas12J_1973640
MYILEMADLKSEPSLLAKLLRDRFPGKYWLPKYWKLAEKKRLTGGEEAACEYMADKQLDSPPPNFRPPARCVILAKSRPFEDWPVHRVASKAQSFVIGLSEQGFAALRAAPPSTADARRDWLRSHGASEDDLMALEAQLLETIMGNAISLHGGVLKKIDNANVKAAKRLSGRNEARLNKGLQELPPEQEGSAYGADGLLVNPPGLNLNIYCRKSCCPKPVKNTARFVGHYPGYLRDSDSILISGTMDRLTIIEGMPGHIPAWQREQGLVKPGGRRRRLSGSESNMRQKVDPSTGPRRSTRSGTVNRSNQRTGRNGDPLLVEIRMKEDWVLLDARGLLRNLRWRESKRGLSCDHEDLSLSGLLALFSGDPVIDPVRNEVVFLYGEGIIPVRSTKPVGTRQSKKLLERQASMGPLTLISCDLGQTNLIAGRASAISLTHGSLGVRSSVRIELDPEIIKSFERLRKDADRLETEILTAAKETLSDEQRGEVNSHEKDSPQTAKASLCRELGLHPPSLPWGQMGPSTTFIADMLISHGRDDDAFLSHGEFPTLEKRKKFDKRFCLESRPLLSSETRKALNESLWEVKRTSSEYARLSQRKKEMARRAVNFVVEISRRKTGLSNVIVNIEDLNVRIFHGGGKQAPGWDGFFRPKSENRWFIQAIHKAFSDLAAHHGIPVIESDPQRTSMTCPECGHCDSKNRNGVRFLCKGCGASMDADFDAACRNLERVALTGKPMPKPSTSCERLLSATTGKVCSDHSLSHDAIEKAS*(SEQ ID NO:166)
Cas12J_3339380
MEKEITELTKIRREFPNKKFSSTDMKKAGKLLKAEGPDAVRDFLNSCQEIIGDFKPPVKTNIVSISRPFEEWPVSMVGRAIQEYYFSLTKEELESVHPGTSSEDHKSFFNITGLSNYNYTSVQGLNLIFKNAKAIYDGTLVKANNKNKKLEKKFNEINHKRSLEGLPIITPDFEEPFDENGHLNNPPGINRNIYGYQGCAAKVFVPSKHKMVSLPKEYEGYNRDPNLSLAGFRNRLEIPEGEPGHVPWFQRMDIPEGQIGHVNKIQRFNFVHGKNSGKVKFSDKTGRVKRYHHSKYKDATKPYKFLEESKKVSALDSILAIITIGDDWVVFDIRGLYRNVFYRELAQKGLTAVQLLDLFTGDPVIDPKKGVVTFSYKEGVVPVFSQKIVPRFKSRDTLEKLTSQGPVALLSVDLGQNEPVAARVCSLKNINDKITLDNSCRISFLDDYKKQIKDYRDSLDELEIKIRLEAINSLETNQQVEIRDLDVFSADRAKANTVDMFDIDPNLISWDSMSDARVSTQISDLYLKNGGDESRVYFEINNKRIKRSDYNISQLVRPKLSDSTRKNLNDSIWKLKRTSEEYLKLSKRKLELSRAVVNYTIRQSKLLSGINDIVIILEDLDVKKKFNGRGIRDIGWDNFFSSRKENRWFIPAFHKAFSELSSNRGLCVIEVNPAWTSATCPDCGFCSKENRDGINFTCRKCGVSYHADIDVATLNIARVAVLGKPMSGPADRERLGDTKKPRVARSRKTMKRKDISNSTVEAMVTA*(SEQ ID NO:167)
Cas12J_10037042_3
MDMLDTETNYATETPAQQQDYSPKPPKKAQRAPKGFSKKARPEKKPPKPITLFTQKHFSGVRFLKRVIRDASKILKLSESRTITFLEQAIERDGSAPPDVTPPVHNTIMAVTRPFEEWPEVILSKALQKHCYALTKKIKIKTWPKKGPGKKCLAAWSARTKIPLIPGQVQATNGLFDRIGSIYDGVEKKVTNRNANKKLEYDEAIKEGRNPAVPEYETAYNIDGTLINKPGYNPNLYITQSRTPRLITEADRPLVEKILWQMVEKKTQSRNQARRARLEKAAHLQGLPVPKFVPEKVDRSQKIEIRIIDPLDKIEPYMPQDRMAIKASQDGHVPYWQRPFLSKRRNRRVRAGWGKQVSSIQAWLTGALLVIVRLGNEAFLADIRGALRNAQWRKLLKPDATYQSLFNLFTGDPVVNTRTNHLTMAYREGVVNIVKSRSFKGRQTREHLLTLLGQGKTVAGVSFDLGQKHAAGLLAAHFGLGEDGNPVFTPIQACFLPQRYLDSLTNYRNRYDALTLDMRRQSLLALTPAQQQEFADAQRDPGGQAKRACCLKLNLNPDEIRWDLVSGISTMISDLYIERGGDPRDVHQQVETKPKGKRKSEIRILKIRDGKWAYDFRPKIADETRKAQREQLWKLQKASSEFERLSRYKINIARAIANWALQWGRELSGCDIVIPVLEDLNVGSKFFDGKGKWLLGWDNRFTPKKENRWFIKVLHKAVAELAPHRGVPVYEVMPHRTSMTCPACHYCHPTNREGDRFECQSCHVVKNTDRDVAPYNILRVAVEGKTLDRWQAEKKPQAEPDRPMILIDNQES*(SEQ ID NO:168)
Cas12J_10020921_9
MDMLDTETNYATETPAQQQDYSPKPPKKAQRAPKGFSKKARPEKKPPKPITLFTQKHFSGVRFLKRVIRDASKILKLSESRTITFLEQAIERDGSAPPDVTPPVHNTIMAVTRPFEEWPEVILSKALQKHCYALTKKIKIKTWPKKGPGKKCLAAWSARTKIPLIPGQVQATNGLFDRIGSIYDGVEKKVTNRNANKKLEYDEAIKEGRNPAVPEYETAYNIDGTLINKPGYNPNLYITQSRTPRLITEADRPLVEKILWQMVEKKTQSRNQARRARLEKAAHLQGLPVPKFVPEKVDRSQKIEIRIIDPLDKIEPYMPQDRMAIKASQDGHVPYWQRPFLSKRRNRRVRAGWGKQVSSIQAWLTGALLVIVRLGNEAFLADIRGALRNAQWRKLLKPDATYQSLFNLFTGDPVVNTRTNHLTMAYREGVVDIVKSRSFKGRQTREHLLTLLGQGKTVAGVSFDLGQKHAAGLLAAHFGLGEDGNPVFTPIQACFLPQRYLDSLTNYRNRYDALTLDMRRQSLLALTPAQQQEFADAQRDPGGQAKRACCLKLNLNPDEIRWDLVSGISTMISDLYIERGGDPRDVHQQVETKPKGKRKSEIRILKIRDGKWAYDFRPKIADETRKAQREQLWKLQKASSEFERLSRYKINIARAIANWALQWGRELSGCDIVIPVLEDLNVGSKFFDGKGKWLLGWDNRFTPKKENRWFIKVLHKAVAELAPHKGVPVYEVMPHRTSMTCPACHYCHPTNREGDRFECQSCHVVKNTDRDVAPYNILRVAVEGKTLDRWQAEKKPQAEPDRPMILIDNQES*(SEQ ID NO:169)
Cas12J_10000002_47
MSSLPTPLELLKQKHADLFKGLQFSSKDNKMAGKVLKKDGEEAALAFLSERGVSRGELPNFRPPAKTLVVAQSRPFEEFPIYRVSEAIQLYVYSLSVKELETVPSGSSTKKEHQRFFQDSSVPDFGYTSVQGLNKIFGLARGIYLGVITRGENQLQKAKSKHEALNKKRRASGEAETEFDPTPYEYMTPERKLAKPPGVNHSIMCYVDISVDEFDFRNPDGIVLPSEYAGYCREINTAIEKGTVDRLGHLKGGPGYIPGHQRKESTTEGPKINFRKGRIRRSYTALYAKRDSRRVRQGKLALPSYRHHMMRLNSNAESAILAVIFFGKDWVVFDLRGLLRNVRWRNLFVDGSTPSTLLGMFGDPVIDPKRGVVAFCYKEQIVPVVSKSITKMVKAPELLNKLYLKSEDPLVLVAIDLGQTNPVGVGVYRVMNASLDYEVVTRFALESELLREIESYRQRTNAFEAQIRAETFDAMTSEEQEEITRVRAFSASKAKENVCHRFGMPVDAVDWATMGSNTIHIAKWVMRHGDPSLVEVLEYRKDNEIKLDKNGVPKKVKLTDKRIANLTSIRLRFSQETSKHYNDTMWELRRKHPVYQKLSKSKADFSRRVVNSIIRRVNHLVPRARIVFIIEDLKNLGKVFHGSGKRELGWDSYFEPKSENRWFIQVLHKAFSETGKHKGYYIIECWPNWTSCTCPKCSCCDSENRHGEVFRCLACGYTCNTDFGTAPDNLVKIATTGKGLPGPKKRCKGSSKGKNPKIARSSETGVSVTESGAPKVKKSSPTQTSQSSSQSAP*(SEQ ID NO:170)
Cas12J_10100763_4MNKIEKEKTPLAKLMNENFAGLRFPFAIIKQAGKKLLKEGELKTIEYMTGKGSIEPLPNFKPPVKCLIVAKRRDLKYFPICKASCEIQSYVYSLNYKDFMDYFSTPMTSQKQHEEFFKKSGLNIEYQNVAGLNLIFNNVKNTYNGVILKVKNRNEKLKKKAIKNNYEFEEIKTFNDDGCLINKPGINNVIYCFQSISPKILKNITHLPKEYNDYDCSVDRNIIQKYVSRLDIPESQPGHVPEWQRKLPEFNNTNNPRRRRKWYSNGRNISKGYSVDQVNQAKIEDSLLAQIKIGEDWIILDIRGLLRDLNRRELISYKNKLTIKDVLGFFSDYPIIDIKKNLVTFCYKEGVIQVVSQKSIGNKKSKQLLEKLIENKPIALVSIDLGQTNPVSVKISKLNKINNKISIESFTYRFLNEEILKEIEKYRKDYDKLELKLINEA(SEQ ID NO:171)Cas12J_10004149_10
MDMLDTETNYATETPSQQQDYSPKPPKKDRRAPKGFSKKARPEKKPPKPITLFTQKHFSGVRFLKRVIRDASKILKLSESRTITFLEQAIERDGSAPPDVTPPVHNTIMAVTRPFEEWPEVILSKALQKHCYALTKKIKIKTWPKKGPGKKCLAAWSARTKIPLIPGQVQATNGLFDRIGSIYDGVEKKVTNRNANKKLEYDEAIKEGRNPAVPEYETAYNIDGTLINKPGYNPNLYITQSRTPRLITEADRPLVEKILWQMVEKKTQSRNQARRARLEKAAHLQGLPVPKFVPEKVDRSQKIEIRIIDPLDKIEPYMPQDRMAIKASQDGHVPYWQRPFLSKRRNRRVRAGWGKQVSSIQAWLTGALLVIVRLGNEAFLADIRGALRNAQWRKLLKPDATYQSLFNLFTGDPVVNTRTNHLTMAYREGVVDIVKSRSFKGRQTREHLLTLLGQGKTVAGVSFDLGQKHAAGLLAAHFGLGEDGNPVFTPIQACFLPQRYLDSLTNYRNRYDALTLDMRRQSLLALTPAQQQEFADAQRDPGGQAKRACCLKLNLNPDEIRWDLVSGISTMISDLYIERGGDPRDVHQQVETKPKGKRKSEIRILKIRDGKWAYDFRPKIADETRKAQREQLWKLQKASSEFERLSRYKINIARAIANWALQWGRELSGCDIVIPVLEDLNVGSKFFDGKGKWLLGWDNRFTPKKENRWFIKVLHKAVAELAPHRGVPVYEVMPHRTSMTCPACHYCHPTNREGDRFECQSCHVVKNTDRDVAPYNILRVAVEGKTLDRWQAEKKPQAEPDRPMILIDNQES*(SEQ ID NO:172)Cas12J_10000724_71
MDMLDTETNYATETPSQQQDYSPKPPKKDRRAPKGFSKKARPEKKPPKPITLFTQKHFSGVRFLKRVIRDASKILKLSESRTITFLEQAIERDGSAPPDVTPPVHNTIMAVTRPFEEWPEVILSKALQKHCYALTKKIKIKTWPKKGPGKKCLAAWSARTKIPLIPGQVQATNGLFDRIGSIYDGVEKKVTNRNANKKLEYDEAIKEGRNPAVPEYETAYNIDGTLINKPGYNPNLYITQSRTPRLITEADRPLVEKILWQMVEKKTQSRNQARRARLEKAAHLQGLPVPKFVPEKVDRSQKIEIRIIDPLDKIEPYMPQDRMAIKASQDGHVPYWQRPFLSKRRNRRVRAGWGKQVSSIQAWLTGALLVIVRLGNEAFLADIRGALRNAQWRKLLKPDATYQSLFNLFTGDPVVNTRTNHLTMAYREGVVNIVKSRSFKGRQTREHLLTLLGQGKTVAGVSFDLGQKHAAGLLAAHFGLGEDGNPVFTPIQACFLPQRYLDSLTNYRNRYDALTLDMRRQSLLALTPAQQQEFADAQRDPGGQAKRACCLKLNLNPDEIRWDLVSGISTMISDLYIERGGDPRDVHQQVETKPKGKRKSEIRILKIRDGKWAYDFRPKIADETRKAQREQLWKLQKASSEFERLSRYKINIARAIANWALQWGRELSGCDIVIPVLEDLNVGSKFFDGKGKWLLGWDNRFTPKKENRWFIKVLHKAVAELAPHRGVPVYEVMPHRTSMTCPACHYCHPTNREGDRFECQSCHVVKNTDRDVAPYNILRVAVEGKTLDRWQAEKKPQAEPDRPMILIDNQES*(SEQ ID NO:173)Cas12J_1000001_267MSNTAVSTREHMSNKTTPPSPLSLLLRAHFPGLKFESQDYKIAGKKLRDGGPEAVISYLTGKGQAKLKDVKPPAKAFVIAQSRPFIEWDLVRVSRQIQEKIFGIPATKGRPKQDGLSETAFNEAVASLEVDGKSKLNEETRAAFYEVLGLDAPSLHAQAQNALIKSAISIREGVLKKVENRNEKNLSKTKRRKEAGEEATFVEEKAHDERGYLIHPPGVNQTIPGYQAVVIKSCPSDFIGLPSGCLAKESAEALTDYLPHDRMTIPKGQPGYVPEWQHPLLNRRKNRRRRDWYSASLNKPKATCSKRSGTPNRKNSRTDQIQSGRFKGAIPVLMRFQDEWVIIDIRGLLRNARYRKLLKEKSTIPDLLSLFTGDPSIDMRQGVCTFIYKAGQACSAKMVKTKNAPEILSELTKSGPVVLVSIDLGQTNPIAAKVSRVTQLSDGQLSHETLLRELLSNDSSDGKEIARYRVASDRLRDKLANLAVERLSPEHKSEILRAKNDTPALCKARVCAALGLNPEMIAWDKMTPYTEFLATAYLEKGGDRKVATLKPKNRPEMLRRDIKFKGTEGVRIEVSPEAAEAYREAQWDLQRTSPEYLRLSTWKQELTKRILNQLRHKAAKSSQCEVVVMAFEDLNIKMMHGNGKWADGGWDAFFIKKRENRWFMQAFHKSLTELGAHKGVPTIEVTPHRTSITCTKCGHCDKANRDGERFACQKCGFVAHADLEIATDNIERVALTGKPMPKPESERSGDAKKSVGARKAAFKPEEDAEAAE*(SEQ ID NO:174)
Cas12J_10000286_53
MIKPTVSQFLTPGFKLIRNHSRTAGLKLKNEGEEACKKFVRENEIPKDECPNFQGGPAIANIIAKSREFTEWEIYQSSLAIQEVIFTLPKDKLPEPILKEEWRAQWLSEHGLDTVPYKEAAGLNLIIKNAVNTYKGVQVKVDNKNKNNLAKINRKNEIAKLNGEQEISFEEIKAFDDKGYLLQKPSPNKSIYCYQSVSPKPFITSKYHNVNLPEEYIGYYRKSNEPIVSPYQFDRLRIPIGEPGYVPKWQYTFLSKKENKRRKLSKRIKNVSPILGIICIKKDWCVFDMRGLLRTNHWKKYHKPTDSINDLFDYFTGDPVIDTKANVVRFRYKMENGIVNYKPVREKKGKELLENICDQNGSCKLATVDVGQNNPVAIGLFELKKVNGELTKTLISRHPTPIDFCNKITAYRERYDKLESSIKLDAIKQLTSEQKIEVDNYNNNFTPQNTKQIVCSKLNINPNDLPWDKMISGTHFISEKAQVSNKSEIYFTSTDKGKTKDVMKSDYKWFQDYKPKLSKEVRDALSDIEWRLRRESLEFNKLSKSREQDARQLANWISSMCDVIGIENLVKKNNFFGGSGKREPGWDNFYKPKKENRWWINAIHKALTELSQNKGKRVILLPAMRTSITCPKCKYCDSKNRNGEKFNCLKCGIELNADIDVATENLATVAITAQSMPKPTCERSGDAKKPVRARKAKAPEFHDKLAPSYTVVLREAV*(SEQ ID NO:175)
Cas12J_10001283_7
MRSSREIGDKILMRQPAEKTAFQVFRQEVIGTQKLSGGDAKTAGRLYKQGKMEAAREWLLKGARDDVPPNFQPPAKCLVVAVSHPFEEWDISKTNHDVQAYIYAQPLQAEGHLNGLSEKWEDTSADQHKLWFEKTGVPDRGLPVQAINKIAKAAVNRAFGVVRKVENRNEKRRSRDNRIAEHNRENGLTEVVREAPEVATNADGFLLHPPGIDPSILSYASVSPVPYNSSKHSFVRLPEEYQAYNVEPDAPIPQFVVEDRFAIPPGQPGYVPEWQRLKCSTNKHRRMRQWSNQDYKPKAGRRAKPLEFQAHLTRERAKGALLVVMRIKEDWVVFDVRGLLRNVEWRKVLSEEAREKLTLKGLLDLFTGDPVIDTKRGIVTFLYKAEITKILSKRTVKTKNARDLLLRLTEPGEDGLRREVGLVAVDLGQTHPIAAAIYRIGRTSAGALESTVLHRQGLREDQKEKLKEYRKRHTALDSRLRKEAFETLSVEQQKEIVTVSGSGAQITKDKVCNYLGVDPSTLPWEKMGSYTHFISDDFLRRGGDPNIVHFDRQPKKGKVSKKSQRIKRSDSQWVGRMRPRLSQETAKARMEADWAAQNENEEYKRLARSKQELARWCVNTLLQNTRCITQCDEIVVVIEDLNVKSLHGKGAREPGWDNFFTPKTENRWFIQILHKTFSELPKHRGEHVIEGCPLRTSITCPACSYCDKNSRNGEKFVCVACGATFHADFEVATYNLVRLATTGMPMPKSLERQGGGEKAGGARKARKKAKQVEKIVVQANANVTMNGASLHSP*(SEQ ID NO:176)
Cas12J_1000002_112
MSSLPTPLELLKQKHADLFKGLQFSSKDNKMAGKVLKKDGEEAALAFLSERGVSRGELPNFRPPAKTLVVAQSRPFEEFPIYRVSEAIQLYVYSLSVKELETVPSGSSTKKEHQRFFQDSSVPDFGYTSVQGLNKIFGLARGIYLGVITRGENQLQKAKSKHEALNKKRRASGEAETEFDPTPYEYMTPERKLAKPPGVNHSIMCYVDISVDEFDFRNPDGIVLPSEYAGYCREINTAIEKGTVDRLGHLKGGPGYIPGHQRKESTTEGPKINFRKGRIRRSYTALYAKRDSRRVRQGKLALPSYRHHMMRLNSNAESAILAVIFFGKDWVVFDLRGLLRNVRWRNLFVDGSTPSTLLGMFGDPVIDPKRGVVAFCYKEQIVPVVSKSITKMVKAPELLNKLYLKSEDPLVLVAIDLGQTNPVGVGVYRVMNASLDYEVVTRFALESELLREIESYRQRTNAFEAQIRAETFDAMTSEEQEEITRVRAFSASKAKENVCHRFGMPVDAVDWATMGSNTIHIAKWVMRHGDPSLVEVLEYRKDNEIKLDKNGVPKKVKLTDKRIANLTSIRLRFSQETSKHYNDTMWELRRKHPVYQKLSKSKADFSRRVVNSIIRRVNHLVPRARIVFIIEDLKNLGKVFHGSGKRELGWDSYFEPKSENRWFIQVLHKAFSETGKHKGYYIIECWPNWTSCTCPKCSCCDSENRHGEVFRCLACGYTCNTDFGTAPDNLVKIATTGKGLPGPKKRCKGSSKGKNPKIARSSETGVSVTESGAPKVKKSSPTQTSQSSSQSAP*(SEQ ID NO:177)
Cas12J_10000506_8
MIKPTVSQFLTPGFKL IRNHSRTAGLKLKNEGEEACKKFVRENEIPKDECPNFQGGPAIANIIAKSREFTEWEIYQSSLAIQEVIFTLPKDKLPEPILKEEWRAQWLSEHGLDTVPYKEAAGLNLIIKNAVNTYKGVQVKVDNKNKNNLAKINRKNEIAKLNGEQEISFEEIKAFDDKGYLLQKPSPNKSIYCYQSVSPKPFITSKYHNVNLPEEYIGYYRKSNEPIVSPYQFDRLRIPIGEPGYVPKWQYTFLSKKENKRRKLSKRIKNVSPILGIICIKKDWCVFDMRGLLRTNHWKKYHKPTDSINDLFDYFTGDPVIDTKANVVRFRYKMENGIVNYKPVREKKGKELLENICDQNGSCKLATVDVGQNNPVAIGLFELKKVNGELTKTLISRHPTPIDFCNKITAYRERYDKLESSIKLDAIKQLTSEQKIEVDNYNNNFTPQNTKQIVCSKLNINPNDLPWDKMISGTHFISEKAQVSNKSEIYFTSTDKGKTKDVMKSDYKWFQDYKPKLSKEVRDALSDIEWRLRRESLEFNKLSKSREQDARQLANWISSMCDVIGIENLVKKNNFFGGSGKREPGWDNFYKPKKENRWWINAIHKALTELSQNKGKRVILLPAMRTSITCPKCKYCDSKNRNGEKFNCLKCGIELNADIDVATENLATVAITAQSMPKPTCERSGDAKKPVRARKAKAPEFHDKLAP
SYTVVLREAV*(SEQ ID NO:178)
Cas12J_1000007_143MSNTAVSTREHMSNKTTPPSPLSLLLRAHFPGLKFESQDYKIAGKKLRDGGPEAVISYLTGKGQAKLKDVKPPAKAFVIAQSRPFIEWDLVRVSRQIQEKIFGIPATKGRPKQDGLSETAFNEAVASLEVDGKSKLNEETRAAFYEVLGLDAPSLHAQAQNALIKSAISIREGVLKKVENRNEKNLSKTKRRKEAGEEATFVEEKAHDERGYLIHPPGVNQTIPGYQAVVIKSCPSDFIGLPSGCLAKESAEALTDYLPHDRMTIPKGQPGYVPEWQHPLLNRRKNRRRRDWYSASLNKPKATCSKRSGTPNRKNSRTDQIQSGRFKGAIPVLMRFQDEWVIIDIRGLLRNARYRKLLKEKSTIPDLLSLFTGDPSIDMRQGVCTFIYKAGQACSAKMVKTKNAPEILSELTKSGPVVLVSIDLGQTNPIAAKVSRVTQLSDGQLSHETLLRELLSNDSSDGKEIARYRVASDRLRDKLANLAVERLSPEHKSEILRAKNDTPALCKARVCAALGLNPEMIAWDKMTPYTEFLATAYLEKGGDRKVATLKPKNRPEMLRRDIKFKGTEGVRIEVSPEAAEAYREAQWDLQRTSPEYLRLSTWKQELTKRILNQLRHKAAKSSQCEVVVMAFEDLNIKMMHGNGKWADGGWDAFFIKKRENRWFMQAFHKSLTELGAHKGVPTIEVTPHRTSITCTKCGHCDKANRDGERFACQKCGFVAHADLEIATDNIERVALTGKPMPKPESERSGDAKKSVGARKAAFKPEEDAEAAE*(SQ ID NO:179)
Cas12J_3877103_16
MYSLEMADLKSEPSLLAKLLRDRFPGKYWLPKYWKLAEKKRLTGGEEAACEYMADKQLDSPPPNFRPPARCVILAKSRPFEDWPVHRVASKAQSFVIGLSEQGFAALRAAPPSTADARRDWLRSHGASEDDLMALEAQLLETIMGNAISLHGGVLKKIDNANVKAAKRLSGRNEARLNKGLQELPPEQEGSAYGADGLLVNPPGLNLNIYCRKSCCPKPVKNTARFVGHYPGYLRDSDSILISGTMDRLTIIEGMPGHIPAWQREQGLVKPGGRRRRLSGSESNMRQKVDPSTGPRRSTRSGTVNRSNQRTGRNGDPLLVEIRMKEDWVLLDARGLLRNLRWRESKRGLSCDHEDLSLSGLLALFSGDPVIDPVRNEVVFLYGEGIIPVRSTKPVGTRQSKKLLERQASMGPLTLISCDLGQTNLIAGRASAISLTHGSLGVRSSVRIELDPEIIKSFERLRKDADRLETEILTAAKETLSDEQRGEVNSHEKDSPQTAKASLCRELGLHPPSLPWGQMGPSTTFIADMLISHGRDDDAFLSHGEFPTLEKRKKFDKRFCLESRPLLSSETRKALNESLWEVKRTSSEYARLSQRKKEMARRAVNFVVEISRRKTGLSNVIVNIEDLNVRIFHGGGKQAPGWDGFFRPKSENRWFIQAIHKAFSDLAAHHGIPVIESDPQRTSMTCPECGHCDSKNRNGVRFLCKGCGASMDADFDAACRNLERVALTGKPMPKPSTSCERLLSATTGKVCSDH
SLSHDAIEKAS*(SEQ ID NO:180)
Cas12J_877636_12
MEKEITELTKIRREFPNKKFSSTDMKKAGKLLKAEGPDAVRDFLNSCQEIIGDFKPPVKTNIVSISRPFEEWPVSMVGRAIQEYYFSLTKEELESVHPGTSSEDHKSFFNITGLSNYNYTSVQGLNLIFKNAKAIYDGTLVKANNKNKKLEKKFNEINHKRSLEGLPIITPDFEEPFDENGHLNNPPGINRNIYGYQGCAAKVFVPSKHKMVSLPKEYEGYNRDPNLSLAGFRNRLEIPEGEPGHVPWFQRMDIPEGQIGHVNKIQRFNFVHGKNSGKVKFSDKTGRVKRYHHSKYKDATKPYKFLEESKKVSALDSILAIITIGDDWVVFDIRGLYRNVFYRELAQKGLTAVQLLDLFTGDPVIDPKKGVVTFSYKEGVVPVFSQKIVPRFKSRDTLEKLTSQGPVALLSVDLGQNEPVAARVCSLKNINDKITLDNSCRISFLDDYKKQIKDYRDSLDELEIKIRLEAINSLETNQQVEIRDLDVFSADRAKANTVDMFDIDPNLISWDSMSDARVSTQISDLYLKNGGDESRVYFEINNKRIKRSDYNISQLVRPKLSDSTRKNLNDSIWKLKRTSEEYLKLSKRKLELSRAVVNYTIRQSKLLSGINDIVIILEDLDVKKKFNGRGIRDIGWDNFFSSRKENRWFIPAFHKTFSELSSNRGLCVIEVNPAWTSATCPDCGFCSKENRDGINFTCRKCGVSYHADIDVATLNIARVAVLGKPMSGPADRERLGDTKKPRVARSRKTMKRKDISNSTVEAMVTA*(SEQ ID NO:181)
Cas12L序列
>Cas12L_1_257905508
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKISELYKYIPNEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYETLNTCNTEHYTGNILNFSDTYYRRFGYVASAISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINDEIYIDINVSVPFDKKIATTNKVVGIDVNIKHMLLATNILDDGNVKGYVNIYKEVINDSDFKKVCNSTVMQYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMVSLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSAKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTDCRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQID NO:182)
>Cas12L_2_196848753
MAHKKNVGAEIVKTYSFKVKNTNGITMEKLMNAIDEFQSYYNLCSDWICKNLTTMTIGDLDQYIPEKAKGNTYATVLLDEAWKNQPLYKIFGKKYSSNNRNNALYCALSSVIDMTKENVLGFSKTHYIRNDYILNVISNYASKLSKLNTGVKSRAIKETSDEATIIEQVIYEMEHNKWESIEDWKNQIEYLNSKTDYNPTYMERMKTLSAYYSTHKSEVDAKMQEMAVENLVKFGGCRRNNSKKSMFIMGSNTTNYTISYIGGNSFNINFANILNFDVYGRRDVVKNGEVLVDIMANHGDSIVLKIVNGELYADVPCSVTLNKVESNFDKVVGIDVNMKHMLLSTSITDNGSSDFLNIYKEMSNNAEFMALCPEEDRKYYKDISKYVTFAPLELDLLFSRISKQGKVKMEKVYSEILEALKWKFFANGDNKNRIYVESIQKIRQQIKALCVIKNAYYEQQSAYDIDKTQEYIETHPFSLTEKGMSIKSKMDKICQTIIGCRNNIIDYAYSFFERNGYSIIGLEKLTSSQFEKTKSMPTCKSLLNFHKVLGHTLSELETLPINDVVKKGYYTFTTDNEGKITDASLSEKGKVRKMKDDFFNQAIKAIHFADVKDYFATLSNNGQTGIFFVPSQFTSQMDSNTHNLYFENAKNGGLKLAPKYKVRQTQEYHLNGLPADYNAARNIAYIGLDETMRNTFLKKANSNKSLYNQPIYDTGIKKTAGVFSRMKKLKRYEII*.(SEQ ID NO:183)
>Cas12L_3_66741167
MRISPHLFYIFFKKIWKCHFFVLSLYQLNQYIMASHEKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYETLNTCNTEHYTGNILNFSDTYYRRFGYVASAISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGIDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQ ID NO:184)
>Cas12L_4_67031163
MRISPHLFYIFFKKIWKSHFFVLSLYQLNQYIMASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYETLNTCNTEHYTGNILNFPDTYYRRFGYVASTISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGIDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKNPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQ ID NO:185)
>Cas12L_5_67793351
MRISPHLFYIFFKKIWKCHIFVLSLYQLNQYIMASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYETLNTCNTEHYTGNILNFSDTYYRRFGYVASTISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTDCRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQ ID NO:186)
>Cas12L_9_68454124
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYETLNTCNTEHYTGNILNFSDTYYRRFGYVASAISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSAKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVSKLKKDGFVKILDEASV*(SEQID NO:187)
>Cas12L_10_68605313
MMKKMRTNPHLFYICFKKIWKCHFFALSLYQLNQYIMASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANSRDNAIYEALNTCNTEHYTGNILNFSDTYYRRFGYVASTISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINEHGASFVLKIINDEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASA*(SEQ ID NO:188)
>Cas12L_13_69733214
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANSRDNAIYEALNTCNTEHYTGNILNFSDTYYRRFGYVASTISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFEKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTDCRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQID NO:189)
>Cas12L_15_70724743
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYETLNTCNTEHYTGNILNFSDTYYRRFGYVASAISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQID NO:190)
>Cas12L_16_70731038
MAHKKNIGAEIVKTYSFKVKNTNGITMEKLMNAIDEYQSYYNLCSDWICKNLTTMTIGDLDRYIPEKAKDNIYATVLLDEVWKNQPLYKIFGKKYSSNNRINALYCTLSSVIDINKKNILGLSQTYYARNGYILNVISNYASKLSKLNTGVKRHTIKETSDEATIVEQVIYEMEHNKWESIEDWKNQIEYLNSKTDYNPTYMERMKTLSAYYSEHKSEVDAKMQEMAVENLVKFGGCRRNNSKKSMFIMGSSKTTYTISYIGDNCFNINFANILNFDVYGRRDVVKNGEVLVDIMANHGDSIVLKIVNGELYADVPCSTTLNKVESTFDKVAGIDVNMKHMLLSTSVTDNGNSDFVNIYKEMSNNAEFMALCPEEDRKYYKDISQYVTFAPLELDLLFSRISKQGKVKMEKAYSEILEALKWKFFANGDNKNRIYVENIQKIRQQIKALCVIKNAYYEQQSAYDIDKTQEYIEAHPFSLTEKGMSIKSKMDNICRTIIGCRNNIIDYAYSFFERNDYSIIGLEKLTSSQFEKTKSLPTCKSLLNFHKVLGHTLSELETLPINDVVKKGYYTFTTDNEGRITDASLSEKGKVRKMKDDFFNQAIKAIHFADVKDYFATLSNNGQTGIFFVPSQFTSQMDSNTHTLYFENAKNGGLKLASKYKVRKSQEYHLNGLPADYNAARNIAYIGLDEIMRNTFLKKANSNKSLYNQPIYDTGIKKTAGVFSRMKKLKKYKVI*(SEQ ID NO:191)
>Cas12L_17_70959391
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANSRDNAIYEALNTCNTEHYTGNILNFSDTYYRRFGYVASTISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMQYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKIIDEASV*(SEQID NO:192)
>Cas12L_18_71078086
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANNRDNAIYEALNTCNTEHYTGNILNFSDTYYRRFGYVASTISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINGHGASFVLKIINGEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNGVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQID NO:193)
>Cas12L_22_71456687
MASHKKTESNQIIKTFSFKIKNANGLSLDVLNDAITEYQNYYNICSDWIKDHLTMKIGELYKYIPDEKKNSGYALTLISDEWKDKPMYMMFKKGYPANSRDNAIYEALNTCNTEHYTGNILNFSDTYYRRFGYVASAISNYVTKISKMSTGSRSKNISNDSDVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINEHGASFVLKIINDEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFEKKPFPTVNSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTECRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQID NO:194)
>Cas12L_23_71708971
DVDTIMEQVIYEMEHNGWTSVKDWENQMEYLESKTDSNPNFVYRMTTLYEFYKSHIDEVNSKMETMSIDSLIKFGGCRRKDSKKSMYIMGGSNTPFDITQIGGNSLNIKFSKNLNVDVFGRYDVIKDNTLLVDIINEHGASFVLKIINDEIYIDINVSVPFDKKIATTNKVVGVDVNIKHMLLATNILDDGNVNGYVNIYKEVINDSDFKKVCNSTVMKYFTDFSKFVTFCPLEFDFLFSRVCNQKGIYNDNSAMEKSFSDVLNKLKWNFIETGDNTKRIYIENVMKLRSQMKAYAIVKNAYYKQQSEYDFGKSEEFIQEHPFSNTDKGIEILNKLDNISKKILGCRNNIIQYSYNLFEINGYDMISLEKLTSSQFKKKPFPTVDSLLKYHKILGCTQEEMEKKDIYSVIKKGYYDIIFDNDVVTDAKLSTKGELSKFKDDFFNLMIKSIHFADIKDYFITLSNNGTAGVSLVPSYFTSQMDSIDHKIYFVQDNKSGKLKLANKHKVRSSQEKHINGLNADYNAARNIAYIMENTDCRNMFMKQSRTDKSLYNKPSYETFIKTQGSAVAKLKKEGFVKILDEASV*(SEQ ID NO:195)
Cas14a序列
>Cas14a.1|rifcsphigho2_02_支架_2167_curated|30296..31798|revcom
MEVQKTVMKTLSLRILRPLYSQEIEKEIKEEKERRKQAGGTGELDGGFYKKLEKKHSEMFSFDRLNLLLNQLQREIAKVYNHAISELYIATIAQGNKSNKHYISSIVYNRAYGYFYNAYIALGICSKVEANFRSNELLTQQSALPTAKSDNFPIVLHKQKGAEGEDGGFRISTEGSDLIFEIPIPFYEYNGENRKEPYKWVKKGGQKPVLKLILSTFRRQRNKGWAKDEGTDAEIRKVTEGKYQVSQIEINRGKKLGEHQKWFANFSIEQPIYERKPNRSIVGGLDVGIRSPLVCAINNSFSRYSVDSNDVFKFSKQVFAFRRRLLSKNSLKRKGHGAAHKLEPITEMTEKNDKFRKKIIERWAKEVTNFFVKNQVGIVQIEDLSTMKDREDHFFNQYLRGFWPYYQMQTLIENKLKEYGIEVKRVQAKYTSQLCSNPNCRYWNNYFNFEYRKVNKFPKFKCEKCNLEISADYNAARNLS
TPDIEKFVAKATKGINLPEK(SEQ ID NO:196)
>Cas14a.2|gwa2_支架_18027_curated|7105..8628
MEEAKTVSKTLSLRILRPLYSAEIEKEIKEEKERRKQGGKSGELDSGFYKKLEKKHTQMFGWDKLNLMLSQLQRQIARVFNQSISELYIETVIQGKKSNKHYTSKIVYNRAYSVFYNAYLALGITSKVEANFRSTELLMQKSSLPTAKSDNFPILLHKQKGVEGEEGGFKISADGNDLIFEIPIPFYEYDSANKKEPFKWIKKGGQKPTIKLILSTFRRQRNKGWAKDEGTDAEIRKVIEGKYQVSHIEINRGKKLGDHQKWFVNFTIEQPIYERKLDKNIIGGIDVGIKSPLVCAVNNSFARYSVDSNDVLKFSKQAFAFRRRLLSKNSLKRSGHGSKNKLDPITRMTEKNDRFRKKIIERWAKEVTNFFIKNQVGTVQIEDLSTMKDRQDNFFNQYLRGFWPYYQMQNLIENKLKEYGIETKRIKARYTSQLCSNPSCRHWNSYFSFDHRKTNNFPKFKCEKCALEISADYNAARNISTPDIEKFVAKATKGINLPDKNENVILE.(SEQ ID NO:197)
>Cas14a.3|gwa1_支架_1795_curated|25635..27224|revcomMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(SEQ ID NO:198)
>Cas14a.4|CG10_big_fil_rev_8_21_14_0.10_支架_20906_curated|649..2829
MERQKVPQIRKIVRVVPLRILRPKYSDVIENALKKFKEKGDDTNTNDFWRAIRDRDTEFFRKELNFSEDEINQLERDTLFRVGLDNRVLFSYFDFLQEKLMKDYNKIISKLFINRQSKSSFENDLTDEEVEELIEKDVTPFYGAYIGKGIKSVIKSNLGGKFIKSVKIDRETKKVTKLTAINIGLMGLPVAKSDTFPIKIIKTNPDYITFQKSTKENLQKIEDYETGIEYGDLLVQITIPWFKNENKDFSLIKTKEAIEYYKLNGVGKKDLLNINLVLTTYHIRKKKSWQIDGSSQSLVREMANGELEEKWKSFFDTFIKKYGDEGKSALVKRRVNKKSRAKGEKGRELNLDERIKRLYDSIKAKSFPSEINLIPENYKWKLHFSIEIPPMVNDIDSNLYGGIDFGEQNIATLCVKNIEKDDYDFLTIYGNDLLKHAQASYARRRIMRVQDEYKARGHGKSRKTKAQEDYSERMQKLRQKITERLVKQISDFFLWRNKFHMAVCSLRYEDLNTLYKGESVKAKRMRQFINKQQLFNGIERKLKDYNSEIYVNSRYPHYTSRLCSKCGKLNLYFDFLKFRTKNIIIRKNPDGSEIKYMPFFICEFCGWKQAGDKNASANIADKDYQDKLNKEKEFCNIRKPKSKKEDIGEENEEERDYSRRFNRNSFIYNSLKKDNKLNQEKLFDEWKNQLKRKIDGRNKFEPKEYKDRFSYLFAYYQEIIKNESES(SEQ ID NO:199)
>Cas14a.5|rifcsplowo2_01_支架_34461_curated|4968..6521
MVPTELITKTLQLRVIRPLYFEEIEKELAELKEQKEKEFEETNSLLLESKKIDAKSLKKLKRKARSSAAVEFWKIAKEKYPDILTKPEMEFIFSEMQKMMARFYNKSMTNIFIEMNNDEKVNPLSLISKASTEANQVIKCSSISSGLNRKIAGSINKTKFKQVRDGLISLPTARTETFPISFYKSTANKDEIPISKINLPSEEEADLTITLPFPFFEIKKEKKGQKAYSYFNIIEKSGRSNNKIDLLLSTHRRQRRKGWKEEGGTSAEIRRLMEGEFDKEWEIYLGEAEKSEKAKNDLIKNMTRGKLSKDIKEQLEDIQVKYFSDNNVESWNDLSKEQKQELSKLRKKKVEELKDWKHVKEILKTRAKIGWVELKRGKRQRDRNKWFVNITITRPPFINKELDDTKFGGIDLGVKVPFVCAVHGSPARLIIKENEILQFNKMVSARNRQITKDSEQRKGRGKKNKFIKKEIFNERNELFRKKIIERWANQIVKFFEDQKCATVQIENLESFDRTSYK(SEQ IDNO:200)
>Cas14a.6|3300012359.a|Ga0137385_10000156|41289..42734
MKSDTKDKKIIIHQTKTLSLRIVKPQSIPMEEFTDLVRYHQMIIFPVYNNGAIDLYKKLFKAKIQKGNEARAIKYFMNKIVYAPIANTVKNSYIALGYSTKMQSSFSGKRLWDLRFGEATPPTIKADFPLPFYNQSGFKVSSENGEFIIGIPFGQYTKKTVSDIEKKTSFAWDKFTLEDTTKKTLIELLLSTKTRKMNEGWKNNEGTEAEIKRVMDGTYQVTSLEILQRDDSWFVNFNIAYDSLKKQPDRDKIAGIHMGITRPLTAVIYNNKYRALSIYPNTVMHLTQKQLARIKEQRTNSKYATGGHGRNAKVTGTDTLSEAYRQRRKKIIEDWIASIVKFAINNEIGTIYLEDISNTNSFFAAREQKLIYLEDISNTNSFLSTYKYPISAISDTLQHKLEEKAIQVIRKKAYYVNQICSLCGHYNKGFTYQFRRKNKFPKMKCQGCLEATSTEFNAAANVANPDYEKLLIKHGLLQLKK(SEQ ID NO:201)
Cas14b序列
>Cas14b.10|CG08_land_8_20_14_0.20_支架_1609_curated|6134..7975
MISLKLKLLPDEEQKKLLDEMFWKWASICTRVGFGRADKEDLKPPKDAEGVWFSLTQLNQANTDINDLREAMKHQKHRLEYEKNRLEAQRDDTQDALKNPDRREISTKRKDLFRPKASVEKGFLKLKYHQERYWVRRLKEINKLIERKTKTLIKIEKGRIKFKATRITLHQGSFKIRFGDKPAFLIKALSGKNQIDAPFVVVPEQPICGSVVNSKKYLDEITTNFLAYSVNAMLFGLSRSEEMLLKAKRPEKIKKKEEKLAKKQSAFENKKKELQKLLGRELTQQEEAIIEETRNQFFQDFEVKITKQYSELLSKIANELKQKNDFLKVNKYPILLRKPLKKAKSKKINNLSPSEWKYYLQFGVKPLLKQKSRRKSRNVLGIDRGLKHLLAVTVLEPDKKTFVWNKLYPNPITGWKWRRRKLLRSLKRLKRRIKSQKHETIHENQTRKKLKSLQGRIDDLLHNISRKIVETAKEYDAVIVVEDLQSMRQHGRSKGNRLKTLNYALSLFDYANVMQLIKYKAGIEGIQIYDVKPAGTSQNCAYCLLAQRDSHEYKRSQENSKIGVCLNPNCQNHKKQIDADLNAARVIASCYALKINDSQPFGTRKRFKKRTTN(SEQ ID NO:202)
>Cas14b.11|CG_4_10_14_0.8_um_filter_支架_20762_curated|1372..3219METLSLKLKLNPSKEQLLVLDKMFWKWASICTRLGLKKAEMSDLEPPKDAEGVWFSKTQLNQANTDVNDLRKAMQHQGKRIEYELDKVENRRNEIQEMLEKPDRRDISPNRKDLFRPKAAVEKGYLKLKYHKLGYWSKELKTANKLIERKRKTLAKIDAGKMKFKPTRISLHTNSFRIKFGEEPKIALSTTSKHEKIELPLITSLQRPLKTSCAKKSKTYLDAAILNFLAYSTNAALFGLSRSEEMLLKAKKPEKIEKRDRKLATKRESFDKKLKTLEKLLERKLSEKEKSVFKRKQTEFFDKFCITLDETYVEALHRIAEELVSKNKYLEIKKYPVLLRKPESRLRSKKLKNLKPEDWTYYIQFGFQPLLDTPKPIKTKTVLGIDRGVRHLLAVSIFDPRTKTFTFNRLYSNPIVDWKWRRRKLLRSIKRLKRRLKSEKHVHLHENQFKAKLRSLEGRIEDHFHNLSKEIVDLAKENNSVIVVENLGGMRQHGRGRGKWLKALNYALSHFDYAKVMQLIKYKAELAGVFVYDVAPAGTSINCAYCLLNDKDASNYTRGKVINGKKNTKIGECKTCKKEFDADLNAARVIALCYEKRLNDPQPFGTRKQFKPKKP.(SEQ ID NO:203)
>Cas14b.12|CG22_combo_CG10-13_8_21_14_所有_支架_2003_curated|553..2880|revcom
MKALKLQLIPTRKQYKILDEMFWKWASLANRVSQKGESKETLAPKKDIQKIQFNATQLNQIEKDIKDLRGAMKEQQKQKERLLLQIQERRSTISEMLNDDNNKERDPHRPLNFRPKGWRKFHTSKHWVGELSKILRQEDRVKKTIERIVAGKISFKPKRIGIWSSNYKINFFKRKISINPLNSKGFELTLMTEPTQDLIGKNGGKSVLNNKRYLDDSIKSLLMFALHSRFFGLNNTDTYLLGGKINPSLVKYYKKNQDMGEFGREIVEKFERKLKQEINEQQKKIIMSQIKEQYSNRDSAFNKDYLGLINEFSEVFNQRKSERAEYLLDSFEDKIKQIKQEIGESLNISDWDFLIDEAKKAYGYEEGFTEYVYSKRYLEILNKIVKAVLITDIYFDLRKYPILLRKPLDKIKKISNLKPDEWSYYIQFGYDSINPVQLMSTDKFLGIDRGLTHLLAYSVFDKEKKEFIINQLEPNPIMGWKWKLRKVKRSLQHLERRIRAQKMVKLPENQMKKKLKSIEPKIEVHYHNISRKIVNLAKDYNASIVVESLEGGGLKQHGRKKNARNRSLNYALSLFDYGKIASLIKYKADLEGVPMYEVLPAYTSQQCAKCVLEKGSFVDPEIIGYVEDIGIKGSLLDSLFEGTELSSIQVLKKIKNKIELSARDNHNKEINLILKYNFKGLVIVRGQDKEEIAEHPIKEINGKFAILDFVYKRGKEKVGKKGNQKVRYTGNKKVGYCSKHGQVDADLNASRVIALCKYLDINDPILFGEQRKSFK.(SEQ ID NO:204)
>Cas14b.13|rifcsphigho2_01_支架_82367_curated|1523..3856|revcom
MVTRAIKLKLDPTKNQYKLLNEMFWKWASLANRFSQKGASKETLAPKDGTQKIQFNATQLNQIKKDVDDLRGAMEKQGKQKERLLIQIQERLLTISEILRDDSKKEKDPHRPQNFRPFGWRRFHTSAYWSSEASKLTRQVDRVRRTIERIKAGKINFKPKRIGLWSSTYKINFLKKKINISPLKSKSFELDLITEPQQKIIGKEGGKSVANSKKYLDDSIKSLLIFAIKSRLFGLNNKDKPLFENIITPNLVRYHKKGQEQENFKKEVIKKFENKLKKEISQKQKEIIFSQIERQYENRDATFSEDYLRAISEFSEIFNQRKKERAKELLNSFNEKIRQLKKEVNGNISEEDLKILEVEAEKAYNYENGFIEWEYSEQFLGVLEKIARAVLISDNYFDLKKYPILIRKPTNKSKKITNLKPEEWDYYIQFGYGLINSPMKIETKNFMGIDRGLTHLLAYSIFDRDSEKFTINQLELNPIKGWKWKLRKVKRSLQHLERRMRAQKGVKLPENQMKKRLKSIEPKIESYYHNLSRKIVNLAKANNASIVVESLEGGGLKQHGRKKNSRHRALNYALSLFDYGKIASLIKYKSDLEGVPMYEVLPAYTSQQCAKCVLKKGSFVEPEIIGYIEEIGFKENLLTLLFEDTGLSSVQVLKKSKNKMTLSARDKEGKMVDLVLKYNFKGLVISQEKKKEEIVEFPIKEIDGKFAVLDSAYKRGKERISKKGNQKLVYTGNKKVGYCSVHGQVDADLNASRVIALCKYLGINEPIVFGEQRKSFK(SEQ ID NO:205)
>Cas14b.14|gwc1_支架_8732_curated|2705..4537
LDLITEPIQPHKSSSLRSKEFLEYQISDFLNFSLHSLFFGLASNEGPLVDFKIYDKIVIPKPEERFPKKESEEGKKLDSFDKRVEEYYSDKLEKKIERKLNTEEKNVIDREKTRIWGEVNKLEEIRSIIDEINEIKKQKHISEKSKLLGEKWKKVNNIQETLLSQEYVSLISNLSDELTNKKKELLAKKYSKFDDKIKKIKEDYGLEFDENTIKKEGEKAFLNPDKFSKYQFSSSYLKLIGEIARSLITYKGFLDLNKYPIIFRKPINKVKKIHNLEPDEWKYYIQFGYEQINNPKLETENILGIDRGLTHILAYSVFEPRSSKFILNKLEPNPIEGWKWKLRKLRRSIQNLERRWRAQDNVKLPENQMKKNLRSIEDKVENLYHNLSRKIVDLAKEKNACIVFEKLEGQGMKQHGRKKSDRLRGLNYKLSLFDYGKIAKLIKYKAEIEGIPIYRIDSAYTSQNCAKCVLESRRFAQPEEISCLDDFKEGDNLDKRILEGTGLVEAKIYKKLLKEKKEDFEIEEDIAMFDTKKVIKENKEKTVILDYVYTRRKEIIGTNHKKNIKGIAKYTGNTKIGYCMKHGQVDADLNASRTIALCKNFDINNPEIWK.(SEQ ID NO:206)
>Cas14b.15|3300010293.a|Ga0116204_1008574|2134..4032
MSDESLVSSEDKLAIKIKIVPNAEQAKMLDEMFKKWSSICNRISRGKEDIETLRPDEGKELQFNSTQLNSATMDVSDLKKAMARQGERLEAEVSKLRGRYETIDASLRDPSRRHTNPQKPSSFYPSDWDISGRLTPRFHTARHYSTELRKLKAKEDKMLKTINKIKNGKIVFKPKRITLWPSSVNMAFKGSRLLLKPFANGFEMELPIVISPQKTADGKSQKASAEYMRNALLGLAGYSINQLLFGMNRSQKMLANAKKPEKVEKFLEQMKNKDANFDKKIKALEGKWLLDRKLKESEKSSIAVVRTKFFKSGKVELNEDYLKLLKHMANEILERDGFVNLNKYPILSRKPMKRYKQKNIDNLKPNMWKYYIQFGYEPIFERKASGKPKNIMGIDRGLTHLLAVAVFSPDQQKFLFNHLESNPIMHWKWKLRKIRRSIQHMERRIRAEKNKHIHEAQLKKRLGSIEEKTEQHYHIVSSKIINWAIEYEAAIVLESLSHMKQRGGKKSVRTRALNYALSLFDYEKVARLITYKARIRGIPVYDVLPGMTSKTCATCLLNGSQGAYVRGLETTKAAGKATKRKNMKIGKCMVCNSSENSMIDADLNAARVIAICKYKNLNDPQPAGSRKVFKRF.(SEQ ID NO:207)
>Cas14b.16|3300005573.a|Ga0078972_1001015a|33750..35627
MLALKLKIMPTEKQAEILDAMFWKWASICSRIAKMKKKVSVKENKKELSKKIPSNSDIWFSKTQLCQAEVDVGDHKKALKNFEKRQESLLDELKYKVKAINEVINDESKREIDPNNPSKFRIKDSTKKGNLNSPKFFTLKKWQKILQENEKRIKKKESTIEKLKRGNIFFNPTKISLHEEEYSINFGSSKLLLNCFYKYNKKSGINSDQLENKFNEFQNGLNIICSPLQPIRGSSKRSFEFIRNSIINFLMYSLYAKLFGIPRSVKALMKSNKDENKLKLEEKLKKKKSSFNKTVKEFEKMIGRKLSDNESKILNDESKKFFEIIKSNNKYIPSEEYLKLLKDISEEIYNSNIDFKPYKYSILIRKPLSKFKSKKLYNLKPTDYKYYLQLSYEPFSKQLIATKTILGIDRGLKHLLAVSVFDPSQNKFVYNKLIKNPVFKWKKRYHDLKRSIRNRERRIRALTGVHIHENQLIKKLKSMKNKINVLYHNVSKNIVDLAKKYESTIVLERLENLKQHGRSKGKRYKKLNYVLSNFDYKKIESLISYKAKKEGVPVSNINPKYTSKTCAKCLLEVNQLSELKNEYNRDSKNSKIGICNIHGQIDADLNAARVIALCYSKNLNEPHFK.(SEQ ID NO:208)
>Cas14b.1|rifcsplowo2_01_支架_239_curated|54653..56257
LKLSEQENITTGVKFKLKLDKETSEGLNDYFDEYGKAINFAIKVIQKELAEDRFAGKVRLDENKKPLLNEDGKKIWDFPNEFCSCGKQVNRYVNGKSLCQECYKNKFTEYGIRKRMYSAKGRKAEQDINIKNSTNKISKTHFNYAIREAFILDKSIKKQRKERFRRLREMKKKLQEFIEIRDGNKILCPKIEKQRVERYIHPSWINKEKKLEDFRGYSMSNVLGKIKILDRNIKREEKSLKEKGQINFKARRLMLDKSVKFLNDNKISFTISKNLPKEYELDLPEKEKRLNWLKEKIKIIKNQKPKYAYLLRKDDNFYLQYTLETEFNLKEDYSGIVGIDRGVSHIAVYTFVHNNGKNERPLFLNSSEILRLKNLQKERDRFLRRKHNKKRKKSNMRNIEKKIQLILHNYSKQIVDFAKNKNAFIVFEKLEKPKKNRSKMSKKSQYKLSQFTFKKLSDLVDYKAKREGIKVLYISPEYTSKECSHCGEKVNTQRPFNGNSSLFKCNKCGVELNADYNASINIAKKGLNILNSTN.(SEQ ID NO:209)
>Cas14b.2|rifcsplowo2_01_支架_282_curated|77370..78983
MEESIITGVKFKLRIDKETTKKLNEYFDEYGKAINFAVKIIQKELADDRFAGKAKLDQNKNPILDENGKKIYEFPDEFCSCGKQVNKYVNNKPFCQECYKIRFTENGIRKRMYSAKGRKAEHKINILNSTNKISKTHFNYAIREAFILDKSIKKQRKKRNERLRESKKRLQQFIDMRDGKREICPTIKGQKVDRFIHPSWITKDKKLEDFRGYTLSIINSKIKILDRNIKREEKSLKEKGQIIFKAKRLMLDKSIRFVGDRKVLFTISKTLPKEYELDLPSKEKRLNWLKEKIEIIKNQKPKYAYLLRKNIESEKKPNYEYYLQYTLEIKPELKDFYDGAIGIDRGINHIAVCTFISNDGKVTPPKFFSSGEILRLKNLQKERDRFLLRKHNKNRKKGNMRVIENKINLILHRYSKQIVDMAKKLNASIVFEELGRIGKSRTKMKKSQRYKLSLFIFKKLSDLVDYKSRREGIRVTYVPPEYTSKECSHCGEKVNTQRPFNGNYSLFKCNKCGIQLNSDYNASINIAKKGLKIPNST(SEQ ID NO:210)
>Cas14b.3|rifcsphigho2_01_支架_36781_curated|2592..4217
LWTIVIGDFIEMPKQDLVTTGIKFKLDVDKETRKKLDDYFDEYGKAINFAVKIIQKNLKEDRFAGKIALGEDKKPLLDKDGKKIYNYPNESCSCGNQVRRYVNAKPFCVDCYKLKFTENGIRKRMYSARGRKADSDINIKNSTNKISKTHFNYAIREGFILDKSLKKQRSKRIKKLLELKRKLQEFIDIRQGQMVLCPKIKNQRVDKFIHPSWLKRDKKLEEFRGYSLSVVEGKIKIFNRNILREEDSLRQRGHVNFKANRIMLDKSVRFLDGGKVNFNLNKGLPKEYLLDLPKKENKLSWLNEKISLIKLQKPKYAYLLRREGSFFIQYTIENVPKTFSDYLGAIGIDRGISHIAVCTFVSKNGVNKAPVFFSSGEILKLKSLQKQRDLFLRGKHNKIRKKSNMRNIDNKINLILHKYSRNIVNLAKSEKAFIVFEKLEKIKKSRFKMSKSLQYKLSQFTFKKLSDLVEYKAKIEGIKVDYVPPEYTSKECSHCGEKVDTQRPFNGNSSLFKCNKCRVQLNADYNASINIAKKSLNISNN.(SEQ ID NO:211)
>Cas14b.4|cg1_0.2_支架_785_c_curated|32521..34155
MSKTTISVKLKIIDLSSEKKEFLDNYFNEYAKATTFCQLRIRRLLRNTHWLGKKEKSSKKWIFESGICDLCGENKELVNEDRNSGEPAKICKRCYNGRYGNQMIRKLFVSTKKREVQENMDIRRVAKLNNTHYHRIPEEAFDMIKAADTAEKRRKKNVEYDKKRQMEFIEMFNDEKKRAARPKKPNERETRYVHISKLESPSKGYTLNGIKRKIDGMGKKIERAEKGLSRKKIFGYQGNRIKLDSNWVRFDLAESEITIPSLFKEMKLRITGPTNVHSKSGQIYFAEWFERINKQPNNYCYLIRKTSSNGKYEYYLQYTYEAEVEANKEYAGCLGVDIGCSKLAAAVYYDSKNKKAQKPIEIFTNPIKKIKMRREKLIKLLSRVKVRHRRRKLMQLSKTEPIIDYTCHKTARKIVEMANTAKAFISMENLETGIKQKQQARETKKQKFYRNMFLFRKLSKLIEYKALLKGIKIVYVKPDYTSQTCSSCGADKEKTERPSQAIFRCLNPTCRYYQRDINADFNAAVNIAKKALNNTEVVTTLL.(SEQ ID NO:212)
>Cas14b.5|rifcsphigho2_02_支架_55589_curated|1904..3598
MARAKNQPYQKLTTTTGIKFKLDLSEEEGKRFDEYFSEYAKAVNFCAKVIYQLRKNLKFAGKKELAAKEWKFEISNCDFCNKQKEIYYKNIANGQKVCKGCHRTNFSDNAIRKKMIPVKGRKVESKFNIHNTTKKISGTHRHWAFEDAADIIESMDKQRKEKQKRLRREKRKLSYFFELFGDPAKRYELPKVGKQRVPRYLHKIIDKDSLTKKRGYSLSYIKNKIKISERNIERDEKSLRKASPIAFGARKIKMSKLDPKRAFDLENNVFKIPGKVIKGQYKFFGTNVANEHGKKFYKDRISKILAGKPKYFYLLRKKVAESDGNPIFEYYVQWSIDTETPAITSYDNILGIDAGITNLATTVLIPKNLSAEHCSHCGNNHVKPIFTKFFSGKELKAIKIKSRKQKYFLRGKHNKLVKIKRIRPIEQKVDGYCHVVSKQIVEMAKERNSCIALEKLEKPKKSKFRQRRREKYAVSMFVFKKLATFIKYKAAREGIEIIPVEPEGTSYTCSHCKNAQNNQRPYFKPNSKKSWTSMFKCGKCGIELNSDYNAAFNIAQKALNMTSA.(SEQ ID NO:213)
>Cas14b.6|CG03_land_8_20_14_0.80_支架_2214_curated|6634..8466|revcom
MDEKHFFCSYCNKELKISKNLINKISKGSIREDEAVSKAISIHNKKEHSLILGIKFKLFIENKLDKKKLNEYFDNYSKAVTFAARIFDKIRSPYKFIGLKDKNTKKWTFPKAKCVFCLEEKEVAYANEKDNSKICTECYLKEFGENGIRKKIYSTRGRKVEPKYNIFNSTKELSSTHYNYAIRDAFQLLDALKKQRQKKLKSIFNQKLRLKEFEDIFSDPQKRIELSLKPHQREKRYIHLSKSGQESINRGYTLRFVRGKIKSLTRNIEREEKSLRKKTPIHFKGNRLMIFPAGIKFDFASNKVKISISKNLPNEFNFSGTNVKNEHGKSFFKSRIELIKTQKPKYAYVLRKIKREYSKLRNYEIEKIRLENPNADLCDFYLQYTIETESRNNEEINGIIGIDRGITNLACLVLLKKGDKKPSGVKFYKGNKILGMKIAYRKHLYLLKGKRNKLRKQRQIRAIEPKINLILHQISKDIVKIAKEKNFAIALEQLEKPKKARFAQRKKEKYKLALFTFKNLSTLIEYKSKREGIPVIYVPPEKTSQMCSHCAINGDEHVDTQRPYKKPNAQKPSYSLFKCNKCGIELNADYNAAFNIAQKGLKTLMLNHSH.(SEQ ID NO:214)
>Cas14b.7|3300013125.a|Ga0172369_10000737|994..2652|revcom
MDEEPDSAEPNLAPISVKLKLVKLDGEKLAALNDYFNEYAKAVNFCELKMQKIRKNLVNIRGTYLKEKKAWINQTGECCICKKIDELRCEDKNPDINGKICKKCYNGRYGNQMIRKLFVSTNKRAVPKSLDIRKVARLHNTHYHRIPPEAADIIKAIETAERKRRNRILFDERRYNELKDALENEEKRVARPKKPKEREVRYVPISKKDTPSKGYTMNALVRKVSGMAKKIERAKRNLNKRKKIEYLGRRILLDKNWVRFDFDKSEISIPTMKEFFGEMRFEITGPSNVMSPNGREYFTKWFDRIKAQPDNYCYLLRKESEDETDFYLQYTWRPDAHPKKDYTGCLGIDIGGSKLASAVYFDADKNRAKQPIQIFSNPIGKWKTKRQKVIKVLSKAAVRHKTKKLESLRNIEPRIDVHCHRIARKIVGMALAANAFISMENLEGGIREKQKAKETKKQKFSRNMFVFRKLSKLIEYKALMEGVKVVYIVPDYTSQLCSSCGTNNTKRPKQAIFMCQNTECRYFGKNINADFNAAINIAKKALNRKDIVRELS.(SEQ ID NO:215)
>Cas14b.8|3300013125.a|Ga0172369_10010464|885..2489|revcom
MEKNNSEQTSITTGIKFKLKLDKETKEKLNNYFDEYGKAINFAVRIIQMQLNDDRLAGKYKRDEKGKPILGEDGKKILEIPNDFCSCGNQVNHYVNGVSFCQECYKKRFSENGIRKRMYSAKGRKAEQDINIKNSTNKISKTHFNYAIREAFNLDKSIKKQREKRFKKLKDMKRKLQEFLEIRDGKRVICPKIEKQKVERYIHPSWINKEKKLEEFRGYSLSIVNSKIKSFDRNIQREEKSLKEKGQINFKAQRLMLDKSVKFLKDNKVSFTISKELPKTFELDLPKKEKKLNWLNEKLEIIKNQKPKYAYLLRKENNIFLQYTLDSIPEIHSEYSGAVGIDRGVSHIAVYTFLDKDGKNERPFFLSSSGILRLKNLQKERDKFLRKKHNKIRKKGNMRNIEQKINLILHEYSKQIVNFAKDKNAFIVFELLEKPKKSRERMSKKIQYKLSQFTFKKLSDLVDYKAKREGIKVIYVEPAYTSKDCSHCGERVNTQRPFNGNFSLFKCNKCGIVLNSDYNASLNIARKGLNISAN.(SEQ ID NO:216)
>Cas14b.9|3300013127.a|Ga0172365_10004421|633..2366|revcom
MAEEKFFFCEKCNKDIKIPKNYINKQGAEEKARAKHEHRVHALILGIKFKIYPKKEDISKLNDYFDEYAKAVTFTAKIVDKLKAPFLFAGKRDKDTSKKKWVFPVDKCSFCKEKTEINYRTKQGKNICNSCYLTEFGEQGLLEKIYATKGRKVSSSFNLFNSTKKLTGTHNNYVVKESLQLLDALKKQRSKRLKKLSNTRRKLKQFEEMFEKEDKRFQLPLKEKQRELRFIHVSQKDRATEFKGYTMNKIKSKIKVLRRNIEREQRSLNRKSPVFFRGTRIRLSPSVQFDDKDNKIKLTLSKELPKEYSFSGLNVANEHGRKFFAEKLKLIKENKSKYAYLLRRQVNKNNKKPIYDYYLQYTVEFLPNIITNYNGILGIDRGINTLACIVLLENKKEKPSFVKFFSGKGILNLKNKRRKQLYFLKGVHNKYRKQQKIRPIEPRIDQILHDISKQIIDLAKEKRVAISLEQLEKPQKPKFRQSRKAKYKLSQFNFKTLSNYIDYKAKKEGIRVIYIAPEMTSQNCSRCAMKNDLHVNTQRPYKNTSSLFKCNKCGVELNADYNAAFNIAQKGLKILNS.(SEQ ID NO:217)
Cas14c序列
>Cas14c.1|CG10_big_fil_rev_8_21_14_0.10_支架_4477_curated|19327..20880|revcom
VINLFGYKFALYPNKTQEELLNKHLGECGWLYNKAIEQNEYYKADSNIEEAQKKFELLPDKNSDEAKVLRGNISKDNYVYRTLVKKKKSEINVQIRKAVVLRPAETIRNLAKVKKKGLSVGRLKFIPIREWDVLPFKQSDQIRLEENYLILEPYGRLKFKMHRPLLGKPKTFCIKRTATDRWTISFSTEYDDSNMRKNDGGQVGIDVGLKTHLRLSNENPDEDPRYPNPKIWKRYDRRLTILQRRISKSKKLGKNRTRLRLRLSRLWEKIRNSRADLIQNETYEILSENKLIAIEDLNVKGMQEKKDKKGRKGRTRAQEKGLHRSISDAAFSEFRRVLEYKAKRFGSEVKPVSAIDSSKECHNCGNKKGMPLESRIYECPKCGLKIDRDLNSAKVILARATGVRPGSNARADTKISATAGASVQTEGTVSEDFRQQMETSDQKPMQGEGSKEPPMNPEHKSSGRGSKHVNIGCKNKVGLYNEDENSRSTEKQIMDENRSTTEDMVEIGALHSPVLTT.(SEQ IDNO:218)
>Cas14c.2|3300001245.a|JGI12048J13642_10201286|4257..5489|revcom
MIASIDYEAVSQALIVFEFKAKGKDSQYQAIDEAIRSYRFIRNSCLRYWMDNKKVGKYDLNKYCKVLAKQYPFANKLNSQARQSAAECSWSAISRFYDNCKRKVSGKKGFPKFKKHARSVEYKTSGWKLSENRKAITFTDKNGIGKLKLKGTYDLHFSQLEDMKRVRLVRRADGYYVQFCISVDVKVETEPTGKAIGLDVGIKYFLADSSGNTIENPQFYRKAEKKLNRANRRKSKKYIRGVKPQSKNYHKARCRYARKHLRVSRQRKEYCKRVAYCVIHSNDVVAYEDLNVKGMVKNRHLAKSISDVAWSTFRHWLEYFAIKYGKLTIPVAPHNTSQNCSNCDKKVPKSLSTRTHICHHCGYSEDRDVNAAKNILKKALSTVGQTGSLKLGEIEPLLVLEQSCTRKFDL(SEQ ID NO:219)
Cas14d序列
>Cas14d.1|RIFCSPHIGHO2_01_全_CPR_46_36_rifcsphigho2_01_支架_646_curated|49808..51616|revcom
MSQSLLKWHDMAGRDKDASRSLQKSAVEGVLLHLTASHRVALEMLEKSVSQTVAVTMEAAQQRLVIVLEDDPTKATSRKRVISADLQFTREEFGSLPNWAQKLASTCPEIATKYADKHINSIRIAWGVAKESTNGDAVEQKLQWQIRLLDVTMFLQQLVLQLADKALLEQIPSSIRGGIGQEVAQQVTSHIQLLDSGTVLKAELPTISDRNSELARKQWEDAIQTVCTYALPFSRERARILDPGKYAAEDPRGDRLINIDPMWARVLKGPTVKSLPLLFVSGSSIRIVKLTLPRKHAAGHKHTFTATYLVLPVSREWINSLPGTVQEKVQWWKKPDVLATQELLVGKGALKKSANTLVIPISAGKKRFFNHILPALQRGFPLQWQRIVGRSYRRPATHRKWFAQLTIGYTNPSSLPEMALGIHFGMKDILWWALADKQGNILKDGSIPGNSILDFSLQEKGKIERQQKAGKNVAGKKYGKSLLNATYRVVNGVLEFSKGISAEHASQPIGLGLETIRFVDKASGSSPVNARHSNWNYGQLSGIFANKAGPAGFSVTEITLKKAQRDLSDAEQARVLAIEATKRFASRIKRLATKRKDDTLFV.(SEQ ID NO:220)
>Cas14d.2|rifcsphigho2_01_支架_10981_curated|5762..7246|revcom
VEPVEKERFYYRTYTFRLDGQPRTQNLTTQSGWGLLTKAVLDNTKHYWEIVHHARIANQPIVFENPVIDEQGNPKLNKLGQPRFWKRPISDIVNQLRALFENQNPYQLGSSLIQGTYWDVAENLASWYALNKEYLAGTATWGEPSFPEPHPLTEINQWMPLTFSSGKVVRLLKNASGRYFIGLPILGENNPCYRMRTIEKLIPCDGKGRVTSGSLILFPLVGIYAQQHRRMTDICESIRTEKGKLAWAQVSIDYVREVDKRRRMRRTRKSQGWIQGPWQEVFILRLVLAHKAPKLYKPRCFAGISLGPKTLASCVILDQDERVVEKQQWSGSELLSLIHQGEERLRSLREQSKPTWNAAYRKQLKSLINTQVFTIVTFLRERGAAVRLESIARVRKSTPAPPVNFLLSHWAYRQITERLKDLAIRNGMPLTHSNGSYGVRFTCSQCGATNQGIKDPTKYKVDIESETFLCSICSHREIAAVNTATNLAKQLLDE.(SEQ ID NO:221)
>Cas14d.3|RIFCSPLOWO2_01_全_OD1_45_34b_rifcsplowo2_01_支架_3495_curated|25656..27605|revcom
MNDTETSETLTSHRTVCAHLHVVGETGSLPRLVEAALAELITLNGRATQALLSLAKNGLVLRRDKEENLIAAELTLPCRKNKYADVAAKAGEPILATRINNKGKLVTKKWYGEGNSYHIVRFTPETGMFTVRVFDRYAFDEELLHLHSEVVFGSDLPKGIKAKTDSLPANFLQAVFTSFLELPFQGFPDIVVKPAMKQAAEQLLSYVQLEAGENQQAEYPDTNERDPELRLVEWQKSLHELSVRTEPFEFVRARDIDYYAETDRRGNRFVNITPEWTKFAESPFARRLPLKIPPEFCILLRRKTEGHAKIPNRIYLGLQIFDGVTPDSTLGVLATAEDGKLFWWHDHLDEFSNLEGKPEPKLKNKPQLLMVSLEYDREQRFEESVGGDRKICLVTLKETRNFRRGRHGHTRTDRLPAGNTLWRADFATSAEVAAPKWNGRILGIHFQHNPVITWALMDHDAEVLEKGFIEGNAFLGKALDKQALNEYLQKGGKWVGDRSFGNKLKGITHTLASLIVRLAREKDAWIALEEISWVQKQSADSVANRRFSMWNYSRLATLIEWLGTDIATRDCGTAAPLAHKVSDYLTHFTCPECGACRKAGQKKEIADTVRAGDILTCRKCGFSGPIPDNFIAEFVAKKALERMLKKKPV.(SEQ ID NO:222)
Cas14e序列
>Cas14e.1|rifcsphigho2_01_支架_566_curated|113069..114313
MAKRNFGEKSEALYRAVRFEVRPSKEELSILLAVSEVLRMLFNSALAERQQVFTEFIASLYAELKSASVPEEISEIRKKLREAYKEHSISLFDQINALTARRVEDEAFASVTRNWQEETLDALDGAYKSFLSLRRKGDYDAHSPRSRDSGFFQKIPGRSGFKIGEGRIALSCGAGRKLSFPIPDYQQGRLAETTKLKKFELYRDQPNLAKSGRFWISVVYELPKPEATTCQSEQVAFVALGASSIGVVSQRGEEVIALWRSDKHWVPKIEAVEERMKRRVKGSRGWLRLLNSGKRRMHMISSRQHVQDEREIVDYLVRNHGSHFVVTELVVRSKEGKLADSSKPERGGSLGLNWAAQNTGSLSRLVRQLEEKVKEHGGSVRKHKLTLTEAPPARGAENKLWMARKLRESFLKEV.(SEQ ID NO:223)
>Cas14e.2|rifcsplowo2_01_支架_81231_curated|976..2217
LAKNDEKELLYQSVKFEIYPDESKIRVLTRVSNILVLVWNSALGERRARFELYIAPLYEELKKFPRKSAESNALRQKIREGYKEHIPTFFDQLKKLLTPMRKEDPALLGSVPRAYQEETLNTLNGSFVSFMTLRRNNDMDAKPPKGRAEDRFHEISGRSGFKIDGSEFVLSTKEQKLRFPIPNYQLEKLKEAKQIKKFTLYQSRDRRFWISIAYEIELPDQRPFNPEEVIYIAFGASSIGVISPEGEKVIDFWRPDKHWKPKIKEVENRMRSCKKGSRAWKKRAAARRKMYAMTQRQQKLNHREIVASLLRLGFHFVVTEYTVRSKPGKLADGSNPKRGGAPQGFNWSAQNTGSFGEFILWLKQKVKEQGGTVQTFRLVLGQSERPEKRGRDNKIEMVRLLREKYLESQTIVV.(SEQ ID NO:224)
>Cas14e.3|rifcsphigho2_01_支架_4702_curated|82881..84230|revcom
MAKGKKKEGKPLYRAVRFEIFPTSDQITLFLRVSKNLQQVWNEAWQERQSCYEQFFGSIYERIGQAKKRAQEAGFSEVWENEAKKGLNKKLRQQEISMQLVSEKESLLQELSIAFQEHGVTLYDQINGLTARRIIGEFALIPRNWQEETLDSLDGSFKSFLALRKNGDPDAKPPRQRVSENSFYKIPGRSGFKVSNGQIYLSFGKIGQTLTSVIPEFQLKRLETAIKLKKFELCRDERDMAKPGRFWISVAYEIPKPEKVPVVSKQITYLAIGASRLGVVSPKGEFCLNLPRSDYHWKPQINALQERLEGVVKGSRKWKKRMAACTRMFAKLGHQQKQHGQYEVVKKLLRHGVHFVVTELKVRSKPGALADASKSDRKGSPTGPNWSAQNTGNIARLIQKLTDKASEHGGTVIKRNPPLLSLEERQLPDAQRKIFIAKKLREEFLADQK.(SEQ ID NO:225)
Cas14f序列
>Cas14f.1|rifcsp13_1_sub10_支架_3_curated|38906..41041
MAKREKKDDVVLRGTKMRIYPTDRQVTLMDMWRRRCISLWNLLLNLETAAYGAKNTRSKLGWRSIWARVVEENHAKALIVYQHGKCKKDGSFVLKRDGTVKHPPRERFPGDRKILLGLFDALRHTLDKGAKCKCNVNQPYALTRAWLDETGHGARTADIIAWLKDFKGECDCTAISTAAKYCPAPPTAELLTKIKRAAPADDLPVDQAILLDLFGALRGGLKQKECDHTHARTVAYFEKHELAGRAEDILAWLIAHGGTCDCKIVEEAANHCPGPRLFIWEHELAMIMARLKAEPRTEWIGDLPSHAAQTVVKDLVKALQTMLKERAKAAAGDESARKTGFPKFKKQAYAAGSVYFPNTTMFFDVAAGRVQLPNGCGSMRCEIPRQLVAELLERNLKPGLVIGAQLGLLGGRIWRQGDRWYLSCQWERPQPTLLPKTGRTAGVKIAASIVFTTYDNRGQTKEYPMPPADKKLTAVHLVAGKQNSRALEAQKEKEKKLKARKERLRLGKLEKGHDPNALKPLKRPRVRRSKLFYKSAARLAACEAIERDRRDGFLHRVTNEIVHKFDAVSVQKMSVAPMMRRQKQKEKQIESKKNEAKKEDNGAAKKPRNLKPVRKLLRHVAMARGRQFLEYKYNDLRGPGSVLIADRLEPEVQECSRCGTKNPQMKDGRRLLRCIGVLPDGTDCDAVLPRNRNAARNAEKRLRKHREAHNA.(SEQ ID NO:226)
>Cas14f.2|3300009991.a|Ga0105042_100140|1624..3348
MNEVLPIPAVGEDAADTIMRGSKMRIYPSVRQAATMDLWRRRCIQLWNLLLELEQAAYSGENRRTQIGWRSIWATVVEDSHAEAVRVAREGKKRKDGTFRKAPSGKEIPPLDPAMLAKIQRQMNGAVDVDPKTGEVTPAQPRLFMWEHELQKIMARLKQAPRTHWIDDLPSHAAQSVVKDLIKALQAMLRERKKRASGIGGRDTGFPKFKKNRYAAGSVYFANTQLRFEAKRGKAGDPDAVRGEFARVKLPNGVGWMECRMPRHINAAHAYAQATLMGGRIWRQGENWYLSCQWKMPKPAPLPRAGRTAAIKIAAAIPITTVDNRGQTREYAMPPIDRERIAAHAAAGRAQSRALEARKRRAKKREAYAKKRHAKKLERGIAAKPPGRARIKLSPGFYAAAAKLAKLEAEDANAREAWLHEITTQIVRNFDVIAVPRMEVAKLMKKPEPPEEKEEQVKAPWQGKRRSLKAARVMMRRTAMALIQTTLKYKAVDLRGPQAYEEIAPLDVTAAACSGCGVLKPEWKMARAKGREIMRCQEPLPGGKTCNTVLTYTRNSARVIGRELAVRLAERQKA(SEQ ID NO:227)
Cas14g序列
>Cas14g.1|RBG_13_支架_1401_curated|15949..18180
MSVRSFQARVECDKQTMEHLWRTHKVFNERLPEIIKILFKMKRGECGQNDKQKSLYKSISQSILEANAQNADYLLNSVSIKGWKPGTAKKYRNASFTWADDAAKLSSQGIHVYDKKQVLGDLPGMMSQMVCRQSVEAISGHIELTKKWEKEHNEWLKEKEKWESEDEHKKYLDLREKFEQFEQSIGGKITKRRGRWHLYLKWLSDNPDFAAWRGNKAVINPLSEKAQIRINKAKPNKKNSVERDEFFKANPEMKALDNLHGYYERNFVRRRKTKKNPDGFDHKPTFTLPHPTIHPRWFVFNKPKTNPEGYRKLILPKKAGDLGSLEMRLLTGEKNKGNYPDDWISVKFKADPRLSLIRPVKGRRVVRKGKEQGQTKETDSYEFFDKHLKKWRPAKLSGVKLIFPDKTPKAAYLYFTCDIPDEPLTETAKKIQWLETGDVTKKGKKRKKKVLPHGLVSCAVDLSMRRGTTGFATLCRYENGKIHILRSRNLWVGYKEGKGCHPYRWTEGPDLGHIAKHKREIRILRSKRGKPVKGEESHIDLQKHIDYMGEDRFKKAARTIVNFALNTENAASKNGFYPRADVLLLENLEGLIPDAEKERGINRALAGWNRRHLVERVIEMAKDAGFKRRVFEIPPYGTSQVCSKCGALGRRYSIIRENNRREIRFGYVEKLFACPNCGYCANADHNASVNLNRRFLIEDSFKSYYDWKRLSEKKQKEEIETIESKLMDKLCAMHKISRGSISK.(SEQ IDNO:228)
>Cas14g.2|3300009652.a|Ga0123330_1010394|2814..5123
MHLWRTHCVFNQRLPALLKRLFAMRRGEVGGNEAQRQVYQRVAQFVLARDAKDSVDLLNAVSLRKRSANSAFKKKATISCNGQAREVTGEEVFAEAVALASKGVFAYDKDDMRAGLPDSLFQPLTRDAVACMRSHEELVATWKKEYREWRDRKSEWEAEPEHALYLNLRPKFEEGEAARGGRFRKRAERDHAYLDWLEANPQLAAWRRKAPPAVVPIDEAGKRRIARAKAWKQASVRAEEFWKRNPELHALHKIHVQYLREFVRPRRTRRNKRREGFKQRPTFTMPDPVRHPRWCLFNAPQTSPQGYRLLRLPQSRRTVGSVELRLLTGPSDGAGFPDAWVNVRFKADPRLAQLRPVKVPRTVTRGKNKGAKVEADGFRYYDDQLLIERDAQVSGVKLLFRDIRMAPFADKPIEDRLLSATPYLVFAVEIKDEARTERAKAIRFDETSELTKSGKKRKTLPAGLVSVAVDLDTRGVGFLTRAVIGVPEIQQTHHGVRLLQSRYVAVGQVEARASGEAEWSPGPDLAHIARHKREIRRLRQLRGKPVKGERSHVRLQAHIDRMGEDRFKKAARKIVNEALRGSNPAAGDPYTRADVLLYESLETLLPDAERERGINRALLRWNRAKLIEHLKRMCDDAGIRHFPVSPFGTSQVCSKCGALGRRYSLARENGRAVIRFGWVERLFACPNPECPGRRPDRPDRPFTCNSDHNASVNLHRVFALGDQAVAAFRALAPRDSPARTLAVKRVEDTLRPQLMRVHKLADAGVDSPF(SEQ ID NO:229)
Cas14h序列
>Cas14h.1|3300005602.a|Ga0070762_10001740|7377..9071|revcom
MSRVELHRAYKFRLYPTPAQVAELAEWERQLRRLYNLAHSQRLAAMQRHVRPKSPGVLKSECLSCGAVAVAEIGTDGKAKKTVKHAVGCSVLECRSCGGSPDAEGRTAHTAACSFVDYYRQGREMTQLLEEDDQLARVVCSARQETLRDLEKAWQRWHKMPGFGKPHFKKRIDSCRIYFSTPKSWAVDLGYLSFTGVASSVGRIKIRQDRVWPGDAKFSSCHVVRDVDEWYAVFPLTFTKEIEKPKGGAVGINRGAVHAIADSTGRVVDSPKFYARSLGVIRHRARLLDRKVPFGRAVKPSPTKYHGLPKADIDAAAARVNASPGRLVYEARARGSIAAAEAHLAALVLPAPRQTSQLPSEGRNRERARRFLALAHQRVRRQREWFLHNESAHYAQSYTKIAIEDWSTKEMTSSEPRDAEEMKRVTRARNRSILDVGWYELGRQIAYKSEATGAEFAKVDPGLRETETHVPEAIVRERDVDVSGMLRGEAGISGTCSRCGGLLRASASGHADAECEVCLHVEVGDVNAAVNVLKRAMFPGAAPPSKEKAKVTIGIKGRKKKRAA.(SEQ ID NO:230)
>Cas14h.2|3300005921.a|Ga0070766_10011912|384..2081
MSRVELHRAYKFRLYPTPVQVAELSEWERQLRRLYNLGHEQRLLTLTRHLRPKSPGVLKGECLSCDSTQVQEVGADGRPKTTVRHAEQCPTLACRSCGALRDAEGRTAHTVACAFVDYYRQGREMTELLAADDQLARVVCSARQEVLRDLDKAWQRWRKMPGFGKPRFKRRTDSCRIYFSTPKAWKLEGGHLSFTGAATTVGAIKMRQDRNWPASVQFSSCHVVRDVDEWYAVFPLTFVAEVARPKGGAVGINRGAVHAIADSTGRVVDSPRYYARALGVIRHRARLFDRKVPSGHAVKPSPTKYRGLSAIEVDRVARATGFTPGRVVTEALNRGGVAYAECALAAIAVLGHGPERPLTSDGRNREKARKFLALAHQRVRRQREWFLHNESAHYARTYSKIAIEDWSTKEMTASEPQGEETRRVTRSRNRSILDVGWYELGRQLAYKTEATGAEFAQVDPGLKETETNVPKAIADARDVDVSGMLRGEAGISGTCSKCGGLLRAPASGHADAECEICLNVEVGDVNAAVNVLKRAMFPGDAPPASGEKPKVSIGIKGRQKKKKAA.(SEQ ID NO:231)
>Cas14h.3|3300009698.a|Ga0116216_10000905|8005..9504MEAIATGMSPERRVELGILPGSVELKRAYKFRLYPMKVQQAELSEWERQLRRLYNLAHEQRLAALLRYRDWDFQKGACPSCRVAVPGVHTAACDHVDYFRQAREMTQLLEVDAQLSRVICCARQEVLRDLDKAWQRWRKKLGGRPRFKRRTDSCRIYLSTPKHWEIAGRYLRLSGLASSVGEIRIEQDRAFPEGALLSSCSIVRDVDEWYACLPLTFTQPIERAPHRSVGLNRGVVHALADSDGRVVDSPKFFERALATVQKRSRDLARKVSGSRNAHKARIKLAKAHQRVRRQRAAFLHQESAYYSKGFDLVALEDMSVRKMTATAGEAPEMGRGAQRDLNRGILDVGWYELARQIDYKRLAHGGELLRVDPGQTTPLACVTEEQPARGISSACAVCGIPLARPASGNARMRCTACGSSQVGDVNAAENVLTRALSSAPSGPKSPKASIKIKGRQKRLGTPANRAGEASGGDPPVRGPVEGGTLAYVVEPVSESQSDT.(SEQ ID NO:232)
Cas14i序列
>Ga0066868_100162752
MTRNYPYKFRLEPTEEQKTRLKHYGFTCRFIYNLALDQRNLSRDPKPLPTLLEMWEKRVADKLAGVKPERKERNFEEERKQEVVHKNINYGFQSPQMTVLRREVEWMQDVPFSCLQETLRSLQTAFKNFFDRVKKGQRVSDGRNPYGYPVYRSRYRLSIPFKPANVSIKKVSERAGGEEGAYFSELKVPLMGSLIRFRQDRPVLGTPKTPTLKLEGDGKWYVVILTEQEVEDPQTPEAEVGIDLGVAKMITLSDGTIYPLTKKQQQTFTNIDTTEKRIRKLQAACDRRKTKFSKNWIKVKRQVVKLKHRQKRSRESLHHEITHLITSGFGRVAVENLNIKGMTPSASGTEEEPGTNVAQKSGLNREILKRGWGLLVSQLEYKAKWRGGEVIKVDPKYTSQTCSKCGHVEKANRATQATFLCQKCGHKENADVNAAKNILTRAEKQ*.(SEQ ID NO:233)
>噬菌体Cas14_SR-VP_2-4_支架_141_2548329_92
MAKQAPGKRTDESKERKAFSFRLYPTPEQERYLARVVGSCRYIYNALVREHERRMKYMRTFGAWPKPIGFKTSKKKQSLAEDYKLEASLYEIQTALHEPGGPAPWLEDVAGNIRNHAVAMFGAAQTNWMSGRTGPPNFKQRRPAGSFRFQDTRVASITGGPDRQPGFDFIRIPLPHGIEIDSWICFRRHRRLRGQPKTATIRRAAGIWYVSILCEWDKPAKLPVHRAPNAKVGVDLNVRNLCALSDGTIIDGRSADLARLEKSINRLKHRESKLRLREKAASAPRSKRHFRLQCRIARLQDRQANLRNEVTNQVAHAVALKHAFVGLEGLDIKGMTASAKGTVDAPGLNVRAKAGLNRAILNRGWGKLREKIESKVKIYGGQTVRVPPQYTSQTCAKCGHIAAENRDGVIFHCVKCGFTAHADVNAATNILEKALRLSAQESPGSGSLDGERPTELGSTTRQRVRKQKDTKTLGAPKATSRKGATAPRSTIPSLHVDMQVTSARVVPAPQEALATEIAQQMKALAKSEVDAAPRQKINRRRRSQTEVEVPTGSVE*(SEQ ID NO:234)
>噬菌体Cas14_SR-VP_4-6_支架_141_3640689_5
MAKQAPGKRTDESKERKAFSFRLYPTPEQERYLARVVGSCRYIYNALVREHERRMKYMRTFGAWPKPIGFKTSKKKQSLAEDYKLEASLYEIQTALHEPGGPAPWLEDVAGNIRNHAVALFGAAQTNWMSGRTGPPNFKQRRPAGSFRFQDTRVASITGGPDRQPGFDFIRIPLPHGIEIDSWICFRRHRRLRGQPKTATIRRAAGIWYVSILCEWDKPAKLPVHRAPNAKVGVDLNVRYLCALSDGTIIDGRSADLARLEKSINRLKHRESKLRLREKAASAPRSKRHFRLQCRIARLQDRQANLRNEVTNQVAHAVALKHAFVGLEGLDIKGMTASAKGTVDAPGLNVRAKAGLNRAILNRGWGKLREKIESKVKIYGGQTVRVPPQYTSQTCAKCGHIAAENRDGVIFHCVKCGFTAHADVNAATNILEKALRLSAQESPGSGSLDGERPTELGSTTRQRVRKQKDTKTLGAPKATSRKGATAPRSTIRSLHVDMQVTSARVVPAPQEALATEIAQQMKALAKSEVDAAPRQKINRRRRSQTEVEVPTGSVE*(SEQ ID NO:235)
Cas14J序列
>噬菌体Cas14J_k87_9374247_16
MIESKAFKFRVYPTDKQKELIHNSVRASNFIFNFSLRQQIDISDKMNEMGIIEKGERKKYMKDNDLYFNKYTMSRQLTVMGNTEEFSFLKEIDATSKSYALRRIDNAFKNMVKMGAGFPKFKNINKSTYSFTGQIQYQNDRIKNLRVIKTKNPKIVHLNLSKLKNLKCVCHIPMFIENWSNMDTIKINSYTISRKGNNYYISFQVEHNQPLISEPIKREIKYETTIGIDMGVERPITTSDEADFNLKLFNERFNILKKHRKELHKLSAILNKKRDYHKKNESEIKFYETATYKRILKKMRGLYHKITNIRENLQHNITSNLVNKENIDTFILEELNLKNMTKRSGKGKSNNKSNLNRVLLDVGMHGIKSKLEYKAEKMGKNVETINPRFTSQKCSDCGHINKLNRKSQAVFKCVKCGYTLNADLNAAINIKNNFFGKNT*(SEQINNO:236)
>噬菌体Cas14J_LacPavin_0818_WC40_支架_407201_205
MEDIIEISEKKKKTKISGTGKGFSIRIYPDKKQIEYIRDSFRVNNFIYNYFLSKQEKIVSELKEMGLEGKALKSHMKLNNLYFDYNSSRDLLYEMKKTPEYSFLGNASALSYHYALMRLKNAFDNMWKMNTGFPNYRKRHINKSFSGQILFNTKADKYSPFEIQTINDKWCEITLTKITELKCVVHNNELLDFWNDRSYMHLKSYTITETPSGEFYLAITADIISKPMLEKRIVNEETSIGIDMGVARPITTSDEELFNDKQLSDKFNLIKEYKSEVERLSQILAKKREGNKNWKESKKYERIKKRLAKLHSKIANIRKYLQHNITSKLINSKYDTIIIEDLDVKNMMKKSAKGKSNNKRGLNRVLSDTGLGEIKRQLVYKSNWCGKNIVTVDPKYTSQMCSNCGHTHRDNRKKQDEFICVSCGHNENADLNAAKNIKNKFFKKLAELKN*(SEQ ID NO:237)
>噬菌体Cas14J_BML_08042016_6_5m_支架_18_prodigal-single_54
MITKAYKFRIYPTKVQEETINNCFRVNDFIYNFFLGLEQETYDVLYMYGLRNGEKKEDKHLNKWRTENKLWFNRFDASRLLTKMAKLEKYKFLKTYPSTSRTYSLKSLESGMKSFMKGGGFPKFKNKKSNKSFTIQTQKDLKIIHKNGKWHSINLPSALDFPIKKLDIKIHNELFLSPNIKTNSCTVSKRGNQYFISFQVELPGELPRKREIKKETSVGVDFGVKKIITISSDEENPYSCETRFLKNSMNELKRLQKALSQKKKGSVKYNNIKEKINKLHIKISNQRKNLQHNISSFLVNLNADTIIMEDLNLKGMTKTPNPIESNGTFLPNGKSRKSGLNASILDVGIGEIKTQVQYKSDFCGKNVVLVNPQYTSQKCNNCGFTHKENRISQSEFECKNCGHKDNADKNASKNIKQKYFDN*(SEQ ID NO:238)
>Ga0194119_1000113823
VKQNKAYKYRIYPTEKQIEYFEGAFKAGRYVYNVSLDCEKQIYQLGGKSNLSHFGLNYHIKNYRVKAPFLNEYDVNIYCNEMKALSKAYKNFFKNKGGYPKFKKESDTTQSFTTRPSTKQNSKNLYITYDGYLKIPKVEKLIKIKYHRPIEGKIKTVTISKKHNKYYVSIMVEYTNNFKKVEVKKSVGIDLGVKAFVVTSDNEVIENPKHLTKNQEHLTVLQRKLARAKKGSNNYKKIKKNISKIHENVANTRENFLHNESKKLVDNYDLICMEDLNVKGMTKSSKGTKENPGKNVKQKSGLNRSIIDVGFGKFKTMIGYKTKNSGKYLVEIGRFEPTSKKCNCCGTINKNLELKDRIWKCENCGEILNRDLNAALNIRDLGTKKFFDSLKK(SEQ ID NO:239)
>Ga0116197_10005458
MLKAYKYRIYPTKEQITLIEKHFGSTRFLYNYFLEYRQKAYAKGNQKVGYMVTQAELTKLKKLKEYEWLNECGSQSLQMALRDLDSAYSRFFKKQGGYPKFKSKKHTSQSFTAPQNIKLASNRVYLPKFTKDGIKVKLHREIPQDAVLKQATVSRQNNQYFVSILIDDNNAIPKPIKAKNAVGLDMGLTDLIITSDFTKYPNNKYFVKSQQKLKKLQRRHSKKQKGSNNRQKAKLRVQKLHTKVSNQRKDTLHKISNEITNQYDIICLETLNVRGMQKNRRLAKGIADVAWSEFMRQLAYKAQWKGKTVLKIDQWFPSSQICSNCGASSKKKELHVRKWECPECHAKHDRDINASINIKNYGLGQIDNRNTVGTIGI*(SEQ ID NO:240)
>Ga0116179_10426881
MKIINKTYRFRLFPTKEQEVLLNKHFGCCRWVYNHFLNERKEQYQANKKSDNYYKQAATLAKLKNEEDTKWLKEVNSQSLQFALRSLDTAFLNFFRGKAQFPKFKSKKHKNTFTIPQFGKLEDGKIVIPKFKEGIKVKLHREVKGKIGKMSITKTPTGKYYVSIFTEQEVEELPKTNKQVGIDLGLKDFVITSDNKKFKNNRYVKKYEKQLKKAQQHLSRKQKGSKGFEKQKLKVAKIHEKIANCRLDILHKVSTELVKNYDLIAVEDLNVKGMTKNHKLSKHIADASWGKFVTLLQYKCDWYGKKLVKVNRFYPSSKTCSECGWINQELKLSDREWTCNSCGAIHDRDLNASKNILKEGLKIISAGAVDYTDGDLNDASVKKRKSVKSEAQPIAFGVGG*(SEQ ID NO:241)
>Ga0268285_10062095
MIKAFKYRIYPTQDQKELLSNIFGQVRFVYNLGLETKISAYTGNKKHLSCFDLNKQITQLKNECPWLKESPSQALQQSIRNLDVAYTNFFRGAGFPKFKNKYTKQSFQLPQGVFLSDDKKQIFIPKLKFTDIDLHKEFKGEVKTVTVSKTTTNKYYISILVDDKKPIPEKRQIKLESTVGIDLGIKDFAITSDGKKFKNHDFFKSAMNELRIQQRSLARKQKGSNHYIKQKMKVSLLHEHIKNQREDYLHKISKYLVYNYDTICIENLGVSNMMKNHKLSRVIGDMGWHKFKSMLEYKCEWYGKNLSVIGRFDPSSKTCSSCGSINKELTLNDREWTCKCGTKHDRDINAAINIRNFGLRNQPSVTQSEWLHCACDVETHQSLADV(SEQ ID NO:242)
Cas14K序列
>噬菌体Cas14_RifSed
MTTQKTYNFCFYDQRFFELSKEAGEVYSRSLEEFWKIYDETGVWLSKFDLQKHMRNKLERKLLHSDSFLGAM
QQVHANLASWKQAKKVVPDACPPRKPKFLQAILFKKSQIKYKNGFLRLTLGTEKEFLYLKWDINIPLPIYGSVTYSKTRGWKINLCLETEVEQKNLSENKYLSIDLGVKRVATIFDGENTITLSGKKFMGLMHYRNKLNGKTQSRLSHKKKGSNNYKKIQRAKRKTTDRLLNIQKEMLHKYSSFIVNYAIRNDIGNIIIGDNSSTHDSPNMRGKTNQKISQNPEQKLKNYIKYKFESISGRVDIVPEPYTSRKCPHCKNIKKSSPKGRTYKCKKCGFIFDRDGVGAINIYNENVSFGQIISPGRIRSLTEPIGMKFHNEIYFKSYVAA(SEQ ID NO:243)
>噬菌体Cas14_16ft_4_支架_2_465_16ft_4_噬菌体_29_13
VITKKTYNFSLYDPRFFELAKEAGDVYSRSLEEFWKVYDETGVWLSKFDLQKHMRNKLERKLLHSDSFIGAMQQVHANLASWKQAKKVVKDACPPRKPKFLQAILFKKSQIKYKNGFLKLTLGIGNEYLNLKWNQEIPLPIYGSVTYSKTRGWKINLCLETDVEQKNLDNNKFLSIDLGVKRIATIFDGENTITLSGKKFMGLMHYRNKLNGKTQSRLSHKKKGSNNYKKIQRAKRRTTDKILNIQKDMLHKYSSFVVNYAIKNNIGNIIIGDNSSTHDSPNMRGKTNQKISQNPEQKLKNYIKYKFEGISGQVNIVPEPYTSRKCPCCKNIKKSSPRGRTYKCKKCDFVFDRDGVGAINIYNENVSFGTCLNLDSGRIRFLTEPIGMKFHNEVYFKSYVAVA*(SEQ ID NO:244)
>Ga0116179_10109322
LKELYKTYILPVKQQELARKLSRESGRIYSKVVSKVFDIYKRKGFWLNEFDMKKYIRLYAKNIGLHSQTKQGIVEQYYIALDSFFKAYKNHRNPKPPYKRRKYNVVMYKDSAIKLKNGILKLSNGKGNEPLMVKANKLGKKPKYAELVYHHNKRKYFLHITVEMKGVQRVYEKDRAIAVDLGQIHPMVTYDSKRSIIFNGGVLNSFIRFRNKQLSKLQQKMSMCKKYSKRWKKLNGAKKKLLNKSKNKVNDVLQKYTSYLVGYCIEQGIGTIVIGDIKSIRENINYGVKTNQKLHNSWLFRKMTNIIEHKANNVGIKVEYINEAYTSQTCPVCNKKHKPGNRNFTCKCGFKYHRDAVGAINIHKKYTSSLSARLEGDLTPPVGYRYRYNQRCLAGWNTSIFDAGYFSDLPTKKVA*(SEQ ID NO:245)
>Ga0116179_10465782
MSRYVVRTYKVAVPKELYPLCAELNKTAARIYNKTMSLVKKIKYKKGFWLSPNNTQKYILRWACSINVHTHSKQAIIQQYFQALDSYFNAVKTKPDLNPPYKRKRFMPFIWKDTAIKLLPDGKLKLSMGSNREPIVIQTTLLADTKIRQAKLVYEEGKYYLHLVIEGKNVARKPQNGKIMAVDLGILRPITCFDGTEVISYHGGILNSLIRYRNKELAKFQQMLSRCKKGSKRYRKLVKAKKKMLRRTRHQIKDILHKITSNFLKMCLQKGIGTIALGDVTNIRERVEGNDSANQKLHQWCFRKMVDMITYKAELLGMDVKLVPEEYTSQTCPMCGSRNHSNNRNYKCQNCGFKYHRDGVGAINIYVRYLGKKSQVVAGLAPVRGVRYKPHLCGHGVRNAPWKAA*(SEQ ID NO:246)
>Ga0134101_10165752
MPGYVVRTYKVPVPEELYPLCAELNKTAARIYNKTMSLVKKIKRKKGIWLSSNNAQKYILRWACGINVHTHSKQAMVQQYFQALDSYFNAVKAKPDLRPPYKKKRFMPFIWKDAAIKLLPDGKLRLSMGNNQKPVVIQTTLPADTKIRQAKLVYEDGKYYLHLATEVKNEVQKQQGKKVMAVDLGILRPITCFDGIEVISYHGGILNSLIRYRNKELAKFQQMLSRCKKGSKRYRKLVKAKKKMLRRIRHQIKDILHKITSNFLKMCLQKGIKTIAVGDITNIRERVQGNDNANQKLHQWCFRKMIDMLTYKVHPLGIDVKLVPENYTSQTCPACGSRNHPTDRNYECQNCGFKYHRDGVGAINIYARYLGKKSQVVAGLAPVRGVRYKPHLCGHGV(SEQ ID NO:247)
>Ga0066665_100815632
MYQVRRVNIGKTAQLDELARECGRLYSQTLASFWRTVRHKGIWLKPKHLMRWHTSEKLHAHTADACVQAFFASLKSWRERRKLGDPDAHPPRKRKWYFRIEYKSTAMHHKDSVLTLSNGKGNTPLVLEWPWETPKTVVIHWTGTQYEAIATYKIEAQGQPQGNKVAGIDLGEIHMAVSHDGTETHILNGRLLRSKRQYQNKLKAELSTMIDVKKKGSLRRKKLIRSKQKQLKKLQHQVNDIEHKQSSRLISTLHAKGVQTVVIGDVRDIRQDLDVGSKNNQKLHQWSHGSIRHKLTYKAEWLGMEVALQDEHYTSRTCPMCQHVRKSKVQGRVFRCPTCHWTYHRDGVGAINIRQKYLGSLPVIGDMAPPIGMRFRPHTSVARWEKTYQ*(SEQ ID NO:248)
>Ga0224523_10070512
MYNVRKLKIDQTEQLDVLATASGELYSRTLVSFWRTVRKHGLWLKPSSMMRWQNSGELHAHSADAVVQSFYASLKSWRALRKVDPDAKPPKRRKHFFKVQWKNSAIRLKDGCLVLSNGKGNEPLIIPWNWTLPTLVELGWNGTGYELRVIYSTTPTGVPLGVKVAGVDMGEIHLAVTHDGDDCHIYNGRYLRSVKRYQNKKKAEISARLDRMKKGSRRSKYLKHNKARTLKKLDNQINDILHKQTTKLVSTLHEAGVKTVVIGDVRDIRKGLDYGAKANQKIHQWHLGKTRWLVSYKAERLGMEVVLQDEAYTSQTCPACGKRHKPKDRNYRCSCGFQYHRDGIGAYNIRAKYLGELETPHVVGAMMSPTGVRVLQRCSHLARKNPLPLGMG(SEQ ID NO:249)
>Ga0247839_10583994
MNIAHQDAIWEASKESASIYNDAIKLNQDGIPKAQAMKSLSIQSKHTKYLQSQSSQAPYQNFFIDLSSYFASLKRYQKSKRGYKNEPKPPHKIKTLHAITFKKSAIRVQNGYLLLSLRKPNKPIKLKWSLSKPIWVLINFDIRTGWKMNCVMEQEVQQHQLDKTKILAIDLGNKRIAASFDGKRCVTYSGKILKSLTRLQNKCSARSKASTSSLIKNSKKYKRVMRARRKITARINNQKRDILHKTSRAIVNYAIENNIDKIVFGDCSSIHDGTTLGKENTQQVQQGCEQKLRKYVEYKFRNVGGTTELVSERYSSQECPICDHRYEPRGRTYKCSACGYVYDRDGVGSINIYTNVSSGLTLDVVGGLMPPRGWKFHSQLPCTTLRNSYFSMLYCGEPNDL(SEQ ID NO:250)
Cas14u序列
>Cas14u9|噬菌体Cas14|LacPavin_0818_WC55_支架_56344_prodigal-single_16
VRKIAESKGYFTKAVSVELVGHSKEDTVWLLDILNRGYPLANKMYLLYRWYYEGLFPTEIELNKLETYVYHKAREDSRFTDIPSNIIACTNRTILQKIKYDIKSGAKSGKRSWSQFKKGQPLYFVQHNYLEKTDDGYNYNFIFGHKFKLKFGRHNEGEQLIEKLMDSESQFKLNANAAFKVIKRRLFLLLSYEIPDKIENKPNPDNIMGIDFGMANFATCYLANDRKFKIVRDHKYLKKRLLLQRKIKNLQSELSMHHAGLGRARKTRKIEDYRNKEKNLTKTEISQILSSIVRLAQANNIGTIKIEYLTIDQKTQLEDKYVYRNWAVMMTIDMLREKAKYVGINVVTIDPYHTSQKCSTCGTIGTRDGRIFSCENPSCKSFHKVVNADKNAAINIANSTQFVDDVKDTEYYKQKQEFFKTLREKKETNIT*(SEQ ID NO:251)
>Cas14u10|Ga0153798_100522201
MAKKNIDDTKKVTLCEKVKLTQIYSPVVDWKEFHKIFKILQKETILASNKIISICNIFNSFNNKEEQKDWLIKKYQSEKLRNVLYDVARKYCYYSYSRNANAISNDIYYKYFKGPNSYKVKIQKGIGNPPMTFTESIPLYITVQRHKIECTNNVRHYYTIEVPLLSNNCKSGIQITDTEQTQVNNNALRFGINAAGNKRLIEILDNIIYGKYEFCDSKLKRVKSKKRSHRYDYYFLLSYKKPVIEIKSLKPENVLGVDLGMTVPAYCAVNYCDYKKKAVGDSRIIRFNLIQEKINKRIQRNIKYNLRDGHGRKYKLDGYDGASNKIAKRNSTFNFNLASEIIQLAIKWQCGTIHLEDLTKIHEINPQNRFLKNWTYYDLQKKIENKAKEYGIVVKYINPYYTSQICSNCGHFESGQRISQSQFQCKSCGYSANADYNAARNIALYKF*(SEQ ID NO:252)
>Cas14u_VU_u11|rifcsplowo2_12_支架_23_prodigal-single_23
MSTMVFEYYLRSPEKEQEQIVIQQLRASYEYYNTLIRIEQNRRNQFRAIQSQDPKIAQLELEISSLDTEIDLHLTSIQNTRSTNRKNVLDKKDVDRVKSLKADRKLKRDELKIAKKSFCDNLIFQKACEDINLFAKNESKAARKATPSYWGSYLLIENAIDAAKKSKTDPKRKYWDWTGRLGVQVQGGMSVSELFGNDTRIQIDPVSLDAWYHPIRGKRKYAQRQPKLRFRINSDDKGKPIFVEFPMIMHRPLPQNACIKQANVIVTNRDRKLCYVLQLTVNIPEPVASPCTNGVGIDLGWRLMDSGDIRVAYGYDQKGTKIDLRLPKSITSLFQKAESIRAIRDKEFEDHRKIMIPLIQGVTFPNINTTNIGLSKSFRRFHSLYLGWKANRQDGDQIAFDALETWHRKDRHLEQYEVGCRKRAMNYRREEYRKFAKQMTSTYGYLALENWNISKVALRPEIEDGTREQSEPQHQRVMACVSMLRQILINTAKREGVSIISVPAAYTTLECAACHKINTWDTSKNVCQTCENCDTVWDQDENAARNLLASGTVLKNTAPLPEEANIANTEKKSRWSKRKAEVVIDEKVDRSQIAS*(SEQIDNO:253)
>Cas14u_VU_u12|SR-VP_4-6_支架_141_2630357_509
MKVYKYGLLPPIKNQTLVFEQLNKAYQYKKQLIDLVNQEKALLKKEEDNIFQRLNPALISKKETTQQTVEELLALMKQQRSKNRSKQDNIELKQQFKIAKENAKQAKKDYFTELSRIKTLEEVKTSKEKIKTNFKQLHKEARKKCGVYWGTYLLIEEAVEQSKKTSFKKDFIFYGRRDNERLGNQIQTSKDDSGSKIMGMLSSHLFNEKNSQIYIEPVADTAWIGVYRKDRRRTAKTILHWRIASDEKLKPIWAEFPMIMHRPLPKDSKIKSATISRRFYGPHQEWTLEITIDDNLSPTKELGNGVVALDIGWRKLNDKIRVATLYDGEFHKELVISTYQLDKANELKSLRDDLFNQVKNQITEWNKEKFPEWILKELEFVSKWKSQARLVRLVKNWKKERWQDDNIYFELVEAWRYKDQHLWQWECGSRRSGLRERIIIATLPPNLERNITVLYWKTLIFQRWQNYQNFRQKKI*(SEQ ID NO:254)
>Cas14u_VU_u13|gwd1_支架_1554_3
MPVKAVKFQIIKPLNATWDVLGKTLRDLNYHTTLMCNRAIQLYWEYGNFRSQYKAEHGKYPIDKDIYGCSYRNHVYRQLRLMYPLMASSNTSQTNQFALKRWQTDVPDIRKLAKSIPSFKLGTPIQVANQNFDLRFNDDTFSVDVTLLGRESEVGRFSILLDTGDKSKRVIFQRILDRTYKQGSMQIVYSKKKGKWFCVIAYDSPIKVNELDIDKVMGIDLGIVNAVYWAFNSGHNRGCISGGEIDTFRKQIEVRRRQILRTPRKDGHGRKRNMQAADILGEKISNFRDTVNHKYSKKIIDIAIANKCGVIQMEDLTGISKDSFFLRNWTYRDLQDKIVYKALQEGIIVKLIDPRNTSKTCSVCGHLDAENREDQATFICKNPECGSNMNADHNAAKNISVWSKVSKEFGL*(SEQ ID NO:255)
>Cas14u_VU_u14|pig_F100_支架_13388_4
MNKVMRYQIIKPIDIDWKTFGDILNKLRQEVRFTKNKTIALYNDWLTYCFQYKNEHNEYPKLVDYCGYKVFSGYAYDKFKTEVVFSNTANYTTSVREACSAYDAHKTDILKGNCSIPSMGANQPIDLHNKSLSVDINEFGDYIATISLLSNRGKKEFGLKSGQIKIVLKAGDKSSRDILQRCVSKEYKICGSKIIYKDKKTFINLCYGFEPVTSELDKSKVMGIDLGVSVPAYMAFNFDKYKRDSIKDNRIMATKWMMDRQLSIAKQSCKYLSDGNCGHGRKKKMVCYDKYSNKSRNLSQTINHGWSKYIVDVAFRNGCGTIQMEDLSGVTSEKDKFLKNWTFYDLQQKIEYKAKERGINVVKINPKYTSQRCCECGCICKRNRPDQKTFKCISCGYSANADFNAAKNIATIGIEDIIANTEVIE*(SEQ ID NO:256)
>Cas14u_VU_u15|pig_ID_3640_F65_支架_73762_2
MRIEIMVKKKGINMNKIMKYQILKPTNIGWEDFGNILYNLRSEVRKIKNRTIALYHEWTGYTLECHDRTGEWPKPKDVYNYGTIGGYIYDRLKGEVKYSNSVNFSSSVRDAMSKYDTHKKDILAGKASVPSMGDGQPIDIYNKNIVLHHLDNEKKDYAATLSLLNNGAKTELGLLSGRVDVILTIKNETQTAILDRCLSGEYRVCGSQLVYEAAGKEKKGKKDKPKVWLYLCYGFEPEAPELDDSRIMGIDLGMKLPAVMAFNFNDKKYEVIDDNRILDRKIRLDKMLSISKHQCQWRCDGNSGHGRKKKVDVYERYSHKSHNLSMHINHQWSKYIVDTAVKNKCGVIQMEDLSGIKASRQNFLGNWTYYDLQQKITYKAEEKGVKVIKVDPSYTSQMCPVCGYINKRNRSTQADFECLECGHIANADYNAARNIATPDIANIIKNRLAQQKKEGKPIE*(SEQ ID NO:257)
>Cas14u_VU_u16|pig_ID_1851_F40_2_支架_55126_1
MPMSSYRKTHYTNTCELREIYMRIEIMVKKKGINMNKIMKYQILKPTNISWEDFGNILYNLRSEVRKIKNRTIALYHEWTNYTLECHDKTGEWPKPKDVYNYGTMSGYIYDRLKGEVRYSNSVNFNSSVRDAMSKYDTHKKDILAGKVSVPSMGDGQPIDIYNKNIVLHHLDNEKKDYAATLSLLNNGAKAELGLLSGRVDVILTIKNETQTAILDRCLSGEYRICGSQLIYEGGKEKKGKKDKPKVWLYLCYGFEPEAPELDDSRIMGIDLGMKLPAVMAFNFNDKKYEVIDDNRILDRKIRLDKMLSMSKHQCQWRCDGNSGHGRNKKVDVYERYSHKSHNLSMDINHQWSKYIVDTAVKNKCGVIQMEDLSGIKASRQNFLGNWTYYDLQQKITYKAEEKGIKVIKVDPCYTSQMCPVCGYINKRNRSTQADFECLECGHIANADYNAARNIATPDIANIIKNRLAQQKKEGKPIE*.(SEQ ID NO:258)
>Cas14u_VU_u17|pig_ID_3784_F96_支架_13509_10
MNKIMKYQIIKPLNIDWETFGNILFNLRKESRQVKNRAIAIYHEWVLYSMAYYDECGKWPKIIDVYPPYKTADGYIYDKLKNEMGHMLSNNFNATIRNALSKYDTHKKDIMAGKVSVPSMDAGQPIDVYAKGITLHHIDGDKGDYVATLSLLNSKAKATLNLPSGRIDMVLKMNDKTQTAILDRCLSGEYRICGSQLVYEAAGKEKKGKKDKPKVWLYLCYGFEPEAPELDDSRIMGIDLGMKLPAVMAFNFNDKKYEVIDDNRILDRKIRLDKMLSISKHQCQWRCDGNSGHGRKKKVDVYERYSHKSHNLSMDINHQWSKYIVETAVKNKCGVIQVEDLSGIKASRQNFLGNWTYYDLQQKITYKAEEKGIKVIKVDPSYTSQMCPVCGYINKRNRSTQADFECLECGHIANADYNAARNIATPDIANIIKNRLAQQKKEGKPIE*(SEQ ID NO:259)
>Cas14u_VU_u18|SRR1747065_支架_28
MNKVMKYQIIKPLNIDWEDFGNILFNLRKESRQIKNRAIAIYHEWVQYSMSYYDEYGKWPKVIDVYPPYKTVDGYIYDRLKNEMGHTSSNNFNATIRNALSKYDTHKKDIMAGKVSVPSMDAGQPIDVYAKGITLHHIDGDKDDYVATLSLLNSKAKATLNLPSGRIDMVLKMNDKTQTAILDRCLSGEYRICGSQLIYEAAGKEKKGKKDKPKVWLYLCYGFEPEAPELDDSRIMGIDLGMKLPAVMAFNFNDKKYEVIDDNRILGQKIRLDKMLSISKHQCQWRCDGNSGHGRKKKVDVYEKCSHRSHNLSMDINHQWSKYIVETAIKNKCGVIQMEDLSGIKASRQNFLGNWTYYDLQQKITYKAEGKGIKVIKIDPHYTSQMCPICGYINKRNRSTQADFECLECGHIANADYNAARNIATPDIANIIKNRVKQQEKEGKSID(SEQ ID NO:260)
>Cas14u.1|3300009029.a|Ga0066793_10010091|37..1113|revcom
MSTITRQVRLSPTPEQSRLLMAHCQQYISTVNVLVAAFDSEVLTGKVSTKDFRAALPSAVKNQALRDAQSVFKRSVELGCLPVLKKPHCQWNNQNWRVEGDQLILPICKDGKTQQERFRCAAVALEGKAGILRIKKKRGKWIADLTVTQEDAPESSGSAIMGVDLGIKVPAVAHIGGKGTRFFGNGRSQRSMRRRFYARRKTLQKAKKLRAVRKSKGKEARWMKTINHQLSRQIVNHAHALGVGTIKIEALQGIRKGTTRKSRGAAARKNNRMTNTWSFSQLTLFITYKAQRQGITVEQVDPAYTSQDCPACRARNGAQDRTYVCSECGWRGHRDTVGAINISRRAGLSGHRRGATGA(SEQ ID NO:261)
>Cas14u.2|3300002172.a|JGI24730J26740_1002785|496..1605|revcom
MLQTLLVKLDPSKEQYKMLYETMERFNEACNQIAETVFAIHSANKIEVQKTVYYPIREKFGLSAQLTILAIRKVCEAYKRDKSIKPEFRLDGALVYDQRVLSWKGLDKVSLVTLQGRQIIPIKFGDYQKARMDRIRGQADLILVKGVFYLCVVVEVSEESPYDPKGVLGVDLGIKNLAVDSDGEVHSGEQTTNTRERLDSLKARLQSKGTKSAKRHLKKLSGRMAKFSKDVNHCISKKLVAKAKGTLMSIALEDLQGIRDRVTVRKAQRRNLHTWNFGLLRMFVDYKAKIAGVPLVFVDPRNTSRTCPSCGHVAKANRPTRDEFRCVSCGFAGAADHIAAMNIAFRAEVSQPIVTRFFVQSQAPSFRVG(SEQID NO:262)
>Cas14u.3|19ft_2_无噬菌体_未知_支架_0_curated|508188..509648
LAEENTLHLTLAMSLPLNDLPENRTRSELWRRQWLPQKKLSLLLGVNQSVRKAAADCLRWFEPYQELLWWEPTDPDGKKLLDKEGRPIKRTAGHMRVLRKLEEIAPFRGYQLGSAVKNGLRHKVADLLLSYAKRKLDPQFTDKTSYPSIGDQFPIVWTGAFVCYEQSITGQLYLYLPLFPRGSHQEDITNNYDPDRGPALQVFGEKEIARLSRSTSGLLLPLQFDKWGEATFIRGENNPPTWKATHRRSDKKWLSEVLLREKDFQPKRVELLVRNGRIFVNVACEIPTKPLLEVENFMGVSFGLEHLVTVVVINRDGNVVHQRQEPARRYEKTYFARLERLRRRGGPFSQELETFHYRQVAQIVEEALRFKSVPAVEQVGNIPKGRYNPRLNLRLSYWPFGKLADLTSYKAVKEGLPKPYSVYSATAKMLCSTCGAANKEGDQPISLKGPTVYCGNCGTRHNTGFNTALNLARRAQELFVKGVVAR.(SEQ ID NO:263)
>Cas14u.4|rifcsp2_19_4_全_支架_168_curated|84455..85657
MTTQKTYNFCFYDQRFFELSKEAGEVYSRSLEEFWKIYDETGVWLSKFDLQKHMRNKLERKLLHSDSFLGAMQQVHANLASWKQAKKVVPDACPPRKPKFLQAILFKKSQIKYKNGFLRLTLGTEKEFLYLKWDINIPLPIYGSVTYSKTRGWKINLCLETEVEQKNLSENKYLSIDLGVKRVATIFDGENTITLSGKKFMGLMHYRNKLNGKTQSRLSHKKKGSNNYKKIQRAKRKTTDRLLNIQKEMLHKYSSFIVNYAIRNDIGNIIIGDNSSTHDSPNMRGKTNQKISQNPEQKLKNYIKYKFESISGRVDIVPEPYTSRKCPHCKNIKKSSPKGRTYKCKKCGFIFDRDGVGAINIYNENVSFGQIISPGRIRSLTEPIGMKFHNEIYFKSYVAA.(SEQ ID NO:264)
>Cas14u.5|3300012532.a|Ga0137373_10000316|3286..5286
MATLVYRYGVRAHGSARQQDAVVSDPAMLEQLRLGHELRNALVGVQHRYEDGKRAVWSGFASVAAADHRVTTGETAVAELEKQARAEHSADRTAATRQGTAESLKAARAAVKQARADRKAAMAAVAEQAKPKIQALGDDRDAEIKDLYRRFCQDGVLLPRCGRCAGDLRSDGDCTDCGAAHEPRKLYWATYNAIREDHQTAVKLVEAKRKAGQPARLRFRRWTGDGTLTVQLQRMHGPACRCVTCAEKLTRRARKTDPQAPAVAADPAYPPTDPPRDPALLASGQGKWRNVLQLGTWIPPGEWSAMSRAERRRVGRSHIGWQLGGGRQLTLPVQLHRQMPADADVAMAQLTRVRVGGRHRMSVALTAKLPDPPQVQGLPPVALHLGWRQRPDGSLRVATWACPQPLDLPPAVADVVVSHGGRWGEVIMPARWLADAEVPPRLLGRRDKAMEPVLEALADWLEAHTEACTARMTPALVRRWRSQGRLAGLTNRWRGQPPTGSAEILTYLEAWRIQDKLLWERESHLRRRLAARRDDAWRRVASWLARHAGVLVVDDADIAELRRRDDPADTDPTMPASAAQAARARAALAAPGRLRHLATITATRDGLGVHTVASAGLTRLHRKCGHQAQPDPRYAASAVVTCPGCGNGYDQDYNAAMLMLDRQQQP(SEQ ID NO:265)
>Cas14u.6|3300006028.a|Ga0070717_10000077|54519..56201|revcom
MTVRTYKYRAYPTPEQAEALTSWLRFASQLYNAALEHRKNAWGRHDAHGRGFRFWDGDAAPRKKSDPPGRWVYRGGGGAHISKNDQGKLLTEFRREHAELLPPGMPALVQHEVLARLERSMAAFFQRATKGQKAGYPRWRSEHRYDSLTFGLTSPSKERFDPETGESLGRGKTVGAGTYHNGDLRLTGLGELRILEHRRIPMGAIPKSVIVRRSGKRWFVSIAMEMPSVEPAASGRPAVGLDMGVVTWGTAFTADTSAAAALVADLRRMATDPSDCRRLEELEREAAQLSEVLAHCRARGLDPARPRRCPKELTKLYRRSLHRLGELDRACARIRRRLQAAHDIAEPVPDEAGSAVLIEGSNAGMRHARRVARTQRRVARRTRAGHAHSNRRKKAVQAYARAKERERSARGDHRHKVSRALVRQFEEISVEALDIKQLTVAPEHNPDPQPDLPAHVQRRRNRGELDAAWGAFFAALDYKAADAGGRVARKPAPHTTQECARCGTLVPKPISLRVHRCPACGYTAPRTVNSARNVLQRPLEEPGRAGPSGANGRGVPHAVA.(SEQ ID NO:266)
>Cas14u.7|3300001256.a|JGI12210J13797_10004690|5792..7006
MNCRYRYRIYPTPGQRQSLARLFGCVRVVWNDALFLCRQSEKLPKNSELQKLCITQAKKTEARGWLGQVSAIPLQQSVADLGVAFKNFFQSRSGKRKGKKVNPPRVKRRNNRQGARFTRGGFKVKTSKVYLARIGDIKIKWSRPLPSEPSSVTVIKDCAGQYFLSFVVEVKPEIKPPKNPSIGIDLGLKTFASCSNGEKIDSPDYSRLYRKLKRCQRRLAKRQRGSKRRERMRVKVAKLNAQIRDKRKDFLHKLSTKVVNENQVIALEDLNVGGMLKNRKLSRAISQAGWYEFRSLCEGKAEKHNRDFRVISRWEPTSQVCSECGYRWGKIDLSVRSIVCINCGVEHDRDDNASVNIEQAGLKVGVGHTHDSKRTGSACKTSNGAVCVEPSTHREYVQLTLFDW.(SEQ ID NO:267)
>Cas14u.8|3300005660.a|Ga0073904_10021651|765..1943
MKSRWTFRCYPTPEQEQHLARTFGCVRFVWNWALRARTDAFRAGERIGYPATDKALTLLKQQPETVWLNEVSSVCLQQALRDLQVAFSNFFDKRAAHPSFKRKEARQSANYTERGFSFDHERRILKLAKIGAIKVKWSRKAIPHPSSIRLIRTASGKYFVSLVVETQPAPMPETGESVGVDFGVARLATLSNGERISNPKHGAKWQRRLAFYQKRLARATKGSKRRMRIKRHVARIHEKIGNSRSDTLHKLSTDLVTRFDLICVEDLNLRGMVKNHSLARSLHDASIGSAIRMIEEKAERYGKNVVKIDRWFPSSKTCSDCGHIVEQLPLNVREWTCPECGTTHDRDANAAANILAVGQTVSAHGGTVRRSRAKASERKSQRSANRQGVNRA.(SEQ ID NO:268)

Claims (37)

1.核酸检测系统,其包含:
i)报告分子,其包含可检测标记物,其中在切割所述报告分子时释放所述可检测标记物用于检测;
ii)初级激活剂复合物,其包含第一识别复合物,和;
iii)无活性次级复合物,其中;
a)所述第一识别复合物识别样品中的一个或多个初级激活剂,其中;
b)在识别所述初级激活剂时,所述初级激活剂复合物被激活并且能够作用于所述报告分子以释放所述可检测标记物,并且;
c)所述激活的初级激活剂复合物能够作用于无活性第二识别复合物的组分,以激活所述第二识别复合物成为激活的信号放大器,其中;
d)所述激活的信号放大器能够作用于所述报告分子以释放所述可检测标记物,并且;
e)所述激活的信号放大器能够作用于无活性第二识别复合物的组分,以激活所述第二识别复合物成为激活的信号放大器,从而启动前馈回路。
2.核酸检测系统,其包含:
报告分子,其包含可检测标记物,其中在切割所述报告分子时释放所述可检测标记物用于检测;
初级激活剂复合物,其包含用第一向导RNA程序化的第一Cas效应物酶,其中所述第一向导RNA识别样品中的一个或多个初级激活剂,其中在所述第一向导RNA与所述初级激活剂杂交时,所述初级激活剂复合物被激活并且是切割所述报告分子并释放所述可检测标记物的非特异性核酸酶;和
信号放大器,其包含第二Cas效应物酶和第二向导RNA,其中所述初级激活复合物的激活导致由所述第二向导RNA识别的一个或多个激活剂序列的激活,其中在所述第二向导RNA与所述激活剂序列杂交时,所述信号放大器复合物被激活并且是切割所述报告分子并释放所述可检测标记物的非特异性核酸酶。
3.权利要求1的核酸检测系统,其中所述第一和/或第二Cas效应物酶在激活时包含非特异性RNA酶和/或DNA酶。
4.前述权利要求中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物酶包含一个或多个Cas13蛋白、一个或多个Cas12蛋白、一个或多个Cas14蛋白、一个或多个Csm6蛋白和/或一个或多个Csx1蛋白,任选地如SEQ ID NO:115至268的任一项中所示的一个或多个蛋白质。
5.前述权利要求中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物包含一个或多个Cas13蛋白,任选地如SEQ ID NO:115至135的任一项中所示的一个或多个Cas13蛋白。
6.前述权利要求中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物包含一个或多个Cas13d蛋白。
7.前述权利要求中任一项的核酸检测系统,其中所述第一和/或第二Cas效应物包含任何组合的一个或多个Cas12蛋白、一个或多个Cas13蛋白、一个或多个Cas14蛋白和/或一个或多个Csm6蛋白。
8.前述权利要求中任一项的核酸检测系统,其中所述第一和第二Cas效应物酶包含相同或不同蛋白质中的一个或多个。
9.权利要求2-8中任一项的核酸检测系统,其中所述第一和/或第二向导RNA包含一个或多个恒定区。
10.权利要求2-9中任一项的核酸检测系统,其中所述第一和第二向导RNA独立地选自SEQ ID NO:42-85的任一项中所列的序列。
11.前述权利要求中任一项的核酸检测系统,其中所述报告分子包含与所述可检测标记物可操作地连接的淬灭剂,任选地其中所述可检测标记物包含一个或多个荧光分子。
12.前述权利要求中任一项的核酸检测系统,其中所述报告分子包含连接所述淬灭剂和所述荧光团的寡核苷酸,并且所述寡核苷酸包含笼锁的结构,任选地具有或导致茎环结构。
13.前述权利要求中任一项的核酸检测系统,其中所述报告分子与反式笼形分子复合,任选地具有或导致茎环结构。
14.前述权利要求中任一项的核酸检测系统,其中所述报告分子所述可检测标记物包含一个或多个荧光染料。
15.前述权利要求中任一项的核酸检测系统,其中所述激活剂复合物是笼锁的,任选地具有或导致茎环结构。
16.前述权利要求中任一项的核酸检测系统,其中所述激活剂复合物进一步包含寡核苷酸序列,其中所述寡核苷酸序列包含修饰的核苷酸碱基。
17.前述权利要求中任一项的核酸检测系统,其中所述激活剂复合物进一步包含寡核苷酸序列,其中所述寡核苷酸序列包含RNA和DNA碱基。
18.前述权利要求中任一项的核酸检测系统,其中所述向导RNA是笼锁的,任选地包含或导致茎环结构。
19.前述权利要求中任一项的核酸检测系统,其中所述放大器序列中的一个或多个和/或所述向导RNA中的一个或两者是笼锁的,任选地其中所述笼包含或导致一个或多个结构诸如环结构和/或对所述放大器序列中的一个或多个的修饰,所述修饰包含一个或多个锁核酸(LNA)或部分和/或2’-OMe RNA。
20.前述权利要求中任一项的核酸检测系统,其中所述放大器序列中的一个或多个在其3’和/或5’末端包含笼锁结构。
21.前述权利要求中任一项的核酸检测系统,其进一步包含反式笼锁分子。
22.前述权利要求中任一项的核酸检测系统,其中所述第一和第二向导RNA中的一个或两者和/或所述放大器序列中的一个或多个经修饰以允许在最佳时间框内与所述Cas效应物酶进行条件性相互作用。
23.前述权利要求中任一项的核酸检测系统,其中所述一个或多个放大器序列包含聚U和/或聚A序列,任选地A4-Un、A5-Un和A6-Un序列。
24.前述权利要求中任一项的核酸检测系统,其中所述靶序列和/或放大器序列与第一和/或第二向导RNA是100%互补的。
25.前述权利要求中任一项的核酸检测系统,其中所述靶序列和/或放大器序列与第一和/或第二向导RNA不是100%互补的。
26.前述权利要求中任一项的核酸检测系统,其中所述靶序列是来自一种或多种哺乳动物、病毒、细菌或真菌的DNA或RNA。
27.前述权利要求中任一项的核酸检测系统,其中所述靶序列在RNA病毒中。
28.前述权利要求中任一项的核酸检测系统,其中所述靶序列在冠状病毒,任选地在SARS-Cov-2冠状病毒中。
29.前述权利要求中任一项的核酸检测系统,其中所述样品是生物样品或环境样品。
30.前述权利要求中任一项的核酸检测系统,其中所述生物样品包括从个体收集的血液、唾液、尿液、生检、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、口腔拭子、宫颈拭子、鼻拭子、间质液、滑液、鼻排出物、泪液、血沉棕黄层、粘膜样品或上皮细胞样品。
31.前述权利要求中任一项的核酸检测系统,其中所述样品包括无细胞液体样品。
32.前述权利要求中任一项的核酸检测系统,其中所述样品包括无细胞液体环境样品。
33.前述权利要求中任一项的核酸检测系统,其中所述样品包括包含细胞的液体。
34.检测样品中的靶序列的方法,所述方法包括:
(a)使怀疑包含所述靶序列的样品与以下接触:
(i)前述权利要求中任一项的核酸检测系统,和
(b)测量来自所述可检测标记物的可检测信号,从而检测所述靶序列。
35.根据权利要求34的方法,其进一步包括定量所述可检测标记物的水平。
36.前述权利要求中任一项的方法,其中所述接触步骤在二价金属离子存在下,在无细胞环境中或在细胞内在体外或体内进行。
37.前述权利要求中任一项的方法,其中所述接触步骤是数秒至2小时。
CN202180060056.4A 2020-05-19 2021-05-18 用于核酸检测的核酸酶链反应的组合物和方法 Pending CN116157536A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063027175P 2020-05-19 2020-05-19
US63/027,175 2020-05-19
PCT/US2021/032977 WO2021236651A1 (en) 2020-05-19 2021-05-18 Compositions and methods of a nuclease chain reaction for nucleic acid detection

Publications (1)

Publication Number Publication Date
CN116157536A true CN116157536A (zh) 2023-05-23

Family

ID=78707531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180060056.4A Pending CN116157536A (zh) 2020-05-19 2021-05-18 用于核酸检测的核酸酶链反应的组合物和方法

Country Status (5)

Country Link
US (1) US20240141412A1 (zh)
EP (1) EP4153772A1 (zh)
JP (1) JP2023527768A (zh)
CN (1) CN116157536A (zh)
WO (1) WO2021236651A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230167487A2 (en) 2021-07-12 2023-06-01 Labsimply, Inc. Crispr cascade assay
US11820983B2 (en) 2021-12-13 2023-11-21 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
US20230279375A1 (en) 2021-12-13 2023-09-07 Labsimply, Inc. Signal boost cascade assay
WO2024011208A1 (en) * 2022-07-08 2024-01-11 The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone VIRAL DIAGNOSTIC USING CRISPR RNA COMBINATIONS AND Cas13a ENZYME
JP2024037076A (ja) * 2022-09-06 2024-03-18 国立研究開発法人産業技術総合研究所 重複遺伝子のゲノム編集方法
WO2024076473A1 (en) 2022-10-02 2024-04-11 Vedabio, Inc. Dimerization screening assays

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5538848A (en) * 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
WO1999049293A2 (en) * 1998-03-24 1999-09-30 Boston Probes, Inc. Methods, kits and compositions pertaining to detection complexes
US7482118B2 (en) * 2001-11-15 2009-01-27 Third Wave Technologies, Inc. Endonuclease-substrate complexes
US10337051B2 (en) * 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
US10476825B2 (en) * 2017-08-22 2019-11-12 Salk Institue for Biological Studies RNA targeting methods and compositions

Also Published As

Publication number Publication date
JP2023527768A (ja) 2023-06-30
EP4153772A1 (en) 2023-03-29
WO2021236651A1 (en) 2021-11-25
US20240141412A1 (en) 2024-05-02

Similar Documents

Publication Publication Date Title
US11118224B2 (en) Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
JP7437474B2 (ja) 標的rnaを検出するための方法及び組成物
CN116157536A (zh) 用于核酸检测的核酸酶链反应的组合物和方法
US20230002811A1 (en) Application of cas protein, method for detecting target nucleic acid molecule and kit
JP6758474B2 (ja) 等温増幅の成分およびプロセス
US20240169179A2 (en) Novel class 2 type ii and type v crispr-cas rna-guided endonucleases
KR102324117B1 (ko) 가닥 침입에 기초한 증폭에 의한 핵산 검출
US20230159986A1 (en) Methods for detecting and sequencing a target nucleic acid
US20200255885A1 (en) Isothermal amplification components and processes
EP2373818B1 (fr) Procede d'amplification et/ou de detection d'acides nucleiques et utilisations de ce procede
US20210230677A1 (en) Application of cas protein, method for detecting target nucleic acid molecule and kit
US20230313282A1 (en) Compositions and methods of isothermal nucleic acid amplification and detection
US20210102237A1 (en) Means and methods for nucleic acid target detection
CN114592040A (zh) 基于Cas12i的核酸检测方法
US20230357761A1 (en) Activators of type iii cas proteins
KR20240067091A (ko) 다양한 내부 변형을 갖는 루프형 프라이머 및 표적 탐지를 위한 루프-디-루프 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination