CN113913497B - 利用碱基修饰的单链核酸进行靶核酸检测的方法 - Google Patents

利用碱基修饰的单链核酸进行靶核酸检测的方法 Download PDF

Info

Publication number
CN113913497B
CN113913497B CN202110146567.XA CN202110146567A CN113913497B CN 113913497 B CN113913497 B CN 113913497B CN 202110146567 A CN202110146567 A CN 202110146567A CN 113913497 B CN113913497 B CN 113913497B
Authority
CN
China
Prior art keywords
nucleic acid
leu
lys
glu
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110146567.XA
Other languages
English (en)
Other versions
CN113913497A (zh
Inventor
梁亚峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shunfeng Biotechnology Co Ltd
Original Assignee
Shandong Shunfeng Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shunfeng Biotechnology Co Ltd filed Critical Shandong Shunfeng Biotechnology Co Ltd
Priority to CN202110146567.XA priority Critical patent/CN113913497B/zh
Publication of CN113913497A publication Critical patent/CN113913497A/zh
Application granted granted Critical
Publication of CN113913497B publication Critical patent/CN113913497B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种利用修饰的单链核酸进行靶核酸检测的方法、系统和试剂盒,所述的检测方法包括向含有靶核酸的反应体系中加入gRNA、Cas蛋白和单链核酸检测器,所述单链核酸检测器存在碱基修饰。

Description

利用碱基修饰的单链核酸进行靶核酸检测的方法
技术领域
本发明涉及核酸检测领域,尤其涉及利用修饰的单链核酸进行靶核酸检测的方法、系统和试剂盒。
背景技术
特异性检测核酸分子(Nucleic acid detection)方法具有重要的应用价值,例如病原体的检测,遗传病检测等。在病原体检测方面,由于每种病原体微生物都有其独一无二的特征核酸分子序列,因此可以开发出针对特定物种的核酸分子检测,也称为核酸诊断(NADs,nucleic acid diagnostics),在食品安全、环境微生物污染检测,人体病原菌感染等领域具有重要义。另一个方面是对人或其他物种的单核苷酸多态性 (SNPs,singlenucleotide polymorphisms)的检测。在基因组水平上去理解遗传变异和生物学功能之间的关系为现代分子生物学提供了新视角,而其中SNPs对生物学的功能、进化和疾病等密切相关,因此SNPs 的检测与分析技术的发展尤为重要。
目前建立的特异性核酸分子检测通常需要分为两步,第一步是目的核酸的扩增,第二步是目的核酸检测。现有检测技术包括限制性核酸内切酶方法、Southern、Northern、斑点杂交、荧光PCR检测技术、 LAMP环介导等温扩增技术、重组酶聚合酶扩增技术(RPA)等方法。2012年之后,CRISPR基因编辑技术兴起,张锋团队基于RPA技术开发了一种以Cas13为核心的靶向RNA的新核酸诊断技术(SHERLOCK 技术),Doudna团队开发了一种以Cas12酶为核心的诊断技术(DETECTR技术),中国科学院上海植物生理生态研究所王金博士等也开发了一种基于Cas12的新型核酸检测技术(HOLMES技术)。基于CRISPR 技术开发的核酸检测技术正在日益发挥重要作用。
在基于CRISPR的核酸检测技术中,核酸探针或者核酸检测器是上述检测技术的关键元件,本发明对核酸探针进行了改进,从而扩展了该技术的应用范围。
发明内容
本发明提供了利用碱基修饰的单链核酸进行靶核酸检测的方法、系统和试剂盒。
方法
一方面,本发明提供了一种检测样品中靶核酸的方法,所述方法包括将样品与V型CRISPR/CAS效应蛋白、gRNA(指导RNA)和单链核酸检测器接触,所述gRNA包括与所述CRISPR/CAS效应蛋白结合的区域和与靶核酸杂交的导向序列;检测由CRISPR/CAS效应蛋白切割单链核酸检测器产生的可检测信号,从而检测靶核酸。
所述单链核酸检测器含有修饰的核酸,所述修饰的核酸为碱基修饰的核酸,所述碱基修饰的核酸包括以下一种或任意几种:2’-Deoxynebularine,或Etheno-dA。
在一个实施方式中,所述单链核酸检测器包含2-30个碱基修饰的核酸,优选,所述单链核酸检测器包含3-15个碱基修饰的核酸,优选,所述单链核酸检测器包含5-10个碱基修饰的核酸,优选,5、6、7、 8、9、10个碱基修饰的核酸。
在一个实施方式中,所述单链核酸检测器的核酸由2-30个碱基修饰的核酸构成,优选的,所述单链核酸检测器的核酸由5-15个碱基修饰的核酸构成,优选的,所述单链核酸检测器的核酸由5-10个碱基修饰的核酸构成,优选,5、6、7、8、9、10个碱基修饰的核酸。
另一方面,本发明还提供了一种切割碱基修饰的核酸的方法,所述方法包括,使碱基修饰的核酸与靶核酸、V型CRISPR/CAS效应蛋白和gRNA(指导RNA)接触,gRNA包括与所述CRISPR/CAS效应蛋白结合的区域和与靶核酸杂交的导向序列,所述gRNA不与所述碱基修饰的核酸杂交。
在一个实施方式中,所述V型CRISPR/CAS效应蛋白切割所述碱基修饰的核酸,
在一个实施方式中,所述接触可以是在体外、离体或体内的细胞内部。
在一个实施方式中,所述切割为非特异性的切割(trans切割)。
试剂、试剂盒、系统或组合物
另一方面,本发明还提供了一种用于检测样品中靶核酸的试剂、试剂盒、系统或组合物,所述试剂、试剂盒、系统或组合物包括V型CAS效应蛋白、gRNA(指导RNA)和单链核酸检测器,所述gRNA 包括与所述CAS效应蛋白结合的区域和与靶核酸杂交的导向序列。
进一步的,所述试剂、试剂盒、系统或组合物还包括用于扩增或转录得到靶核酸的引物。
另一方面,本发明还提供了一种用于切割碱基修饰的核酸的试剂、试剂盒、系统或组合物,所述试剂、试剂盒、系统或组合物包括V型CAS效应蛋白、gRNA(指导RNA)和靶核酸,所述gRNA包括与所述CAS效应蛋白结合的区域和与靶核酸杂交的导向序列。
在一个实施方式中,优选的,所述碱基修饰的核酸是含有碱基修饰的核苷酸,优选的,所述切割是非特异性切割。
应用
另一方面,本发明还提供了上述试剂、试剂盒、系统或组合物在检测样品中靶核酸的应用。
另一方面,本发明还提供了上述试剂、试剂盒、系统或组合物在切割含有碱基修饰的单链核酸中的应用。优选的,所述切割含有碱基修饰的单链核酸为非特异性的切割。
另一方面,本发明还提供了V型或VI型CRISPR/CAS效应蛋白在切割碱基修饰的核酸中的应用。
如上所述的应用,所述V型或VI型CRISPR/CAS效应蛋白在与样品中的靶核酸结合或杂交后,激活旁路激活(trans活性),可以切割体系中的碱基修饰的核酸。
另一方面,本发明还提供了V型或VI型CRISPR/CAS效应蛋白在制备切割碱基修饰的核酸的试剂、试剂盒、系统或组合物中的应用。
另一方面,本发明还提供了上述V型Cas蛋白、gRNA和单链核酸检测器在检测样品中靶核酸中的应用;或者,在制备用于检测样品中靶核酸的试剂、系统、组合物或试剂盒中的用途。
另一方面,本发明还提供了上述试剂、系统、组合物或试剂盒在检测样品中靶核酸中的应用。
单链核酸检测器
本发明中,所述单链核酸检测器包括DNA、RNA、核酸类似物和核酸修饰物中的一种或多种的组合。
如本领域所知,核苷是碱基-糖基的组合,所述碱基通常是杂环碱基,最常见的是嘌呤和嘧啶,嘌呤碱基腺嘌呤(A)和鸟嘌呤(G),以及嘧啶碱基胸腺嘧啶(T),胞嘧啶(C)和尿嘧啶(U)通常被称为天然的核碱基。
所述单链核酸检测器中一种或多种修饰,所述修饰包括碱基修饰(杂环碱基的修饰),糖修饰(糖基修饰),骨架修饰(核苷间连接键的修饰)等。
本文所述碱基修饰是指对杂环碱基进行改造。所述经过修饰的碱基可以与脱氧核糖或核糖连接,经过修饰的碱基与脱氧核糖连接构成的是脱氧核苷,可以构成DNA;经过修饰的碱基与核糖连接构成的是核苷,可以构成RNA。
在一种实施方式中,所述单链核酸检测器的核酸是经过碱基修饰的核酸,所述碱基修饰的核酸包括以下一种或任意几种:结构为nebularine的核酸、结构为2’-Deoxynebularine的核酸、结构为Etheno-dA 的核酸、碱基为5-Nitroindole的核糖核苷酸或碱基为5-Nitroindole的脱氧核糖核苷酸;
优选的,所述单链核酸检测器是经过碱基修饰的核酸,所述碱基修饰的核酸包括以下一种或任意几种:结构为2’-Deoxynebularine的核酸、结构为Etheno-dA的核酸。
所述nebularine,又称水粉蕈素,烟云杯伞素,其结构示意如下:
所述2’-Deoxynebularine结构示意如下:
所述Etheno-dA结构如下所示:
所述5-Nitroindole(5-硝基吲哚)可以作为一种杂环碱基构成核苷,其结构示意如下:
构成完整的脱氧核糖核苷酸的结构如下:
在一个实施方式中,所述单链核酸检测器包含2-30个碱基修饰的核酸,优选,所述单链核酸检测器包含3-15个碱基修饰的核酸,优选,所述单链核酸检测器包含5-10个碱基修饰的核酸,优选,5、6、7、 8、9、10个碱基修饰的核酸。
在一个实施方式中,所述单链核酸检测器的核酸由2-30个碱基修饰的核酸构成,优选的,所述单链核酸检测器的核酸由5-15个碱基修饰的核酸构成,优选的,所述单链核酸检测器的核酸由5-10个碱基修饰的核酸构成,优选,5、6、7、8、9、10个碱基修饰的核酸。
所述单链核酸检测器不与所述gRNA杂交。
CRISPR/CAS效应蛋白
进一步的,所述V型CRISPR/CAS效应蛋白选自Cas12、Cas14家族蛋白或其突变体;在一个实施方式中,所述Cas蛋白优选为Cas12家族,包括但不限于Cas12a、Cas12b、Cas12d、Cas12e、Cas12f、 Cas12g、Cas12h、Cas12i、Cas12j中的一种或任意几种。
在一个实施方式中,所述Cas12a选自FnCas12a、AsCas12a、LbCas12a、Lb5Cas12a、HkCas12a、 OsCas12a、TsCas12a、BbCas12a、BoCas12a或Lb4Cas12a中一种或任意几种;所述Cas12a优选为LbCas12a,氨基酸序列如SEQ ID No.1所示,或者,将SEQ ID No.1所示氨基酸序或其活性片段经过一个或多个(如 2个、3个、4个,5个,6个,7个,8个,9个或10个)氨基酸残基的取代、缺失或添加而形成的,且具有基本相同功能的衍生蛋白。
在其他的实施方式中,所述Cas12b的氨基酸序列如SEQ ID No.2所示,或者,将SEQID No.2所示氨基酸序或其活性片段经过一个或多个(如2个、3个、4个,5个,6个,7个,8个,9个或10个) 氨基酸残基的取代、缺失或添加而形成的,且具有基本相同功能的衍生蛋白。
在优选的实施方式中,所述Cas12i蛋白的氨基酸序列选自下组:
(1)SEQ ID No.3所示的蛋白;
(2)将SEQ ID No.3所示氨基酸序或其活性片段经过一个或多个(如2个、3个、4个,5个,6个, 7个,8个,9个或10个)氨基酸残基的取代、缺失或添加而形成的,且具有基本相同功能的衍生蛋白。
所述Cas12j蛋白的氨基酸序列选自下组:
(1)SEQ ID No.4所示的蛋白;
(2)将SEQ ID No.4所示氨基酸序或其活性片段经过一个或多个(如2个、3个、4个,5个,6个, 7个,8个,9个或10个)氨基酸残基的取代、缺失或添加而形成的,且具有基本相同功能的衍生蛋白。
在一个实施方式中,所述Cas蛋白突变体包括氨基酸取代、缺失或替换,且所述突变体至少保留其 trans切割活性。优选地,所述突变体具有Cis和trans切割活性。
本领域技人员清楚,可以改变蛋白质的结构而不对其活性和功能性产生不利影响,例如可以在蛋白质氨基酸序列中引入一个或多个保守性氨基酸取代,而不会对蛋白质分子的活性和/或三维结构产生不利影响。本领域技术人员清楚保守性氨基酸取代的实例以及实施方式。具体的说,可以用与待取代位点属于相同组的另一氨基酸残基取代该氨基酸残基,即用非极性氨基酸残基取代另一非极性氨基酸残基,用极性不带电荷的氨基酸残基取代另一极性不带电荷的氨基酸残基,用碱性氨基酸残基取代另一碱性氨基酸残基,和用酸性氨基酸残基取代另一酸性氨基酸残基。这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的。只要取代不导致蛋白质生物活性的失活,则一种氨基酸被属于同组的其他氨基酸替换的保守取代落在本发明的范围内。因此,本发明的蛋白可以在氨基酸序列中包含一个或多个保守性取代, 这些保守性取代最好根据表1进行替换而产生。另外,本发明也涵盖还包含一个或多个其他非保守取代的蛋白,只要该非保守取代不显著影响本发明的蛋白质的所需功能和生物活性即可。
保守氨基酸置换可以在一个或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基是可以发生改变(缺失、取代或置换)而不改变生物活性的氨基酸残基,而“必需”氨基酸残基是生物活性所需的。“保守氨基酸置换”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。氨基酸置换可以在Cas酶的非保守区域中进行。一般而言,此类置换不对保守的氨基酸残基,或者不对位于保守基序内的氨基酸残基进行,其中此类残基是蛋白质活性所需的。然而,本领域技术人员应当理解,功能变体可以具有较少的在保守区域中的保守或非保守改变。
表1
本领域熟知,可以从蛋白质的N和/或C末端改变(置换、删除、截短或插入)一或多个氨基酸残基而仍保留其功能活性。因此,从本发明的Cas蛋白的N和/或C末端改变了一或多个氨基酸残基、同时保留了其所需功能活性的蛋白,也在本发明的范围内。这些改变可以包括通过现代分子方法例如PCR 而引入的改变,所述方法包括借助于在PCR扩增中使用的寡核苷酸之中包含氨基酸编码序列而改变或延长蛋白质编码序列的PCR扩增。
应认识到,蛋白质可以以各种方式进行改变,包括氨基酸置换、删除、截短和插入,用于此类操作的方法是本领域通常已知的。例如,可以通过对DNA的突变来制备Cas蛋白的氨基酸序列变体。还可以通过其他诱变形式和/或通过定向进化来完成,例如,使用已知的诱变、重组和/或改组(shuffling)方法,结合相关的筛选方法,来进行单个或多个氨基酸取代、缺失和/或插入。
本领域技术人员能够理解,本发明Cas蛋白中的这些微小氨基酸变化可以出现(例如天然存在的突变) 或者产生(例如使用r-DNA技术)而不损失蛋白质功能或活性。如果这些突变出现在蛋白的催化结构域、活性位点或其它功能结构域中,则多肽的性质可改变,但多肽可保持其活性。如果存在的突变不接近催化结构域、活性位点或其它功能结构域中,则可预期较小影响。
本领域技术人员可以根据本领域已知的方法,例如定位诱变或蛋白进化或生物信息系的分析,来鉴定Cas蛋白的必需氨基酸。蛋白的催化结构域、活性位点或其它功能结构域也能够通过结构的物理分析而确定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,结合推定的关键位点氨基酸的突变来确定。
靶核酸
本发明中,所述靶核酸包括核糖核苷酸或脱氧核糖核苷酸,包括单链核酸、双链核酸,例如单链DNA、双链DNA、单链RNA、双链RNA。
在一个实施方式中,所述靶核酸来源于病毒、细菌、微生物、土壤、水源、人体、动物、植物等样品。优选的,所述靶核酸为PCR、NASBA、RPA、SDA、LAMP、HAD、NEAR、MDA、RCA、LCR、RAM等方法富集或扩增的产物。
在一个实施方式中,所述方法还包括从样品中获得靶核酸的步骤。
在一个实施方式中,所述靶核酸为病毒核酸、细菌核酸、与疾病相关的特异核酸,如特定的突变位点或SNP位点或与对照有差异的核酸;优选地,所述病毒为植物病毒或动物病毒,例如,乳头瘤病毒,肝DNA病毒,疱疹病毒,腺病毒,痘病毒,细小病毒,冠状病毒;优选地,所述病毒为冠状病毒,优选地,SARS、SARS-CoV2(COVID-19)、HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1、Mers-Cov。
在一些实施方式中,所述靶核酸来源于细胞,例如,来源于细胞裂解液。
在一个实施方式中,所述的靶核酸包括DNA、RNA,优选为单链核酸或双链核酸或核酸修饰物。
可检测信号
本发明中,所述可检测信号通过以下方式实现:基于视觉的检测,基于传感器的检测,颜色检测,基于金纳米颗粒的检测,荧光偏振,胶体相变/分散,电化学检测和基于半导体的检测。
在一些实施方式中,本发明的方法还包括测量CRISPR/CAS效应蛋白(Cas蛋白)产生的可检测信号的步骤。所述Cas蛋白识别所述靶核酸或与所述靶核酸杂交之后可以激发单链核酸的切割活性,从而切割所述单链核酸检测器进而产生可检测信号。
本发明中,所述可检测信号可以是当切割单链核酸检测器时产生的任何信号。例如,基于金纳米颗粒的检测,荧光偏振,荧光检测,胶体相变/分散,电化学检测,基于半导体的传感。所述可检测信号可通过任何合适的方式读出,包括但不限于:可检测的荧光信号的测量,凝胶电泳检测(通过检测凝胶上的条带的变化),基于视觉或传感器的颜色的存在或不存在的检测、或者颜色存在的差异(例如,基于金纳米颗粒)以及电信号的差异。
在优选的实施方式中,所述可检测信号通过以下方式实现:所述单链核酸检测器的5’端和3’端分别设置不同的报告基团,当所述单链核酸检测器被切割后,可以表现出可检测的报告信号;例如,单链核酸检测器的两端分别设置荧光基团和淬灭基团,当所述单链核酸检测器被切割后,可以表现出可检测的荧光信号。
在一个实施方式中,所述荧光基团选自FAM、FITC、VIC、JOE、TET、CY3、CY5、ROX、Texas Red 或LC RED460中的一种或任意几种;所述淬灭基团选自BHQ1、BHQ2、BHQ3、Dabcy1或Tamra中的一种或任意几种。
在其他的实施方式中,所述可检测信号还可以通过以下方式实现:所述单链核酸检测器的5’端和3’端分别设置不同的标记分子,通过胶体金检测的方式检测反应信号。
在一些实施方式中,所述可检测信号的测量可以是定量的,在其他的实施方式中,所述可检测信号的测量可以是定性的。
优选的,所述单链核酸检测器在被所述Cas蛋白切割之前产生第一可检测信号,并且在被切割之后产生不同于第一可检测信号的第二可检测信号。
gRNA
本发明中,所述gRNA包括靶向所述待检测特征序列的序列(导向序列)和识别Cas蛋白的序列(同向重复序列或其部分)。
本发明中,所述的导向序列包括10-40bp;优选地,12-25bp;优选地,15-23bp;优选地,16-18bp。
本发明中,所述gRNA与待检测特征序列至少有50%的匹配度,优选至少60%,优选至少70%,优选至少80%,优选至少90%。
在一个实施方式中,当所述的特征序列含有一个或多个特征位点(如特定的突变位点或SNP)时,所述的特征位点与gRNA完全匹配。
在一个实施方式中,所述检测方法中可以包含一种或多种导向序列互不相同的gRNA,其靶向不同的特征序列。
在一个实施方式中,所述的识别所述待检测的特征序列包括结合和/或切割待检测特征序列。
比例
在一个实施方式中,所述Cas蛋白与gRNA的用量摩尔比为(0.8-1.2):1。
在一个实施方式中,所述Cas蛋白的用量终浓度为20-200nM,优选,30-100nM,更优选,40-80nM,更优选,50nM。
在一个实施方式中,所述gRNA的用量终浓度为20-200nM,优选,30-100nM,更优选,40-80nM,更优选,50nM。
在一个实施方式中,所述靶核酸的用量终浓度为5-100nM,优选,10-50nM。
在一个实施方式中,所述单链核酸检测器的用量终浓度为100-1000nM,优选,150-800nM,优选, 200-800nM,优选,200-500nM,优选,200-300nM。
术语“杂交”或“互补的”或“基本上互补的”是指核酸(例如RNA、DNA)包含使其能够非共价结合的核苷酸序列,即以序列特异性,反平行的方式(即核酸特异性结合互补核酸)与另一核酸形成碱基对和/ 或G/U碱基对,“退火”或“杂交”。杂交需要两个核酸含有互补序列,尽管碱基之间可能存在错配。两个核酸之间杂交的合适条件取决于核酸的长度和互补程度,这是本领域公知的变量。典型地,可杂交核酸的长度为8个核苷酸或更多(例如,10个核苷酸或更多,12个核苷酸或更多,15个核苷酸或更多,20 个核苷酸或更多,22个核苷酸或更多,25个核苷酸或更多,或30个核苷酸或更多)。
应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高, 98%或更高,99%或更高,99.5%或更高,或与其杂交的靶核酸序列中的靶区域的序列互补性为100%。
序列表
seq ID 内容 类型
1 Cas12a protein
2 Cas12b protein
3 Cas12i protein
4 Cas12j protein
一般定义
除非另有定义,否则本文所用的技术和科学术语具有与所属领域的普通技术人员之一通常理解的相同的含义。
术语“氨基酸”是指含有氨基的羧酸。生物体内的各种蛋白质是由20种基本氨基酸构成的。
术语“多核苷酸”、“核苷酸序列”、“核酸序列”、“核酸分子”和“核酸”可以互换使用,包括DNA、RNA 或者其杂交体,可以是双链或单链的。
术语“寡核苷酸”是指含有3-100个核苷酸的序列,优选,具有3-30个核苷酸,优选,4-20个核苷酸,更优选,5-15个核苷酸。
术语“同源性”或“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,氨基酸序列的同一性可以通过常规方法,参考例如Smith and Waterman,1981,Adv.Appl.Math.2:482Pearson&Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444, Thompson etal.,1994,Nucleic AcidsRes 22:467380等的教导,通过计算机化运行运算法则(Wisconsin Genetics软件包中的GAP,BESTFIT,FASTA,和TFASTA,Genetics Computer Group)来确定。也可使用可从美国国立生物技术信息中心(NCBI www.ncbi.nlm.nih.gov/)获得的BLAST运算法则,使用默认参数确定。
如本文所用,所述“CRISPR”是指成簇、规律间隔的短回文重复序列(Clusteredregularly interspaced short palindromic repeats),其来自微生物的免疫系统。
如本文所用,“生物素(biotin)”也称维生素H,是一种分子量为244Da的小分子维生素。“亲和素 (avidin)”,又称抗生物素,是一种碱性糖蛋白,具有4个同生物素亲和例极高的结合位点,常用亲和素有链霉亲合素。生物素与亲和素的极强亲和力可用于在检测体系中放大或增强检测信号。如生物素很易与蛋白质(如抗体等)以共价键结合,而结合了酶的亲和素分子与结合有特异性抗体的生物素分子产生反应,既起到了多级放大作用,又由于酶在遇到相应底物时的催化作用而呈色,达到检测未知抗原(或抗体)分子的目的。
靶核酸
如本文所用,所述“靶核酸”是指从生物样品(待测样品)中提取的多核苷酸分子。所述生物样品是从任何生物体获得、排泄或分泌的任何固体或流体样品,包括但不限于单细胞生物,例如细菌、酵母、原生动物和变形虫等,多细胞生物(例如植物或动物,包括来自健康或表面健康的人类受试者或受待诊断或调查的病症或疾病影响的人类患者的样品,例如病原微生物例如病原细菌或病毒的感染)。例如,生物样品可以是从例如血液、血浆、血清、尿液、粪便、痰液、粘液、淋巴液、滑液、胆汁、腹水、胸腔积液、血清肿、唾液、脑脊液、水性或玻璃体液、或任何身体分泌物、渗出液、渗出液(例如,从脓肿或任何其他感染或炎症部位获得的液体)中获得的生物液体或从关节(例如,正常关节或受疾病影响的关节,例如类风湿性关节炎、骨关节炎、痛风或脓毒性关节炎)获得的液体,或皮肤或粘膜表面的拭子。样品也可以是从任何器官或组织获得的样品(包括活组织检查或尸体解剖标本,例如肿瘤活检)或者可以包含细胞(原代细胞或培养的细胞)或由任何细胞、组织或器官调理的培养基。示例性的样品包括但不限于,细胞、细胞裂解物、血涂片、细胞离心制剂、细胞学涂片、体液(例如血液、血浆、血清、唾液、痰、尿、支气管肺泡灌洗、精液等)、组织活检(例如肿瘤活组织检查)、细针抽吸物和/或组织切片(例如低温恒温器组织切片和/或石蜡包埋的组织切片)。
在其他实施方式中,生物样品可以是植物细胞、愈伤、组织或器官(如根、茎、叶、花、种子、果实)等。
本发明中,所述的靶核酸还包括通过逆转录RNA形成的DNA分子,进一步地,所述的靶核酸可以采用本领域公知的技术对其进行扩增,所述的扩增技术等温扩增技术和非等温扩增技术,等温扩增可以是基于核酸测序的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增 (SDA)、解旋酶依赖性扩增(HDA)、或切口酶扩增反应(NEAR)。在某些示例性实施方式中,可以使用非等温扩增方法,其包括但不限于PCR、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)、或衍生物扩增方法(RAM)。
进一步的,本发明所述的检测方法还一步包括对靶核酸扩增的步骤;所述的检测系统,还进一步包括对靶核酸进行扩增的试剂。所述扩增的试剂包括下组中的一种或多种:DNA聚合酶、链置换酶、解旋酶、重组酶、单链结合蛋白等。
Cas蛋白
本文所述“Cas蛋白”是指CRISPR-associated蛋白,优选来自V型或VI型CRISPR/CAS蛋白,其一旦与待检测特征序列(靶序列)结合(即形成Cas蛋白-gRNA-靶序列的三元复合物),就可以诱发其trans 活性,即随机切割非靶向单链核苷酸(即本文所述单链核酸检测器,优选单链DNA(ssDNA)、单链 DNA-RNA杂交体、单链RNA)。当Cas蛋白与特征序列结合后,其切割或不切割特征序列,均可以诱发其trans活性;优选地,其通过切割特征序列诱发其trans活性;更优选地,其通过切割单链特征序列诱发其trans活性。所述Cas蛋白通过识别与特征序列临近的PAM(protospacer adjacent motif)识别特征序列。
本发明所述的Cas蛋白为至少具有trans切割活性的蛋白,优选地,所述的Cas蛋白为具有Cis和trans 切割活性的蛋白。所述的Cis活性是指Cas蛋白可在gRNA的作用下识别PAM位点并特异性切割靶序列的活性。
本发明所述的Cas蛋白包括V型和VI型CRISPR/CAS效应蛋白,包括Cas12、Cas13、Cas14等蛋白家族。优选地,例如Cas12蛋白,例如Cas12a、Cas1 2b、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、 Cas12i、Cas12j;优选地,所述Cas蛋白为Cas12a、Cas12b、Cas12i、Cas12j。Cas13蛋白家族包括Cas13a、 Cas13b等。
在实施方式中,本文所称的Cas蛋白,如Cas12,也涵盖Cas的功能变体或其同源物或直系同源物。如本文所用的蛋白的“功能变体”是指至少部分保留该蛋白的活性的这样的蛋白的变体。功能变体可以包括突变体(其可以是插入、缺失或替换突变体),包括多晶型物等。功能变体中还包括这样的蛋白与另一种通常不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。有利的实施方式可以涉及工程化或非天然存在的V型DNA靶向效应蛋白。
在一个实施方式中,编码Cas蛋白,如Cas12,的一种或多种核酸分子或其直系同源物或同源物可以被密码子优化用于在真核细胞中表达。真核生物可如本文所述。一种或多种核酸分子可以是工程化的或非天然存在的。
在一个实施方式中,Cas12蛋白或其直系同源物或同源物可以包含一个或多个突变(并且因此编码其的核酸分子可以具有一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。
在一个实施方式中,Cas蛋白可以来自:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真细菌属、链球菌属、乳酸菌属、支原体属、拟杆菌属、Flaviivola、黄杆菌属、固氮螺菌属、Sphaerochaeta、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、Parvibaculum、葡萄球菌属、Nitratifractor、支原体属、弯曲杆菌属和毛螺菌属。
在一个实施方式中,Cas蛋白选自如下序列组成的蛋白:
(1)SEQ ID No.1-4所示的蛋白;
(2)将SEQ ID No.1-4所示氨基酸序或其活性片段列经过一个或多个(如2个、3个、4个,5个,6个,7个,8个,9个或10个)氨基酸残基的取代、缺失或添加而形成的,且具有基本相同功能的衍生蛋白。
在一个实施方式中,所述Cas蛋白还包括与上述序列具有50%,优选55%,优选60%,优选65%,优选70%,优选75%,优选80%,优选85%,优选90%,优选95%,序列同一性的,且具有trans活性的蛋白。
所述的Cas蛋白可以通过重组表达载体技术获得,即将编码该蛋白的核酸分子构建到合适的载体上,再转化到宿主细胞中,使得所述的编码核酸分子在细胞中表达,从而获得相应的蛋白。所述的蛋白可以被细胞分泌出来,或者破解细胞通过常规的提取技术获得该蛋白。所述的编码核酸分子可以整合至宿主细胞的基因组中进行表达,也可以不整合到宿主细胞中进行表达。所述的载体还进一步包括有利于序列整合,或进行自我复制的调节元件。所述的载体可以是例如质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的,优选地,本发明中的表达载体是质粒。所述的载体进一步包括一种或多种调控元件,选自启动子、增强子、翻译起始的核糖体结合位点、终止子、多聚腺苷酸序列、筛选标记基因。
宿主细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。本领域一般技术人员都清楚如何选择适当的载体和宿主细胞。
gRNA
如本文所用,所述的“gRNA”又称为guide RNA或导向RNA,并且具有本领域技术人员通常理解的含义。一般而言,导向RNA可以包含同向(direct)重复序列和导向序列(guidesequence),或者基本上由或由同向重复序列和导向序列(在内源性CRISPR系统背景下也称为间隔序列(spacer))组成。gRNA在不同的CRISPR系统中,依据其所依赖的Cas蛋白的不同,可以包括crRNA和tracrRNA,也可以只含有 crRNA。crRNA和tracrRNA可以经过人工改造融合形成single guide RNA(sgRNA)。在某些情况下,导向序列是与靶序列(本发明中所述特征序列)具有足够互补性从而与所述靶序列杂交并引导 CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列,通常具有12-25nt的序列长度。所述的同向重复序列可折叠形成特定结构(如茎环结构)供Cas蛋白识别,以形成复合物。所述的导向序列不需要与特征序列(靶序列)100%互补。所述的导向序列不与单链核酸检测器互补。
在某些实施方案中,当最佳比对时,导向序列与其相应靶序列之间的互补程度(匹配度)为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。
本发明所述的gRNA可以是天然的,也可以是经过人工改造或设计合成的。
单链核酸检测器
本发明所述的单链核酸检测器是指含有2-200个核苷酸的序列,优选,具有2-150个核苷酸,优选, 3-100个核苷酸,优选,3-30个核苷酸,优选,4-20个核苷酸,更优选,5-15个核苷酸。优选为单链DNA 分子、单链RNA分子或单链DNA-RNA杂交体。
本发明中,对单链核酸检测器的碱基进行了修饰,从而使得原本无法用于核酸检测的poly G,经过修饰后可以高效的用于核酸检测。
所述的单链核酸检测器在检测方法或系统中用以报告是否含有特征序列。所述的单链核酸检测器两端包括不同的报告基团或标记分子,当其处于初始状态(即未被切割状态时)不呈现报告信号,当该单链核酸检测器被切割后,呈现出可检测的信号,即切割后与切割前表现出可检测的区别。在本发明中,如果能够检测出可检测的区别,则反映靶核酸中含有待检测的特征序列;或者,如果无法检检测出所述的可检测的区别,则反映靶核酸中不含有待检测的特征序列。
在一个实施方式中,所述的报告基团或标记分子包括荧光基团和淬灭基团,所述荧光基团选自FAM、 FITC、VIC、JOE、TET、CY3、CY5、ROX、Texas Red或LC RED460中的一种或任意几种;所述淬灭基团选自BHQ1、BHQ2、BHQ3、Dabcy1或Tamra中的一种或任意几种。
在一个实施方式中,所述的单链核酸检测器具有连接至5’端第一分子(如FAM或FITC)和连接至 3’端的第二分子(如生物素)。所述的含有单链核酸检测器的反应体系与流动条配合用以检测特征序列(优选,胶体金检测方式)。所述的流动条被设计为具有两条捕获线,在样品接触端(胶体金)设有结合第一分子的抗体(即第一分子抗体),在第一线(control line)处含有结合第一分子抗体的抗体,在第二线(test line)处含有与第二分子结合的第二分子的抗体(即第二分子抗体,如亲和素)。当反应沿着条带流动时,第一分子抗体与第一分子结合携带切割或未切割的寡核苷酸至捕获线,切割的报告子将在第一个捕获线处结合第一分子抗体的抗体,而未切割的报告子将在第二捕获线处结合第二分子抗体。报告基团在各条线的结合将导致强读出/信号(例如颜色)。随着更多的报告子被切割,更多的信号将在第一捕获线处累积,并且在第二线处将出现更少的信号。在某些方面,本发明涉及如本文所述的流动条用于检测核酸的用途。在某些方面,本发明涉及用本文定义的流动条检测核酸的方法,例如(侧)流测试或(侧)流免疫色谱测定。在某些方面,所述单链核酸检测器中的分子可相互替换,或改变分子的位置,只要其报告原理与本发明相同或相近,所改进的方式也均包含在本发明中。
本发明所述的检测方法,可用于待检测特征序列的定量检测。所述的定量检测指标可以根据报告基团的信号强弱进行定量,如根据荧光基团的发光强度,或根据显色条带的宽度等。
附图说明
图1、5个2’-Deoxynebularine相连接的单链核酸,在5’端连接有荧光基团FAM和3’端连接有淬灭集团BHQ1作为单链核酸检测器时的检测结果。
图2、5个Etheno-dA相连接的单链核酸,在5’端连接有荧光基团FAM和3’端连接有淬灭集团BHQ1 作为单链核酸检测器时的检测结果。
图3、5个碱基为5-Nitroindole的脱氧核糖核苷酸,在5’端连接有荧光基团FAM和3’端连接有淬灭基团BHQ1作为单链核酸检测器时的检测结果。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
本发明技术方案基于如下原理,获得待测样品的核酸,比如,可以通过扩增的方法得到靶核酸,利用可以与靶核酸配对的gRNA引导Cas蛋白识别并结合在靶核酸上;随后,Cas蛋白激发单链核酸切割活性,从而切割体系里的单链核酸检测器;单链核酸检测器的两端分别设置荧光基团和淬灭基团,如果单链核酸检测器被切割,则会激发荧光;如果单链核酸无法被切割,则不会激发荧光;在其他的实施方式中,单链核酸检测器的两端还可以设置成能够被胶体金检测的标记。
实施例1、碱基修饰的单链核酸检测器的检测效果
本实施方式中,利用结构为5个2’-Deoxynebularine相连接的核酸、5个Etheno-dA相连接的核酸、 5个碱基为5-Nitroindole的核苷相连接的核酸作为单链核酸检测器,同时在单链核酸检测器的5’端连接有荧光基团FAM且3’端连接有淬灭基团BHQ1。
申请人对Cas12a(SEQ ID No.1)、Cas12b(SEQ ID No.2)、Cas12i(SEQ ID No.3)和Cas12j(SEQ ID No.4),在利用上述含有单链核酸检测器时的检测效果进行了验证,试验设计如下:
上述Cas12i3-g2-ssDNA0的序列:
gatcgttggtagttcatgctgctgtcggtgaaataaacatctccggtaac
上述Cas12j19-g3-ssDNA0的序列:
ccccgccttt tggaccaact cgcatcaatc ccatgtaggc gtcggcgatg
上述LbCas12a-TGW6-g1的序列:
uaauuucuacuaaguguagauuuucaccgacagcagcauga
上述AaCas12b-TGW6-g1的序列:
gucuaaaggacagaauuuuucaacgggugugccaauggccacuuuccagguggcaaagcccguugaacuucaagcgaaguggcacuuuca ccgacagcagcauga
上述dri3-gostgw6-2的序列:
agagaaugugugcauagucacacuuucaccgacagcagcaugaacu
上述Cas12j19-TGW6-g3的序列:
gugcugcugucucccagacgggaggcagaacugcacggauugaugcgaguugguccaaaa
配制20微升反应体系,体系内各成分的含量如下:
组分 20ul体系使用量 终浓度
缓冲液 2ul
2uM的Cas12 0.5ul 50nM
1uM的gRNA 1ul 50nM
100nM的ssDNA 1ul 5nM
10uM的单链核酸检测器 0.4ul 200nM
H2O Up to 20ul
结果如图1-3所示,当单链核酸检测器是由碱基修饰的核酸构成时,具体的,结构为 2’-Deoxynebularine的核酸、结构为Etheno-dA的核酸为单链核酸检测器时,利用Cas12a(SEQ ID No.1)、Cas12b(SEQ ID No.2)、Cas12i(SEQ ID No.3)和Cas12j(SEQ IDNo.4)皆可以进行核酸检测;尤其是,Cas12a、Cas12b和Cas12i利用结构为2’-Deoxynebularine的单链核酸检测器,与对照相比,可以快速的表现出荧光;Cas12a和Cas12i利用结构为Etheno-dA的单链核酸检测器,与对照相比,可以快速的表现出荧光。但是,利用碱基为5-Nitroindole的脱氧核糖核苷酸作为单链核酸检测器时,整体检测效果不好。
SEQUENCE LISTING
<110> 山东舜丰生物科技有限公司
<120> 利用碱基修饰的单链核酸进行靶核酸检测的方法
<130> JH-CNP210171DJ
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 1228
<212> PRT
<213> Artificial Sequence
<220>
<223> LbCas12a
<400> 1
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 2
<211> 1129
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12b
<400> 2
Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240
Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415
Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445
Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460
Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685
Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700
Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720
Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735
Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750
Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765
Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780
Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800
Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815
Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 3
<211> 1045
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12i
<400> 3
Met Lys Lys Val Glu Val Ser Arg Pro Tyr Gln Ser Leu Leu Leu Pro
1 5 10 15
Asn His Arg Lys Phe Lys Tyr Leu Asp Glu Thr Trp Asn Ala Tyr Lys
20 25 30
Ser Val Lys Ser Leu Leu His Arg Phe Leu Val Cys Ala Tyr Gly Ala
35 40 45
Val Pro Phe Asn Lys Phe Val Glu Val Val Glu Lys Val Asp Asn Asp
50 55 60
Gln Leu Val Leu Ala Phe Ala Val Arg Leu Phe Arg Leu Val Pro Val
65 70 75 80
Glu Ser Thr Ser Phe Ala Lys Val Asp Lys Ala Asn Leu Ala Lys Ser
85 90 95
Leu Ala Asn His Leu Pro Val Gly Thr Ala Ile Pro Ala Asn Val Gln
100 105 110
Ser Tyr Phe Asp Ser Asn Phe Asp Pro Lys Lys Tyr Met Trp Ile Asp
115 120 125
Cys Ala Trp Glu Ala Asp Arg Leu Ala Arg Glu Met Gly Leu Ser Ala
130 135 140
Ser Gln Phe Ser Glu Tyr Ala Thr Thr Met Leu Trp Glu Asp Trp Leu
145 150 155 160
Pro Leu Asn Lys Asp Asp Val Asn Gly Trp Gly Ser Val Ser Gly Leu
165 170 175
Phe Gly Glu Gly Lys Lys Glu Asp Arg Gln Gln Lys Val Lys Met Leu
180 185 190
Asn Asn Leu Leu Asn Gly Ile Lys Lys Asn Pro Pro Lys Asp Tyr Thr
195 200 205
Gln Tyr Leu Lys Ile Leu Leu Asn Ala Phe Asp Ala Lys Ser His Lys
210 215 220
Glu Ala Val Lys Asn Tyr Lys Gly Asp Ser Thr Gly Arg Thr Ala Ser
225 230 235 240
Tyr Leu Ser Glu Lys Ser Gly Glu Ile Thr Glu Leu Met Leu Glu Gln
245 250 255
Leu Met Ser Asn Ile Gln Arg Asp Ile Gly Asp Lys Gln Lys Glu Ile
260 265 270
Ser Leu Pro Lys Lys Asp Val Val Lys Lys Tyr Leu Glu Ser Glu Ser
275 280 285
Gly Val Pro Tyr Asp Gln Asn Leu Trp Ser Gln Ala Tyr Arg Asn Ala
290 295 300
Ala Ser Ser Ile Lys Lys Thr Asp Thr Arg Asn Phe Asn Ser Thr Leu
305 310 315 320
Glu Lys Phe Lys Asn Glu Val Glu Leu Arg Gly Leu Leu Ser Glu Gly
325 330 335
Asp Asp Val Glu Ile Leu Arg Ser Lys Phe Phe Ser Ser Glu Phe His
340 345 350
Lys Thr Pro Asp Lys Phe Val Ile Lys Pro Glu His Ile Gly Phe Asn
355 360 365
Asn Lys Tyr Asn Val Val Ala Glu Leu Tyr Lys Leu Lys Ala Glu Ala
370 375 380
Thr Asp Phe Glu Ser Ala Phe Ala Thr Val Lys Asp Glu Phe Glu Glu
385 390 395 400
Lys Gly Ile Lys His Pro Ile Lys Asn Ile Leu Glu Tyr Ile Trp Asn
405 410 415
Asn Glu Val Pro Val Glu Lys Trp Gly Arg Val Ala Arg Phe Asn Gln
420 425 430
Ser Glu Glu Lys Leu Leu Arg Ile Lys Ala Asn Pro Thr Val Glu Cys
435 440 445
Asn Gln Gly Met Thr Phe Gly Asn Ser Ala Met Val Gly Glu Val Leu
450 455 460
Arg Ser Asn Tyr Val Ser Lys Lys Gly Ala Leu Val Ser Gly Glu His
465 470 475 480
Gly Gly Arg Leu Ile Gly Gln Asn Asn Met Ile Trp Leu Glu Met Arg
485 490 495
Leu Leu Asn Lys Gly Lys Trp Glu Thr His His Val Pro Thr His Asn
500 505 510
Met Lys Phe Phe Glu Glu Val His Ala Tyr Asn Pro Ser Leu Ala Asp
515 520 525
Ser Val Asn Val Arg Asn Arg Leu Tyr Arg Ser Glu Asp Tyr Thr Gln
530 535 540
Leu Pro Ser Ser Ile Thr Asp Gly Leu Lys Gly Asn Pro Lys Ala Lys
545 550 555 560
Leu Leu Lys Arg Gln His Cys Ala Leu Asn Asn Met Thr Ala Asn Val
565 570 575
Leu Asn Pro Lys Leu Ser Phe Thr Ile Asn Lys Lys Asn Asp Asp Tyr
580 585 590
Thr Val Ile Ile Val His Ser Val Glu Val Ser Lys Pro Arg Arg Glu
595 600 605
Val Leu Val Gly Asp Tyr Leu Val Gly Met Asp Gln Asn Gln Thr Ala
610 615 620
Ser Asn Thr Tyr Ala Val Met Gln Val Val Lys Pro Lys Ser Thr Asp
625 630 635 640
Ala Ile Pro Phe Arg Asn Met Trp Val Arg Phe Val Glu Ser Gly Ser
645 650 655
Ile Glu Ser Arg Thr Leu Asn Ser Arg Gly Glu Tyr Val Asp Gln Leu
660 665 670
Asn His Asp Gly Val Asp Leu Phe Glu Ile Gly Asp Thr Glu Trp Val
675 680 685
Asp Ser Ala Arg Lys Phe Phe Asn Lys Leu Gly Val Lys His Lys Asp
690 695 700
Gly Thr Leu Val Asp Leu Ser Thr Ala Pro Arg Lys Ala Tyr Ala Phe
705 710 715 720
Asn Asn Phe Tyr Phe Lys Thr Met Leu Asn His Leu Arg Ser Asn Glu
725 730 735
Val Asp Leu Thr Leu Leu Arg Asn Glu Ile Leu Arg Val Ala Asn Gly
740 745 750
Arg Phe Ser Pro Met Arg Leu Gly Ser Leu Ser Trp Thr Thr Leu Lys
755 760 765
Ala Leu Gly Ser Phe Lys Ser Leu Val Leu Ser Tyr Phe Asp Arg Leu
770 775 780
Gly Ala Lys Glu Met Val Asp Lys Glu Ala Lys Asp Lys Ser Leu Phe
785 790 795 800
Asp Leu Leu Val Ala Ile Asn Asn Lys Arg Ser Asn Lys Arg Glu Glu
805 810 815
Arg Thr Ser Arg Ile Ala Ser Ser Leu Met Thr Val Ala Gln Lys Tyr
820 825 830
Lys Val Asp Asn Ala Val Val His Val Val Val Glu Gly Asn Leu Ser
835 840 845
Ser Thr Asp Arg Ser Ala Ser Lys Ala His Asn Arg Asn Thr Met Asp
850 855 860
Trp Cys Ser Arg Ala Val Val Lys Lys Leu Glu Asp Met Cys Asn Leu
865 870 875 880
Tyr Gly Phe Asn Ile Lys Gly Val Pro Ala Phe Tyr Thr Ser His Gln
885 890 895
Asp Pro Leu Val His Arg Ala Asp Tyr Asp Asp Pro Lys Pro Ala Leu
900 905 910
Arg Cys Arg Tyr Ser Ser Tyr Ser Arg Ala Asp Phe Ser Lys Trp Gly
915 920 925
Gln Asn Ala Leu Ala Ala Val Val Arg Trp Ala Ser Asn Lys Lys Ser
930 935 940
Asn Thr Cys Tyr Lys Val Gly Ala Val Glu Phe Leu Lys Gln His Gly
945 950 955 960
Leu Phe Ala Asp Lys Lys Leu Thr Val Glu Gln Phe Leu Ser Lys Val
965 970 975
Lys Asp Glu Glu Ile Leu Ile Pro Arg Arg Gly Gly Arg Val Phe Leu
980 985 990
Thr Thr His Arg Leu Leu Ala Glu Ser Thr Phe Val Tyr Leu Asn Gly
995 1000 1005
Val Lys Tyr His Ser Cys Asn Ala Asp Glu Val Ala Ala Val Asn
1010 1015 1020
Ile Cys Leu Asn Asp Trp Val Ile Pro Cys Lys Lys Lys Met Lys
1025 1030 1035
Glu Glu Ser Ser Ala Ser Gly
1040 1045
<210> 4
<211> 908
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas12j
<400> 4
Met Pro Ser Tyr Lys Ser Ser Arg Val Leu Val Arg Asp Val Pro Glu
1 5 10 15
Glu Leu Val Asp His Tyr Glu Arg Ser His Arg Val Ala Ala Phe Phe
20 25 30
Met Arg Leu Leu Leu Ala Met Arg Arg Glu Pro Tyr Ser Leu Arg Met
35 40 45
Arg Asp Gly Thr Glu Arg Glu Val Asp Leu Asp Glu Thr Asp Asp Phe
50 55 60
Leu Arg Ser Ala Gly Cys Glu Glu Pro Asp Ala Val Ser Asp Asp Leu
65 70 75 80
Arg Ser Phe Ala Leu Ala Val Leu His Gln Asp Asn Pro Lys Lys Arg
85 90 95
Ala Phe Leu Glu Ser Glu Asn Cys Val Ser Ile Leu Cys Leu Glu Lys
100 105 110
Ser Ala Ser Gly Thr Arg Tyr Tyr Lys Arg Pro Gly Tyr Gln Leu Leu
115 120 125
Lys Lys Ala Ile Glu Glu Glu Trp Gly Trp Asp Lys Phe Glu Ala Ser
130 135 140
Leu Leu Asp Glu Arg Thr Gly Glu Val Ala Glu Lys Phe Ala Ala Leu
145 150 155 160
Ser Met Glu Asp Trp Arg Arg Phe Phe Ala Ala Arg Asp Pro Asp Asp
165 170 175
Leu Gly Arg Glu Leu Leu Lys Thr Asp Thr Arg Glu Gly Met Ala Ala
180 185 190
Ala Leu Arg Leu Arg Glu Arg Gly Val Phe Pro Val Ser Val Pro Glu
195 200 205
His Leu Asp Leu Asp Ser Leu Lys Ala Ala Met Ala Ser Ala Ala Glu
210 215 220
Arg Leu Lys Ser Trp Leu Ala Cys Asn Gln Arg Ala Val Asp Glu Lys
225 230 235 240
Ser Glu Leu Arg Lys Arg Phe Glu Glu Ala Leu Asp Gly Val Asp Pro
245 250 255
Glu Lys Tyr Ala Leu Phe Glu Lys Phe Ala Ala Glu Leu Gln Gln Ala
260 265 270
Asp Tyr Asn Val Thr Lys Lys Leu Val Leu Ala Val Ser Ala Lys Phe
275 280 285
Pro Ala Thr Glu Pro Ser Glu Phe Lys Arg Gly Val Glu Ile Leu Lys
290 295 300
Glu Asp Gly Tyr Lys Pro Leu Trp Glu Asp Phe Arg Glu Leu Gly Phe
305 310 315 320
Val Tyr Leu Ala Glu Arg Lys Trp Glu Arg Arg Arg Gly Gly Ala Ala
325 330 335
Val Thr Leu Cys Asp Ala Asp Asp Ser Pro Ile Lys Val Arg Phe Gly
340 345 350
Leu Thr Gly Arg Gly Arg Lys Phe Val Leu Ser Ala Ala Gly Ser Arg
355 360 365
Phe Leu Ile Thr Val Lys Leu Pro Cys Gly Asp Val Gly Leu Thr Ala
370 375 380
Val Pro Ser Arg Tyr Phe Trp Asn Pro Ser Val Gly Arg Thr Thr Ser
385 390 395 400
Asn Ser Phe Arg Ile Glu Phe Thr Lys Arg Thr Thr Glu Asn Arg Arg
405 410 415
Tyr Val Gly Glu Val Lys Glu Ile Gly Leu Val Arg Gln Arg Gly Arg
420 425 430
Tyr Tyr Phe Phe Ile Asp Tyr Asn Phe Asp Pro Glu Glu Val Ser Asp
435 440 445
Glu Thr Lys Val Gly Arg Ala Phe Phe Arg Ala Pro Leu Asn Glu Ser
450 455 460
Arg Pro Lys Pro Lys Asp Lys Leu Thr Val Met Gly Ile Asp Leu Gly
465 470 475 480
Ile Asn Pro Ala Phe Ala Phe Ala Val Cys Thr Leu Gly Glu Cys Gln
485 490 495
Asp Gly Ile Arg Ser Pro Val Ala Lys Met Glu Asp Val Ser Phe Asp
500 505 510
Ser Thr Gly Leu Arg Gly Gly Ile Gly Ser Gln Lys Leu His Arg Glu
515 520 525
Met His Asn Leu Ser Asp Arg Cys Phe Tyr Gly Ala Arg Tyr Ile Arg
530 535 540
Leu Ser Lys Lys Leu Arg Asp Arg Gly Ala Leu Asn Asp Ile Glu Ala
545 550 555 560
Arg Leu Leu Glu Glu Lys Tyr Ile Pro Gly Phe Arg Ile Val His Ile
565 570 575
Glu Asp Ala Asp Glu Arg Arg Arg Thr Val Gly Arg Thr Val Lys Glu
580 585 590
Ile Lys Gln Glu Tyr Lys Arg Ile Arg His Gln Phe Tyr Leu Arg Tyr
595 600 605
His Thr Ser Lys Arg Asp Arg Thr Glu Leu Ile Ser Ala Glu Tyr Phe
610 615 620
Arg Met Leu Phe Leu Val Lys Asn Leu Arg Asn Leu Leu Lys Ser Trp
625 630 635 640
Asn Arg Tyr His Trp Thr Thr Gly Asp Arg Glu Arg Arg Gly Gly Asn
645 650 655
Pro Asp Glu Leu Lys Ser Tyr Val Arg Tyr Tyr Asn Asn Leu Arg Met
660 665 670
Asp Thr Leu Lys Lys Leu Thr Cys Ala Ile Val Arg Thr Ala Lys Glu
675 680 685
His Gly Ala Thr Leu Val Ala Met Glu Asn Ile Gln Arg Val Asp Arg
690 695 700
Asp Asp Glu Val Lys Arg Arg Lys Glu Asn Ser Leu Leu Ser Leu Trp
705 710 715 720
Ala Pro Gly Met Val Leu Glu Arg Val Glu Gln Glu Leu Lys Asn Glu
725 730 735
Gly Ile Leu Ala Trp Glu Val Asp Pro Arg His Thr Ser Gln Thr Ser
740 745 750
Cys Ile Thr Asp Glu Phe Gly Tyr Arg Ser Leu Val Ala Lys Asp Thr
755 760 765
Phe Tyr Phe Glu Gln Asp Arg Lys Ile His Arg Ile Asp Ala Asp Val
770 775 780
Asn Ala Ala Ile Asn Ile Ala Arg Arg Phe Leu Thr Arg Tyr Arg Ser
785 790 795 800
Leu Thr Gln Leu Trp Ala Ser Leu Leu Asp Asp Gly Arg Tyr Leu Val
805 810 815
Asn Val Thr Arg Gln His Glu Arg Ala Tyr Leu Glu Leu Gln Thr Gly
820 825 830
Ala Pro Ala Ala Thr Leu Asn Pro Thr Ala Glu Ala Ser Tyr Glu Leu
835 840 845
Val Gly Leu Ser Pro Glu Glu Glu Glu Leu Ala Gln Thr Arg Ile Lys
850 855 860
Arg Lys Lys Arg Glu Pro Phe Tyr Arg His Glu Gly Val Trp Leu Thr
865 870 875 880
Arg Glu Lys His Arg Glu Gln Val His Glu Leu Arg Asn Gln Val Leu
885 890 895
Ala Leu Gly Asn Ala Lys Ile Pro Glu Ile Arg Thr
900 905

Claims (19)

1.一种检测样品中靶核酸的方法,所述方法为非疾病诊断和治疗目的的方法,所述方法包括将样品与V型Cas蛋白、gRNA和单链核酸检测器接触,所述gRNA包括与所述V型Cas蛋白结合的区域和与靶核酸杂交的导向序列;检测由V型Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测靶核酸;所述单链核酸检测器不与所述gRNA杂交;
所述单链核酸检测器由碱基修饰的脱氧核糖核苷酸组成的核酸和设置于所述核酸5’端和3’端的不同报告基团或标记分子组成;
所述碱基修饰的脱氧核糖核苷酸为2’-Deoxynebularine或Etheno-dA,
当所述碱基修饰的脱氧核糖核苷酸为2’-Deoxynebularine时,
所述V型Cas蛋白选自Cas12i、Cas12j、Cas12a或Cas12b中的一种或任意几种组合;
当所述碱基修饰的脱氧核糖核苷酸为Etheno-dA时,所述V型Cas蛋白选自Cas12a和/或Cas12b。
2.根据权利要求1所述的方法,其特征在于,所述单链核酸检测器的核酸由2-30个碱基修饰的脱氧核糖核苷酸构成。
3.根据权利要求1所述的方法,其特征在于,所述可检测信号通过以下方式进行检测:基于视觉的检测。
4.根据权利要求1所述的方法,其特征在于,所述可检测信号通过以下方式进行检测:基于传感器的检测。
5.根据权利要求1所述的方法,其特征在于,所述可检测信号通过以下方式进行检测:基于颜色或胶体相变/分散的检测。
6.根据权利要求1所述的方法,其特征在于,所述可检测信号通过以下方式进行检测:基于金纳米颗粒的检测或基于半导体的检测。
7.根据权利要求1所述的方法,其特征在于,所述可检测信号通过以下方式进行检测:荧光检测、胶体金检测或电化学检测。
8.根据权利要求1所述的方法,其特征在于,所述可检测信号通过荧光偏振进行检测。
9.根据权利要求1-8任一所述的方法,其特征在于,所述靶核酸包括核糖核苷酸或脱氧核糖核苷酸。
10.根据权利要求9所述的方法,其特征在于,所述靶核酸包括单链核酸、双链核酸,所述单链核酸包括单链DNA、单链RNA,所述双链核酸包括双链DNA。
11.根据权利要求1-8任一所述的方法,其特征在于,所述靶核酸来源于微生物、土壤、水源、动物、植物。
12.根据权利要求11所述的方法,其特征在于,所述靶核酸来源于病毒、细菌、人体。
13.根据权利要求12所述的方法,其特征在于,所述靶核酸为病毒核酸、细菌核酸或与对照有差异的特异核酸。
14.根据权利要求12所述的方法,其特征在于,所述病毒为乳头瘤病毒,肝DNA病毒,疱疹病毒,腺病毒,痘病毒,细小病毒或冠状病毒。
15.根据权利要求14所述的方法,其特征在于,所述病毒为冠状病毒,所述冠状病毒为SARS、SARS-CoV2、HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1或Mers-Cov。
16.一种切割碱基修饰的单链核酸的方法,所述方法为非疾病诊断和治疗目的的方法,其特征在于,所述碱基修饰的单链核酸由碱基修饰的脱氧核糖核苷酸组成,使用所述碱基修饰的单链核酸与靶核酸、V型CRISPR/CAS蛋白和gRNA接触,gRNA包括与所述CRISPR/CAS效应蛋白结合的区域和与靶核酸杂交的导向序列,所述V型CRISPR/CAS效应蛋白切割所述碱基修饰的单链核酸,所述gRNA不与所述碱基修饰的单链核酸杂交,
当所述碱基修饰的脱氧核糖核苷酸为2’-Deoxynebularine时,
所述V型Cas蛋白选自Cas12i、Cas12j、Cas12a或Cas12b中的一种或任意几种组合;
当所述碱基修饰的脱氧核糖核苷酸为Etheno-dA时,所述V型Cas蛋白选自Cas12a和/或Cas12b。
17.根据权利要求16所述的方法,其特征在于,所述单链核酸检测器的核酸由2-30个碱基修饰的脱氧核糖核苷酸构成。
18.一种用于检测样品中靶核酸的组合物,其特征在于,所述组合物包括
V型Cas蛋白、gRNA和单链核酸检测器,
所述gRNA包括与所述V型Cas蛋白结合的区域和与靶核酸杂交的导向序列;
所述单链核酸检测器由碱基修饰的脱氧核糖核苷酸组成的核酸和设置于所述核酸5’端和3’端的不同报告基团或标记分子组成;
所述碱基修饰的脱氧核糖核苷酸为2’-Deoxynebularine或Etheno-dA,
当所述碱基修饰的脱氧核糖核苷酸为2’-Deoxynebularine时,
所述V型Cas蛋白选自Cas12i、Cas12j、Cas12a或Cas12b中的一种或任意几种组合;
当所述碱基修饰的脱氧核糖核苷酸为Etheno-dA时,所述V型Cas蛋白选自Cas12a和/或Cas12b。
19.权利要求18所述的组合物在制备用于检测样品中靶核酸的试剂盒中的应用。
CN202110146567.XA 2021-02-03 2021-02-03 利用碱基修饰的单链核酸进行靶核酸检测的方法 Active CN113913497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110146567.XA CN113913497B (zh) 2021-02-03 2021-02-03 利用碱基修饰的单链核酸进行靶核酸检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110146567.XA CN113913497B (zh) 2021-02-03 2021-02-03 利用碱基修饰的单链核酸进行靶核酸检测的方法

Publications (2)

Publication Number Publication Date
CN113913497A CN113913497A (zh) 2022-01-11
CN113913497B true CN113913497B (zh) 2024-05-28

Family

ID=79232546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110146567.XA Active CN113913497B (zh) 2021-02-03 2021-02-03 利用碱基修饰的单链核酸进行靶核酸检测的方法

Country Status (1)

Country Link
CN (1) CN113913497B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0952228A2 (en) * 1996-09-24 1999-10-27 Rapigene, Inc. Compositions and methods for enhancing hybridization specificity
CN1592792A (zh) * 2000-05-19 2005-03-09 伊拉根生物科学公司 检测核酸的材料和方法
CN101707886A (zh) * 2006-12-15 2010-05-12 霍洛基克公司 以切割反应检测核酸的方法和组合物
CN102770556A (zh) * 2009-09-03 2012-11-07 Seegene株式会社 靶区分性探针及其用途
CN108603222A (zh) * 2016-02-09 2018-09-28 荣研化学株式会社 对目标核酸进行检测的方法及该方法中使用的核酸探针
CN111690720A (zh) * 2020-06-16 2020-09-22 山东舜丰生物科技有限公司 利用修饰的单链核酸进行靶核酸检测的方法
CN111996236A (zh) * 2020-05-29 2020-11-27 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸检测的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0952228A2 (en) * 1996-09-24 1999-10-27 Rapigene, Inc. Compositions and methods for enhancing hybridization specificity
CN1592792A (zh) * 2000-05-19 2005-03-09 伊拉根生物科学公司 检测核酸的材料和方法
CN101707886A (zh) * 2006-12-15 2010-05-12 霍洛基克公司 以切割反应检测核酸的方法和组合物
CN102770556A (zh) * 2009-09-03 2012-11-07 Seegene株式会社 靶区分性探针及其用途
CN108603222A (zh) * 2016-02-09 2018-09-28 荣研化学株式会社 对目标核酸进行检测的方法及该方法中使用的核酸探针
CN111996236A (zh) * 2020-05-29 2020-11-27 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸检测的方法
CN111690720A (zh) * 2020-06-16 2020-09-22 山东舜丰生物科技有限公司 利用修饰的单链核酸进行靶核酸检测的方法

Also Published As

Publication number Publication date
CN113913497A (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
CN111690720B (zh) 利用修饰的单链核酸进行靶核酸检测的方法
CN111996236B (zh) 基于crispr技术进行靶核酸检测的方法
CN111690773B (zh) 利用新型Cas酶进行目标核酸检测的方法和系统
CN113801917B (zh) 基于crispr技术进行多重核酸检测的方法
CN111690717B (zh) 基于crispr技术进行目标核酸检测的方法和系统
CN111876469B (zh) 利用核酸类似物进行靶核酸检测的方法
CN112795624B (zh) 利用含有无碱基间隔物的核酸检测器检测靶核酸的方法
CN113667718B (zh) 利用双链核酸检测器进行靶核酸检测的方法
CN113913499B (zh) 利用Cas12j效应蛋白检测目标突变的方法
CN113913498B (zh) 一种基于crispr技术检测目标突变的方法
CN113913497B (zh) 利用碱基修饰的单链核酸进行靶核酸检测的方法
CN116103286A (zh) 一种基于crispr技术检测甘薯羽状斑驳病毒的方法
CN116334078A (zh) 一种基于crispr技术检测甘薯病毒病的方法
CN115707775A (zh) 一种基于crispr技术检测非洲猪瘟病毒的方法
CN113293198B (zh) 基于crispr技术进行靶核酸多重检测的方法
CN114634972B (zh) 利用Cas酶进行核酸检测的方法
CN113234795B (zh) 利用Cas蛋白进行核酸检测的方法
CN114517224A (zh) 一种利用优化的单链核酸检测器进行核酸检测的方法
WO2021254267A1 (zh) 利用核酸类似物或碱基修饰物进行靶核酸检测的方法
CN114457073B (zh) 一种基于crispr技术检测副结核分枝杆菌的方法
CN115044649A (zh) 一种改进的基于crispr技术检测靶核酸的方法
CN114480384B (zh) 一种基于crispr技术检测口蹄疫病毒的方法
CN117587163A (zh) 利用Cas酶进行非洲猪瘟检测的方法
CN115637268A (zh) 一种基于crispr技术检测病毒的方法
CN114058735A (zh) 一种基于crispr技术检测手足口病的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant