CN111630163A - 用于切割ssdna以及检测靶dna的v型crispr/cas效应蛋白 - Google Patents

用于切割ssdna以及检测靶dna的v型crispr/cas效应蛋白 Download PDF

Info

Publication number
CN111630163A
CN111630163A CN201880087246.3A CN201880087246A CN111630163A CN 111630163 A CN111630163 A CN 111630163A CN 201880087246 A CN201880087246 A CN 201880087246A CN 111630163 A CN111630163 A CN 111630163A
Authority
CN
China
Prior art keywords
dna
target dna
target
guide rna
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880087246.3A
Other languages
English (en)
Inventor
J·A·都纳
J·S·陈
L·B·哈灵顿
E·马
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of CN111630163A publication Critical patent/CN111630163A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/543Immobilised enzyme(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

提供了用于检测样品中的靶DNA(双链或单链)的组合物和方法。在一些实施方案中,主题方法包括:(a)使所述样品与以下物质接触:(i)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e);(ii)指导RNA(所述指导RNA包含与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列);和(iii)检测剂DNA,所述检测剂DNA为单链的(即“单链检测剂DNA”)且不与所述指导RNA的所述指导序列杂交;以及(b)测量(由所述V型CRISPR/Cas效应蛋白)切割所述单链检测剂DNA而产生的可检测信号。还提供了用于例如在细胞内部切割单链DNA(例如,非靶ssDNA)的组合物和方法。

Description

用于切割SSDNA以及检测靶DNA的V型CRISPR/CAS效应蛋白
交叉引用
本申请要求2017年11月22日提交的美国临时专利申请号62/590,106、2018年2月5日提交的美国临时专利申请号62/626,593和2018年2月14日提交的美国专利申请号15/897,089的权益,所述申请以引用方式整体并入本文。
关于联邦资助研究的声明
本发明是根据国家科学基金会(National Science Foundation)授予的资助号1244557在政府支持下完成的。政府享有本发明的某些权利。
引言
细菌适应性免疫系统采用CRISPR(成簇规律间隔短回文重复序列)和CRISPR相关(Cas)蛋白进行RNA指导的核酸切割。CRISPR-Cas系统由此通过RNA指导的核酸干扰赋予细菌和古细菌中的适应性免疫。为了提供抗病毒免疫,将经加工的CRISPR阵列转录物(crRNA)与含Cas蛋白的监督复合物组装,所述监督复合物识别与crRNA的病毒来源区段(称为间隔序列)具有序列互补性的核酸。
2类CRISPR-Cas系统是精简型式,其中与RNA结合的单个Cas蛋白(效应蛋白,例如V型Cas效应蛋白,诸如Cpf1)负责结合和切割靶向序列。这些最小系统的可编程性质有利于它们用作一种多功能技术,这种技术持续变革基因组操纵领域。
发明内容
2类CRISPR-Cas系统(例如,V型CRISPR/Cas系统,诸如Cas12家族系统)的特征在于包含单个效应蛋白的效应模块。例如,在V型CRISPR/Cas系统中,效应蛋白-CRISPR/Cas内切核酸酶(例如,Cas12a蛋白)与相应的指导RNA(例如,Cas12a指导RNA)相互作用(结合)以形成核糖核蛋白(RNP)复合物,所述复合物通过指导RNA与靶核酸分子内的靶序列之间的碱基配对被靶向至靶核酸中的特定位点。
本公开提供了利用以下发现的组合物和方法:V型CRISPR/Cas蛋白(例如,Cas 12蛋白,诸如Cpf1(Cas12a)和C2c1(Cas12b))一旦通过检测到靶DNA而被激活,就会混杂地切割非靶向单链DNA(ssDNA)。一旦V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)被指导RNA激活(在样品包含与指导RNA杂交的靶DNA(即,样品包含靶向DNA)时发生),该蛋白质就会成为混杂地切割ssDNA(即非靶ssDNA,即指导RNA的指导序列未与之杂交的ssDNA)的核酸酶。因此,当样品中存在靶向DNA(双链或单链)时(例如,在一些情况下超过阈值量),引起样品中ssDNA的切割,这可使用任何方便的检测方法(例如,使用标记的单链检测剂DNA)加以检测。
提供了用于检测样品中的靶DNA(双链或单链)的组合物和方法。在一些情况下,主题方法包括:(a)使样品与以下物质接触:(i)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e);(ii)指导RNA(其包含与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA杂交的指导序列);和(iii)检测剂DNA,所述检测剂DNA为单链的(即“单链检测剂DNA”)且不与指导RNA的指导序列杂交;以及(b)测量(由V型CRISPR/Cas效应蛋白)切割单链检测剂DNA而产生的可检测信号。在一些情况下,单链检测剂DNA包含荧光发射染料对(例如,荧光发射染料对是荧光共振能量转移(FRET)对、猝灭剂/荧光剂对)。在一些情况下,靶DNA是病毒DNA(例如,乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒、细小病毒等)。
还提供了用于切割单链DNA(ssDNA)的组合物和方法。在一些情况下,此类方法包括使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:(i)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e);和(ii)指导RNA(其包含与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA杂交的指导序列),其中V型CRISPR/Cas效应蛋白切割所述多个非靶ssDNA。在一些情况下,接触是在诸如真核细胞、植物细胞、哺乳动物细胞等的细胞的内部(例如,体外、离体、体内)。
还提供了用于实施主题方法的组合物(例如,试剂盒)。
附图说明
图1A-图1E提供各种V型CRISPR/Cas效应蛋白的氨基酸序列(描绘为Cas12a和Cas12b序列)。
图2提供示例性指导RNA序列(例如,crRNA重复序列和示例性单指导RNA序列)和示例性PAM序列。
图3A-图3B呈现与非互补链切割有关的数据。
图4A-图4B呈现与Cas12a的非特异性DNA酶活性有关的数据。
图5A-图5B呈现与非靶链切割有关的数据。
图6呈现与显示RuvC核酸酶负责ssDNA的反式切割有关的数据。
图7呈现与M13噬菌体ssDNA的快速“切碎”有关的数据。
图8呈现与使用基于FQ的测定进行的检测有关的数据。
图9A-图9B呈现与PAM近端错配有关的数据。
图10呈现与转换动力学有关的数据。
图11A-图11B呈现与使用主题检测方法区分病毒血清型有关的数据。
图12呈现CRISPR-Cas12a切割DNA的图解模型。
图13A-图13C呈现显示Cas12a靶标识别激活非特异性单链DNA切割的数据。图13A.靶向dsDNA底物的Cas12a-crRNA复合物的卡通插图,其中切割位点描绘了5’突出交错切口。图13B.靶向环状单链M13DNA噬菌体的纯化LbaCas12a的体外时程揭示了强大的切碎模式。图13C.靶向M13ssDNA噬菌体的纯化SpyCas9的时程。
图14A-图14C呈现显示Cas12a反式切割活性需要互补激活剂的数据。图14A.如所示以多种摩尔比与LbaCas12a-crRNA一起孵育的放射性标记的靶dsDNA或图14B)非特异性ssDNA。每个点表示在37C下30分钟后(此时反应完成)的定量切割%。图14C.使用dsDNA或ssDNA激活剂的LbCas12a反式切割的Michaelis-Menten动力学。
图15A-图15C呈现显示反式切割激活的特异性涉及PAM识别和DNA解链的数据。图15A.使用指定激活剂在变性PAGE凝胶上的反式切割产物。图15B.使用具有指定错配的ssDNA或dsDNA激活剂观察到的反式切割速率。图15C.LbaCas12a可区分两个密切相关的dsDNA HPV序列。
图16A-图16C呈现显示非特异性ssDNA切割活性在V型CRISPR系统中保守的数据。图16A.突出显示指定V型效应蛋白的系统发育树。图16B.描绘V型效应蛋白中,而非II型效应蛋白SpyCas9的激活剂依赖性反式切割的切割凝胶。图16C.PAM依赖性和PAM非依赖性顺式和反式切割激活的模型。
图17呈现显示靶链识别是单链DNA切割的先决条件的数据。
图18A-图18C呈现显示RuvC核酸酶负责非特异性DNA酶活性的数据。
图19呈现显示环状单链M13DNA噬菌体被预先激活的LbaCas12a复合物反式降解的数据。
图20A-图20B呈现显示LbaCas12a被dsDNA质粒激活以进行反式切割的数据。
图21呈现显示LbaCas12a反式切割降解互补和非特异性ssDNA但不降解ssRNA的数据。
图22呈现显示Michaelis-Menten动力学揭示了使用ssDNA和dsDNA激活剂的强大的反式切割活性的数据。
图23呈现显示dsDNA激活剂中的PAM序列和PAM近端错配提供反式激活特异性的数据。
图24呈现显示使用主题检测方法(例如,经标记的检测剂ssDNA)检测到的HPV检测测定时程的数据。
图25A-图25C呈现显示Cas12a靶标识别激活非特异性单链DNA切割的数据。
图26A-图26D呈现与Cas12a ssDNA反式切割的动力学有关的数据。
图27A-图27C呈现显示反式切割激活的特异性和保守性的数据。
图28A-图28D呈现显示通过DETECTR进行的对人样品中的HPV 16型和18型的快速鉴定的数据。
图29呈现Cas12a的PAM依赖性和PAM非依赖性顺式和反式切割激活的图解模型。
图30呈现显示对Cas12和Cas9蛋白的纯化的数据。
图31A-图31B呈现显示LbCas12a是DNA激活的一般DNA酶的数据。
图32A-图32B呈现显示靶链识别是单链DNA切割的先决条件的数据。
图33A-图33C呈现显示RuvC核酸酶结构域负责激活剂依赖性的非特异性DNA酶活性的数据。
图34A-图34C呈现显示LbCas12a反式切割降解互补和非特异性ssDNA但不降解ssRNA的数据。
图35A-图35B呈现显示触发非特异性ssDNA酶活性不需要Cas12a切割靶链的数据。
图36A-图36E呈现显示揭示了使用ssDNA和dsDNA激活剂的强大的反式切割活性的Michaelis-Menten分析的数据。
图37呈现显示dsDNA激活剂中的PAM序列和PAM近端错配提供反式激活特异性的数据。
图38呈现显示激活剂依赖性的非特异性ssDNA切割活性在V型CRISPR干扰蛋白中保守的数据。
图39A-图39E呈现显示Cas12a可区分两个密切相关的HPV序列的数据。
图40A-图40B呈现显示等温扩增与Cas12a检测相结合产生可达到渺摩尔级(attomolar)灵敏度的DETECTR的数据。
图41A-图41D呈现显示通过DETECTR进行的对人细胞系和患者样品中的HPV 16型和18型的鉴定的数据。
图42A-图42B呈现显示人临床样品中HPV的PCR和杂交捕获验证以及基因分型的数据。
图43A-图43B呈现显示使用Cas12d和Cas12e蛋白通过DETECTR对靶核酸的鉴定的数据。
图44呈现显示使用DETECTR对负责棕眼或蓝眼的HERC2基因内的单核苷酸多态性(SNP)的鉴定的数据。
图45呈现显示通过检测来自人唾液的XIST(X染色体内)或SRY(Y染色体内)基因(使用DETECTR测定)对X或Y染色体的鉴定的数据。
图46呈现说明了DETECTR作为用于快速即时诊断的平台的示意图。
定义
在本文中可互换使用的术语“多核苷酸”和“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。因此,术语“多核苷酸”和“核酸”涵盖单链DNA;双链DNA;多链DNA;单链RNA;双链RNA;多链RNA;基因组DNA;cDNA;DNA-RNA杂交体;以及包含嘌呤碱基和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。
术语“寡核苷酸”是指介于4与100个核苷酸之间的单链或双链核酸(例如,DNA、RNA或修饰的核酸)的多核苷酸。然而,出于本公开的目的,寡核苷酸的长度没有上限。寡核苷酸也称为“寡聚体”或“寡聚物”,并且可以从基因中分离、(体外和/或体内)转录,或化学合成。术语“多核苷酸”和“核酸”应理解为包括如可适用于所描述的实施方案的单链(诸如有义链或反义链)和双链多核苷酸。
“可杂交的”或“互补的”或“基本上互补的”意指核酸(例如RNA、DNA)包含这样的核苷酸序列,所述核苷酸序列使所述核酸能够在适当的体外和/或体内温度和溶液离子强度条件下,与另一核酸以序列特异性、反向平行方式(即,核酸特异性地结合互补核酸)非共价结合(即,形成沃森-克里克(Watson-Crick)碱基对和/或G/U碱基对)、“退火”或“杂交”。标准沃森-克里克碱基配对包括:腺嘌呤/腺苷)(A)与胸腺嘧啶/胸苷(T)配对,A与尿嘧啶/尿苷(U)配对,以及鸟嘌呤/鸟苷(G)与胞嘧啶/胞苷(C)配对。此外,对于两个RNA分子(例如,dsRNA)之间的杂交,以及对于DNA分子与RNA分子的杂交(例如,当DNA靶核酸碱基与指导RNA配对时,等):G也可以与U碱基配对。例如,在tRNA反密码子与mRNA中的密码子进行碱基配对的情形下,G/U碱基配对部分地负责遗传密码的简并性(即,冗余)。因此,在本公开的上下文中,G(例如,指导RNA分子的蛋白结合区段(例如,dsRNA双链体)的G;与指导RNA碱基配对的靶核酸(例如,靶DNA)的G)被认为是与U和C两者互补。例如,当可以在指导RNA分子的蛋白结合区段(例如,dsRNA双链体)的给定核苷酸位置处制备G/U碱基对时,该位置不被认为是不互补的,而是替代地被认为是互补的。
杂交需要两个核酸含有互补序列,但是碱基之间的错配是可能的。适合于两个核酸之间杂交的条件取决于核酸的长度和互补程度,核酸的长度和互补程度是本领域中众所周知的变量。两个核苷酸序列之间的互补程度越大,则具有这些序列的核酸的杂交体的解链温度(Tm)值越大。通常,可杂交核酸的长度为8个核苷酸或更多个(例如,10个核苷酸或更多个、12个核苷酸或更多个、15个核苷酸或更多个、20个核苷酸或更多个、22个核苷酸或更多个、25个核苷酸或更多个、或30个核苷酸或更多个)。
应理解,多核苷酸的序列不需要与其可特异性杂交的靶核酸的序列100%互补。此外,多核苷酸可在一个或多个区段上杂交,使得在杂交事件中不涉及中间或相邻区段(例如,环结构或发夹结构,“凸起”等)。多核苷酸可包含与其将杂交的靶核酸序列内的靶区域60%或更高、65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高或100%的序列互补性。例如,这样的反义核酸将代表百分之90的互补性,在所述反义核酸中,反义化合物的20个核苷酸中的18个与靶区域互补并因此与靶区域特异性杂交。剩余的非互补核苷酸可与互补核苷酸成簇或散布,并且不需要彼此邻接或与互补核苷酸邻接。可使用任何方便的方法确定核酸内的特定核酸序列段之间的互补性百分比。示例性方法包括BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,J.Mol.Biol.,1990,215,403-410;Zhang和Madden,Genome Res.,1997,7,649-656),或通过使用例如使用默认设置的Gap程序(Wisconsin序列分析包,用于Unix的第8版,Genetics Computer Group,University Research Park,Madison Wis.),所述程序使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489)。
术语“肽”、“多肽”和“蛋白质”在本文中可互换使用,并且是指具有任何长度的氨基酸的聚合形式,其可包括编码和非编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸以及具有修饰的肽骨架的多肽。
如本文所用的“结合”(例如,关于多肽的RNA结合结构域、与靶核酸结合等)是指大分子之间的非共价相互作用(例如,蛋白质与核酸之间的非共价相互作用;指导RNA与靶核酸之间的非共价相互作用等)。当处于非共价相互作用状态时,大分子被称为“缔合的”或“相互作用”或“结合”(例如,当分子X被称为与分子Y相互作用时,则意味着分子X以非共价方式与分子Y结合)。并非结合相互作用的所有组分都需要是序列特异性的(例如,与DNA骨架中的磷酸残基接触),但结合相互作用的一些部分可以是序列特异性的。结合相互作用的特征通常在于解离常数(Kd)小于10-6M、小于10-7M、小于10-8M、小于10-9M、小于10-10M、小于10-11M、小于10-12M、小于10-13M、小于10-14M、或小于10-15M。“亲和力”是指结合强度,增加的结合亲和力与较低的Kd相关。
“结合结构域”是指能够与另一分子非共价结合的蛋白结构域。结合结构域可与例如RNA分子(RNA结合结构域)和/或蛋白分子(蛋白结合结构域)结合。在具有蛋白结合结构域的蛋白质的情况下,所述蛋白质在一些情况下可与其自身结合(以形成同源二聚体、同源三聚体等)并且/或者所述蛋白质可与一个或多个不同蛋白质的一个或多个区域结合。
术语“保守氨基酸取代”是指蛋白质中具有相似侧链的氨基酸残基的可互换性。例如,具有脂肪族侧链的一组氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;具有脂肪族-羟基侧链的一组氨基酸由丝氨酸和苏氨酸组成;具有含酰胺侧链的一组氨基酸由天冬酰胺和谷氨酰胺组成;具有芳香族侧链的一组氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;具有碱性侧链的一组氨基酸由赖氨酸、精氨酸和组氨酸组成;具有酸性侧链的一组氨基酸由谷氨酸和天冬氨酸组成;并且具有含硫侧链的一组氨基酸由半胱氨酸和甲硫氨酸组成。示例性保守氨基酸取代基团是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸-甘氨酸和天冬酰胺-谷氨酰胺。
多核苷酸或多肽与另一种多核苷酸或多肽具有一定的“序列同一性”百分比,这意味着当比对时碱基或氨基酸的百分数为相同的,并且当比较两个序列时处于相同的相对位置上。可以许多不同方式确定序列同一性。为了确定序列同一性,可使用各种方法和计算机程序(例如BLAST、T-COFFEE、MUSCLE、MAFFT、Phyre2等)比对序列,所述各种方法和计算机程序可通过万维网在包括以下网站处获得:ncbi.nlm.nili.gov/BLAST、ebi.ac.uk/Tools/msa/tcoffee/、ebi.ac.uk/Tools/msa/muscle/、mafft.cbrc.jp/alignment/software/、http://www.sbg.bio.ic.ac.uk/~phyre2/。参见例如Altschul等人(1990),J.Mol.Biol.215:403-10。
在本文中可互换使用的术语“DNA调控序列”、“控制元件”和“调控元件”是指转录和翻译控制序列,诸如启动子、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号等,所述转录和翻译控制序列提供和/或调控非编码序列(例如,指导RNA)或编码序列(例如,蛋白质编码序列)的转录和/或调控编码多肽的翻译。
如本文所用,“启动子序列”是能够结合RNA聚合酶并启动下游(3′方向)编码或非编码序列的转录的DNA调控区。真核启动子通常将(但不总是)包含“TATA”盒和“CAT”盒。包括诱导型启动子在内的各种启动子可用于驱动本公开的各种核酸(例如,载体)。
如本文所用,适用于核酸、多肽、细胞或生物体的术语“天然存在的”或“未修饰的”或“野生型”是指存在于自然界中的核酸、多肽、细胞或生物体。
如本文所用,“重组”意指特定核酸(DNA或RNA)是克隆、限制、聚合酶链式反应(PCR)和/或连接步骤的各种组合的产物,所述步骤产生具有可与天然系统中存在的内源核酸区别开的结构编码序列或非编码序列的构建体。编码多肽的DNA序列可由cDNA片段或由一系列合成寡核苷酸组装,以提供能够由包含在细胞中或无细胞转录和翻译系统中的重组转录单元表达的合成核酸。包含相关序列的基因组DNA还可用于重组基因或转录单元的形成中。非翻译DNA的序列可存在于开放读码框的5′端或3′端,其中此类序列不干扰编码区的操纵或表达,并且实际上可通过各种机制起到调节所需产物的产生的作用(参见下文的“DNA调控序列”)。或者,编码未翻译的RNA(例如,指导RNA)的DNA序列也可被认为是重组的。因此,例如术语“重组”核酸是指非天然存在核酸,例如通过人干预由序列的两个另外分开的区段的人工组合制成的核酸。这种人工组合常常通过化学合成手段或通过人工操纵核酸的分离区段(例如,通过遗传工程化技术)来完成。通常进行这种操作以用编码相同氨基酸、保守氨基酸或非保守氨基酸的密码子替换密码子。可替代地,执行这种操作以将具有所需功能的核酸区段连接在一起以产生所需的功能组合。这种人工组合常常通过化学合成手段或通过人工操纵核酸的分离区段(例如,通过遗传工程化技术)来完成。当重组多核苷酸编码多肽时,所编码的多肽的序列可以是天然存在的(“野生型”)或者可以是天然存在的序列的变体(例如,突变体)。因此,术语“重组”多肽不一定是指序列不是天然存在的多肽。相反,“重组”多肽由重组DNA序列编码,但是所述多肽的序列可以是天然存在的(“野生型”)或非天然存在的(例如,变体、突变体等)。因此,“重组”多肽是人工干预的结果,但可以是天然存在的氨基酸序列。
“载体”或“表达载体”是复制子,诸如质粒、噬菌体、病毒或粘粒,另一个DNA区段(即“插入物”)可连接到所述复制子以便引起连接的区段在细胞中的复制。
“表达盒”包含与启动子可操作地连接的DNA编码序列。“可操作地连接”是指其中所述组分处于允许它们以其预期的方式起作用的关系的并置。例如,如果启动子影响编码序列的转录或表达,则启动子可操作地连接至所述编码序列。
术语“重组表达载体”或“DNA构建体”在本文中可互换使用,以指代包含载体和一个插入物的DNA分子。通常产生重组表达载体以用于表达和/或增殖一个或多个插入物的目的,或用于构建其他重组核苷酸序列的目的。所述一个或多个插入物可或可不与启动子序列可操作地连接,并且可或可不与DNA调控序列可操作地连接。
任何给定的部件或部件组合可以是未标记的,或者可用标记部分可检测地标记。在一些情况下,当标记两种或更多种组分时,它们可用彼此可区分的标记部分标记。
一般的分子和细胞生物化学方法可在标准教科书中找到,所述标准教科书为诸如Molecular Cloning:A Laboratory Manual,第3版(Sambrook等人,HaRBor LaboratoryPress 2001);Short Protocols in Molecular Biology,第4版(Ausubel等人编,JohnWiley&Sons 1999);Protein Methods(Bollag等人,John Wiley&Sons 1996);NonyiralVectors for Gene Therapy(Wagner等人编,Academic Press 1999);Viral Vectors(Kaplift和Loewy编,Academic Press 1995);Immunology Methods Manual(I.Lefkovits编,Academic Press 1997);以及Cell and Tissue Culture:Laboratory Procedures inBiotechnology(Doyle和Griffiths,John Wiley&Sons 1998),这些标准教科书的公开内容以引用方式并入本文。
在进一步描述本发明之前,应理解本发明不限于所述的具体实施方案,因此,当然也可有所变化。还应理解,本文所用的术语仅出于描述具体实施方案的目的,并且不意图具有限制性,因为本发明的范围将仅受所附权利要求限制。
在提供值的范围的情况下,应理解此范围的上限与下限之间的各介入值(除非上下文另外清楚地指出,否则准确到下限的单位的十分之一),以及此所述范围内的任何其他所述值或介入值涵盖在本发明内。这些较小范围的上限和下限可独立地包括在较小的范围内,并且也涵盖在本发明内,从属于所述范围内的任何特定排除的限值。在所述范围包括所述限值中的一个或两个的情况下,排除那些所包括的限值中的任一个或两个的范围也包括在本发明内。
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域中的普通技术人员通常所理解相同的含义。虽然与本文所述的那些相似或等同的任何方法和材料也可用于实践或测试本发明中,但是现在描述优选的方法和材料。本文提及的所有出版物以引用方式并入本文,以结合所引用的出版物公开并描述方法和/或材料。
必须指出,如在本文和所附权利要求中所用,单数形式“一个(a)/一种(an)”和“所述(the)”包括复数指示物,除非上下文另外清楚地指出。因此,例如,提及“V型CRISPR/Cas效应蛋白”包括多个此类V型CRISPR/Cas效应蛋白,并且提及“指导RNA”包括提及本领域的技术人员已知的一种或多种指导RNA及其等效物,等。还应注意,权利要求可拟订成排除任何任选的要素。因而,这种陈述意图充当结合权利要求要素的叙述来使用诸如“仅仅”、“仅”等排他性术语或使用“否定”限制的前提基础。
应理解,出于清晰目的而在单独的实施方案的上下文中描述的本发明的某些特征也可在单个实施方案中组合提供。相反,为了简明而在单个实施方案的上下文中描述的本发明的各种特征也可分开地或以任一合适的子组合来提供。属于本发明的实施方案的所有组合确切地涵盖在本发明中并且在本文中公开如同每个和每一种组合均单独地且明确地公开一样。另外,各种实施方案及其要素的所有子组合也确切地涵盖在本发明中并且在本文中公开如同每个和每一种此类子组合均单独地且明确地在本文中公开一样。
本文中讨论的出版物仅仅提供它们在本申请的提交日期之前的公开内容。本文中的任何内容均不应解释为承认本发明无权借助在先发明而先于此类出版物。此外,所提供的出版日可能不同于可能需要独立确认的实际出版日期。
具体实施方式
如上所指出,发明人已发现V型CRISPR/Cas蛋白(例如,Cas12蛋白,诸如Cpf1(Cas12a)和C2c1(Cas12b))一旦通过检测到靶DNA(双链或单链)而被激活,就会混杂地切割非靶向单链DNA(ssDNA)。一旦V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)被指导RNA激活(在指导RNA与靶DNA的靶序列杂交(即,样品包含靶向DNA)时发生),该蛋白质就会成为混杂地切割ssDNA的核酸酶(即,核酸酶切割非靶ssDNA,即指导RNA的指导序列未与之杂交的ssDNA)。因此,当样品中存在靶DNA时(例如,在一些情况下超过阈值量),引起样品中ssDNA的切割,这可使用任何方便的检测方法(例如,使用标记的单链检测剂DNA)加以检测。
提供了用于检测样品中的靶DNA(双链或单链)的组合物和方法。在一些情况下,使用为单链(ssDNA)并且不与指导RNA的指导序列杂交的检测剂DNA(即,检测剂ssDNA是非靶ssDNA)。此类方法可包括(a)使样品与以下物质接触:(i)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白);(ii)指导RNA,所述指导RNA包含与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA杂交的指导序列;和(iii)为单链的且不与指导RNA的指导序列杂交的检测剂DNA;以及(b)测量由V型CRISPR/Cas效应蛋白切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。如上所指出,一旦主题V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)被指导RNA激活(在样品中包含与指导RNA杂交的靶DNA(即,样品中包含靶向靶DNA)时发生),V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)就会被激活并且充当内切核糖核酸酶来非特异性地切割样品中存在的ssDNA(包括非靶ssDNA)。因此,当样品中存在靶向靶DNA时(例如,在一些情况下超过阈值量),引起样品中ssDNA(包括非靶ssDNA)的切割,这可使用任何方便的检测方法(例如,使用标记的检测剂ssDNA)加以检测。
还提供了用于切割单链DNA(ssDNA)(例如,非靶ssDNA)的组合物和方法。此类方法可包括使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:(i)V型CRISPR/Cas效应蛋白;和(ii)指导RNA,所述指导RNA包含与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA杂交的指导序列,其中V型CRISPR/Cas效应蛋白切割所述多个非靶ssDNA。可使用这种方法,例如,在细胞中切割外源ssDNA(例如,病毒DNA)。
主题方法的接触步骤可在包含二价金属离子的组合物中进行。接触步骤可在无细胞环境中,例如在细胞外部进行。接触步骤可在细胞内部进行。接触步骤可在体外细胞中进行。接触步骤可在离体细胞中进行。接触步骤可在体内细胞中进行。
指导RNA可作为RNA或作为编码指导RNA的核酸(例如,DNA,诸如重组表达载体)提供。V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)可作为蛋白质或作为编码所述蛋白质的核酸(例如,mRNA、DNA诸如重组表达载体)提供。在一些情况下,可通过(例如,使用可被V型CRISPR/Cas效应蛋白切割成单独的(“成熟的”)指导RNA的前体指导RNA阵列)提供两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、或6个或更多个)指导RNA。
在一些情况下(例如,当使样品与指导RNA和V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)接触时),在测量步骤之前使样品接触2小时或更短时间(例如,1.5小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间)。例如,在一些情况下,在测量步骤之前使样品接触40分钟或更短时间。在一些情况下,在测量步骤之前使样品接触20分钟或更短时间。在一些情况下,在测量步骤之前使样品接触10分钟或更短时间。在一些情况下,在测量步骤之前使样品接触5分钟或更短时间。在一些情况下,在测量步骤之前使样品接触1分钟或更短时间。在一些情况下,在测量步骤之前使样品接触50秒至60秒。在一些情况下,在测量步骤之前使样品接触40秒至50秒。在一些情况下,在测量步骤之前使样品接触30秒至40秒。在一些情况下,在测量步骤之前使样品接触20秒至30秒。在一些情况下,在测量步骤之前使样品接触10秒至20秒。
本公开的用于检测样品中的靶DNA(单链或双链)的方法可以高灵敏度检测靶DNA。在一些情况下,可使用本公开的方法检测包含多个DNA(包括靶DNA和多个非靶DNA)的样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个或多个拷贝(例如,每106个非靶DNA一个或多个拷贝、每105个非靶DNA一个或多个拷贝、每104个非靶DNA一个或多个拷贝、每103个非靶DNA一个或多个拷贝、每102个非靶DNA一个或多个拷贝、每50个非靶DNA一个或多个拷贝、每20个非靶DNA一个或多个拷贝、每10个非靶DNA一个或多个拷贝、或每5个非靶DNA一个或多个拷贝)存在。在一些情况下,可使用本公开的方法检测包含多个DNA(包括靶DNA和多个非靶DNA)的样品中存在的靶DNA,其中靶DNA以每1018个非靶DNA一个或多个拷贝(例如,每1015个非靶DNA一个或多个拷贝、每1012个非靶DNA一个或多个拷贝、每109个非靶DNA一个或多个拷贝、每106个非靶DNA一个或多个拷贝、每105个非靶DNA一个或多个拷贝、每104个非靶DNA一个或多个拷贝、每103个非靶DNA一个或多个拷贝、每102个非靶DNA一个或多个拷贝、每50个非靶DNA一个或多个拷贝、每20个非靶DNA一个或多个拷贝、每10个非靶DNA一个或多个拷贝、或每5个非靶DNA一个或多个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个拷贝至每10个非靶DNA一个拷贝(例如,每107个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA 1个拷贝、或每105个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每1018个非靶DNA一个拷贝至每10个非靶DNA一个拷贝(例如,每1018个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每1015个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每1012个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每109个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每106个非靶DNA1个拷贝至每104个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、或每105个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个拷贝至每100个非靶DNA一个拷贝(例如,每107个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每100个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每100个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA 1个拷贝、或每105个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝)存在。
在一些情况下,对于检测样品中的靶DNA的主题方法,检测阈值为10nM或更小。术语“检测阈值”在本文用于描述要发生检测样品中必须存在的最小靶DNA量。因此,作为说明性实例,当检测阈值为10nM时,则当靶DNA以10nM或更高的浓度存在于样品中时,可检测到信号。在一些情况下,本公开的方法的检测阈值为5nM或更小。在一些情况下,本公开的方法的检测阈值为1nM或更小。在一些情况下,本公开的方法的检测阈值为0.5nM或更小。在一些情况下,本公开的方法的检测阈值为0.1nM或更小。在一些情况下,本公开的方法的检测阈值为0.05nM或更小。在一些情况下,本公开的方法的检测阈值为0.01nM或更小。在一些情况下,本公开的方法的检测阈值为0.005nM或更小。在一些情况下,本公开的方法的检测阈值为0.001nM或更小。在一些情况下,本公开的方法的检测阈值为0.0005nM或更小。在一些情况下,本公开的方法的检测阈值为0.0001nM或更小。在一些情况下,本公开的方法的检测阈值为0.00005nM或更小。在一些情况下,本公开的方法的检测阈值为0.00001nM或更小。在一些情况下,本公开的方法的检测阈值为10pM或更小。在一些情况下,本公开的方法的检测阈值为1pM或更小。在一些情况下,本公开的方法的检测阈值为500tM或更小。在一些情况下,本公开的方法的检测阈值为250fM或更小。在一些情况下,本公开的方法的检测阈值为100fM或更小。在一些情况下,本公开的方法的检测阈值为50fM或更小。在一些情况下,本公开的方法的检测阈值为500aM(渺摩尔)或更小。在一些情况下,本公开的方法的检测阈值为250aM或更小。在一些情况下,本公开的方法的检测阈值为100aM或更小。在一些情况下,本公开的方法的检测阈值为50aM或更小。在一些情况下,本公开的方法的检测阈值为10aM或更小。在一些情况下,本公开的方法的检测阈值为1aM或更小。
在一些情况下,检测阈值(用于以主题方法检测靶DNA)在500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内(其中浓度是指可检测到靶DNA的靶DNA阈值浓度)。在一些情况下,本公开的方法的检测阈值在800fM至100pM的范围内。在一些情况下,本公开的方法的检测阈值在1pM至10pM的范围内。在一些情况下,本公开的方法的检测阈值在10fM至500fM,例如10fM至50fM、50fM至100fM、100fM至250fM、或250fM至500fM的范围内。
在一些情况下,可在样品中检测到靶DNA的最小浓度在500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在800fM至100pM的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在1pM至10pM的范围内。
在一些情况下,检测阈值(用于以主题方法检测靶DNA)在1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内(其中浓度是指可检测到靶DNA的靶DNA阈值浓度)。在一些情况下,本公开的方法的检测阈值在1aM至800aM的范围内。在一些情况下,本公开的方法的检测阈值在50aM至1pM的范围内。在一些情况下,本公开的方法的检测阈值在50aM至500fM的范围内。
在一些情况下,可在样品中检测到靶DNA的最小浓度在1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在1aM至500pM的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在100aM至500pM的范围内。
在一些情况下,主题组合物或方法表现出渺摩尔级(aM)的检测灵敏度。在一些情况下,主题组合物或方法表现出飞摩尔级(fM)的检测灵敏度。在一些情况下,主题组合物或方法表现出皮摩尔级(pM)的检测灵敏度。在一些情况下,主题组合物或方法表现出纳摩尔级(nM)的检测灵敏度。
靶DNA
靶DNA可以是单链的(ssDNA)或双链的(dsDNA)。当靶DNA是单链的时,对靶DNA中的PAM序列没有偏好或要求。但是,当靶DNA是dsDNA时,PAM通常邻近靶DNA的靶序列存在(例如,参见本文其他地方对PAM的论述)。靶DNA的来源可与样品的来源相同,例如,如下文所述。
靶DNA的来源可以是任何来源。在一些情况下,靶DNA是病毒DNA(例如,DNA病毒的基因组DNA)。因而,主题方法可用于检测核酸群体中(例如,样品中)病毒DNA的存在。主题方法还可用于在靶DNA存在下切割非靶ssDNA。例如,如果方法发生在细胞中,则当细胞中存在特定靶DNA时,主题方法可用于混杂地切割细胞中的非靶ssDNA(不与指导RNA的指导序列杂交的ssDNA)(例如,当细胞被病毒感染并检测到病毒靶DNA时)。
可能的靶DNA的实例包括但不限于病毒DNA,诸如:乳多空病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(epstein-barr virus,EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒(ichtadenovirus)、美洲白鲟腺病毒(mastavirus)、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮化病毒科;藻类DNA病毒科(Phycodnaviridae)等。在一些情况下,靶DNA是寄生虫DNA。在一些情况下,靶DNA是细菌DNA,例如病原性细菌的DNA。
样品
主题样品包括核酸(例如,多个核酸)。术语“多个”在本文中用于意指两个或更多个。因此,在一些情况下,样品包含两个或更多个(例如,3个或更多个、5个或更多个、10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或5,000个或更多个)核酸(例如,DNA)。主题方法可用作检测样品中(例如,诸如DNA的核酸的复杂混合物中)存在的靶DNA的非常灵敏的方法。在一些情况下,样品包含序列彼此不同的5个或更多个DNA(例如,10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或5,000个或更多个DNA)。在一些情况下,样品包含10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、103个或更多个、5x 103个或更多个、104个或更多个、5x 104个或更多个、105个或更多个、5x 105个或更多个、106个或更多个、5x 106个或更多个、或107个或更多个DNA。在一些情况下,样品包含10至20个、20至50个、50至100个、100至500个、500至103个、103至5x 103个、5x 103至104个、104至5x104个、5x 104至105个、105至5x 105个、5x 105至106个、106至5x 106、或5x 106至107、或超过107个DNA。在一些情况下,样品包含5至107个DNA(例如,序列彼此不同)(例如,5至106个、5至105个、5至50,000个、5至30,000个、10至106个、10至105个、10至50,000个、10至30,000个、20至106个、20至105个、20至50,000个、或20至30,000个DNA)。在一些情况下,样品包含20个或更多个序列彼此不同的DNA。在一些情况下,样品包含来自细胞裂解液(例如,真核细胞裂解液、哺乳动物细胞裂解液、人细胞裂解液、原核细胞裂解液、植物细胞裂解液等)的DNA。例如,在一些情况下,样品包含来自细胞诸如真核细胞,例如哺乳动物细胞诸如人细胞的DNA。
术语“样品”在本文中用于意指包含DNA的任何样品(例如,以便确定在DNA群体中是否存在靶DNA)。样品可衍生自任何来源,例如,样品可以是纯化DNA的合成组合;样品可以是细胞裂解液、富含DNA的细胞裂解液,或从细胞裂解液中分离和/或纯化的DNA。样品可来自患者(例如,出于诊断目的)。样品可来自透化细胞。样品可来自交联细胞。样品可在组织切片中。样品可来自通过交联,之后进行脱脂和调整以形成均匀折射率而制备的组织。通过交联,之后进行脱脂和调整以形成均匀折射率的组织制备的实例描述于例如Shah等人,Development(2016)143,2862-2867doi:10.1242/dev.138560中。
“样品”可包含靶DNA和多个非靶DNA。在一些情况下,靶DNA在样品中以每10个非靶DNA一个拷贝、每20个非靶DNA一个拷贝、每25个非靶DNA一个拷贝、每50个非靶DNA一个拷贝、每100个非靶DNA一个拷贝、每500个非靶DNA一个拷贝、每103个非靶DNA一个拷贝、每5x103个非靶DNA一个拷贝、每104个非靶DNA一个拷贝、每5x 104个非靶DNA一个拷贝、每105个非靶DNA一个拷贝、每5x 105个非靶DNA一个拷贝、每106个非靶DNA一个拷贝、或小于每106个非靶DNA一个拷贝存在。在一些情况下,靶DNA在样品中以每10个非靶DNA一个拷贝至每20个非靶DNA 1个拷贝、每20个非靶DNA 1个拷贝至每50个非靶DNA 1个拷贝、每50个非靶DNA 1个拷贝至每100个非靶DNA 1个拷贝、每100个非靶DNA 1个拷贝至每500个非靶DNA 1个拷贝、每500个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每103个非靶DNA 1个拷贝至每5x103个非靶DNA 1个拷贝、每5x 103个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每104个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每106个非靶DNA1个拷贝、或每106个非靶DNA 1个拷贝至每107个非靶DNA 1个拷贝。
合适的样品包括但不限于唾液、血液、血清、血浆、尿液、抽吸物和活检样品。因此,关于患者的术语“样品”涵盖生物来源的血液和其他液体样品、实体组织样品诸如活检样本或组织培养物或来源于其的细胞及其后代。该定义还包括在获得后采用以下任何方式操作过的样品:诸如用试剂处理;洗涤;或针对某些细胞群体诸如癌细胞进行富集。该定义还包括已经富集了特定类型的分子(例如,DNA)的样品。术语“样品”涵盖生物样品,诸如临床样品,诸如血液、血浆、血清、抽吸物、脑脊髓液(CSF),并且还包括通过手术切除获得的组织、通过活检获得的组织、培养物中的细胞、细胞上清液、细胞裂解液、组织样品、器官、骨髓等。“生物样品”包括来源于其的生物流体(例如,癌细胞、感染细胞等),例如包含从此类细胞获得的RNA的样品(例如,细胞裂解液或其他包含RNA的细胞提取物)。
样品可包含或可从多种细胞、组织、器官或无细胞流体中的任一种获得。合适的样品来源包括真核细胞、细菌细胞和古细菌细胞。合适的样品来源包括单细胞生物体和多细胞生物体。合适的样品来源包括单细胞真核生物体;植物或植物细胞;藻类细胞,例如布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、海洋富油微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens)、羽藻(C.agardh)等;真菌细胞(例如,酵母细胞);动物细胞、组织或器官;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫、昆虫、蛛形纲动物等)的细胞、组织或器官;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、组织、体液或器官;来自哺乳动物(例如,人;非人灵长类动物;有蹄类动物;猫科动物;牛;绵羊;山羊等)的细胞、组织、体液或器官。合适的样品来源包括线虫、原生动物等。合适的样品来源包括寄生虫,诸如蠕虫、疟疾寄生虫等。
合适的样品来源包括例如以下六个界中任何一个界的细胞、组织或生物体:细菌界(例如,真细菌界);古细菌界;原生生物界;真菌界;植物界;和动物界。合适的样品来源包括原生生物界的植物样成员,包括但不限于藻类(例如,绿藻、红藻、灰胞藻、蓝细菌);原生生物界的真菌样成员,例如粘液菌、水霉菌等;原生生物界的动物样成员,例如鞭毛虫类(例如,眼虫藻)、变形虫类(amoeboids)(例如,变形虫)、孢子虫类(例如,顶复门(Apicomplexa)、粘体动物门(Myxozoa)、微孢子虫纲(Microsporidia))和纤毛虫类(例如,草履虫)。合适的样品来源包括包括真菌界的成员,包括但不限于以下门中的任何门的成员:担子菌门(担子菌类;例如,伞菌属、鹅膏菌属、牛肝菌属、鸡油菌属等成员);子囊菌门(子囊菌类,包括例如酵母菌);菌藻门(地衣);接合菌门(接合真菌);以及不完全菌门。合适的样品来源包括包括植物界的成员,包括但不限于以下分类中的任何分类的成员:苔藓植物门(例如,藓类)、角苔植物门(例如,角苔类)、苔类植物门(Hepaticophyta)(例如,苔类)、石松植物门(例如,石松类)、楔叶植物门(例如,木贼类)、裸蕨植物门(例如,松叶蕨类)、瓶尔小草门、蕨门(例如,蕨类)、苏铁门、银杏门、松柏门、买麻藤门和木兰门(例如,开花植物)。合适的样品来源包括包括动物界的成员,包括但不限于以下门中的任何门的成员:多孔动物门(海绵动物);扁盘动物门;直泳虫门(海洋无脊椎动物的寄生物);菱形虫门;刺胞动物门(珊瑚、海葵、海蜇、海笔、海肾、立方水母);栉水母门(栉水母类);扁虫动物门(扁虫类);纽形动物门(纽虫类);颚胃动物门(Ngathostomulida)(有颚蠕虫)p腹毛动物门;轮虫动物门;曳鳃动物门;动吻动物门;铠甲动物门;棘头动物门;内肛动物门;线虫动物门;线形动物门;环口动物门;软体动物门(软体动物);星虫动物门(方格星虫(peanut worms));环节动物门(环节蠕虫);缓步动物门(缓步动物);有爪动物门(栉蚕);节肢动物门(包括以下亚门:有螯肢亚门、多足亚门、六足亚门和甲壳亚门,其中有螯肢亚门包括例如蛛形纲、肢口纲和海蜘蛛纲,其中多足亚门包括例如唇足纲(唇足类)、倍足纲(多足类)、少足纲(Paropoda)和综合纲,其中六足亚门包括昆虫纲,并且其中甲壳亚门包括虾、磷虾、藤壶等;帚虫动物门;外肛动物门(苔藓动物);腕足动物门;棘皮动物门(例如,海星、海雏菊、毛头星、海胆、海参、海蛇尾、脆篮(brittle baskets)等);毛颚动物门(箭虫);半索动物门(玉钩虫);和脊索动物门。合适的脊索动物门成员包括以下亚门的任何成员:尾索动物亚门(海鞘纲;包括海鞘目、樽海鞘目和幼形目);头索亚门(文昌鱼);盲鳗纲(盲鳗);和脊椎动物亚门,其中脊椎动物亚门成员包括例如以下纲的成员:鳃鳗纲(七鳃类)、软骨鱼纲(软骨鱼)、辐鳍鱼纲(辐鳍鱼)、腔棘焦纲(腔棘鱼)、肺鱼纲(肺鱼)、爬行纲(爬行动物,例如蛇、短吻鳄、鳄鱼、蜥蜴等)、鸟纲(鸟类);和哺乳纲(哺乳动物)。合适的植物包括任何单子叶植物和任何双子叶植物。
合适的样品来源包括取自生物体;从生物体分离的特定细胞或细胞群的细胞、流体、组织或器官等。例如,在生物体是植物的情况下,合适的来源包括木质部、韧皮部、形成层、叶、根等。在生物体是动物的情况下,合适的来源包括特定组织(例如,肺、肝、心脏、肾、脑、脾、皮肤、胎儿组织等)、或特定细胞类型(例如,神经元细胞、上皮细胞、内皮细胞、星形胶质细胞、巨噬细胞、神经胶质细胞、胰岛细胞、T淋巴细胞、B淋巴细胞等)。
在一些情况下,样品来源是病变的(或疑似病变的细胞、流体、组织或器官。在一些情况下,样品来源是正常(非病变的)细胞、流体、组织或器官。在一些情况下,样品来源是或疑似是病原体感染的细胞、组织或器官。例如,样品来源可以是可能被感染或可能未被感染的个体-并且样品可以是从个体收集的任何生物样品(例如血液、唾液、活检物、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,颊拭子、宫颈拭子、鼻拭子)、间质液、滑液、鼻分泌物、眼泪、血沉棕黄层、粘膜样品、上皮细胞样品(例如,上皮细胞刮擦物)等)。在一些情况下,样品是无细胞液体样品。在一些情况下,样品是可包含细胞的液体样品。病原体包括病毒、真菌、蠕虫、原生动物、疟疾寄生虫、疟原虫寄生虫、弓形虫寄生虫、血吸虫寄生虫等。“蠕虫”包括蛔虫、犬恶丝虫和植食性线虫(线虫纲)、吸虫(吸虫纲)、棘头虫纲和绦虫(绦虫纲)。原生动物感染包括来自贾第虫属、毛滴虫属、非洲锥虫病、阿米巴痢疾、巴贝虫病、小袋虫性痢疾、查加斯病(Chaga′s disease)、球虫病、疟疾和弓形体病的感染。病原体(诸如寄生/原生动物病原体)的实例包括但不限于:恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、克氏锥虫(Trypanosomacruzi)和刚地弓形虫(Toxoplasma gondii)。真菌病原体包括但不限于:新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、粗球孢菌(Coccidioides immitis)、皮炎芽生菌(Blastomyces dermatitidis)、沙眼衣原体(Chlamydia trachomatis)和白色念珠菌(Candida albicans)。病原性病毒包括例如免疫缺陷病毒(例如,HIV);流感病毒;登革热病毒;西尼罗河病毒;疱疹病毒;黄热病毒;丙型肝炎病毒;甲型肝炎病毒;乙型肝炎病毒;乳头瘤病毒等。病原性病毒可包括DNA病毒,诸如:乳多空病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒、美洲白鲟腺病毒、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮化病毒科;藻类DNA病毒科等。病原体可包括,例如DNA病毒[例如:乳多空病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒、美洲白鲟腺病毒、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮化病毒科;藻类DNA病毒科等]、结核分枝杆菌(Mycobacteriumtuberculosis)、无乳链球菌(Streptococcus agalactiae)、耐甲氧西林金黄色葡萄球菌(methicillin-resistant Staphylococcus aureus)、嗜肺军团菌(Legionellapneumophila)、酿脓链球菌(Streptococcus pyogenes)、大肠杆菌(Escherichia coli)、淋病奈瑟氏菌(Neisseria gonorrhoeae)、脑膜炎奈瑟氏菌(Neisseria meningitidis)、肺炎球菌(Pneumococcus)、新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、流感嗜血杆菌B(Hemophilus influenzae B)、梅毒密螺旋体(Treponema pallidum)、莱姆病螺旋体(Lyme disease spirochetes)、铜绿假单胞菌(Pseudomonas aeruginosa)、麻风分枝杆菌(Mycobacterium leprae)、流产布鲁氏菌(Brucella abortus)、狂犬病病毒、流感病毒、巨细胞病毒、单纯疱疹病毒I、单纯疱疹病毒II、人血清细小样病毒(human serum parvo-like virus)、呼吸道合胞体病毒、水痘-带状疱疹病毒、乙型肝炎病毒、丙型肝炎病毒、麻疹病毒、腺病毒、人T细胞白血病病毒、爱泼斯坦-巴尔病毒、鼠白血病病毒、腮腺炎病毒、水疱性口炎病毒、辛德毕斯病毒(Sindbisvirus)、淋巴细胞性脉络丛脑膜炎病毒、疣病毒、蓝舌病毒、仙台病毒(Sendai virus)、猫白血病病毒、呼肠孤病毒、脊髓灰质炎病毒、猿猴病毒40、小鼠乳腺肿瘤病毒、登革热病毒、风疹病毒、西尼罗河病毒、恶性疟原虫、间日疟原虫、刚地弓形虫、蓝氏锥虫(Trypanosomarangeli)、克氏锥虫、罗氏锥虫(Trypanosoma rhodesiense)、布氏锥虫(Trypanosomabrucei)、曼氏血吸虫(Schistosoma mansoni)、日本血吸虫(Schistosoma japonicum)、巴贝斯虫(Babesia bovis)、柔嫩艾美球虫(Eimeria tenella)、盘尾丝虫(Onchocercavolvulus)、利什曼原虫(Leishmania tropica)、结核分枝杆菌、旋毛虫(Trichinellaspiralis)、泰勒原虫(Theileria parva)、胞状绦虫(Taenia hydatigena)、羊绦虫(Taeniaovis)、牛肉绦虫(Taenia saginata)、细粒棘球绦虫(Echinococcus granulosus)、柯氏中殖孔绦虫(Mesocestoides corti)、关节炎支原体(Mycoplasma arthritidis)、猪鼻支原体(M.hyorhinis)、口腔支原体(M.orale)、精氨酸支原体(M.arginini)、莱氏无胆甾原体(Acholeplasma laidlawii)、唾窦支原体(M.salivarium)和肺炎支原体(M.pneumoniae)。
测量可检测信号
在一些情况下,主题方法包括测量步骤(例如,测量由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)介导的ssDNA切割产生的可检测信号)。因为V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)一旦被激活就切割非靶向ssDNA(所述激活在存在V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)的情况下指导RNA与靶DNA杂交时发生),所以可检测信号可以是当ssRNA被切割时产生的任何信号。例如,在一些情况下,测量步骤可包括以下一项或多项:基于金纳米颗粒的检测(例如,参见Xu等人,AngewChem Int Ed Engl.2007;46(19):3468-70;和Xia等人,Proc Natl Acad Sci U S A.2010年6月15日;107(24):10837-41)、荧光偏振、胶体相变/分散(例如,Baksh等人,Nature.2004年1月8日;427(6970):139-41)、电化学检测、基于半导体的感测(例如,Rothberg等人,Nature.2011年7月20日;475(7356):348-52;例如,可以在ssRNA切割反应后使用磷酸酶以通过打开2′-3′环状磷酸酯并通过将无机磷酸盐释放到溶液中而产生pH变化),以及检测经标记的检测剂ssRNA(更多细节参见本文其他地方)。此类检测方法的读出可以是任何方便的读出。可能的读出的实例包括但不限于:所测量的可检测荧光信号的量;对凝胶上条带(例如,表示切割产物对比未切割底物的条带)的视觉分析、基于视觉或传感器的对颜色存在或不存在的检测(即,颜色检测方法),以及电信号的存在或不存在(或电信号的特定量)。
在一些情况下,例如在检测到的信号量可用于确定样品中存在的靶DNA的量的意义上,测量可以是定量的。在一些情况下,例如在可检测信号的存在或不存在可以指示靶DNA(例如,病毒、SNP等)的存在或不存在的意义上,测量可以是定性的。在一些情况下,除非靶DNA(例如,病毒、SNP等)以高于特定阈值浓度存在,否则可检测信号将不存在(例如,高于给定阈值水平)。在一些情况下,可通过修改V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)、指导RNA、样品体积和/或检测剂ssDNA(如果使用的话)的量来滴定检测阈值。因此,例如,如本领域的普通技术人员应当理解的,如果需要的话,可使用许多对照以建立一个或多个反应,每个反应设置用于检测靶DNA的不同阈值水平,并且因此可使用这样的一系列反应来确定样品中存在的靶DNA的量(例如,可使用这样的一系列反应来确定靶DNA‘以至少X的浓度’存在于样品中)。本公开的组合物和方法的应用/用途的非限制性实例包括在图46中描绘的那些。该图描绘了其中在与Cas12蛋白接触之前扩增样品的核酸(在图46中指示为“RPA”)的实施方案,但相同的应用/用途(例如,SNP检测、癌症筛查、细菌感染检测、抗生素抗性检测、病毒感染检测等)可应用于其中不包括扩增步骤的实施方案。本公开的组合物和方法可用于检测任何DNA靶标。例如,可检测将核酸物质整合到基因组中的任何病毒,因为受试样品可包含细胞基因组DNA-并且指导RNA可被设计成检测整合的核苷酸序列。
在一些情况下,可使用本公开方法确定样品(例如,包含靶DNA和多个非靶DNA的样品)中靶DNA的量。确定样品中靶DNA的量可包括将由测试样品产生的可检测信号的量与由参考样品产生的可检测信号的量进行比较。确定样品中靶DNA的量可包括:测量可检测信号以生成测试测量值;测量由参考样品产生的可检测信号以生成参考测量值;以及将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
例如,在一些情况下,本公开的用于确定样品中靶DNA量的方法包括:a)使样品(例如,包含靶DNA和多个非靶DNA的样品)与以下物质接触:(i)与靶DNA杂交的指导RNA;(ii)切割样品中存在的RNA的V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e);和(iii)检测剂ssDNA;b)测量由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)介导的ssDNA切割(例如,检测剂ssDNA的切割)产生的可检测信号,生成测试测量值;c)测量由参考样品产生的可检测信号以生成参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
作为另一个实例,在一些情况下,本公开的用于确定样品中靶DNA量的方法包括:a)使样品(例如,包含靶DNA和多个非靶DNA的样品)与以下物质接触:i)前体指导RNA阵列,所述前体指导RNA阵列包含两个或更多个指导RNA,每个指导RNA具有不同的指导序列;(ii)将前体指导RNA阵列切割成单独的指导RNA并且还切割样品的RNA的V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e);和(iii)检测剂ssDNA;b)测量由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)介导的ssDNA切割(例如,检测剂ssDNA的切割)产生的可检测信号,生成测试测量值;c)测量由两个或更多个参考样品中的每个样品产生的可检测信号以生成两个或更多个参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
样品中核酸的扩增
在一些实施方案中,可通过将检测与核酸扩增结合来提高主题组合物和/或方法(例如,用于检测细胞基因组DNA中靶DNA(诸如病毒DNA或SNP)的存在)的灵敏度。在一些情况下,在与切割ssDNA的V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触之前扩增样品中的核酸(例如,样品中核酸的扩增可在与V型CRISPR/Cas效应蛋白接触之前开始)。在一些情况下,在与V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触的同时扩增样品中的核酸。例如,在一些情况下,主题方法包括扩增样品的核酸(例如,通过使样品与扩增组分接触),之后使扩增的样品与V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触。在一些情况下,主题方法包括在使样品与V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触的同一时间(同时)使样品与扩增组分接触。如果同时添加所有组分(扩增组分和检测组分,诸如V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)、指导RNA和检测剂DNA),则V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)的反式切割活性可能会在样品的核酸经历扩增的同时开始降解核酸。但是,即使是这种情况,与不进行扩增的方法相比,同时进行扩增和检测仍然可提高灵敏度。
在一些情况下,例如使用引物从样品中扩增特定序列(例如,病毒的序列,包括目标SNP的序列)。因此,可扩增将与指导RNA杂交的序列以提高主题检测方法的灵敏度-这可实现所需序列的有偏扩增,从而增加样品中存在的目标序列相对于样品中存在的其他序列的拷贝数。作为一个说明性实例,如果使用主题方法来确定给定样品是否包含特定病毒(或特定SNP),则可扩增病毒序列(或非病毒基因组序列)的所需区域,并且如果实际上样品中存在病毒序列(或SNP),则扩增的区域将包括与指导RNA杂交的序列。
如所指出的,在一些情况下,扩增核酸(例如,通过与扩增组分接触),之后使扩增的核酸与V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触。在一些情况下,在与活性V型CRISPR/Cas效应蛋白(例如,Casl2蛋白)接触之前,扩增持续10秒或更长时间(例如,30秒或更长时间、45秒或更长时间、1分钟或更长时间、2分钟或更长时间、3分钟或更长时间、4分钟或更长时间、5分钟或更长时间、7.5分钟或更长时间、10分钟或更长时间等)。在一些情况下,在与活性V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触之前,扩增持续2分钟或更长时间(例如,3分钟或更长时间、4分钟或更长时间、5分钟或更长时间、7.5分钟或更长时间、10分钟或更长时间等)。在一些情况下,扩增持续时间段范围为10秒至60分钟(例如,10秒至40分钟、10秒至30分钟、10秒至20分钟、10秒至15分钟、10秒至10分钟、10秒至5分钟、30秒至40分钟、30秒至30分钟、30秒至20分钟、30秒至15分钟、30秒至10分钟、30秒至5分钟、1分钟至40分钟、1分钟至30分钟、1分钟至20分钟、1分钟至15分钟、1分钟至10分钟、1分钟至5分钟、2分钟至40分钟、2分钟至30分钟、2分钟至20分钟、2分钟至15分钟、2分钟至10分钟、2分钟至5分钟、5分钟至40分钟、5分钟至30分钟、5分钟至20分钟、5分钟至15分钟、或5分钟至10分钟)。在一些情况下,扩增持续时间段范围为5分钟至15分钟。在一些情况下,扩增持续时间段范围为7分钟至12分钟。
在一些情况下,使样品在与V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)接触的同时与扩增组分接触。在一些此类情况下,V型CRISPR/Cas效应蛋白在接触时是无活性的,并且一旦样品中的核酸被扩增就被激活。
各种扩增方法和组分是本领域的普通技术人员已知的,并且可使用任何方便的方法(参见例如Zanoli和Spoto,Biosensors(Basel).2013年3月;3(1):18-43;Gill和Ghaemi,Nucleosides,Nucleotides,and Nucleic Acids,2008,27:224-243;Craw和Balachandrana,Lab Chip,2012,12,2469-2486;所述参考文献以引用方式整体并入本文)。核酸扩增可包括聚合酶链式反应(PCR)、逆转录PCR(RT-PCR)、定量PCR(qPCR)、逆转录qPCR(RT-qPCR)、巢式PCR、多重PCR、不对称PCR、降落式PCR、随机引物PCR、半巢式PCR、聚合酶循环组装(PCA)、菌落PCR、连接酶链式反应(LCR)、数字PCR、甲基化特异性PCR(MSP)、较低变性温度下的共扩增-PCR(COLD-PCR)、等位基因特异性PCR、序列间特异性PCR(ISS-PCR)、全基因组扩增(WGA)、反向PCR和热不对称交错PCR(TAIL-PCR)。
在一些情况下,扩增是等温扩增。术语“等温扩增”指示核酸(例如,DNA)扩增的一种方法(例如,使用酶链式反应),该方法可使用单一温度孵育,由此不需要热循环仪。等温扩增是核酸扩增的一种形式,其在扩增反应期间不依赖于靶核酸的热变性,因此可能不需要温度的多次快速变化。因此,等温核酸扩增方法可在实验室环境内部或外部进行。通过与逆转录步骤结合,这些扩增方法可用于等温扩增RNA。
等温扩增方法的实例包括但不限于:环介导等温扩增(LAMP)、解旋酶依赖性扩增(HDA)、重组酶聚合酶扩增(RPA)、链置换扩增(SDA)、基于核酸序列的扩增(NASBA)、转录介导扩增(TMA)、切口酶扩增反应(NEAR)、滚环扩增(RCA)、多置换扩增(MDA)、分枝(RAM)、环状解旋酶依赖性扩增(cHDA)、单引物等温扩增(SPIA)、信号介导RNA扩增技术(SMART)、自我持续序列复制(3SR)、基因组指数扩增反应(GEAR)和等温多置换扩增(IMDA)。
在一些情况下,扩增是重组酶聚合酶扩增(RPA)(参见例如美国专利号8,030,000;8,426,134;8,945,845;9,309,502;和9,663,820,所述专利特此以引用方式整体并入)。重组酶聚合酶扩增(RPA)使用两个相对的引物(非常类似于PCR),并且采用三种酶-重组酶、单链DNA结合蛋白(SSB)和置换链聚合酶。重组酶将双链DNA中具有同源序列的寡核苷酸引物配对,SSB结合DNA的置换链以防止引物被置换,并且置换链聚合酶开始DNA合成,其中引物已与靶DNA结合。在RPA反应中添加逆转录酶可促进RNA以及DNA的检测,而无需单独的步骤来生产cDNA。RPA反应的组分的一个实例如下(参见例如美国专利号8,030,000;8,426,134;8,945,845;9,309,502;9,663,820):50mM Tris pH 8.4、80mM乙酸钾、10mM乙酸镁、2mMDTT、5%PEG化合物(Carbowax-20M)、3mM ATP、30mM磷酸肌酸、100ng/ul肌酸激酶、420ng/μlgp32、140ng/μl UvsX、35ng/μl UvsY、2000M dNTP、300nM各寡核苷酸、35ng/μl Bsu聚合酶和含核酸样品)。
在转录介导扩增(TMA)中,使用RNA聚合酶从引物区中工程化的启动子制备RNA,然后逆转录酶从引物合成cDNA。然后可使用第三种酶,例如RNA酶H,从cDNA降解RNA靶标,而无需进行热变性步骤。这种扩增技术类似于自我持续序列复制(3SR)和基于核酸序列的扩增(NASBA),但所用的酶有所不同。再例如,解旋酶依赖性扩增(HDA)利用热稳定解旋酶(Tte-UvrD)而非热量来解链dsDNA而产生单链,然后将单链用于通过聚合酶进行杂交和引物延伸。又例如,环介导扩增(LAMP)采用具有链置换能力的热稳定聚合酶和一组四个或更多个特异性设计的引物。每个引物均被设计成具有发夹末端,一旦移位,这些发夹末端便会卡入发夹中,以促进自动引发和进一步的聚合酶延伸。在LAMP反应中,尽管反应在等温条件下进行,但是对于双链靶标来说,需要初始的热变性步骤。另外,扩增产生各种长度产物的梯形图。又例如,链置换扩增(SDA)结合了限制性内切核酸酶对其靶DNA的未修饰链进行切口的能力和外切核酸酶缺陷型DNA聚合酶延伸切口处的3’末端并置换下游DNA链的能力。
检测剂DNA
在一些情况下,主题方法包括使样品(例如,包含靶DNA和多个非靶ssDNA的样品)与以下物质接触:i)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e);ii)指导RNA(或前体指导RNA阵列);以及iii)为单链且不与指导RNA的指导序列杂交的检测剂DNA。例如,在一些情况下,主题方法包括使样品与以下物质接触:经标记的单链检测剂DNA(检测剂ssDNA),所述经标记的单链检测剂DNA包含荧光发射染料对;V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Casl2a、Cas12b、Cas12c、Cas12d、Cas12e),所述V型CRISPR/Cas效应蛋白在被激活后会切割经标记的检测剂ssDNA(通过在与靶DNA杂交的指导RNA的情形下与指导RNA结合);并且所测量到的可检测信号是由荧光发射染料对产生的。例如,在一些情况下,主题方法包括使样品与经标记的检测剂ssDNA接触,所述经标记的检测剂ssDNA包含荧光共振能量转移(FRET)对或猝灭剂/荧光剂对,或两者。在一些情况下,主题方法包括使样品与包含FRET对的经标记的检测剂ssDNA接触。在一些情况下,主题方法包括使样品与包含荧光剂/猝灭剂对的经标记的检测剂ssDNA接触。
荧光发射染料对包含FRET对或猝灭剂/荧光剂对。在FRET对和猝灭剂/荧光剂对的两种情况下,染料中的一种染料的发射光谱与所述对中的另一种染料的吸收光谱的某一区域重叠。如本文所用,术语“荧光发射染料对”是用于涵盖“荧光共振能量转移(FRET)对”和“猝灭剂/荧光剂对”两者的通用术语,这两个术语将在下文更详细地论述。术语“荧光发射染料对”与短语“FRET对和/或猝灭剂/荧光剂对”可互换使用。
在一些情况下(例如,当检测剂ssDNA包括FRET对时),经标记的检测剂ssDNA在被切割之前产生一定量的可检测信号,并且当经标记的检测剂ssDNA被切割时所测量到的可检测信号的量减少。在一些情况下,经标记的检测剂ssDNA在被切割之前产生第一可检测信号(例如,来自FRET对),并且当经标记的检测剂ssDNA被切割时产生第二可检测信号(例如,来自猝灭剂/荧光剂对)。因此,在一些情况下,经标记的检测剂ssDNA包含FRET对和猝灭剂/荧光剂对。
在一些情况下,经标记的检测剂ssDNA包含FRET对。FRET是这样的过程,通过所述过程,能量的无辐射转移发生为从激发态荧光团到紧邻的第二发色团。能量转移可以发生的范围限制在大约10纳米(100埃),并且转移效率对荧光团之间的分开距离非常敏感。因此,如本文所使用,术语“FRET”(“荧光共振能量转移”;也称为“萤光共振能量转移(
Figure BDA0002594130530000371
resonance energy transfer)”)是指这样的物理现象,所述物理现象涉及供体荧光团和匹配的受体荧光团被选择为使得供体的发射光谱与受体的激发光谱重叠,并且被进一步选择为使得当供体和受体彼此非常接近(通常为10nm或更短距离)时,供体的激发将引起来自受体的激发和发射,这是因为一些能量经由量子耦合效应从供体传递到受体。因此,FRET信号用作供体和受体的接近度尺度;只有当它们彼此非常接近时才会产生信号。FRET供体部分(例如,供体荧光团)和FRET受体部分(例如,受体荧光团)在本文中统称为“FRET对”。
供体-受体对(FRET供体部分和FRET受体部分)在本文中被称为“FRET对”或“信号FRET对”。因此,在一些情况下,主题经标记的检测剂ssDNA包含两个信号配偶体(信号对),当一个信号配偶体是FRET供体部分时,另一个信号配偶体是FRET受体部分。因此,当信号配偶体非常接近时(例如,在相同的RNA分子上时),包含这种FRET对(FRET供体部分和FRET受体部分)的主题经标记的检测剂ssDNA将显示可检测信号(FRET信号),但是当所述配偶体分开时(例如,在V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)切割RNA分子后),信号将减少(或不存在)。
FRET供体和受体部分(FRET对)将是本领域的普通技术人员已知的,并且可以使用任何方便的FRET对(例如,任何方便的供体和受体部分对)。合适的FRET对的实例包括但不限于表1中呈现的那些。另参见:Bajar等人Sensors(Basel).2016年9月14日;16(9);和Abraham等人PLoS One.2015年8月3日;10(8):e0134436。
表1.FRET对的实例(供体和受体FRET部分)
Figure BDA0002594130530000381
Figure BDA0002594130530000391
(1)5-(2-碘乙酰基氨基乙基)氨基萘-1-磺酸
(2)N-(4-二甲基氨基-3,5-二硝基苯基)马来酰亚胺
(3)羧基荧光素琥珀酰亚胺酯
(4)4,4-二氟-4-硼杂-3a,4a-二氮杂-s-吲哒省
在一些情况下,当经标记的检测剂ssDNA被切割时产生可检测信号(例如,在一些情况下,经标记的检测剂ssDNA包含猝灭剂/荧光剂对)。信号猝灭对的一个信号配偶体产生可检测信号,而另一个信号配偶体是猝灭剂部分,所述猝灭剂部分猝灭第一信号配偶体的可检测信号(即,猝灭剂部分猝灭信号部分的信号,使得当信号配偶体彼此接近时(例如,当信号对的信号配偶体非常接近时),来自信号部分的信号减少(被猝灭))。
例如,在一些情况下,当经标记的检测剂ssDNA被切割时,可检测信号的量增加。例如,在一些情况下,由一个信号配偶体(信号部分)显示的信号被另一个信号配偶体(猝灭剂信号部分)猝灭,例如当在由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)进行切割之前两者存在于相同的ssDNA分子上时。这种信号对在本文中称为“猝灭剂/荧光剂对”、“猝灭对”或“信号猝灭对”。例如,在一些情况下,一个信号配偶体(例如,第一信号配偶体)是产生可检测信号的信号部分,所述可检测信号由第二信号配偶体(例如,猝灭剂部分)猝灭。因此,当配偶体被分开时(例如,在由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)切割检测剂ssDNA之后),这种猝灭剂/荧光剂对的信号配偶体将产生可检测信号,但是当配偶体非常接近(例如,在由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)切割检测剂ssDNA之前)时,所述信号将被猝灭。
猝灭剂部分可以将来自信号部分的信号(例如,在由V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)切割检测剂ssDNA之前)猝灭至不同程度。在一些情况下,猝灭剂部分猝灭来自信号部分的信号,其中在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号是在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号的95%或更少。例如,在一些情况下,在存在猝灭剂部分的情况下检测到的信号可以是在不存在猝灭剂部分的情况下检测到的信号的90%或更少、80%或更少、70%或更少、60%或更少、50%或更少、40%或更少、30%或更少、20%或更少、15%或更少、10%或更少、或5%或更少。在一些情况下,在存在猝灭剂部分的情况下未检测到信号(例如,高于背景)。
在一些情况下,在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号是在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号的至少1.2倍(例如,至少1.3倍、至少1.5倍、至少1.7倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少7倍、至少10倍、至少20倍或至少50倍)。
在一些情况下,信号部分是荧光标记。在一些此类情况下,猝灭剂部分猝灭来自荧光标记的信号(光信号)(例如,通过吸收标记的发射光谱中的能量)。因此,当猝灭剂部分不与信号部分接近时,来自荧光标记的发射(信号)是可检测的,因为信号不被猝灭剂部分吸收。可以使用任何方便的供体受体对(信号部分/猝灭剂部分对),并且许多合适的对在本领域中是已知的。
在一些情况下,猝灭剂部分从信号部分(在本文中也称为“可检测标记”)吸收能量,然后发射信号(例如,不同波长的光)。因此,在一些情况下,猝灭剂部分本身是信号部分(例如,信号部分可以是6-羧基荧光素,而猝灭剂部分可以是6-羧基-四甲基罗丹明),并且在一些此类情况下,所述对也可以是FRET对。在一些情况下,猝灭剂部分是暗猝灭剂。暗猝灭剂可以吸收激发能量并以不同方式(例如,作为热量)耗散能量。因此,暗猝灭剂本身具有极小荧光至没有荧光(不发射荧光)。暗猝灭剂的实例进一步描述于美国专利号8,822,673和8,586,718;美国专利公布20140378330、20140349295和20140194611;以及国际专利申请:WO200142505和WO200186001中,所有这些专利特此以引用方式整体并入。
荧光标记的实例包括但不限于:Alexa
Figure BDA0002594130530000411
染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTORho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白(tethered fluorescent protein)。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa
Figure BDA0002594130530000412
染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿和太平洋橙。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa
Figure BDA0002594130530000421
染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白。
ATTO染料的实例包括但不限于:ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTORho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTORho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTOOxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725和ATTO 740。
AlexaFluor染料的实例包括但不限于:Alexa
Figure BDA0002594130530000422
350、Alexa
Figure BDA0002594130530000423
405、Alexa
Figure BDA0002594130530000424
430、Alexa
Figure BDA0002594130530000425
488、Alexa
Figure BDA0002594130530000426
500、Alexa
Figure BDA0002594130530000427
514、Alexa
Figure BDA0002594130530000428
532、Alexa
Figure BDA0002594130530000429
546、Alexa
Figure BDA00025941305300004210
555、Alexa
Figure BDA0002594130530000431
568、Alexa
Figure BDA0002594130530000432
594、Alexa
Figure BDA0002594130530000433
610、Alexa
Figure BDA0002594130530000434
633、Alexa
Figure BDA0002594130530000435
635、Alexa
Figure BDA0002594130530000436
647、Alexa
Figure BDA0002594130530000437
660、Alexa
Figure BDA0002594130530000438
680、Alexa
Figure BDA0002594130530000439
700、Alexa
Figure BDA00025941305300004310
750、Alexa
Figure BDA00025941305300004311
790等。
猝灭剂部分的实例包括但不限于:暗猝灭剂、Black Hole
Figure BDA00025941305300004312
(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇(诸如金纳米颗粒)等。
在一些情况下,猝灭剂部分选自:暗猝灭剂、Black Hole
Figure BDA00025941305300004313
(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇。
ATTO猝灭剂的实例包括但不限于:ATTO 540Q、ATTO 580Q和ATTO 612Q。BlackHole
Figure BDA00025941305300004314
的实例包括但不限于:BHQ-0(493nm)、BHQ-1(534nm)、BHQ-2(579nm)和BHQ-3(672nm)。
对于一些可检测标记(例如,荧光染料)和/或猝灭剂部分的实例,参见例如Bao等人,Annu Rev Biomed Eng.2009;11:25-47;以及美国专利号8,822,673和8,586,718;美国专利公布20140378330、20140349295、20140194611、20130323851、20130224871、20110223677、20110190486、20110172420、20060179585和20030003486;以及国际专利申请:WO200142505和WO200186001,所有这些文献特此以引用方式整体并入。
在一些情况下,可以通过测量比色读出来检测对经标记的检测剂ssDNA的切割。例如,荧光团的释放(例如,从FRET对释放、从猝灭剂/荧光剂对释放等)可导致可检测信号的波长偏移(并因此色移)。因此,在一些情况下,可以通过色移检测主题经标记的检测剂ssDNA的切割。这种偏移可以表示为一种颜色(波长)信号的量的损失、另一种颜色的量的增益、一种颜色与另一种颜色的比率的变化等。
V型CRISPR/Cas效应蛋白
V型CRISPR/Cas效应蛋白是2类CRISPR/Cas效应蛋白的亚型。对于V型CRISPR/Cas系统及其效应蛋白(例如,Cas12家族蛋白,诸如Cas12a)的实例,参见例如Shmakov等人,NatRev Microbiol.2017年3月;15(3):169-182:“Diversity and evolution of class2CRISPR-Cas systems”。实例包括但不限于:Cas12家族(Cas12a、Cas12b、Cas12c)、C2c4、C2c8、C2c5、C2c10和C2c9;以及CasX(Cas12e)和CasY(Cas12d)。另外参见例如Koonin等人,Curr Opin Microbiol.2017年6月;37:67-78:“Diversity,classification andevolution of CRISPR-Cas systems”。
因此,在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12蛋白(例如,Cas12a、Cas12b、Cas12c)。在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12d或Cas12e。在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12a蛋白。在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12b蛋白。在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12c蛋白。在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12d蛋白。在一些情况下,主题V型CRISPR/Cas效应蛋白是Cas12e蛋白。在一些情况下,主题V型CRISPR/Cas效应蛋白是选自以下的蛋白:Cas12(例如,Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)、C2c4、C2c8、C2c5、C2c10和C2c9。在一些情况下,主题V型CRISPR/Cas效应蛋白是选自以下的蛋白:C2c4、C2c8、C2c5、C2c10和C2c9。在一些情况下,主题V型CRISPR/Cas效应蛋白是选自以下的蛋白:C2c4、C2c8和C2c5。在一些情况下,主题V型CRISPR/Cas效应蛋白是选自以下的蛋白:C2c10和C2c9。
在一些情况下,主题V型CRISPR/Cas效应蛋白是天然存在的蛋白质(例如,天然存在于原核细胞中)。在其他情况下,V型CRISPR/Cas效应蛋白不是天然存在的多肽(例如,效应蛋白是变体蛋白、嵌合蛋白,包括融合配偶体等)。天然存在的V型CRISPR/Cas效应蛋白的实例包括但不限于图1A-图1E中所描绘的那些。任何V型CRISPR/Cas效应蛋白均可适用于本公开的组合物(例如,核酸、试剂盒等)和方法(例如,只要V型CRISPR/Cas效应蛋白与指导RNA形成复合物并且在被激活后(通过指导RNA与其靶DNA的杂交和缔合)表现出非靶ssDNA的ssDNA切割活性即可)。
在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12蛋白(例如,Cas12a、Cas12b、Cas12c)(例如,图1A-图1E中所描绘的Cas12蛋白)具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12蛋白(例如,Cas12a、Cas12b、Cas12c)(例如,图1A-图1E中所描绘的Cas12蛋白)具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12蛋白(例如,Cas12a、Cas12b、Cas12c)(例如,图1A-图1E任一图中所描绘的Cas12蛋白)具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12蛋白(例如,Cas12a、Cas12b、Cas12c)(例如,图1A-图1E中所描绘的Cas12蛋白)具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含图1A-图1E中所描绘的Cas12氨基酸序列(例如,Cas12a、Cas12b、Cas12c)。
在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12a蛋白(例如,图1A-图1E中所描绘的Cas12a蛋白)具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12a蛋白(例如,图1A-图1E中所描绘的Cas12a蛋白)具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12a蛋白(例如,图1A-图1E中所描绘的Cas12a蛋白)具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12a蛋白(例如,图1A-图1E中所描绘的Cas12a蛋白)具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含图1A-图1E中所描绘的Cas12a氨基酸序列。
在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1A中所描绘的毛螺菌科(Lachnospiraceae)细菌ND2006 Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1A中所描绘的氨基酸球菌属种(Acidaminococcus sp)BV3L6 Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1B中所描绘的新凶手弗朗西斯菌(Francisella novicida)U112Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1B中所描绘的猕猴卟啉单胞菌(Porphyromonas macacae)Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1C中所描绘的牛眼莫拉氏菌(Moraxella bovoculi)237Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1C中所描绘的牛眼莫拉氏菌AAX08_00205Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1D中所描绘的牛眼莫拉氏菌AAX11_00205Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1D中所描绘的硫微螺菌属种(Thiomicrospira sp.)XS5 Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1E中所描绘的丁酸弧菌属种(Butyrivibrio sp.)NC3005 Cas12a蛋白氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,合适的V型CRISPR/Cas效应蛋白包含与图1E中所描绘的AACCas12b氨基酸序列具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。
在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12b蛋白(例如,图1A-图1E中所描绘的Cas12b蛋白)具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12b蛋白(例如,图1A-图1E中所描绘的Cas12b蛋白)具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12b蛋白(例如,图1A-图1E中所描绘的Cas12b蛋白)具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12b蛋白(例如,图1A-图1E中所描绘的Cas12b蛋白)具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含图1A-图1E中所描绘的Cas12b氨基酸序列。
在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8、C2c5、C2c10或C2c9蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8、C2c5、C2c10或C2c9蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8、C2c5、C2c10或C2c9蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8、C2c5、C2c10或C2c9蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含Cas12、C2c4、C2c8、C2c5、C2c10或C2c9氨基酸序列。
在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8或C2c5蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8或C2c5蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8或C2c5蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c4、C2c8或C2c5蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含Cas12、C2c4、C2c8或C2c5氨基酸序列。
在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c4、C2c8或C2c5蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c4、C2c8或C2c5蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c4、C2c8或C2c5蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c4、C2c8或C2c5蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含C2c4、C2c8或C2c5氨基酸序列。
在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c10或C2c9蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c10或C2c9蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c10或C2c9蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与Cas12、C2c10或C2c9蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含Cas12、C2c10或C2c9氨基酸序列。
在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c10或C2c9蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c10或C2c9蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c10或C2c9蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含与C2c10或C2c9蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,V型CRISPR/Cas效应蛋白包含C2c10或C2c9氨基酸序列。
在一些情况下,主题V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)与异源多肽融合(缀合)。在一些情况下,异源多肽(融合配偶体)提供亚细胞定位,即异源多肽含有亚细胞定位序列(例如,用于靶向细胞核的核定位信号(NLS)、用于将融合蛋白保持在细胞核外的序列(例如核输出序列(NES))、用于将融合蛋白保留在细胞质中的序列、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、ER保留信号等)。在一些情况下,V型CRISPR/Cas效应蛋白(例如,Cas12蛋白)不包含NLS,使得蛋白质不靶向细胞核(例如,当期望切割胞质溶胶中的非靶ssDNA时,这可能是有利的)。在一些情况中,异源多肽可提供便于追踪和/或纯化的标签(即,异源多肽是可检测标记)(例如,荧光蛋白,例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;组氨酸标签,例如6XHis标签;血凝素(HA)标签;FLAG标签;Myc标签等)。
在一些情况下,V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)包含(融合至)核定位信号(NLS)(例如,在一些情况下,2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)。因此,在一些情况下,V型CRISPR/Cas效应蛋白包含一个或多个NLS(例如,2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)定位在N末端和/或C末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)定位在N末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个、或5个或更多个NLS)定位在C末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(3个或更多个、4个或更多个、或5个或更多个NLS)定位在N末端和C末端二者处或附近(例如,在50个氨基酸内)。在一些情况下,NLS定位在N末端,并且NLS定位在C末端。
在一些情况下,V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)包含(融合至)1与10个之间的NLS(例如,1-9个、1-8个、1-7个、1-6个、1-5个、2-10个、2-9个、2-8个、2-7个、2-6个、或2-5个NLS)。在一些情况下,V型CRISPR/Cas效应蛋白包含(融合至)2与5个之间的NLS(例如,2-4个或2-3个NLS)。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV(SEQ IDNO:136);来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:137)的核质蛋白二分NLS);c-mycNLS,具有氨基酸序列PAAKRVKLD(SEQ ID NO:138)或RQRRNELKRSP(SEQID NO:139);hRNPA1 M9 NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQID NO:140);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:141);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:142)和PPKKARED(SEQID NO:143);人p53的序列PQPKKKPL(SEQ ID NO:144);小鼠c-ab1 IV的序列SALIKKKKKMAP(SEQ ID NO:145);流感病毒NS1的序列DRLRR(SEQ ID NO:146)和PKQKKRK(SEQ ID NO:147);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:148);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:149);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:150);以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:151)。一般来讲,NLS(或多个NLS)具有足够的强度来驱动蛋白在真核细胞的细胞核中以可检测的量积累。可通过任何合适的技术执行细胞核中的积累的检测。
原间隔序列相邻基序(PAM)
V型CRISPR/Cas效应蛋白在由靶向DNA的RNA与靶DNA之间的互补性区域限定的靶序列处与靶DNA结合。与许多CRISPR/Cas内切核酸酶的情况一样,双链靶DNA的位点特异性结合(和/或切割)发生在由以下二者确定的位置处:(i)指导RNA与靶DNA之间的碱基配对互补性;和(ii)靶DNA中的短基序[称为原间隔序列相邻基序(PAM)]。
在一些情况下,V型CRISPR/Cas效应蛋白的PAM直接位于(例如靶DNA的非互补链-互补链与指导RNA的指导序列杂交,而非互补链不直接与指导RNA杂交并且是非互补链的反向互补物)的靶序列的5′端。在一些情况下(例如,当使用如本文所述的Cas12a或Cas12b时),PAM序列为5’-TTN-3’。在一些情况下,PAM序列为5’-TTTN-3’。(例如,参见图2)。
在一些情况下,不同的V型CRISPR/Cas效应蛋白(即,来自各种物种的V型CRISPR/Cas效应蛋白)可有利地用于各种所提供的方法中以便利用所需特征(例如,不同V型CRISPR/Cas效应蛋白的特定酶特征)。来自不同物种的V型CRISPR/Cas效应蛋白可能需要靶DNA中的不同的PAM序列。因此,对于所选择的具体V型CRISPR/Cas效应蛋白,PAM序列要求可与上述5’-TTN-3’或5’-TTTN-3’序列不同。用于鉴定适当的PAM序列的各种方法(包括计算机模拟方法和/或湿实验室方法(wet lab methods))是本领域已知且常规的,并且可使用任何方便的方法。
指导RNA
与V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)结合形成核糖核蛋白复合物(RNP)并将复合物靶向靶DNA内的特定靶序列的核酸分子(例如,天然crRNA)在本文中称为“指导RNA”。应理解,在一些情况下,可制备杂交体DNA/RNA,使得指导RNA除RNA碱基外还包含DNA碱基,但术语“指导RNA”在本文中仍然用于涵盖此类杂交体分子。主题指导RNA包含指导序列(也称为“间隔序列”)(其与靶DNA的靶序列杂交)和恒定区(例如,与指导序列相邻并且与V型CRISPR/Cas效应蛋白结合的区域)。“恒定区”在本文中也可以称为“蛋白结合区段”。在一些情况下,例如对于Cas12a,恒定区是指导序列的5’端。
指导序列
指导序列与靶DNA的靶序列具有互补性(与靶DNA的靶序列杂交)。在一些情况下,指导序列的长度为15-28个核苷酸(nt)(例如,长度为15-26个、15-24个、15-22个、15-20个、15-18个、16-28个、16-26个、16-24个、16-22个、16-20个、16-18个、17-26个、17-24个、17-22个、17-20个、17-18个、18-26个、18-24个、或18-22个nt)。在一些情况下,指导序列的长度为18-24个核苷酸(nt)。在一些情况下,指导序列的长度为至少15个nt(例如,长度为至少16个、18个、20个或22个nt)。在一些情况下,指导序列的长度为至少17个nt。在一些情况下,指导序列的长度为至少18个nt。在一些情况下,指导序列的长度为至少20个nt。
在一些情况下,指导序列与靶DNA的靶序列具有80%或更高(例如,85%或更高、90%或更高、95%或更高、或100%的互补性)。在一些情况下,指导序列与靶DNA的靶序列100%互补。在一些情况下,靶DNA包含与指导RNA的指导序列互补的至少15个核苷酸(nt)。
恒定区
可以用于V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)的指导RNA的恒定区的实例呈现在图2中。
在一些情况下,主题指导RNA包含与图2中所示的crRNA重复序列中的任一者具有70%或更高的同一性(例如,80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、或100%的同一性)的核苷酸序列。在一些情况下,主题指导RNA包含与图2中所示的crRNA重复序列中的任一者具有90%或更高的同一性(例如,95%或更高、98%或更高、99%或更高、或100%的同一性)的核苷酸序列。在一些情况下,主题指导RNA包含图2中所示的crRNA核苷酸序列。
在一些情况下,指导RNA包含双链RNA双链体(dsRNA双链体)。在一些情况下,指导RNA包含长度为2至12个bp(例如,2至10个bp、2至8个bp、2至6个bp、2至5个bp、2至4个bp、3至12个bp、3至10个bp、3至8个bp、3至6个bp、3至5个bp、3至4个bp、4至12个bp、4至10个bp、4至8个bp、4至6个bp、或4至5个bp)的dsRNA双链体。在一些情况下,指导RNA包含长度为2个或更多个bp(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、或7个或更多个bp)的dsRNA双链体。在一些情况下,指导RNA包含比相应野生型指导RNA的dsRNA双链体更长的dsRNA双链体。在一些情况下,指导RNA包含比相应野生型指导RNA的dsRNA双链体更短的dsRNA双链体。
在一些情况下,指导RNA的恒定区的长度为15个或更多个核苷酸(nt)(例如,长度为18个或更多个、20个或更多个、21个或更多个、22个或更多个、23个或更多个、24个或更多个、25个或更多个、26个或更多个、27个或更多个、28个或更多个、29个或更多个、30个或更多个、31个或更多个nt、32个或更多个、33个或更多个、34个或更多个、或35个或更多个nt)。在一些情况下,指导RNA的恒定区的长度为18个或更多个nt。
在一些情况下,指导RNA的恒定区的长度在12至100个nt(例如,12至90个、12至80个、12至70个、12至60个、12至50个、12至40个、15至100个、15至90个、15至80个、15至70个、15至60个、15至50个、15至40个、20至100个、20至90个、20至80个、20至70个、20至60个、20至50个、20至40个、25至100个、25至90个、25至80个、25至70个、25至60个、25至50个、25至40个、28至100个、28至90个、28至80个、28至70个、28至60个、28至50个、28至40个、29至100个、29至90个、29至80个、29至70个、29至60个、29至50个、或29至40个nt)的范围内。在一些情况下,指导RNA的恒定区的长度在28至100个nt的范围内。在一些情况下,指导RNA的在指导序列的5′端的区域的长度在28至40个nt的范围内。
在一些情况下,指导RNA的恒定区相对于(短于)相应野生型指导RNA的相应区域被截短。在一些情况下,指导RNA的恒定区相对于(长于)相应野生型指导RNA的相应区域被延长。在一些情况下,主题指导RNA的长度为30个或更多个核苷酸(nt)(例如,长度为34个或更多个、40个或更多个、45个或更多个、50个或更多个、55个或更多个、60个或更多个、65个或更多个、70个或更多个、或80个或更多个nt)。在一些情况下,指导RNA的长度为35个或更多个nt。
前体指导RNA阵列
V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)可例如通过对前体的内切核糖核酸酶切割将前体指导RNA切割成成熟的指导RNA。V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)可将前体指导RNA阵列(其包含串联排列的超过一个指导RNA)切割成两个或更多个单独的指导RNA。因此,在一些情况下,前体指导RNA阵列包含两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个、2个、3个、4个或5个)指导RNA(例如,作为前体分子串联排列)。换句话讲,在一些情况下,阵列(前体指导RNA阵列)上可存在两个或更多个指导RNA。V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)可将前体指导RNA阵列切割成单独的指导RNA。
在一些情况下,主题指导RNA阵列包含2个或更多个指导RNA(例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、或7个或更多个指导RNA)。给定阵列的指导RNA可靶向相同靶DNA的不同靶位点(即,可包括与相同靶DNA的不同靶位点杂交的指导序列)(例如,这可增加检测灵敏度),并且/或者可靶向不同的靶DNA分子(例如,单核苷酸多态性(SNP)、特定病毒的不同毒株等),这可例如用于检测病毒的多种毒株。在一些情况下,前体指导RNA阵列的每个指导RNA具有不同的指导序列。在一些情况下,前体指导RNA阵列的两个或更多个指导RNA具有相同的指导序列。
在一些情况下,前体指导RNA阵列包含靶向相同靶DNA分子内的不同靶位点的两个或更多个指导RNA。例如,在一些情况下,当所述指导RNA中的任一者与靶DNA分子杂交时,这种情形可通过激活V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)而增加检测灵敏度。如此,在一些情况下,主题组合物(例如,试剂盒)或方法包括两个或更多个指导RNA(在前体指导RNA阵列的情形下,或不在前体指导RNA阵列的情形下,例如指导RNA可以是成熟的指导RNA)。
在一些情况下,前体指导RNA阵列包含靶向不同靶DNA分子的两个或更多个指导RNA。例如,当存在潜在靶DNA家族中的任一者时,这种情形可导致阳性信号。这种阵列可用于例如基于诸如单核苷酸多态性(SNP)的变异而靶向转录物家族(例如,用于诊断目的)。这也可用于检测是否存在许多不同病毒株中的任一种。这也可用于检测是否存在许多不同物种、菌株、分离株或细菌变体中的任一者(例如,分枝杆菌(Mycobacterium)的不同物种、菌株、分离株或变体;奈瑟氏菌(Neisseria)的不同物种、菌株、分离株、或变体;金黄色葡萄球菌(Staphylococcus aureus)的不同物种、菌株、分离株、或变体;大肠杆菌的不同物种、菌株、分离株、或变体等)。如此,在一些情况下,主题组合物(例如,试剂盒)或方法包括两个或更多个指导RNA(在前体指导RNA阵列的情形下,或不在前体指导RNA阵列的情形下,例如指导RNA可以是成熟的指导RNA)。
核酸修饰
在一些情况下,经标记的检测剂ssDNA(和/或指导RNA)包含一个或多个修饰(例如,碱基修饰、骨架修饰、糖修饰等)以对核酸提供新的或增强的特征(例如,改进的稳定性)。如本领域已知的,核苷是碱-糖组合。核苷的碱基部分通常是杂环碱基。此类杂环碱基的两个最常见类别是嘌呤和嘧啶。核苷酸是还包含共价连接至核苷的糖部分的磷酸酯基团的核苷。对于包含戊呋喃糖的那些核苷,磷酸酯基团可连接至糖的2′、3′或5′羟基部分。在形成寡核苷酸中,磷酸酯基团共价连接彼此相邻的核苷以形成线性聚合化合物。继而,此线性聚合化合物的各端可进一步连接以形成环状化合物,然而,线性化合物一般是合适的。另外,线性化合物可具有内部核苷酸碱基互补性并且因此可以为了产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸酯基团通常被称为形成寡核苷酸的核苷间骨架。RNA和DNA的正常键或骨架是3′到5′的磷酸二酯键。
修饰的骨架和修饰的核苷间键
合适的修饰的实例包括修饰的核酸骨架和非天然的核苷间键联。具有修饰的骨架的核酸包括在骨架中保留磷原子的那些核酸和在骨架中不具有磷原子的那些核酸。
其中含有磷原子的合适的经修饰的寡核苷酸骨架包括例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基磷酸酯(包括3′-亚烷基磷酸酯、5′-亚烷基磷酸酯和手性磷酸酯)、次膦酸酯、氨基磷酸酯(包括3′-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫羰氨基磷酸酯、硫羰烷基磷酸酯、硫羰烷基磷酸三酯,具有正常3′-5′亚键的硒代磷酸酯和硼代磷酸酯、这些物质的2′-5′连接类似物以及具有反极性的那些寡核苷酸骨架,其中一个或多个核苷酸间键为3′至3′、5′至5′或2′至2′键联。具有反极性的合适的寡核苷酸在最3′核苷酸间键处包含单个3′至3′键联,即可为碱性(核碱基丢失或其被羟基替代)的单个反转核苷残基。还包括各种盐(例如像钾或钠)、混合盐和游离酸形式。
在一些实施方案中,经标记的检测剂ssDNA(和/或指导RNA)包含一个或多个硫代磷酸酯和/或杂原子核苷间键联,具体地是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(称为亚甲基(甲基亚氨基)或MMI骨架)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键联表示为-O-P(=O)(OH)-O-CH2-)。MMI型核苷间键联公开于上文提及的美国专利号5,489,677中。合适的酰胺核苷间键联公开于美国专利号5,602,240中。
还合适的是具有吗啉代骨架结构的核酸,如例如美国专利号5,034,506中所述。例如,在一些情况下,经标记的检测剂ssDNA(和/或指导RNA)包含替代核糖环的6元吗啉代环。在一些情况下,二氨基磷酸酯或其他非磷酸二酯核苷间键联替代磷酸二酯键。
其中不包含磷原子的合适的经修饰的多核苷酸骨架具有通过短链烷基或环烷基核苷间键联、混合杂原子和烷基或环烷基核苷间键联或一个或多个短链杂原子或杂环核苷间键联形成的骨架。这些包括:具有吗啉代键联(部分地由核苷的糖部分形成)的那些骨架;硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;核糖乙酰基(riboacetyl)骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚胺基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰氨骨架;以及具有混合的N、O、S和CH2组成部分的其他骨架。
模拟物
经标记的检测剂ssDNA(和/或指导RNA)可以是核酸模拟物。当对多核苷酸应用术语“模拟物”时意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间键联两者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环替代在本领域中也称为糖替代。维持杂环碱基部分或修饰的杂环碱基部分用于与适当的靶核酸的杂交。一种这样的核酸(已显示出具有优良杂交特性的多核苷酸模拟物)称为肽核酸(PNA)。在PNA中,多核苷酸的糖骨架被含酰胺的骨架替代,具体地被氨基乙基甘氨酸骨架替代。核苷酸被保留下来并且直接或间接键合至骨架的酰胺部分的氮杂氮原子。
已报道具有优良杂交特性的一种多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的骨架是给予PNA含酰胺骨架的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分直接或间接键合至骨架的酰胺部分的氮杂氮原子。描述PNA化合物制备的代表性美国专利包括但不限于:美国专利号5,539,082;5,714,331;和5,719,262。
已研究的另一类多核苷酸模拟物基于具有连接至吗啉代环的杂环碱基的连接吗啉代单元(吗啉代核酸)。已报道连接吗啉代核酸中的吗啉代单体单元的许多连接基团。已选择一类连接基团来得到非离子型低聚化合物。基于非离子型吗啉代的低聚化合物不太可能与细胞蛋白质有不期望的相互作用。基于吗啉代的多核苷酸是不太可能与细胞蛋白质形成不期望的相互作用的寡核苷酸的非离子型模拟物(Dwaine A.Braasch和David R.Corey,Biochemistry,2002,41(14),4503-4510)。基于吗啉代的多核苷酸公开于美国专利号5,034,506中。已制备了吗啉代类多核苷酸内的多种化合物,所述化合物具有连接单体亚单元的多种不同的连接基团。
另一类多核苷酸模拟物称为环己烯基核酸(CeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环替代。已制备了CeNA DMT保护的亚磷酰胺单体并且用于根据经典亚磷酰胺化学性质的低聚化合物合成。已制备并且研究了完全修饰的CeNA低聚化合物和具有用CeNA修饰的特异性位置的寡核苷酸(参见Wang等人,J.Am.Chem.Soc.,2000,122,8595-8602)。一般来讲,CeNA单体并入DNA链中增加了DNA/RNA杂交体的稳定性。CeNA寡腺苷酸与RNA和DNA互补序列形成具有与天然复合物相似的稳定性的复合物。通过NMR和圆二色性示出将CeNA结构并入天然核酸结构中的研究以继续进行简单的构象调整。
另一种修饰包括锁核酸(LNA),其中2′-羟基连接至糖环的4′碳原子从而形成2′-C、4′-C-氧基亚甲基键联,从而形成双环糖部分。所述键可以是亚甲基(-CH2-),即桥接2’氧原子和4′碳原子的基团,其中n为1或2(Singh等人,Chem.Commun.,1998,4,455-456)。LNA和LNA类似物显现出与互补DNA和RNA具有非常高的双链体热稳定性(Tm=+3℃至+10℃)、朝向3′-核酸外切降解的稳定性和良好的溶解特性。已经描述了含有LNA的有效且无毒的反义寡核苷酸(Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638)。
已描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基-胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备连同其低聚化以及核酸识别特性(Koshkin等人,Tetrahedron,1998,54,3607-3630)。LNA及其制备也描述于WO 98/39352和WO 99/14226中。
修饰的糖部分
经标记的检测剂ssDNA(和/或指导RNA)还可以包含一个或多个取代的糖部分。合适的多核苷酸包含选自以下的糖取代基团:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。特别合适的是:O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其他合适的多核苷酸包含选自以下的糖取代基团:C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷氨基、聚烷氨基、取代的硅烷基、RNA切割基团、报告基团、嵌入剂、改进寡核苷酸的药物代谢动力学特性的基团、或改进寡核苷酸的药效动力学特性的基团,以及其他具有相似特性的取代基。合适的修饰包括2’-甲氧基乙氧基(2′-O-CH2 CH2OCH3,又称为2′-O-(2-甲氧基乙基)或2′-MOE)(Martin等人,Helv.Chim.Acta,1995,78,486-504),即烷氧基烷氧基。另外合适的修饰包括2′-二甲基氨基氧基乙氧基,即O(CH2)2ON(CH3)2基团,又称为2′-DMAOE,如在下文的实施例中所述;和2′-二甲基氨基乙氧基乙氧基(在本领域中又称为2′-O-二甲基-氨基-乙氧基-乙基或2′-DMAEOE),即2′-O-CH2-O-CH2-N(CH3)2
其他合适的糖取代基团包括甲氧基(-O-CH3)、氨基丙氧基(--OCH2 CH2 CH2NH2)、烯丙基(-CH2-CH=CH2)、-O-烯丙基(--O--CH2-CH=CH2)和氟(F)。2′-糖取代基团可处于阿拉伯糖(上)位或核糖(下)位。合适的2′-阿拉伯糖修饰是2′-F。还可在低聚化合物上的其他位置上做出相似的修饰,具体地在糖的3′端核苷上或在2′-5′连接的寡核苷酸中的3′位置以及5′端核苷酸的5′位置。低聚化合物还可具有替代呋喃戊糖的糖模拟物,诸如环丁基部分。
碱基修饰和取代
经标记的检测剂ssDNA(和/或指导RNA)还可包括核碱基(在本领域中常常简称为“碱基”)修饰或取代。如本文所用,“未修饰”或“天然”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G)以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其他合成和天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代基、8-氨基、8-巯基、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤代基(具体为5-溴代基)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。另外的经修饰的核碱基包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3′,2′:4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可包括其中嘌呤或嘧啶碱基被其他杂环替代的那些碱基,例如7-脱氮腺嘌呤、7-脱氮鸟苷、2-氨基吡啶和2-吡啶酮。另外的核碱基包括公开于美国专利号3,687,808中的那些、公开于The Concise Encyclopedia Of Polymer Science AndEngineering,第858-859页,Kroschwitz,J.I.编John Wiley&Sons,1990中的那些、由Englisch等人,Angewandte Chemie,International Edition,1991,30,613公开的那些以及由Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页,Crooke,S.T.和Lebleu,B.编,CRC Press,1993公开的那些。这些核碱基中的某些可用于增加低聚化合物的结合亲和力。这些包括5-取代的嘧啶、6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示出使核酸双链体稳定性增加0.6℃-1.2℃(Sanghvi等人编Antisense Research andApplications,CRC Press,Boca Raton,1993,第276-278页)并且例如当与2’-O-甲氧基乙基糖修饰组合时是适合的碱基取代。
将组分引入靶细胞中
可通过多种众所周知的方法中的任一种方法将指导RNA(或包含编码指导RNA的核苷酸序列的核酸)和/或V型CRISPR/Cas效应蛋白引入宿主细胞中。作为非限制性实例,指导RNA和/或V型CRISPR/Cas效应蛋白可与脂质组合。作为另一个非限制性实例,指导RNA和/或V型CRISPR/Cas效应蛋白可与颗粒组合或配制成颗粒。
将核酸和/或蛋白质引入宿主细胞中的方法在本领域中是已知的,并且可使用任何方便的方法来将主题核酸(例如,表达构建体/载体)引入靶细胞(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、人细胞等)中。合适的方法包括例如病毒感染、转染、缀合、原生质体融合、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米颗粒介导的核酸递送(参见例如Panyam等人Adv Drug Deliv Rev.2012年9月13日.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023)等。
指导RNA可例如作为编码指导RNA的DNA分子引入,或者可直接作为RNA分子(或适用时,杂交体分子)提供。在一些情况下,V型CRISPR/Cas效应蛋白作为编码所述蛋白质的核酸(例如,mRNA、DNA、质粒、表达载体、病毒载体等)提供。在一些情况下,V型CRISPR/Cas效应蛋白直接作为蛋白质(例如,不与相关联的指导RNA一起或与相关联的指导RNA一起,即作为核糖核蛋白复合物RNP)提供。同指导RNA一样,可通过任何方便的方法将V型CRISPR/Cas效应蛋白引入细胞中(提供至细胞);此类方法是本领域的普通技术人员已知的。作为说明性实例,可将V型CRISPR/Cas效应蛋白直接注射到细胞中(例如,与或不与指导RNA或编码指导RNA的核酸一起)。作为另一个实例,可将V型CRISPR/Cas效应蛋白和指导RNA的预先形成的复合物(RNP)引入细胞(例如,真核细胞)中(例如,通过注射、通过核转染;通过缀合至一种或多种组分的蛋白转导结构域(PTD),例如缀合至V型CRISPR/Cas效应蛋白、缀合至指导RNA等)。
在一些情况下,将核酸(例如,指导RNA;包含编码V型CRISPR/Cas效应蛋白的核苷酸序列的核酸等)和/或多肽(例如,V型CRISPR/Cas效应蛋白)递送至颗粒中的或与颗粒缔合的细胞(例如,靶宿主细胞)。术语“颗粒”和“纳米颗粒”可适当地互换使用。
这可以例如使用颗粒或脂质包膜来实现,例如核糖核蛋白(RNP)复合物可通过颗粒递送,例如通过包含脂质或类脂质以及亲水聚合物(例如,阳离子脂质和亲水聚合物)的递送颗粒递送,例如,其中阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四烷酰基-sn-甘油基-3-磷酸胆碱(DMPC)并且/或者其中亲水性聚合物包括乙二醇或聚乙二醇(PEG);并且/或者其中颗粒还包含胆固醇(例如,来自制剂1的颗粒=DOTAP 100、DMPC 0、PEG 0、胆固醇0;制剂编号2=DOTAP 90、DMPC 0、PEG 10、胆固醇0;制剂编号3=DOTAP 90、DMPC 0、PEG 5、胆固醇5)。
V型CRISPR/Cas效应蛋白(或包含编码所述蛋白质的核苷酸序列的mRNA)和/或指导RNA(或核酸,诸如一种或多种编码指导RNA的表达载体)可使用颗粒或脂质包膜同时递送。例如,可使用具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核的可生物降解的核壳结构的纳米颗粒。在一些情况下,使用基于自组装生物粘附聚合物的颗粒/纳米颗粒;此类颗粒/纳米颗粒可应用于肽的口服递送、肽的静脉内递送和肽的鼻内递送,例如递送至脑。还考虑了其他实施方案,诸如疏水性药物的口服吸收和眼部递送。可使用分子包膜技术,其涉及受保护并递送至疾病部位的工程化聚合物包膜。可以单剂量或多剂量使用约5mg/kg的剂量,这取决于各种因素,例如靶组织。
类脂质化合物(例如,如美国专利申请20110293703中所述)也可用于多核苷酸的施用,并且可加以使用。在一方面,氨基醇类脂质化合物与待递送至细胞或受试者的剂组合以形成微颗粒、纳米颗粒、脂质体或胶束。氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等组合以形成颗粒。然后可任选地将这些颗粒与药物赋形剂组合以形成药物组合物。
可使用聚(β-氨基醇)(PBAA),可使用基于糖的颗粒,例如,如参考WO2014118272(以引用方式并入本文)和Nair,J K等人,2014,Journal of the American ChemicalSociety 136(49),16958-16961)所述的GalNAc。在一些情况下,使用脂质纳米颗粒(LNP)。球形核酸(SNATM)构建体和其他纳米颗粒(特别是金纳米颗粒)可用于靶细胞。参见例如Cutler等人,J.Am.Chem.Soc.2011 133:9254-9257;Hao等人,Small.2011 7:3158-3162;Zhang等人,ACS Nano.2011 5:6962-6970;Cutler等人,J.Am.Chem.Soc.2012 134:1376-1391;Young等人,Nano Lett.2012 12:3867-71;Zheng等人,Proc.Natl.Acad.Sci.USA.2012 109:11975-80;Mirkin,Nanomedicine 2012 7:635-638;Zhang等人,J.Am.Chem.Soc.2012 134:16488-1691;Weintraub,Nature 2013 495:S14-S16,Choi等人,Proc.Natl.Acad.Sci.USA.2013 110(19):7625-7630;Jensen等人,Sci.Transl.Med.5,209ra152(2013)以及Mirkin等人,Small,10:186-192。半固体和软纳米颗粒也适用于递送。外泌体可用于递送。外泌体是内源性纳米囊泡,其运输RNA和蛋白质,并且可将RNA递送至脑和其他靶器官。超电荷蛋白可用于递送至细胞。超电荷蛋白是一类工程化或天然存在的蛋白质,其具有异常高的正或负净理论电荷。超负电荷蛋白和超正电荷蛋白均表现出耐受热或化学诱导的聚集的能力。超正电荷蛋白也能够穿透哺乳动物细胞。使货物与这些蛋白质(诸如质粒DNA、RNA或其他蛋白质)缔合可促进这些大分子在体外和体内向哺乳动物细胞的功能性递送。细胞穿透肽(CPP)可用于递送。CPP通常具有以下氨基酸组成,其含有高相对丰度的带正电荷的氨基酸(诸如赖氨酸或精氨酸),或者具有含有极性/带电荷氨基酸和非极性疏水氨基酸的交替模式的序列。
目标靶细胞
合适的靶细胞(其可包含靶核酸,诸如基因组DNA)包括但不限于:细菌细胞;古细菌细胞;单细胞真核生物体的细胞;植物细胞;藻类细胞,例如,布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞;昆虫(例如,蚊子;蜜蜂;农业害虫等)的细胞;蛛形纲动物(例如,蜘蛛;蜱等)的细胞;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞;来自哺乳动物的细胞(例如,来自啮齿动物的细胞;来自人的细胞;非人哺乳动物的细胞;啮齿动物(例如,小鼠、大鼠)的细胞;兔形目动物(例如,兔)的细胞;有蹄类动物(例如,牛、马、骆驼、美洲驼、骆马、绵羊、山羊等)的细胞;海洋哺乳动物(例如,鲸鱼、海豹、象海豹、海豚、海狮等)的细胞等。任何类型的细胞都可以是感兴趣的(例如干细胞,例如胚胎干(ES)细胞、诱导多能干(iPS)细胞、生殖细胞(例如,卵母细胞、精子、卵原细胞、精原细胞等)、成体干细胞、体细胞(例如,成纤维细胞)、造血细胞、神经元、肌肉细胞、骨细胞、肝细胞、胰腺细胞;在任何阶段下胚胎的体外或体内胚胎细胞(例如,1个细胞、2个细胞、4个细胞、8个细胞等阶段斑马鱼胚胎)等)。
细胞可来自已建立的细胞系或者它们可以是原代细胞,其中“原代细胞”、“原代细胞系”和“原代培养物”在本文中可互换使用,是指衍生自受试者并且允许培养物在体外生长有限次数的传代(即,分裂)的细胞和细胞培养物。例如,原代培养物是可传代0次、1次、2次、4次、5次、10次或15次但不足以通过转折期的次数的培养物。通常,原代细胞系在体外维持少于10代。靶细胞可以是单细胞生物体并且/或者可在培养物中生长。如果细胞是原代细胞,它们可通过任何方便的方法从个体收获。例如,白细胞可通过血浆分离置换法、白细胞血浆分离置换法、密度梯度分离等方便地收获,而来自组织(诸如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等)的细胞可通过活组织检查方便地收获。
因为指导RNA通过与靶核酸杂交来提供特异性,所以在公开的方法中目标有丝分裂细胞和/或有丝分裂后细胞可包括任何生物体的细胞(例如,细菌细胞;古细菌细胞;单细胞真核生物体的细胞;植物细胞;藻类细胞,例如布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞;无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞;脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞;哺乳动物的细胞;啮齿动物的细胞;人的细胞等)。
植物细胞包括单子叶植物细胞和双子叶植物细胞。细胞可以是根细胞、叶细胞、木质部细胞、韧皮部细胞、形成层细胞、顶端分生组织细胞、实质细胞、厚角组织细胞、厚壁组织细胞等。植物细胞包括农作物的细胞,诸如小麦、玉米、大米、高粱、小米、大豆等的细胞。植物细胞包括农业水果和坚果植物的细胞,例如产生杏、橙子、柠檬、苹果、李子、梨、杏仁等的植物的细胞。
细胞(靶细胞)的非限制性实例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如,来自植物作物、水果、蔬菜、谷物、大豆、玉米(corn)、玉米(maize)、小麦、种子、番茄、大米、木薯、甘蔗、南瓜、干草、马铃薯、棉花、大麻、烟草、开花植物、针叶树、裸子植物、被子植物、蕨类植物、石松类、角苔类、苔类、苔藓、双子叶植物、单子叶植物等的细胞)、藻类细胞(例如,布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等)、海藻(例如巨藻(kelp))、真菌细胞(例如,酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如,有蹄类动物(例如,猪、牛、山羊、绵羊);啮齿动物(例如,大鼠、小鼠);非人灵长类动物;人;猫科动物(例如,猫);犬(例如,狗)等)的细胞等。在一些情况下,细胞是不源自天然生物体的细胞(例如,细胞可以是合成制得的细胞;也称为人造细胞)。
细胞可以是体外细胞(例如,建立的培养细胞系)。细胞可以是离体细胞(来自个体的培养细胞)。细胞可以是体内细胞(例如,个体中的细胞)。细胞可以是分离的细胞。细胞可以是生物体内部的细胞。细胞可以是生物体。
合适的细胞包括人胚胎干细胞、胚胎心肌细胞、肌成纤维细胞、间充质干细胞、自体移植的扩增的心肌细胞、脂肪细胞、全能细胞、多能细胞、血液干细胞、成肌细胞、成体干细胞、骨髓细胞、间充质细胞、胚胎干细胞、实质细胞、上皮细胞、内皮细胞、间皮细胞、成纤维细胞、成骨细胞、软骨细胞、外源细胞、内源细胞、干细胞、造血干细胞、骨髓衍生祖细胞、心肌细胞、骨骼细胞、胎儿细胞、未分化细胞、多能祖细胞、单能祖细胞、单核细胞、心脏成肌细胞、骨骼成肌细胞、巨噬细胞、毛细血管内皮细胞、异种细胞、同种异体细胞和产后干细胞。
在一些情况下,细胞是免疫细胞、神经元、上皮细胞和内皮细胞或干细胞。在一些情况下,免疫细胞是T细胞、B细胞、单核细胞、天然杀伤细胞、树突状细胞或巨噬细胞。在一些情况下,免疫细胞是细胞毒性T细胞。在一些情况下,免疫细胞是辅助性T细胞。在一些情况下,免疫细胞是调节性T细胞(Treg)。
在一些情况下,细胞是干细胞。干细胞包括成体干细胞。成体干细胞也称为体细胞干细胞。
成体干细胞驻留在分化组织中,但保留自我更新的特性和产生多种细胞类型的能力,通常是干细胞所存在于的组织中的典型细胞类型。体细胞干细胞的许多实例是本领域的技术人员已知的,包括肌肉干细胞;造血干细胞;上皮干细胞;神经干细胞;间充质干细胞;乳腺干细胞;肠干细胞;中胚层干细胞;内皮干细胞;嗅干细胞;神经嵴干细胞等。
目标干细胞包括哺乳动物干细胞,其中术语“哺乳动物”是指被分类为哺乳动物的任何动物,包括人;非人灵长类动物;家畜和农场动物;以及动物园、实验室、运动或宠物动物,诸如狗、马、猫、牛、小鼠、大鼠、兔等。在一些情况下,干细胞是人干细胞。在一些情况下,干细胞是啮齿动物(例如,小鼠;大鼠)干细胞。在一些情况下,干细胞是非人灵长类动物干细胞。
试剂盒
本公开提供一种用于例如在包含多个DNA的样品中检测靶DNA的试剂盒。在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,即FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;(ii)包含两个或更多个指导RNA(例如,每个指导RNA具有不同的指导序列)的前体指导RNA阵列,和/或编码所述前体指导RNA阵列的核酸;和(iii)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e),和/或编码所述V型CRISPR/Cas效应蛋白的核酸。在一些情况下,编码前体指导RNA阵列的核酸包括供用户插入指导序列的序列插入位点。
在一些情况下,主题试剂盒包含:(a)包含荧光发射染料对,即FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA;以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;(ii)包含两个或更多个指导RNA(例如,每个指导RNA具有不同的指导序列)的前体指导RNA阵列,和/或编码所述前体指导RNA阵列的核酸;和(iii)V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e),和/或编码所述V型CRISPR/Cas效应蛋白的核酸。
阳性对照
本公开的试剂盒(例如,包含经标记的检测剂ssDNA和V型CRISPR/Cas效应蛋白的试剂盒)还可以包含阳性对照靶DNA。在一些情况下,试剂盒还包含阳性对照指导RNA,所述阳性对照指导RNA包含与对照靶DNA杂交的核苷酸序列。在一些情况下,将阳性对照靶DNA以各种量提供在分开的容器中。在一些情况下,将阳性对照靶DNA以各种已知浓度与对照非靶DNA一起提供在分开的容器中。
核酸
虽然本公开的RNA(例如,指导RNA和前体指导RNA阵列)可以使用任何方便的方法合成(例如,使用RNA聚合酶(例如,T7聚合酶、T3聚合酶、SP6聚合酶)在体外化学合成等),但是也设想了编码指导RNA和/或前体指导RNA阵列的核酸。另外,虽然可以蛋白质形式提供本公开的V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)(例如,作为试剂盒的一部分),但是也可以提供编码所述V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)的核酸(诸如mRNA和/或DNA)。
例如,在一些情况下,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码指导RNA的核苷酸序列。在一些情况下,核苷酸序列编码没有指导序列的指导RNA。例如,在一些情况下,核酸包含编码指导RNA(没有指导序列的指导RNA)的恒定区的核苷酸序列,并且包含编码指导序列的核酸的插入位点。在一些情况下,本公开的试剂盒包含核酸(例如,mRNA、DNA,例如重组表达载体),所述核酸包含编码V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)的核苷酸序列。
在一些情况下,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码前体指导RNA阵列的核苷酸序列(例如,在其中所述阵列的每个指导RNA具有不同的指导序列的一些情况下)。在一些情况下,阵列的一个或多个编码的指导RNA不具有指导序列,例如,核酸可包括阵列的一个或多个指导RNA的一个或多个指导序列的一个或多个插入位点。在一些情况下,主题指导RNA可包括来自前体crRNA的柄,但是不一定必须包括多个指导序列。
在一些情况下,编码指导RNA的核苷酸序列(和/或编码前体指导RNA阵列的核苷酸序列)与启动子可操作地连接,所述启动子是例如在原核细胞中是功能性的启动子、在真核细胞中是功能性的启动子、在哺乳动物细胞中是功能性的启动子、在人细胞中是功能性的启动子等。在一些情况下,编码V型CRISPR/Cas效应蛋白(例如,Cas12蛋白,诸如Cas12a、Cas12b、Cas12c、Cas12d、Cas12e)的核苷酸序列与启动子可操作地连接,所述启动子是例如在原核细胞中是功能性的启动子、在真核细胞中是功能性的启动子、在哺乳动物细胞中是功能性的启动子、在人细胞中是功能性的启动子、细胞类型特异性启动子、可调控启动子、组织特异性启动子等。
本公开的非限制性方面的实例
上文所述的本发明主题的方面(包括实施方案)可单独有益或与一个或多个其他方面或实施方案组合地有益。在不限制前述描述的情况下,下文提供本公开的某些非限制性方面,其编号为1-45(A组)和1-54(B组)。对本领域技术人员在阅读本公开后将显而易见的是,每个单独编号的方面都可与之前或之后单独编号的方面中的任一个一起使用或组合。这意图为所有此类方面的组合提供支持,并且不限于下文明确提供的方面的组合:
A组
1.一种检测样品中的靶DNA的方法,所述方法包括:
(a)使所述样品与以下物质接触:
(i)V型CRISPR/Cas效应蛋白;
(ii)指导RNA,所述指导RNA包含:与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列;和
(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及
(b)测量由所述V型CRISPR/Cas效应蛋白切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
2.如1所述的方法,其包括使所述样品与前体指导RNA阵列接触,其中所述V型CRISPR/Cas效应蛋白切割所述前体指导RNA阵列以产生所述指导RNA和至少一个另外的指导RNA。
3.如1或2所述的方法,其中所述靶DNA是单链的。
4.如1或2所述的方法,其中所述靶DNA是双链的。
5.如1-4中任一项所述的方法,其中所述靶DNA是病毒DNA。
6.如1-4中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
7.如1-4中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12蛋白。
8.如1-6中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12a(Cpf1)或Cas12b(C2c1)蛋白。
9.根据1-8中任一项所述的方法,其中所述样品包含来自细胞裂解液的DNA分子。
10.根据1-9中任一项所述的方法,其中所述样品包含细胞。
11.根据1-10中任一项所述的方法,其中所述接触在体外、离体或体内的细胞内部进行。
12.根据11所述的方法,其中所述细胞是真核细胞。
13.根据1-12中任一项所述的方法,其中所述靶DNA能够以低至200fM的浓度被检测到。
14.根据1-13中任一项所述的方法,其包括确定所述样品中存在的所述靶DNA的量。
15.根据14所述的方法,其中所述确定包括:
测量所述可检测信号以生成测试测量值;
测量由参考样品或细胞产生的可检测信号以生成参考测量值;以及
将所述测试测量值与所述参考测量值进行比较,以确定所述样品中存在的靶DNA的量。
16.根据1-15中任一项所述的方法,其中测量可检测信号包括以下一项或多项:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
17.根据1-16中任一项所述的方法,其中所述单链检测剂DNA包含荧光发射染料对。
18.根据17所述的方法,其中在所述单链检测剂DNA被切割之前所述荧光发射染料对产生一定量的可检测信号,并且在所述单链检测剂DNA被切割之后所述可检测信号的量减少。
19.根据17所述的方法,其中所述单链检测剂DNA在被切割之前产生第一可检测信号,并且在所述单链检测剂DNA被切割之后产生第二可检测信号。
20.根据17-19中任一项所述的方法,其中所述荧光发射染料对是荧光共振能量转移(FRET)对。
21.根据17所述的方法,其中在所述单链检测剂DNA被切割之后,可检测信号的量增加。
22.根据17或21所述的方法,其中所述荧光发射染料对是猝灭剂/荧光剂对。
23.根据17-22中任一项所述的方法,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
24.根据23所述的方法,其中所述两个或更多个荧光发射染料对包括荧光共振能量转移(FRET)对和猝灭剂/荧光剂对。
25.根据1-24中任一项所述的方法,其中所述单链检测剂DNA包含修饰的核碱基、修饰的糖部分和/或修饰的核酸键联。
26.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:
(a)指导RNA,或编码所述指导RNA的核酸,或包含所述指导RNA的前体指导RNA阵列,或编码所述前体指导RNA阵列的核酸;其中所述指导RNA包含:与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA互补的指导序列;和
(b)为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
27.如26所述的试剂盒,其还包含V型CRISPR/Cas效应蛋白。
28.如27所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12蛋白。
29.如27所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12a(Cpf1)或Cas12b(C2c1)蛋白。
30.如26-29中任一项所述的试剂盒,其中所述单链检测剂DNA包含荧光发射染料对。
31.如30所述的试剂盒,其中所述荧光发射染料对是FRET对。
32.如30所述的试剂盒,其中所述荧光发射染料对是猝灭剂/荧光剂对。
33.如30-32中任一项所述的试剂盒,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
34.如33所述的试剂盒,其中所述两个或更多个荧光发射染料对包括产生第一可检测信号的第一荧光发射染料对和产生第二可检测信号的第二荧光发射染料对。
35.一种切割单链DNA(ssDNA)的方法,所述方法包括:
使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:
(i)V型CRISPR/Cas效应蛋白;和
(ii)指导RNA,所述指导RNA包含:与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列,
其中所述V型CRISPR/Cas效应蛋白切割所述多个非靶ssDNA。
36.如35所述的方法,其包括使所述样品与前体指导RNA阵列接触,其中所述V型CRISPR/Cas效应蛋白切割所述前体指导RNA阵列以产生所述指导RNA和至少一个另外的指导RNA。
37.如35或36所述的方法,其中所述接触是在体外、离体或体内的细胞内部。
38.如37所述的方法,其中所述细胞是真核细胞。
39.如38所述的方法,其中所述真核细胞是植物细胞。
40.如37-39中任一项所述的方法,其中所述非靶ssDNA对于所述细胞是外源的。
41.如40所述的方法,其中所述非靶ssDNA是病毒DNA。
42.如35-41中任一项所述的方法,其中所述靶DNA是单链的。
43.如35-41中任一项所述的方法,其中所述靶DNA是双链的。
44.如35-43中任一项所述的方法,其中所述靶DNA是病毒DNA。
45.如35-43中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
B组
1.一种检测样品中的靶DNA的方法,所述方法包括:
(a)使所述样品与以下物质接触:
(i)V型CRISPR/Cas效应蛋白;
(ii)指导RNA,所述指导RNA包含:与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列;和
(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及
(b)测量由所述V型CRISPR/Cas效应蛋白切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
2.如1所述的方法,其包括使所述样品与前体指导RNA阵列接触,其中所述V型CRISPR/Cas效应蛋白切割所述前体指导RNA阵列以产生所述指导RNA和至少一个另外的指导RNA。
3.如1或2所述的方法,其中所述靶DNA是单链的。
4.如1或2所述的方法,其中所述靶DNA是双链的。
5.如1-4中任一项所述的方法,其中所述靶DNA是病毒DNA。
6.如1-4中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
7.如1-4中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12蛋白。
8.如1-6中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12a(Cpf1)或Cas12b(C2c1)蛋白。
9.如1-6中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12d(CasY)或Cas12e(CasX)蛋白。
10.根据1-9中任一项所述的方法,其中所述样品包含来自细胞裂解液的DNA分子。
11.根据1-10中任一项所述的方法,其中所述样品包含细胞。
12.根据1-11中任一项所述的方法,其中所述接触在体外、离体或体内的细胞内部进行。
13.根据12所述的方法,其中所述细胞是真核细胞。
14.根据1-13中任一项所述的方法,其中所述靶DNA能够以低至200fM的浓度被检测到。
15.根据1-14中任一项所述的方法,其包括确定所述样品中存在的所述靶DNA的量。
16.根据15所述的方法,其中所述确定包括:
测量所述可检测信号以生成测试测量值;
测量由参考样品或细胞产生的可检测信号以生成参考测量值;以及
将所述测试测量值与所述参考测量值进行比较,以确定所述样品中存在的靶DNA的量。
17.根据1-16中任一项所述的方法,其中测量可检测信号包括以下一项或多项:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
18.根据1-17中任一项所述的方法,其中所述单链检测剂DNA包含荧光发射染料对。
19.根据18所述的方法,其中在所述单链检测剂DNA被切割之前所述荧光发射染料对产生一定量的可检测信号,并且在所述单链检测剂DNA被切割之后所述可检测信号的量减少。
20.根据18所述的方法,其中所述单链检测剂DNA在被切割之前产生第一可检测信号,并且在所述单链检测剂DNA被切割之后产生第二可检测信号。
21.根据18-20中任一项所述的方法,其中所述荧光发射染料对是荧光共振能量转移(FRET)对。
22.根据18所述的方法,其中在所述单链检测剂DNA被切割之后,可检测信号的量增加。
23.根据18或22所述的方法,其中所述荧光发射染料对是猝灭剂/荧光剂对。
24.根据18-23中任一项所述的方法,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
25.根据24所述的方法,其中所述两个或更多个荧光发射染料对包括荧光共振能量转移(FRET)对和猝灭剂/荧光剂对。
26.根据1-25中任一项所述的方法,其中所述单链检测剂DNA包含修饰的核碱基、修饰的糖部分和/或修饰的核酸键联。
27.根据1-26中任一项所述的方法,其中所述方法包括扩增所述样品中的核酸。
28.根据27所述的方法,其中所述扩增包括等温扩增。
29.根据28所述的方法,其中所述等温扩增包括重组酶聚合酶扩增(RPA)。
30.根据27-29中任一项所述的方法,其中所述扩增在所述步骤(a)的接触之前开始。
31.根据27-29中任一项所述的方法,其中所述扩增与所述步骤(a)的接触一起开始。
32.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:
(a)指导RNA,或编码所述指导RNA的核酸,或包含所述指导RNA的前体指导RNA阵列,或编码所述前体指导RNA阵列的核酸;其中所述指导RNA包含:与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA互补的指导序列;和
(b)为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
33.如32所述的试剂盒,其还包含V型CRISPR/Cas效应蛋白。
34.如33所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12蛋白。
35.如33所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12a(Cpf1)或Cas12b(C2c1)蛋白。
36.如33所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12d(CasY)或Cas12e(CasX)蛋白。
37.如32-36中任一项所述的试剂盒,其中所述单链检测剂DNA包含荧光发射染料对。
38.如37所述的试剂盒,其中所述荧光发射染料对是FRET对。
39.如37所述的试剂盒,其中所述荧光发射染料对是猝灭剂/荧光剂对。
40.如37-39中任一项所述的试剂盒,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
41.如40所述的试剂盒,其中所述两个或更多个荧光发射染料对包括产生第一可检测信号的第一荧光发射染料对和产生第二可检测信号的第二荧光发射染料对。
42.如32-41中任一项所述的试剂盒,其还包含核酸扩增组分。
43.如42所述的试剂盒,其中所述核酸扩增组分是用于重组酶聚合酶扩增(RPA)的组分。
44.一种切割单链DNA(ssDNA)的方法,所述方法包括:
使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:
(i)V型CRISPR/Cas效应蛋白;和
(ii)指导RNA,所述指导RNA包含:与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列,
其中所述V型CRISPR/Cas效应蛋白切割所述多个非靶ssDNA。
45.如44所述的方法,其包括使所述样品与前体指导RNA阵列接触,其中所述V型CRISPR/Cas效应蛋白切割所述前体指导RNA阵列以产生所述指导RNA和至少一个另外的指导RNA。
46.如44或45所述的方法,其中所述接触是在体外、离体或体内的细胞内部。
47.如46所述的方法,其中所述细胞是真核细胞。
48.如47所述的方法,其中所述真核细胞是植物细胞。
49.如46-48中任一项所述的方法,其中所述非靶ssDNA对于所述细胞是外源的。
50.如49所述的方法,其中所述非靶ssDNA是病毒DNA。
51.如44-50中任一项所述的方法,其中所述靶DNA是单链的。
52.如44-50中任一项所述的方法,其中所述靶DNA是双链的。
53.如44-52中任一项所述的方法,其中所述靶DNA是病毒DNA。
54.如44-52中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
实施例
提出以下实施例以便向本领域的普通技术人员提供如何制备和使用本发明的完全公开和描述,并且并非意图限制本发明人看待其发明的范围,也非意图表示以下实验是执行的全部或仅有的实验。已经努力确保关于所用数值(例如量、温度等)的精确性,但一些实验误差和偏差应加以说明。除非另外指示,否则份为重量份,分子量为重均分子量,温度以摄氏度计,并且压力在大气压下或接近大气压。可使用标准缩写,例如,bp,碱基对;kb,千碱基;pl,皮升;s或sec,秒;min,分钟;h或hr,小时;aa,氨基酸;kb,千碱基;bp,碱基对;nt,核苷酸;i.m.,肌内的(肌内地);i.p.,腹膜内的(腹膜内地);s.c.,皮下的(皮下地)等。
实施例1
图3A-图3B.非互补链的切割取决于互补链的识别。改变非靶链(NTS)(顶部凝胶)或靶链(TS)(底部凝胶)的长度,以确定Cas12切割的底物要求。LbCas12a-crRNA复合物大大超过放射性标记的底物,并且通过变性聚丙烯酰胺凝胶电泳(PAGE)来解析切割产物。无论NTS的长度如何,TS均被修剪为单个核苷酸,而NTS仅在存在至少15nt的互补TS时才被切割。
图4A-图4B.互补链结合通过Cas12a释放非特异性DNA酶活性。测试非互补的随机ssDNA在Cas12a被互补靶链激活后是否易于降解。LbCas12a-crRNA复合物大大超过放射性标记的底物,并且通过变性PAGE来解析切割产物。仅当LbCas12a与“激活剂”互补靶链预复合时,随机ssDNA放射性标记的靶标(蓝色)才被降解。保护随机dsDNA放射性标记的靶标(蓝色)以免其被切割。
图5A-图5B.仅当存在具有至少15nt的互补性的靶链时,非靶链才被切割。无论非靶链的长度如何,LbCpf1均切割靶链DNA。仅当靶链具有至少15nt的互补性时,LbCpf1才切割非靶链DNA。
图6.RuvC核酸酶负责ssDNA的反式切割。在存在激活剂靶链时,使用无催化活性的RuvC核酸酶(pXT002)未观察到非特异性的反式切割。使用RNA加工死亡突变体(pXT006)仍观察到反式切割。
图7.通过Cas12a的两个同源物进行靶向导致M13噬菌体ssDNA的快速“切碎”。通过使用M13噬菌体环状ssDNA作为反式底物,测试是否需要游离5’或3’末端进行反式切割。将LbCas12a-crRNA和AsCas12a-crRNA与ssDNA激活剂(与M13噬菌体无序列互补性)预复合,并在37C下与M13 ssDNA一起孵育;将产物在1.5%琼脂糖凝胶上解析并用SyberGold可视化。在最早的时间点(1分钟)观察到快速切碎,并且快速切碎既依赖于激活剂,也依赖于RuvC。观察到与AsCas12a相同的趋势,表明该活性在Cas12a同源物中可能是保守的。
图8.可以使用基于FQ的测定检测Cas12a的反式切割。为了提高测量反式切割的通量,将使用DNase Alert底物(IDT)的基于FQ的测定调整用作反式激活的探针。切割含有DNA接头和相邻猝灭剂的底物时释放出荧光信号。
图9A-图9B.反式激活对双链底物的PAM近端的错配敏感,但对单链底物的PAM近端的错配不敏感。使用基于FQ的测定,测试激活反式切割的错配耐受性。将LbCas12a-crRNA与ssDNA或dsDNA预复合,所述ssDNA或dsDNA含有从PAM远端到PAM近端的2bp错配或突变PAM。上图显示在37C下孵育后1小时后ssDNA(左)或dsDNA(右)的减去背景的最大荧光。下图显示在37C下孵育1小时后观察到的切割速率。在ssDNA底物的情况下对错配的耐受性似乎很高,但在dsDNA底物的情况下对PAM近端错配的耐受性差,这可能是由于RNA链侵入不足所致。值得注意的是,当Cas12a被ssDNA激活时,反式切割不依赖于PAM。
图10.dsDNA靶(顺式)切割遵循单次转换动力学,而ssDNA(反式)切割为多次转换。通过将放射性标记的dsDNA(左)或随机ssDNA(右)以相应的LbCas12a-crRNA比率进行孵育,测定顺式和反式切割的转换动力学。每个点代表与LbCas12a在37C下孵育30分钟后的定量切割%(通过变性PAGE)。对于ssDNA动力学,在添加放射性标记的随机ssDNA之前,将LbCas12a-crRNA与ssDNA激活剂预复合。数据显示,LbCas12a的顺式切割为单次转换,而反式切割为多次转换。
图11A-图11B.可以利用Cas12a的反式ssDNA切割作为一种简单的诊断方法,以区分病毒血清型,诸如HPV和其他临床相关的DNA病毒。Cas12a可以检测低至皮摩尔浓度的靶标。为了证明可以利用LbCas12a反式活性作为一种简单的诊断方法,使用利用DNase Alert底物的基于FQ的测定来测试是否可以区分两个密切相关的HPV序列(HPV16和HPV18)(其被认为是宫颈癌的高危菌株)。将LbCas12与靶向与TTTA PAM相邻的HPV16和HPV18序列的crRNA一起预孵育;这两个序列相差6个核苷酸。将500bp的HPV16和HPV18片段克隆到质粒骨架(共约6kb)中,作为完整HPV基因组的替代物(约8kb),并与LbCas12a-crRNA在37C下一起孵育30分钟(上)或1小时(下)。HPV血清型易于区分,并且所述方法可检测低至约10pM的靶标。原则上,此方法可以扩展到检测任何DNA病毒,并且本文列出了临床相关DNA病毒的实例。
图12.CRISPR-Cas12a/Cas12a-crRNA复合物切割DNA的统一模型以PAM依赖性(dsDNA)或PAM独立性(ssDNA)方式与底物结合。当dsDNA PAM被识别时,RNA链侵入询问双链体,并且互补靶链的识别激活RuvC核酸酶以切割解链的TS和NTS。互补ssDNA的结合也触发RuvC核酸酶降解任何ssDNA。
实施例2
CRISPR-Cas12a(Cpf1)属于RNA指导的DNA靶向酶家族,其结合并切割DNA作为细菌适应性免疫系统的组成部分。像CRISPR-Cas9一样,Cas12a和相关酶也是强大的基因组编辑工具,因为它们具有在双链DNA切割位点诱导细胞遗传变化的能力。在研究Cas12a的DNA底物选择性的过程中,发明人惊讶地发现,RNA指导的DNA结合释放出足以完全降解线性和环状ssDNA分子的强大的非特异性单链DNA(ssDNA)切割活性。此活性由负责位点特异性dsDNA切割的同一活性位点催化,切碎ssDNA而不受序列要求的影响,并且具有快速的多次转换切割动力学。激活ssDNA切割要求如实识别与指导RNA的指导序列相匹配的DNA靶序列,其特异性足以区分密切相关的病毒血清型。本文提供的数据显示,对于CRISPR-Cas9酶未观察到Cas12a催化的ssDNA降解是其他Cas12家族蛋白的基本特性,揭示了与VI型CRISPR-Cas13酶的RNA触发的一般RNA酶活性具吸引力且令人惊讶的相似性。
结果
细菌和古细菌中的CRISPR-Cas适应性免疫使用RNA指导的核酸酶来鉴别并切割外源核酸。基于由两个催化结构域RuvC和HNH诱导的在与指导RNA序列互补的序列处的双链DNA(dsDNA)切割精度,CRISPR-Cas9酶家族已广泛应用于真核生物的基因编辑应用中。用于基因编辑的第二酶家族CRISPR-Cas12a(以前称为Cpf1)使用单个催化结构域(RuvC)用于指导RNA定向的dsDNA切割(图13A)。与Cas9不同,Cas12a酶还加工来自较长前体转录物的单个指导RNA,并产生具有交错5′和3’末端的dsDNA断裂,这一特征引起了对Cas12a用于基因编辑应用的兴趣。尽管已将其用作基因组编辑工具,但尚未充分阐明Cas12a的底物特异性和DNA切割机制。
在研究Cas12a激活的DNA底物要求的同时,测试毛螺菌科细菌ND2006 Cas12a(LbaCas12a)的指导RNA定向单链DNA(ssDNA)切割,这是各种CRISPR-Cas9直系同源物的一种能力。将纯化的LbaCas12a或SpyCas9蛋白与同环状单链M13 DNA噬菌体具有碱基配对互补性的指导RNA组装。尽管SpyCas9催化位点特异性M13切割,如预期的那样产生线性噬菌体分子,但是LbaCas12a出人意料地通过切割机制诱导了M13的快速和完全降解,这不能通过序列特异性DNA切割来解释(图13B)。在使用包含RuvC催化结构域失活突变的LbaCas12a蛋白的实验中,未观察到这种强大的ssDNA降解。这些结果表明,LbaCas12a具有独特的ssDNA切碎活性,需要用于RNA定向dsDNA切割的相同活性位点。
仅当靶链(TS)与指导RNA具有至少15nt的互补性时,非靶链(NTS)才被切割(图17)。这些结果表明,TS识别是ssDNA切割的先决条件,提高了LbaCas12a具有非特异性ssDNA酶活性的可能性。为了测试TS激活的LbaCas12a可以切割任何ssDNA的观念,将LbaCas12a与crRNA和互补的ssDNA或dsDNA激活剂预复合,并在反式中引入不相关的放射性标记的ssDNA、dsDNA或ssRNA。值得注意的是,ssDNA和dsDNA激活剂均触发LbaCas12a以RuvC依赖性方式将ssDNA反式底物完全降解至其5′末端标记(图18A-图18C、图19、图20A-图20B),而dsDNA和ssRNA反式底物保持免受激活复合物的影响(图21)。这些发现共同表明,Cas12aDNA结合通过RuvC核酸酶释放出强大的非特异性ssDNA酶反式活性。
反式底物的快速降解表明,非特异性ssDNA反式切割的动力学可能与顺式切割有根本性区别,在顺式切割中LbaCas12a靶向互补的dsDNA底物。为了研究单个RuvC核酸酶如何通过两种不同的机制进行切割,通过分别滴定多个摩尔比的LbaCas12a-crRNA或LbaCas12a-crRNA-ssDNA激活剂复合物与dsDNA靶标(顺式)或非特异性ssDNA(反式)底物来观察底物转换。切割的靶dsDNA的分数与LbaCas12a-crRNA与DNA的摩尔比成比例,表明顺式切割是单次转换(图14A)。相反,切割的非特异性ssDNA的分数以亚等摩尔比饱和,表明反式切割遵循多次转换动力学(图14B)。为了进一步检查反式切割的Michaelis-Menten动力学,将实时荧光团猝灭剂(FQ)标记的DNA报告基因测定试剂盒调整用于在LbaCas12a-crRNA与ssDNA或dsDNA激活剂稳定结合的条件下测量非特异性DNA酶活性。与ssDNA激活剂预复合的LbaCas12a显示出高度稳健的活性,产生5.1×108s-1M-1的催化效率(kcat/Km)。当与dsDNA激活剂预复合时,催化效率快了近一个数量级,并接近扩散速率,其中kcat/Km测量值为1.7×109s-1M-1(图14C;图22)。这些催化效率的差异表明,dsDNA激活剂的NTS可能使得Cas12a复合物稳定处于切割反式ssDNA底物的最佳构象。
接下来考虑了ssDNA与dsDNA激活剂对反式切割的底物特异性。首先,进行实验以确认PAM识别对于互补dsDNA的激活至关重要,但对于匹配的ssDNA的激活却不是关键,这与靶标结合的要求一致(图15A)。为了测试沿着激活序列的错配是否会影响反式切割的速率,在ssDNA或dsDNA激活剂中在靶序列上引入两个碱基对(bp)错配。使用基于FQ的测定,在添加ssDNA报告基因之前,将LbaCas12a预先装载crRNA和激活剂,并测量荧光信号的实时增加,作为观察到的反式切割速率的替代指标。对ssDNA激活剂序列上的错配的耐受性一般较好,但对dsDNA激活剂的PAM或“种子区”中的错配的耐受性较差(图15B,图23)。使用dsDNA激活剂的这些趋势表明,PAM识别和单向DNA解链为反式切割提供了额外的调控。但是,crRNA与靶链之间的广泛碱基互补性是激活反式切割的唯一要求。
因为使用dsDNA激活剂LbaCas12a表现出更高的反式切割特异性,所以使用基于FQ的测定来测试LbaCas12a是否可以被轻松程序化以区分两种密切相关的dsDNA病毒。作为原理论证,选择人乳头瘤病毒(HPV)血清型16(HPV16)和18(HPV18),所述血清型构成持续HPV感染后的所有宫颈癌病例的70%。首先将LbaCas12a与靶向与TTTA PAM相邻的HPV16或HPV18序列的crRNA预复合,所述序列仅相差6个核苷酸(图15C)。作为完整HPV基因组(约8kb)的替代物,将500bp的HPV16和HPV18片段克隆到约5kb的质粒中,并将含HPV的质粒与LbaCas12a-crRNA一起孵育。仅当LbaCas12a的同源HPV靶标以至少约10pM存在时,才能观察到强大的反式切割激活(图15D、图24),这表明dsDNA识别的天然特异性和LbaCas12a的反式切割激活原则上可以扩展到检测任何dsDNA病毒。
然后测试这种反式切割活性是否在Cas12a家族中甚至更宽泛地在进化上截然不同的V型效应蛋白中保守。有两条证据表明了这种可能性:首先,Cas12b的靶标结合晶体结构(以前称为C2c1)显示其RuvC催化口袋可容纳TS和NTS进行切割,这与针对Cas12a提出的顺式切割机制相似。其次,尽管这些亚型之间的序列和结构相似性低,但是所有Cas12蛋白之间的统一结构特征是多肽C末端附近的RuvC核酸酶结构域。因此,选择了来自氨基酸球菌属种(AspCas12a)和新凶手弗朗西斯菌(FnoCas12a)的另外两个Cas12a直系同源物,以及来自嗜酸脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)的Cas12b蛋白(AacCas12b)来测试顺式切割和反式切割(图16A)。尽管效率各不相同,但是当与互补ssDNA激活剂预复合时,所有评估的同系物都显示出非特异性ssDNA酶活性(图16B),这表明反式切割是Cas12家族蛋白的基本特性。这些实验进一步强调了靶向DNA的V型效应蛋白与靶向RNA的VI型效应蛋白之间的反式切割的功能融合。
本文中的数据表明了Cas12蛋白家族对靶标干扰的新机制,并且本文提出了一种新模型,其中Cas12-指导RNA复合物以PAM依赖性(dsDNA)或PAM非依赖性(ssDNA)方式结合DNA底物(图16C)。在dsDNA底物的PAM识别后,RNA链侵入和靶标识别激活RuvC核酸酶以切割解链的TS并修整NTS,从而产生交错的dsDNA断裂并稳健地激活ssDNA反式切割。互补ssDNA的结合绕过了PAM识别和RNA链侵入,但足以触发RuvC核酸酶降解任何ssDNA。
实施例3:CRISPR-Cas12a靶标结合释放出无差别的单链DNA酶活性
此处呈现的数据显示,RNA指导的DNA结合可在Cas12蛋白(例如,Cas12a)中释放出足以完全降解线性和环状ssDNA分子的强大的无差别的单链DNA(ssDNA)切割活性。数据显示,由负责位点特异性dsDNA切割的相同活性位点催化的靶标激活的非特异性ssDNA酶活性是V型CRISPR-Cas12酶的基本特性。激活ssDNA切割要求如实识别与指导RNA的指导序列相匹配的DNA靶序列,其特异性能够区分密切相关的DNA序列。将靶标依赖性Cas12ssDNA酶激活与等温扩增相结合创建了一种称为DNA核酸内切酶靶向的CRISPR反式报告基因(DETECTR)的方法,所述方法实现了渺摩尔级的核酸检测灵敏度。在此证明DETECTR有助于快速地且特异性地检测人患者样品中的DNA(例如,HPV),从而为基于核酸的即时诊断提供简单的平台。
细菌和古细菌中的CRISPR-Cas适应性免疫使用RNA指导的核酸酶来靶向并降解外源核酸。基于由两个催化结构域RuvC和HNH诱导的在与指导RNA序列互补的序列处的双链DNA(dsDNA)切割精度,CRISPR-Cas9蛋白家族已广泛应用于基因编辑应用中。第二酶家族CRISPR-Cas12a(Cpf1)使用单个RuvC催化结构域用于指导RNA定向的dsDNA切割(图25A)。与Cas9不同,Cas12a酶识别富含T的原间隔序列相邻基序(PAM),催化其自身的指导RNA(crRNA)成熟并产生带有交错的5′和3′末端的PAM远端dsDNA断裂,这一特征引起了对基因编辑应用的兴趣。
在研究Cas12a激活的底物要求的同时,测试毛螺菌科细菌ND2006 Cas12a(LbCas12a)的指导RNA定向单链DNA(ssDNA)切割,这是不同CRISPR-Cas9直系同源物的一种能力。将纯化的LbCas12a或酿脓链球菌(Streptococcus pyogenes)Cas9(SpCas9)蛋白(图30)与靶向环状单链M13 DNA噬菌体的指导RNA序列组装。与SpCas9相比,出人意料地发现LbCas12a通过切割机制诱导了M13的快速和完全降解,这不能通过序列特异性DNA切割来解释(图25B)。使用在RuvC催化结构域(D832A)中含有失活突变的LbCas12a蛋白未观察到此ssDNA切碎活性,这增加了与靶标结合的LbCas12a可以降解任何ssDNA的可能性,不管与指导RNA的互补性如何。为了验证此观念,将LbCas12a或SpCas9与不同的指导RNA以及其与M13噬菌体基因组序列没有序列同源性的互补ssDNA组装,并将单链M13 DNA加入该反应中。值得注意的是,LbCas12a仅在存在此互补ssDNA激活剂的情况下催化M13降解,而对于SpCas9则未观察到这种活性(图25C)。这些发现揭示,LbCas12a-crRNA复合物与指导物互补ssDNA的结合释放出强大的、非特异性的ssDNA反式切割活性。
图25A-图25C.Cas12a靶标识别激活非特异性单链DNA切割。(A)Cas12a-crRNA复合物结合dsDNA底物,并使用单个RuvC核酸酶产生5’突出交错切口。(B,C)与(B)同M13噬菌体互补的指导RNA或(C)指导RNA和同M13噬菌体没有序列同源性的互补ssDNA激活剂复合的经纯化的LbCas12a(左)和SpCas9(右)的代表性M13 ssDNA切割时程。
图30.Cas12和Cas9蛋白的纯化。本研究中使用的所有纯化的Cas12和Cas9蛋白的SDS-PAGE凝胶。
接下来研究了对LbCas12a催化的反式切割活性的要求。使用荧光猝灭剂(FQ)标记的报告基因测定,将LbCas12a与其crRNA和互补ssDNA、dsDNA或单链RNA(ssRNA)组装,并且将不相关的ssDNA-FQ报告基因或ssRNA-FQ报告基因引入反式切割中(图31A-图31B)。crRNA互补的ssDNA或dsDNA(激活剂)均触发LbCas12a切割ssDNA-FQ报告基因底物(图31A)。然而,ssRNA既不能够激活反式切割,也不易被LbCas12a降解(图31B),这证实了LbCas12a具有DNA激活的一般DNA酶活性。
图31A-图31B.LbCas12a是DNA激活的一般DNA酶。将LbCas12a-crRNA激活剂与定制的(A)反式ssDNA-FQ报告基因或(B)反式ssRNA-FQ报告基因在37℃下孵育1小时后产生的最大荧光信号的定量结果,在指示处使用DNA酶I或RNA酶A对照。误差条表示均值±s.d.,其中n=3个重复。
为了确定LbCas12a催化的ssDNA切割活性与位点特异性dsDNA切割之间的关系,使用放射性标记的寡核苷酸测试LbCas12a激活的靶链(TS)和非靶链(NTS)的长度要求。TS切割的发生与NTS长度无关(图32A),但NTS切割仅在TS与crRNA含有至少15个核苷酸(nt)的互补性时才发生(图32B)。这表明TS识别是NTS切割的先决条件。为了测试LbCas12a在序列特异性结合和切割dsDNA底物后是否仍保持对非特异性ssDNA切割具有活性,首先用LbCas12a-crRNA复合物切割dsDNA质粒,接着将不相关的dsDNA或ssDNA加入该反应中(图26A)。非特异性dsDNA底物保持完整,而ssDNA却以RuvC结构域依赖性方式迅速降解(图26A;图33A-图33C;图34A-图34C)。接下来使用太短而不能被切割的截短的激活剂,确定仅需要靶DNA结合来激活反式ssDNA切割(图35A-图35B)。这些结果共同显示,RNA指导的DNA结合可激活LbCas12a进行位点特异性dsDNA切割和非特异性ssDNA反式切割。
图26A-图26D.Cas12a ssDNA反式切割的动力学。(A)将通过LbCas12a-crRNA进行的序列特异性质粒DNA切割反应(顶部)引入不相关序列的单独的放射性标记的dsDNA或ssDNA底物中(底部);时程表示分钟。(B)如所示以多个摩尔比与LbCas12a-crRNA一起孵育的靶dsDNA或(C)非特异性ssDNA。每个点表示在37℃下30分钟后(此时反应完成)的平均定量切割百分比。误差条表示均值±s.d.,其中n=3个重复。(D)使用dsDNA或ssDNA激活剂的LbCas12a催化的ssDNA反式切割的代表性Michaelis-Menten曲线图。测量的kcat/Km值报告均值±s.d.,其中n=3个重复。
图32A-图32B.靶链识别是单链DNA切割的先决条件。使用LbCas12a的对(A)与放射性标记的靶链(TS)退火的截短的非靶链(NTS)、(B)与放射性标记的NTS退火的截短的TS的切割时程测定结果。时程表示分钟,并且通过变性PAGE解析切割产物。右示意图描绘了放射标记的TS(A)或NTS(B)的切割,切割产生了Cas12a介导的交错切口。
图33A-图33C.RuvC核酸酶结构域负责激活剂依赖性的非特异性DNA酶活性。使用(A)WT LbCas12a,(B)RuvC催化突变体(D832A)和(C)在有或没有ssDNA激活剂的情况下crRNA加工突变体(H759A)进行的互补dsDNA和非特异性ssDNA底物的放射性标记非靶链的切割时程凝胶。时程表示分钟,并且通过变性PAGE解析切割产物。
图34A-图34C.LbCas12a反式切割降解互补和非特异性ssDNA,但不降解ssRNA。使用(A)无激活剂,(B)1.2倍摩尔过量的ssDNA激活剂或(C)100倍摩尔过量的ssDNA激活剂进行的LbCas12a-crRNA复合物的切割时程凝胶。示出放射性标记的底物,其中顺式(cis)表示互补靶标,反式(trans)表示非互补序列。对于顺式底物,对非靶链进行放射性标记。时程表示分钟,并且通过变性PAGE解析切割产物。
图35A-图35B.触发非特异性ssDNA酶活性不需要Cas12a切割靶链。使用(A)放射性标记的靶链加上ssDNA(10-25nt)或dsDNA(10-25bp)底物或(B)ssDNA(10-25nt)或dsDNA(10-25bp)激活剂存在下的放射性标记的非特异性ssDNA底物进行的使用LbCas12a的切割时程测定结果。时程表示分钟,并且通过变性PAGE解析切割产物。
反式底物的快速降解表明,LbCas12a催化的位点特异性dsDNA(顺式)切割和非特异性ssDNA(反式)切割的动力学有根本性区别。化学计量滴定实验显示,顺式切割是单次转换(图26B),而反式切割是多次转换(图26C)。尽管在顺式切割后,Cas12a-crRNA复合物仍与dsDNA靶标结合,但该复合物从RuvC活性位点释放其PAM远端切割产物,从而使ssDNA底物得以进入和转换。使用FQ测定发现,与ssDNA激活分子结合的LbCas12a-crRNA以约250/秒的速率和5.1×108s-1M-1的催化效率(kcat/Km)催化反式ssDNA切割。当与dsDNA激活剂结合时,LbCas12a-crRNA每秒催化约1250次转换,催化效率接近扩散速率,kcat/Km为1.7×109s-1M-1(图26D;图36A-36E)。这些差异表明,dsDNA激活剂的NTS有助于使Cas12a复合物稳定处于反式ssDNA切割的最佳构象。
图36A-图36E.Michaelis-Menten分析揭示了使用ssDNA和dsDNA激活剂下的强大反式切割活性。在37℃下使用0.1nM有效LbCas12a-crRNA激活剂复合物和增加的DNaseAlert底物浓度进行的(A)ssDNA或(C)dsDNA激活剂的初始速度与时间的代表性曲线图。相应的(B)ssDNA或(D)dsDNA激活剂的Michaelis-Menten拟合结果。(E)计算的kcat、Km和kcat/Km值报告均值±s.d.,其中n=3个重复。
接下来使用ssDNA或dsDNA激活剂测试反式切割激活的特异性。发现CRISPR-Cas12a结合dsDNA所需的PAM序列对于crRNA互补dsDNA的催化激活至关重要,但对于crRNA互补ssDNA却不是关键(图27A)。沿着ssDNA或dsDNA激活分子的crRNA互补序列引入的两个碱基对(bp)错配使ssDNA-FQ报告基因的反式切割速率减慢多达约100倍,这取决于错配位置。仅对于dsDNA激活剂,PAM序列的改变或crRNA与PAM相邻“种子区”之间的错配也对反式ssDNA切割活性具有很大的抑制作用(图27B;图37),这与在Cas12a脱靶研究中观察到的错配耐受模式相似。这些数据合在一起,与PAM介导的dsDNA靶标结合以及crRNA与靶链之间的碱基配对激活反式ssDNA切割的作用相一致。
图27A-图27C.反式切割激活的特异性和保守性。在不存在或存在所示激活剂的情况下,将(A)LbCas12a-crRNA与放射性标记的非特异性ssDNA底物(S)在37℃下孵育30分钟;通过变性PAGE解析产物(P)。(B)使用具有所示错配的ssDNA或dsDNA激活剂观察到的LbCas12a的反式切割速率;速率表示一式三份测量的三个不同靶标的平均值,误差条表示均值±s.d.,其中n=9(三个独立靶标的3个重复)。(C)在存在或不存在ssDNA激活剂的情况下,将放射性标记的顺式(互补)或反式(非互补)底物与Cas12a-crRNA或Cas9-sgRNA在37℃下孵育30分钟;在“无酶”泳道中使用顺式dsDNA底物。底物(S)和核苷酸产物(P)通过变性PAGE来解析。
图37.dsDNA激活剂中的PAM序列和PAM近端错配提供反式激活特异性。针对三个不同的靶序列使用错配的底物进行反式切割动力学的定量;误差条表示均值±s.d.,其中n=3个重复。
考虑到所有V型效应蛋白都含有单个RuvC核酸酶结构域,该数据表明这种反式ssDNA切割活性可能是其他Cas12a酶(也许是进化上更不同的V型CRISPR效应蛋白)共有的一种特性。与这种可能性一致,从氨基酸球菌属种纯化的Cas12a直系同源物(AsCas12a)和从新凶手弗朗西斯菌纯化的Cas12a直系同源物(FnCas12a),以及来自嗜酸脂环酸芽孢杆菌的Cas12b蛋白(AaCas12b),当与crRNA和互补的ssDNA激活剂组装在一起时都催化非特异性ssDNA酶切割(图27C;图38)。相反,测试的II型CRISPR-Cas9蛋白均未显示出反式ssDNA切割的证据(图27C;图38),表明非特异性ssDNA切割的靶标依赖性激活是所有V型CRISPR-Cas12的基本特征。这些结果揭示了Cas12酶与III型CRISPR-Csm/Cmr和VI型CRISPR-Cas13效应蛋白的出乎意料的功能融合,这些效应蛋白也分别表现出靶标激活的非特异性ssDNA酶或ssRNA酶活性。
图38.发现激活剂依赖性的非特异性ssDNA切割活性在V型CRISPR干扰蛋白中是保守的。在存在或不存在ssDNA激活剂的情况下,将放射性标记的顺式(互补)或反式(非互补)底物与Cas12-crRNA在37℃(或对于AaCas12b,在47.5℃)下孵育30分钟。对于顺式dsDNA,对非靶链进行5′末端标记,而对于顺式ssDNA,则对靶链(与指导RNA互补)进行5’末端标记;反式ssDNA和dsDNA是非特异性DNA。在“无酶”泳道中,装有5’末端标记的反式ssDNA。底物(S)和核苷酸产物(P)通过变性PAGE来解析。
接下来根据LbCas12a响应特定dsDNA序列诱导荧光读出的能力,测试是否可以再将LbCas12a用作临床样本中使用的DNA检测平台。特别地,准确地且快速地鉴定人乳头瘤病毒(HPV)对于鉴定有HPV相关癌前期和癌症风险的人至关重要,其中16型(HPV16)和18型(HPV18)占了癌前病变的大部分。为了测试LbCas12a催化的反式ssDNA切割是否可以区分这两种dsDNA病毒,选择位于TTTA PAM旁边的20nt靶序列,所述靶序列在两种HPV基因型之间仅相差六个碱基对(图39A-图39E)。将含有约500bp的HPV16或HPV18基因组片段(包括靶序列)的质粒与靶向HPV16或HPV18片段的LbCas12a-crRNA复合物以及猝灭的荧光ssDNA报告基因一起孵育。一小时后,LbCas12a仅在存在同源HPV靶标的情况下才产生强大的荧光信号,靶标的身份可分辨至质粒的约10pM(图39A-39E)。为了增强测定灵敏度,将通过重组酶聚合酶扩增(RPA)进行的等温扩增与LbCas12a结合以开发一种快速的一锅法检测方法,该方法称为DNA核酸内切酶靶向CRISPR反式报告基因(DETECTR)(图40A)。当DETECTR被程序化为识别其同源质粒时,DETECTR能够以渺摩尔级灵敏度识别靶标(图40B)。
图39A-图39E.Cas12a区分两个密切相关的HPV序列。(A)相差6个核苷酸的HPV16和HPV18基因组内的20nt靶向序列的比对结果,以及使用ssDNA-FQ报告基因进行的Cas12a检测示意图。在存在含有HPV16(上排)或HPV18(中排)基因组片段的dsDNA质粒和DNaseAlert底物的情况下,与靶向(B)HPV16或(C)HPV16的crRNA预先组装的LbCas12a的荧光时程,其中在37℃下每30秒进行一次荧光测量持续1小时。(D)从(B)和(C)中的时程获得的最大荧光信号。误差条表示均值±s.d.,其中n=3个重复。
图40A-图40B.等温扩增与Cas12a检测相结合产生了DETECTR,其达到了渺摩尔级灵敏度。(A)DETECTR的示意图,DETECTR由RPA等温扩增和使用ssDNA-FQ报告基因的Cas12a检测组成。(B)通过DETECTR或单独的Cas12a检测的两个独立质粒的滴定。需注意,DETECTR达到了渺摩尔级灵敏度。误差条表示均值±s.d.,其中n=3个重复。
为了评定是否可以在更复杂的混合物中检测到HPV,将从感染了HPV 16型(SiHa)、18型(HeLa)或无HPV(BJAB)的经培养的人细胞中提取的DNA加入到与靶向HPV16或HPV18内L1基因的高变V环的crRNA复合的LbCas12a中(图28A)。
单独的LbCas12a-crRNA的灵敏度不足以检测到HPV,而DETECTR仅分别在SiHa和HeLa细胞中明确鉴定出HPV 16型和18型。(图28B;图41A-图41B)。为了研究DETECTR在患者样品上的效用,对先前用基于PCR的方法对HPV感染进行分析的25个人肛门拭子的粗DNA提取物进行测试(图42A-图42B)。在一小时内,DETECTR准确鉴定出25个含有HPV型异质混合物的患者样品中HPV16(25/25一致性)和HPV18(23/25一致性)的存在或不存在,基于PCR的强度与DETECTR信号之间存在良好相关性(图28C,图28D;图41C,图41D;图42A-图42B)。此外,未受HPV 16型或18型感染但确实含有其他HPV型的样本中没有荧光信号,这表明DETECTR具有良好的特异性。这些结果展示了基于CRISPR的诊断的新平台,并表明DETECTR原则上可以扩展到以高灵敏度和特异性快速检测任何目标DNA序列。
图28A-图28D.通过DETECTR进行的对人样品中的HPV 16型和18型的快速鉴定结果。(A)Cas12a靶向的L1基因的高变V环内的HPV16和HPV18序列的图;突出显示的碱基指示5′PAM序列。(B)热图表示通过DETECTR在人细胞系中检测到的HPV 16型和18型的归一化平均荧光值;归一化比例显示在(D)中。(C)概述了从人肛门样品中提取DNA到通过DETECTR鉴定HPV的示意图。(D)通过PCR(左)和DETECTR(右)进行的对25个患者样品中的HPV 16型和18型的鉴定结果;DETECTR热图表示归一化的平均荧光值。
图41A-图41D.通过DETECTR对人细胞系和患者样品中的HPV16型和18型的鉴定结果。(A)通过DETECTR或单独Cas12a进行的HPV检测的示意图。(B)在进行或不进行RPA扩增的情况下,SiHa(整合的HPV16)、HeLa(整合的HPV18)和BJAB(无HPV)人细胞系中的HPV 16型或1 8型的检测结果。(C)通过DETECTR在25个人肛门临床样品中检测HPV 16型或18型的结果;BJAB细胞系(无HPV)用作对照。误差条表示均值±s.d.,其中n=3个重复。(D)基于Dunnett事后检验的单因素方差分析,对照组与样品组之间的差异的95%置信区间的图,其中n=3个重复。突出显示的样品编号指示在患者样品中HPV16(左)或HPV18(右)的阳性检测结果,其中**p≤0.01和***p≤0.001。
图42A-图42B.人临床样品中HPV的PCR和杂交捕获验证以及基因分型。(A)25个患者样品中HPV 16型(第2列和黄色圆圈)和1 8型(第3列和橙色圆圈)的基于PCR的检测以及通过PCR对其他HPV型的鉴定(第4列)的总结(2);为每个基于PCR的验证(第2列和第3列)分配主观密集值(0-4比例)。(B)PCR结果的热图描绘。
这些发现共同支持了靶标干扰的统一机制,所述机制始于Cas12指导RNA复合物以PAM依赖性(dsDNA)或PAM独立性(ssDNA)方式与互补DNA序列结合(图29)。在宿主细菌内,这种酶激活可以同时提供针对dsDNA和ssDNA噬菌体的保护,还可以靶向在噬菌体复制或转录过程中临时出现的ssDNA序列。在基因组编辑的背景下,Cas12的靶标激活ssDNA切割可能是稀有事件,但它有可能切割在复制叉、R环和转录泡或用于同源定向修复的ssDNA模板上短暂暴露的ssDNA。最后,释放Cas12蛋白的ssDNA酶活性提供了一种新的策略,这种策略可提高用于即时诊断应用的核酸检测的速度、灵敏度和特异性。
图29.Cas12a的PAM依赖性和PAM非依赖性顺式和反式切割激活的模型。Cas12a-crRNA复合物以PAM依赖性方式(顶部)与互补dsDNA结合,或以PAM非依赖性方式(底部)与ssDNA结合,这足以通过RuvC核酸酶释放出无差别的ssDNA酶活性。Cas12蛋白(例如,Cas12a)也可以释放其PAM远端切割产物,从而暴露RuvC活性位点以进行多轮非特异性ssDNA降解。
表2.本研究中所使用的核酸。
Figure BDA0002594130530001001
Figure BDA0002594130530001011
Figure BDA0002594130530001021
Figure BDA0002594130530001031
Figure BDA0002594130530001041
Figure BDA0002594130530001051
Figure BDA0002594130530001061
Figure BDA0002594130530001071
Figure BDA0002594130530001081
Figure BDA0002594130530001091
材料和方法
蛋白质表达和纯化。将编码SpCas9和Cas12蛋白及其突变体的DNA序列克隆到基于pET的定制表达载体中,所述表达载体含有N端10×His标签、麦芽糖结合蛋白(MBP)和TEV蛋白酶切割位点。通过圆角PCR引入点突变,并通过DNA测序加以验证。如所述地,经过以下改动对蛋白质进行纯化:使含有SpCas9或Cas12表达质粒的大肠杆菌BL21(DE3)在TerrificBroth中于16℃下生长14小时。收获细胞并重悬于裂解缓冲液(50mM Tris-HCl(pH 7.5)、500mM NaCl、5%(v/v)甘油、1mM TCEP、0.5mM PMSF和0.25mg/ml溶菌酶)中,通过超声处理破坏,并使用Ni-NTA树脂纯化。在4℃下TEV切割过夜后,通过连接至HiTrap肝素HP柱的MBPTrap HP柱纯化蛋白质,以进行阳离子交换色谱。在含有20mM Tris-HCl(pH 7.5)、200mMNaCl(或对于AaCas12b为250mM NaCl)、5%(v/v)甘油和1mM TCEP的洗脱缓冲液中进行最终的凝胶过滤步骤(Superdex 200)。本研究中测试的所有蛋白质均显示在图30中。
核酸制备。DNA底物是商业合成的(IDT)。对于FQ报告基因测定,通过在1×杂交缓冲液(20nM Tris-Cl(pH 7.5)、100mM KCl、5mM MgCl2)中将5倍摩尔过量的NTS与TS退火,在95℃下加热并在台式机上缓慢冷却来制备激活剂DNA双链体。将HPV16和HPV18片段合成为gBlocks(IDT),并通过Gibson组件克隆到基于pET的定制载体中。使用Qubit荧光计(Invitrogen)定量用于滴定实验的质粒DNA。对于放射性标记的切割测定,如所述地制备PAGE纯化的DNA寡核苷酸。
从pUC19载体或含有T7启动子、20个核苷酸的靶序列和sgRNA支架的重叠引物PCR扩增sgRNA模板。扩增的PCR产物用作体外转录反应的DNA模板,如所述地进行体外转录反应。使用含有呈反向互补取向的T7启动子、重复序列和间隔序列的单链DNA模板在体外转录crRNA,将所述模板在1×杂交缓冲液中与T7正向引物退火。
DNA切割测定。一般来讲,在切割缓冲液中进行Cas12a介导的切割测定,所述切割缓冲液由20mM HEPES(pH 7.5)、150mM KCl、10mM MgCl2、1%甘油和0.5mM DTT组成。对于M13靶向测定,将30nM Cas12a与36nM靶向M13的crRNA(顺式)或与36nM crRNA和40nM与M13没有序列同源性的互补ssDNA(激活剂)(反式)在37℃下预先组装10分钟。通过加入10nMM13mp18 ssDNA(New England Biolabs)引发反应,并在37℃下孵育指定的时间点。反应用含有15mM EDTA的DNA上样缓冲液(30%(v/v)甘油、0.25%(w/v)溴酚蓝、0.25%(w/v)二甲苯蓝)猝灭,并通过用SYBER Go1d(Invitrogen)预染色的1.5%琼脂糖凝胶进行分离。
对于放射性标记的切割测定,在存在γ32p-ATP的情况下,将所用的底物用T4 PNK(NEB)进行5’末端标记。对于dsDNA底物,首先对非靶链进行5′末端标记,然后与过量的相应靶链退火。反应中使用的Cas12a(或SpCas9)、指导RNA和32P标记的底物的浓度分别为30nM、36nM和1-3nM(除非另有说明)。将反应在37℃(或对于嗜热性AacCas12b为47.5℃)下孵育30分钟(除非另有说明),并用甲酰胺上样缓冲液(最终浓度为45%的甲酰胺和15mM EDTA,含有痕量的二甲苯蓝和溴酚)在90℃下猝灭2-3分钟。用12%尿素变性PAGE凝胶解析底物和产物,并用Amersham Typhoon(GE Healthcare)定量。
对于底物转换研究,将预先组装的Cas12a-crRNA或Cas12a-crRNA激活剂(靶ssDNA或dsDNA)在37℃下孵育10分钟,然后将30nM的预先组装RNP用于每个反应中,其中各底物浓度分别为15、30、45和60nM。
荧光团猝灭剂(FQ)标记的报告基因测定。通过将200nM LbCpf1与250nM crRNA和4nM激活剂(ssDNA、dsDNA或ssRNA)在37℃下孵育30分钟来预先组装LbCas12a-crRNA复合物。通过在含有1×结合缓冲液(20mM Tris-HCl(pH 7.5)、100mM KCl、5mM MgCl2、1mM DTT、5%甘油、50μg ml-1肝素)和50nM DNaseAlert substrateTM(IDT)或定制ssDNA/ssRNA FQ报告底物的溶液中将LbCas12a复合物稀释至最终浓度为50nM LbCas12a:62.5nM crRNA:1nM激活剂来引发反应,反应量为20μl。如上所述,经过以下改动进行HPV检测测定:将LbCas12a与靶向HPV16或HPV18的crRNA预先组装,并在含有1×结合缓冲液、定制ssDNA-FQ报告基因和1、10、100或1000nM含HPV16或HPV18的质粒的溶液中稀释。将反应(20μl,384孔微板格式)在荧光酶标仪(Tecan Infinite Pro F200)中于37℃下孵育长达120分钟,每30秒进行一次荧光测量(DNaseAlert底物=λex:535nm;λem:595nm,定制ssDNA/ssRNA FQ底物=λex:485nm;λem:535nm)。
对于反式切割速率测定,通过减去在不存在靶质粒的情况下进行的反应获得的荧光值来计算背景校正的荧光值。根据以下方程式,将所得数据拟合到单一指数衰减曲线(GraphPad软件):切割分数=A×(1-exp(-k×t)),其中A是曲线的振幅,k是一阶速率常数,并且t是时间。
对于Michaelis-Menten分析,如上所述制备LbCas12a-crRNA-激活剂(靶ssDNA或dsDNA)复合物,并通过在含有1×结合缓冲液和0.001、0.01、0.1、0.2、0.5、1或2uMDNaseAlertTM底物(IDT)的溶液中将LbCas12a复合物稀释至最终浓度为5nM LbCas12a∶6.25nM crRNA∶0.1nM激活剂(有效复合物=0.1nM)来引发反应。将反应在荧光酶标仪上于37℃下孵育达30分钟,每30秒进行一次荧光测量(λex:535nm;λem:595nm)。通过拟合线性回归来计算初始速度(V0),并相对于底物浓度作图以根据以下方程式确定Michaelis-Menten常数(GraphPad软件):Y=(Vmax×X)/(Km+X),其中X是底物浓度并且Y是酶速度。由以下方程式确定转换数(kcat):kcat=Vmax/Et,其中Et=0.1nM。
人临床样品收集和DNA制备。肛门样品供体是从UCSF Anal Neoplasia Clinic,Research and Education Center(ANCRE)招募的。该研究得到了UCSF Committee onHuman Research的批准。获得知情同意后,将参与者的肛门拭子插入ThinprepTM小瓶中,以进行肛门细胞学检查和HPV测试。制作单层细胞学载玻片后,将从第一个拭子留下的细胞悬液用于HPV DNA PCR。
通过沉淀1.5ml细胞悬液制备粗DNA制剂。使沉淀物干燥后,将其以200μg/ml的浓度悬浮于具有蛋白酶K(Life Technologies)的100μl Tris-EDTA中,并在56℃下孵育1小时,然后将蛋白酶K热灭活。将其中五μl用于HPV共有PCR。如上所述,经过以下改动从人细胞系(SiHa、HeLa、BJAB)制备DNA:收集106-107个细胞,将其重悬于具有蛋白酶K的100μl Tris-EDTA中,在56℃下孵育1小时,然后将蛋白酶K热灭活。将该样品一μl用于DETECTR实验。
DETECTR测定。DETECTR在同一反应中组合使用TwistAmp Basic(TwistBiosciences)的重组酶聚合酶扩增(RPA)和随后的Cas12a检测。简而言之,将含有1 μl样品、0.48μM正向和反向引物、1×再水合缓冲液、14mM醋酸镁和RPA混合物的50μl反应在37℃下孵育10分钟。将RPA反应(18μl)转移至384孔微板,并将50nM LbCas12a:62.5nM crRNA:50nM定制ssDNA-FQ报告基因直接加入反应中(最终体积为20μl)。将反应在荧光酶标仪(Tecan Infinite Pro F200)上于37℃下孵育1-2小时,每分钟进行一次荧光测量(λex:485nm;λem:535nm)。
对于通过DETECTR进行的HPV鉴定,将人样品中HPV 16型或18型的检测值分别归一化为分别使用靶向HPV16或HPV18的crRNA获得的最大平均荧光信号。采用Dunnett事后检验的单因素方差分析用于确定患者样品中HPV16或HPV18鉴定的阳性截止值(设定为p≤0.05)。基于此截止值,100%的样品准确鉴定出HPV16感染(与基于PCR的结果25/25一致),而92%的样品准确鉴定出HPV18感染(与基于PCR的结果23/25一致)。
HPV基因分型和验证。如前所述,使用经过改良的MY09/MY11共有HPV L1引物集合以及用于扩增人β-珠蛋白的引物作为样本充分性的指示剂来进行PCR。在40个扩增循环后,用生物素标记的HPV L1共有探针混合物对样本进行探测。用人β-珠蛋白基因的经生物素标记的探针探测单独的膜。通过与38种不同的HPV型(6/11、16、18、26/69、30、31、32/42、33、34、35、39、45、51、52、53、54、56、57/2/27、58、59、61、62、66、67、68、70、71、72、73、81、82、83、84、85、86/87、90/106、97、102/89),以及两种单独的混合物杂交来对样本进行分类。混合物1含有7、13、40、43、44、55、74和91,并且混合物2含有3、10、28、29、77、78和94。将对β-珠蛋白基因扩增呈阴性的样本从分析中排除。如前所述,基于斑点印迹上信号的强度,将PCR结果以0到5的比例记录。结果记录为1或更高的样品被认为是阳性的。
实施例4:Cas12d和Cas12e的反式切割活性
使用DETECTR测定证明另外两种V型CRISPR/Cas效应蛋白CasX(Cas12e)和CasY(Cas12d)的反式切割活性(图43A-图43B)。
实施例5:对负责棕眼或蓝眼的HERC2基因内的单核苷酸多态性(SNP)的鉴定
使用Cas12a,用DETECTR检测来自唾液样品的眼睛颜色SNP(图44)。样品制备:将500μL磷酸盐缓冲盐水添加至约500μL志愿者唾液中并且以1800g离心5分钟。倾析上清液并且将沉淀物重悬于具有0.2%Triton X-100的100μL磷酸盐缓冲盐水中,随后在95℃下孵育5分钟。1μL样品用作向RPA反应中的直接输入。将以下核酸用于这些实验:
RPA引物:
正向引物:CAAAGAGAAGCCTCGGCC(SEQ ID NO:153)
反向引物:GTGTTAATACAAAGGTACAGGAACAAAGAATTTG(SEQ ID NO:154)
HERC2 G-SNP crRNA:
GTAATTTCTACTAAGTGTAGATAGCATTAAGTGTCAAGTTCT(SEQ ID NO:155)
HERC2 A-SNP crRNA:
GTAATTTCTACTAAGTGTAGATAGCATTAAATGTCAAGTTCT(SEQ ID NO:156)
实施例6:通过检测来自人唾液的XIST(X染色体内)或SRY(Y染色体内)基因对X或Y 染色体的鉴定
图45提供了显示通过检测来自人唾液的XIST(X染色体内)或SRY(Y染色体内)基因对X或Y染色体的鉴定的数据。将以下核酸用于这些实验:
XIST crRNA:GTAATTTCTACTAAGTGTAGATACTAGTCCCTTGTACTGATA(SEQ ID NO:157)
SRY crRNA:GTAATTTCTACTAAGTGTAGATGCATTCTGGGATTCTCTAGA(SEQ ID NO:158)
XIST RPA引物:
正向引物:CTATCTGAATGAATTGATTTGGGGCTTG(SEQ ID NO:159)
反向引物:GCAATGTCAAAATCGCCATTTTAAGC(SEQ ID NO:160)
SRY RPA引物:
正向引物:AGGCAACGTCCAGGATAGAGTG(SEQ ID NO:161)
反向引物:CAGTAAGCATTTTCCACTGGTATCCCAG(SEQ ID NO:162)
虽然本发明已经参考其具体实施方案进行描述,但是本领域技术人员应理解,可在不脱离本发明的真实精神和范围的情况下进行各种改变并且可进行等同物替换。另外,为了使特定情况、材料、物质组成、方法、一个或多个方法步骤适应本发明的目的、精神和范围,可进行许多修改。所有此类修改意图处于所附权利要求的范围内。
序列表
<110> 贾尼斯·S·陈(Chen, Janice S)
詹尼弗·A·多德纳(Doudna, Jennifer A)
卢卡斯·B·哈林顿(Harrington, Lucas B)
恩波·马(Ma, Enbo)
<120> 用于切割SSDNA以及检测靶DNA的V型CRISPR/CAS效应蛋白
<130> BERK-375WO
<150> US 62/590,106
<151> 2017-11-22
<150> US 62/626,593
<151> 2018-02-05
<160> 179
<170> PatentIn version 3.5
<210> 1
<211> 1228
<212> PRT
<213> 未知(Unknown)
<220>
<223> 毛螺菌科细菌
<400> 1
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 2
<211> 1307
<212> PRT
<213> 氨基酸球菌属种BV3L6 (Acidaminococcus sp.BV3L6)
<400> 2
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 3
<211> 1300
<212> PRT
<213> 新凶手弗朗西斯菌(Francisella novicida)
<400> 3
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 4
<211> 1246
<212> PRT
<213> 猕猴卟啉单胞菌(Porphyromonas macacae)
<400> 4
Met Lys Thr Gln His Phe Phe Glu Asp Phe Thr Ser Leu Tyr Ser Leu
1 5 10 15
Ser Lys Thr Ile Arg Phe Glu Leu Lys Pro Ile Gly Lys Thr Leu Glu
20 25 30
Asn Ile Lys Lys Asn Gly Leu Ile Arg Arg Asp Glu Gln Arg Leu Asp
35 40 45
Asp Tyr Glu Lys Leu Lys Lys Val Ile Asp Glu Tyr His Glu Asp Phe
50 55 60
Ile Ala Asn Ile Leu Ser Ser Phe Ser Phe Ser Glu Glu Ile Leu Gln
65 70 75 80
Ser Tyr Ile Gln Asn Leu Ser Glu Ser Glu Ala Arg Ala Lys Ile Glu
85 90 95
Lys Thr Met Arg Asp Thr Leu Ala Lys Ala Phe Ser Glu Asp Glu Arg
100 105 110
Tyr Lys Ser Ile Phe Lys Lys Glu Leu Val Lys Lys Asp Ile Pro Val
115 120 125
Trp Cys Pro Ala Tyr Lys Ser Leu Cys Lys Lys Phe Asp Asn Phe Thr
130 135 140
Thr Ser Leu Val Pro Phe His Glu Asn Arg Lys Asn Leu Tyr Thr Ser
145 150 155 160
Asn Glu Ile Thr Ala Ser Ile Pro Tyr Arg Ile Val His Val Asn Leu
165 170 175
Pro Lys Phe Ile Gln Asn Ile Glu Ala Leu Cys Glu Leu Gln Lys Lys
180 185 190
Met Gly Ala Asp Leu Tyr Leu Glu Met Met Glu Asn Leu Arg Asn Val
195 200 205
Trp Pro Ser Phe Val Lys Thr Pro Asp Asp Leu Cys Asn Leu Lys Thr
210 215 220
Tyr Asn His Leu Met Val Gln Ser Ser Ile Ser Glu Tyr Asn Arg Phe
225 230 235 240
Val Gly Gly Tyr Ser Thr Glu Asp Gly Thr Lys His Gln Gly Ile Asn
245 250 255
Glu Trp Ile Asn Ile Tyr Arg Gln Arg Asn Lys Glu Met Arg Leu Pro
260 265 270
Gly Leu Val Phe Leu His Lys Gln Ile Leu Ala Lys Val Asp Ser Ser
275 280 285
Ser Phe Ile Ser Asp Thr Leu Glu Asn Asp Asp Gln Val Phe Cys Val
290 295 300
Leu Arg Gln Phe Arg Lys Leu Phe Trp Asn Thr Val Ser Ser Lys Glu
305 310 315 320
Asp Asp Ala Ala Ser Leu Lys Asp Leu Phe Cys Gly Leu Ser Gly Tyr
325 330 335
Asp Pro Glu Ala Ile Tyr Val Ser Asp Ala His Leu Ala Thr Ile Ser
340 345 350
Lys Asn Ile Phe Asp Arg Trp Asn Tyr Ile Ser Asp Ala Ile Arg Arg
355 360 365
Lys Thr Glu Val Leu Met Pro Arg Lys Lys Glu Ser Val Glu Arg Tyr
370 375 380
Ala Glu Lys Ile Ser Lys Gln Ile Lys Lys Arg Gln Ser Tyr Ser Leu
385 390 395 400
Ala Glu Leu Asp Asp Leu Leu Ala His Tyr Ser Glu Glu Ser Leu Pro
405 410 415
Ala Gly Phe Ser Leu Leu Ser Tyr Phe Thr Ser Leu Gly Gly Gln Lys
420 425 430
Tyr Leu Val Ser Asp Gly Glu Val Ile Leu Tyr Glu Glu Gly Ser Asn
435 440 445
Ile Trp Asp Glu Val Leu Ile Ala Phe Arg Asp Leu Gln Val Ile Leu
450 455 460
Asp Lys Asp Phe Thr Glu Lys Lys Leu Gly Lys Asp Glu Glu Ala Val
465 470 475 480
Ser Val Ile Lys Lys Ala Leu Asp Ser Ala Leu Arg Leu Arg Lys Phe
485 490 495
Phe Asp Leu Leu Ser Gly Thr Gly Ala Glu Ile Arg Arg Asp Ser Ser
500 505 510
Phe Tyr Ala Leu Tyr Thr Asp Arg Met Asp Lys Leu Lys Gly Leu Leu
515 520 525
Lys Met Tyr Asp Lys Val Arg Asn Tyr Leu Thr Lys Lys Pro Tyr Ser
530 535 540
Ile Glu Lys Phe Lys Leu His Phe Asp Asn Pro Ser Leu Leu Ser Gly
545 550 555 560
Trp Asp Lys Asn Lys Glu Leu Asn Asn Leu Ser Val Ile Phe Arg Gln
565 570 575
Asn Gly Tyr Tyr Tyr Leu Gly Ile Met Thr Pro Lys Gly Lys Asn Leu
580 585 590
Phe Lys Thr Leu Pro Lys Leu Gly Ala Glu Glu Met Phe Tyr Glu Lys
595 600 605
Met Glu Tyr Lys Gln Ile Ala Glu Pro Met Leu Met Leu Pro Lys Val
610 615 620
Phe Phe Pro Lys Lys Thr Lys Pro Ala Phe Ala Pro Asp Gln Ser Val
625 630 635 640
Val Asp Ile Tyr Asn Lys Lys Thr Phe Lys Thr Gly Gln Lys Gly Phe
645 650 655
Asn Lys Lys Asp Leu Tyr Arg Leu Ile Asp Phe Tyr Lys Glu Ala Leu
660 665 670
Thr Val His Glu Trp Lys Leu Phe Asn Phe Ser Phe Ser Pro Thr Glu
675 680 685
Gln Tyr Arg Asn Ile Gly Glu Phe Phe Asp Glu Val Arg Glu Gln Ala
690 695 700
Tyr Lys Val Ser Met Val Asn Val Pro Ala Ser Tyr Ile Asp Glu Ala
705 710 715 720
Val Glu Asn Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe
725 730 735
Ser Pro Tyr Ser Lys Gly Ile Pro Asn Leu His Thr Leu Tyr Trp Lys
740 745 750
Ala Leu Phe Ser Glu Gln Asn Gln Ser Arg Val Tyr Lys Leu Cys Gly
755 760 765
Gly Gly Glu Leu Phe Tyr Arg Lys Ala Ser Leu His Met Gln Asp Thr
770 775 780
Thr Val His Pro Lys Gly Ile Ser Ile His Lys Lys Asn Leu Asn Lys
785 790 795 800
Lys Gly Glu Thr Ser Leu Phe Asn Tyr Asp Leu Val Lys Asp Lys Arg
805 810 815
Phe Thr Glu Asp Lys Phe Phe Phe His Val Pro Ile Ser Ile Asn Tyr
820 825 830
Lys Asn Lys Lys Ile Thr Asn Val Asn Gln Met Val Arg Asp Tyr Ile
835 840 845
Ala Gln Asn Asp Asp Leu Gln Ile Ile Gly Ile Asp Arg Gly Glu Arg
850 855 860
Asn Leu Leu Tyr Ile Ser Arg Ile Asp Thr Arg Gly Asn Leu Leu Glu
865 870 875 880
Gln Phe Ser Leu Asn Val Ile Glu Ser Asp Lys Gly Asp Leu Arg Thr
885 890 895
Asp Tyr Gln Lys Ile Leu Gly Asp Arg Glu Gln Glu Arg Leu Arg Arg
900 905 910
Arg Gln Glu Trp Lys Ser Ile Glu Ser Ile Lys Asp Leu Lys Asp Gly
915 920 925
Tyr Met Ser Gln Val Val His Lys Ile Cys Asn Met Val Val Glu His
930 935 940
Lys Ala Ile Val Val Leu Glu Asn Leu Asn Leu Ser Phe Met Lys Gly
945 950 955 960
Arg Lys Lys Val Glu Lys Ser Val Tyr Glu Lys Phe Glu Arg Met Leu
965 970 975
Val Asp Lys Leu Asn Tyr Leu Val Val Asp Lys Lys Asn Leu Ser Asn
980 985 990
Glu Pro Gly Gly Leu Tyr Ala Ala Tyr Gln Leu Thr Asn Pro Leu Phe
995 1000 1005
Ser Phe Glu Glu Leu His Arg Tyr Pro Gln Ser Gly Ile Leu Phe
1010 1015 1020
Phe Val Asp Pro Trp Asn Thr Ser Leu Thr Asp Pro Ser Thr Gly
1025 1030 1035
Phe Val Asn Leu Leu Gly Arg Ile Asn Tyr Thr Asn Val Gly Asp
1040 1045 1050
Ala Arg Lys Phe Phe Asp Arg Phe Asn Ala Ile Arg Tyr Asp Gly
1055 1060 1065
Lys Gly Asn Ile Leu Phe Asp Leu Asp Leu Ser Arg Phe Asp Val
1070 1075 1080
Arg Val Glu Thr Gln Arg Lys Leu Trp Thr Leu Thr Thr Phe Gly
1085 1090 1095
Ser Arg Ile Ala Lys Ser Lys Lys Ser Gly Lys Trp Met Val Glu
1100 1105 1110
Arg Ile Glu Asn Leu Ser Leu Cys Phe Leu Glu Leu Phe Glu Gln
1115 1120 1125
Phe Asn Ile Gly Tyr Arg Val Glu Lys Asp Leu Lys Lys Ala Ile
1130 1135 1140
Leu Ser Gln Asp Arg Lys Glu Phe Tyr Val Arg Leu Ile Tyr Leu
1145 1150 1155
Phe Asn Leu Met Met Gln Ile Arg Asn Ser Asp Gly Glu Glu Asp
1160 1165 1170
Tyr Ile Leu Ser Pro Ala Leu Asn Glu Lys Asn Leu Gln Phe Asp
1175 1180 1185
Ser Arg Leu Ile Glu Ala Lys Asp Leu Pro Val Asp Ala Asp Ala
1190 1195 1200
Asn Gly Ala Tyr Asn Val Ala Arg Lys Gly Leu Met Val Val Gln
1205 1210 1215
Arg Ile Lys Arg Gly Asp His Glu Ser Ile His Arg Ile Gly Arg
1220 1225 1230
Ala Gln Trp Leu Arg Tyr Val Gln Glu Gly Ile Val Glu
1235 1240 1245
<210> 5
<211> 1373
<212> PRT
<213> 牛眼莫拉氏菌(Moraxella bovoculi)
<400> 5
Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val
1 5 10 15
Arg Phe Glu Leu Lys Pro Ile Asp Arg Thr Leu Glu His Ile His Ala
20 25 30
Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met His Gln Lys
35 40 45
Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met
50 55 60
Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr
65 70 75 80
Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Glu Leu Gln Lys Gln Leu
85 90 95
Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ile Val Lys Pro Ile Gly
100 105 110
Asn Gly Gly Lys Tyr Lys Ala Gly Tyr Asp Arg Leu Phe Gly Ala Lys
115 120 125
Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile
130 135 140
Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe
145 150 155 160
Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn
165 170 175
Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile
180 185 190
His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr
195 200 205
Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu
210 215 220
Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr
225 230 235 240
His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Thr Leu Leu
245 250 255
Gly Gly Ile Ser Gly Glu Ala Gly Ser Pro Lys Ile Gln Gly Ile Asn
260 265 270
Glu Leu Ile Asn Ser His His Asn Gln His Cys His Lys Ser Glu Arg
275 280 285
Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met
290 295 300
Ser Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys
305 310 315 320
Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Ala Asp Val Phe Ala Lys
325 330 335
Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile
340 345 350
Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly
355 360 365
Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val
370 375 380
Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn
385 390 395 400
Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val
405 410 415
His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His Tyr Thr Ala Arg
420 425 430
His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys
435 440 445
His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn
450 455 460
His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu
465 470 475 480
Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln
485 490 495
Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His
500 505 510
Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly
515 520 525
Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile
530 535 540
Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe
545 550 555 560
Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn
565 570 575
Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln
580 585 590
Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys
595 600 605
Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Ser Ile Tyr Gln Lys Met
610 615 620
Ile Tyr Lys Tyr Leu Glu Val Arg Lys Gln Phe Pro Lys Val Phe Phe
625 630 635 640
Ser Lys Glu Ala Ile Ala Ile Asn Tyr His Pro Ser Lys Glu Leu Val
645 650 655
Glu Ile Lys Asp Lys Gly Arg Gln Arg Ser Asp Asp Glu Arg Leu Lys
660 665 670
Leu Tyr Arg Phe Ile Leu Glu Cys Leu Lys Ile His Pro Lys Tyr Asp
675 680 685
Lys Lys Phe Glu Gly Ala Ile Gly Asp Ile Gln Leu Phe Lys Lys Asp
690 695 700
Lys Lys Gly Arg Glu Val Pro Ile Ser Glu Lys Asp Leu Phe Asp Lys
705 710 715 720
Ile Asn Gly Ile Phe Ser Ser Lys Pro Lys Leu Glu Met Glu Asp Phe
725 730 735
Phe Ile Gly Glu Phe Lys Arg Tyr Asn Pro Ser Gln Asp Leu Val Asp
740 745 750
Gln Tyr Asn Ile Tyr Lys Lys Ile Asp Ser Asn Asp Asn Arg Lys Lys
755 760 765
Glu Asn Phe Tyr Asn Asn His Pro Lys Phe Lys Lys Asp Leu Val Arg
770 775 780
Tyr Tyr Tyr Glu Ser Met Cys Lys His Glu Glu Trp Glu Glu Ser Phe
785 790 795 800
Glu Phe Ser Lys Lys Leu Gln Asp Ile Gly Cys Tyr Val Asp Val Asn
805 810 815
Glu Leu Phe Thr Glu Ile Glu Thr Arg Arg Leu Asn Tyr Lys Ile Ser
820 825 830
Phe Cys Asn Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly
835 840 845
Gln Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala
850 855 860
His Gly Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu Phe Ser
865 870 875 880
Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln
885 890 895
Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu Thr Thr Ile His
900 905 910
Arg Ala Gly Glu Val Leu Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys
915 920 925
Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp
930 935 940
Lys Phe Met Leu His Val Pro Ile Thr Met Asn Phe Gly Val Gln Gly
945 950 955 960
Met Thr Ile Lys Glu Phe Asn Lys Lys Val Asn Gln Ser Ile Gln Gln
965 970 975
Tyr Asp Glu Val Asn Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu
980 985 990
Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly Glu Ile Leu Glu Gln Cys
995 1000 1005
Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala Asn Gly Thr Gln Met
1010 1015 1020
Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg
1025 1030 1035
Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu
1040 1045 1050
Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile Ser Gln
1055 1060 1065
Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu Asn
1070 1075 1080
Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr
1085 1090 1095
Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val
1100 1105 1110
Leu Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala
1115 1120 1125
Leu Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys
1130 1135 1140
Gln Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys
1145 1150 1155
Ile Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr
1160 1165 1170
Glu Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys
1175 1180 1185
Ile Cys Tyr Asn Ala Asp Lys Asp Tyr Phe Glu Phe His Ile Asp
1190 1195 1200
Tyr Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Ile Trp
1205 1210 1215
Thr Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr
1220 1225 1230
Ala Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp
1235 1240 1245
Glu Leu Lys Ser Leu Phe Ala Arg His His Ile Asn Glu Lys Gln
1250 1255 1260
Pro Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe
1265 1270 1275
His Lys Ser Leu Met Tyr Leu Leu Lys Thr Leu Leu Ala Leu Arg
1280 1285 1290
Tyr Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val
1295 1300 1305
Ala Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp
1310 1315 1320
Thr Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala
1325 1330 1335
Leu Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp
1340 1345 1350
Leu Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn
1355 1360 1365
Phe Ala Gln Asn Arg
1370
<210> 6
<211> 1259
<212> PRT
<213> 牛眼莫拉氏菌(Moraxella bovoculi)
<400> 6
Met Gly Ile His Gly Val Pro Ala Ala Leu Phe Gln Asp Phe Thr His
1 5 10 15
Leu Tyr Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile Gly
20 25 30
Arg Thr Leu Glu His Ile His Ala Lys Asn Phe Leu Ser Gln Asp Glu
35 40 45
Thr Met Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp Tyr
50 55 60
His Arg Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr Lys
65 70 75 80
Leu Ala Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro Lys
85 90 95
Asp Asp Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu Arg
100 105 110
Lys Glu Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr Gly
115 120 125
Tyr Asp Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu Leu
130 135 140
Gly Asp Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser Pro
145 150 155 160
Lys Leu Ala His Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe Thr
165 170 175
Gly Phe His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys His
180 185 190
Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe Ile
195 200 205
Asp Asn Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala Leu
210 215 220
Tyr Asp Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val Ser
225 230 235 240
Leu Ala Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu Gly
245 250 255
Ile Thr Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr Asn
260 265 270
Lys His Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu Arg
275 280 285
Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe Leu
290 295 300
Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn Glu
305 310 315 320
Phe Tyr Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu Phe
325 330 335
Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val Glu His Lys
340 345 350
Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu Leu
355 360 365
Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu Phe
370 375 380
Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys Leu
385 390 395 400
Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala Ser
405 410 415
Leu Glu Gln Ala Ile Glu His His Thr Ala Arg His Asp Asp Glu Ser
420 425 430
Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala Gly
435 440 445
Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn His Ser Thr Ile Lys
450 455 460
Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro Lys
465 470 475 480
Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu Lys
485 490 495
Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu Leu
500 505 510
Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly Glu
515 520 525
Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr Asn
530 535 540
Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys Tyr
545 550 555 560
Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu Asn
565 570 575
Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys Tyr
580 585 590
Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn Ala
595 600 605
Pro Asn Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu Leu
610 615 620
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser Asn
625 630 635 640
Leu Asp Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala Lys
645 650 655
Gly Thr His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His Ala
660 665 670
Leu Ile Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp Gln
675 680 685
His Phe Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu Ser
690 695 700
Asp Phe Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe Val
705 710 715 720
Asp Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly Lys Leu
725 730 735
Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala His Gly
740 745 750
Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu Phe Ser Glu Asp
755 760 765
Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln Ile Phe
770 775 780
Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu Thr Thr Ile His Arg Ala
785 790 795 800
Gly Glu Val Leu Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys Arg Gln
805 810 815
Phe Val Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe
820 825 830
Met Leu His Val Pro Ile Thr Met Asn Phe Gly Val Gln Gly Met Thr
835 840 845
Ile Lys Glu Phe Asn Lys Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp
850 855 860
Glu Val Asn Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr
865 870 875 880
Leu Thr Val Ile Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu
885 890 895
Asn Asp Ile Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro
900 905 910
Tyr His Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg
915 920 925
Val Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr
930 935 940
Leu Ser His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr Asn
945 950 955 960
Ala Ile Val Val Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg
965 970 975
Phe Lys Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn Ala Leu Ile
980 985 990
Lys Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala Asp Asp Glu Ile
995 1000 1005
Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn Asn Phe Thr Asp
1010 1015 1020
Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu Phe Tyr Val Pro
1025 1030 1035
Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr Gly Phe Val Asp
1040 1045 1050
Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln Ser Gln Ala Phe
1055 1060 1065
Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr Asp Lys Gly Tyr
1070 1075 1080
Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr Asp Lys Ala Lys
1085 1090 1095
Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His Gly Asp Lys Arg
1100 1105 1110
Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys Gly Ala Ala Lys
1115 1120 1125
Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu Phe Ala Arg Tyr
1130 1135 1140
His Ile Asn Asp Lys Gln Pro Asn Leu Val Met Asp Ile Cys Gln
1145 1150 1155
Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met Cys Leu Leu Lys
1160 1165 1170
Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser Ser Asp Glu Asp
1175 1180 1185
Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly Val Phe Phe Asn
1190 1195 1200
Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn Ala Asp Ala Asn
1205 1210 1215
Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp Leu Leu Asn Glu
1220 1225 1230
Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys Leu Ala Ile Asp
1235 1240 1245
Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg
1250 1255
<210> 7
<211> 1269
<212> PRT
<213> 牛眼莫拉氏菌(Moraxella bovoculi)
<400> 7
Met Gly Ile His Gly Val Pro Ala Ala Leu Phe Gln Asp Phe Thr His
1 5 10 15
Leu Tyr Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile Gly
20 25 30
Lys Thr Leu Glu His Ile His Ala Lys Asn Phe Leu Asn Gln Asp Glu
35 40 45
Thr Met Ala Asp Met Tyr Gln Lys Val Lys Ala Ile Leu Asp Asp Tyr
50 55 60
His Arg Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr Lys
65 70 75 80
Leu Ala Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro Lys
85 90 95
Asp Asp Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu Arg
100 105 110
Lys Glu Ile Val Lys Pro Ile Gly Asn Gly Gly Lys Tyr Lys Ala Gly
115 120 125
Tyr Asp Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu Leu
130 135 140
Gly Asp Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser Pro
145 150 155 160
Lys Leu Ala His Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe Thr
165 170 175
Gly Phe His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys His
180 185 190
Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe Ile
195 200 205
Asp Asn Leu Gln Ile Leu Ala Thr Ile Lys Gln Lys His Ser Ala Leu
210 215 220
Tyr Asp Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val Ser
225 230 235 240
Leu Ala Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu Gly
245 250 255
Ile Thr Ala Tyr Asn Thr Leu Leu Gly Gly Ile Ser Gly Glu Ala Gly
260 265 270
Ser Arg Lys Ile Gln Gly Ile Asn Glu Leu Ile Asn Ser His His Asn
275 280 285
Gln His Cys His Lys Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His
290 295 300
Lys Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys
305 310 315 320
Phe Ala Asp Asp Ser Glu Val Cys Gln Ala Val Asn Glu Phe Tyr Arg
325 330 335
His Tyr Ala Asp Val Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe
340 345 350
Asp Asp Tyr Gln Lys Asp Gly Ile Tyr Val Glu Tyr Lys Asn Leu Asn
355 360 365
Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val
370 375 380
Leu Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg
385 390 395 400
Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu
405 410 415
Lys Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln
420 425 430
Ala Ile Glu His Tyr Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala
435 440 445
Gly Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn
450 455 460
Pro Ile Gln Lys Ile His Asn Asn His Ser Thr Ile Lys Gly Phe Leu
465 470 475 480
Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser
485 490 495
Asp Lys Ser Pro Glu Ile Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala
500 505 510
Leu Asn Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu
515 520 525
His Asn Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Ala Leu Tyr Asp
530 535 540
Glu Leu Ala Lys Ile Ala Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu
545 550 555 560
Ser Gln Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn
565 570 575
Pro Thr Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe
580 585 590
Gly Val Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp
595 600 605
Lys Ala His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Ser
610 615 620
Val Tyr Gln Lys Met Ile Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
625 630 635 640
Leu Pro Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro
645 650 655
Ser Ala Glu Leu Leu Asp Lys Tyr Ala Gln Gly Thr His Lys Lys Gly
660 665 670
Asp Asn Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys
675 680 685
Ala Gly Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe
690 695 700
Ser Pro Thr Ser Ser Tyr Gln Asp Leu Ser Asp Phe Tyr Arg Glu Val
705 710 715 720
Glu Pro Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr
725 730 735
Ile Asn Glu Leu Val Glu Gln Gly Gln Leu Tyr Leu Phe Gln Ile Tyr
740 745 750
Asn Lys Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr
755 760 765
Leu Tyr Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Val Asn Pro Ile
770 775 780
Tyr Lys Leu Asn Gly Glu Ala Glu Ile Phe Tyr Arg Lys Ala Ser Leu
785 790 795 800
Asp Met Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn
805 810 815
Lys Asn Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile
820 825 830
Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile
835 840 845
Thr Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys
850 855 860
Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly
865 870 875 880
Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser
885 890 895
Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala
900 905 910
Ser Ala Asn Gly Thr Gln Met Thr Thr Pro Tyr His Lys Ile Leu Asp
915 920 925
Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile
930 935 940
Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His
945 950 955 960
Gln Ile Ser Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu
965 970 975
Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln
980 985 990
Ile Tyr Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu
995 1000 1005
Val Leu Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn
1010 1015 1020
Ala Leu Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly
1025 1030 1035
Lys Gln Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser
1040 1045 1050
Lys Ile Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg
1055 1060 1065
Tyr Glu Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp
1070 1075 1080
Lys Ile Cys Tyr Asn Ala Asp Arg Gly Tyr Phe Glu Phe His Ile
1085 1090 1095
Asp Tyr Ala Lys Phe Asn Asp Lys Ala Lys Asn Ser Arg Gln Ile
1100 1105 1110
Trp Lys Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys
1115 1120 1125
Thr Ala Asn Gln Asn Lys Gly Ala Thr Ile Gly Val Asn Val Asn
1130 1135 1140
Asp Glu Leu Lys Ser Leu Phe Thr Arg Tyr His Ile Asn Asp Lys
1145 1150 1155
Gln Pro Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu
1160 1165 1170
Phe His Lys Ser Leu Met Tyr Leu Leu Lys Thr Leu Leu Ala Leu
1175 1180 1185
Arg Tyr Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro
1190 1195 1200
Val Ala Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp
1205 1210 1215
Asp Thr Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile
1220 1225 1230
Ala Leu Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp
1235 1240 1245
Asp Leu Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu
1250 1255 1260
Asn Phe Ala Gln Asn Arg
1265
<210> 8
<211> 1306
<212> PRT
<213> 硫微螺菌属种XS5 (Thiomicrospira sp.XS5)
<400> 8
Met Gly Ile His Gly Val Pro Ala Ala Thr Lys Thr Phe Asp Ser Glu
1 5 10 15
Phe Phe Asn Leu Tyr Ser Leu Gln Lys Thr Val Arg Phe Glu Leu Lys
20 25 30
Pro Val Gly Glu Thr Ala Ser Phe Val Glu Asp Phe Lys Asn Glu Gly
35 40 45
Leu Lys Arg Val Val Ser Glu Asp Glu Arg Arg Ala Val Asp Tyr Gln
50 55 60
Lys Val Lys Glu Ile Ile Asp Asp Tyr His Arg Asp Phe Ile Glu Glu
65 70 75 80
Ser Leu Asn Tyr Phe Pro Glu Gln Val Ser Lys Asp Ala Leu Glu Gln
85 90 95
Ala Phe His Leu Tyr Gln Lys Leu Lys Ala Ala Lys Val Glu Glu Arg
100 105 110
Glu Lys Ala Leu Lys Glu Trp Glu Ala Leu Gln Lys Lys Leu Arg Glu
115 120 125
Lys Val Val Lys Cys Phe Ser Asp Ser Asn Lys Ala Arg Phe Ser Arg
130 135 140
Ile Asp Lys Lys Glu Leu Ile Lys Glu Asp Leu Ile Asn Trp Leu Val
145 150 155 160
Ala Gln Asn Arg Glu Asp Asp Ile Pro Thr Val Glu Thr Phe Asn Asn
165 170 175
Phe Thr Thr Tyr Phe Thr Gly Phe His Glu Asn Arg Lys Asn Ile Tyr
180 185 190
Ser Lys Asp Asp His Ala Thr Ala Ile Ser Phe Arg Leu Ile His Glu
195 200 205
Asn Leu Pro Lys Phe Phe Asp Asn Val Ile Ser Phe Asn Lys Leu Lys
210 215 220
Glu Gly Phe Pro Glu Leu Lys Phe Asp Lys Val Lys Glu Asp Leu Glu
225 230 235 240
Val Asp Tyr Asp Leu Lys His Ala Phe Glu Ile Glu Tyr Phe Val Asn
245 250 255
Phe Val Thr Gln Ala Gly Ile Asp Gln Tyr Asn Tyr Leu Leu Gly Gly
260 265 270
Lys Thr Leu Glu Asp Gly Thr Lys Lys Gln Gly Met Asn Glu Gln Ile
275 280 285
Asn Leu Phe Lys Gln Gln Gln Thr Arg Asp Lys Ala Arg Gln Ile Pro
290 295 300
Lys Leu Ile Pro Leu Phe Lys Gln Ile Leu Ser Glu Arg Thr Glu Ser
305 310 315 320
Gln Ser Phe Ile Pro Lys Gln Phe Glu Ser Asp Gln Glu Leu Phe Asp
325 330 335
Ser Leu Gln Lys Leu His Asn Asn Cys Gln Asp Lys Phe Thr Val Leu
340 345 350
Gln Gln Ala Ile Leu Gly Leu Ala Glu Ala Asp Leu Lys Lys Val Phe
355 360 365
Ile Lys Thr Ser Asp Leu Asn Ala Leu Ser Asn Thr Ile Phe Gly Asn
370 375 380
Tyr Ser Val Phe Ser Asp Ala Leu Asn Leu Tyr Lys Glu Ser Leu Lys
385 390 395 400
Thr Lys Lys Ala Gln Glu Ala Phe Glu Lys Leu Pro Ala His Ser Ile
405 410 415
His Asp Leu Ile Gln Tyr Leu Glu Gln Phe Asn Ser Ser Leu Asp Ala
420 425 430
Glu Lys Gln Gln Ser Thr Asp Thr Val Leu Asn Tyr Phe Ile Lys Thr
435 440 445
Asp Glu Leu Tyr Ser Arg Phe Ile Lys Ser Thr Ser Glu Ala Phe Thr
450 455 460
Gln Val Gln Pro Leu Phe Glu Leu Glu Ala Leu Ser Ser Lys Arg Arg
465 470 475 480
Pro Pro Glu Ser Glu Asp Glu Gly Ala Lys Gly Gln Glu Gly Phe Glu
485 490 495
Gln Ile Lys Arg Ile Lys Ala Tyr Leu Asp Thr Leu Met Glu Ala Val
500 505 510
His Phe Ala Lys Pro Leu Tyr Leu Val Lys Gly Arg Lys Met Ile Glu
515 520 525
Gly Leu Asp Lys Asp Gln Ser Phe Tyr Glu Ala Phe Glu Met Ala Tyr
530 535 540
Gln Glu Leu Glu Ser Leu Ile Ile Pro Ile Tyr Asn Lys Ala Arg Ser
545 550 555 560
Tyr Leu Ser Arg Lys Pro Phe Lys Ala Asp Lys Phe Lys Ile Asn Phe
565 570 575
Asp Asn Asn Thr Leu Leu Ser Gly Trp Asp Ala Asn Lys Glu Thr Ala
580 585 590
Asn Ala Ser Ile Leu Phe Lys Lys Asp Gly Leu Tyr Tyr Leu Gly Ile
595 600 605
Met Pro Lys Gly Lys Thr Phe Leu Phe Asp Tyr Phe Val Ser Ser Glu
610 615 620
Asp Ser Glu Lys Leu Lys Gln Arg Arg Gln Lys Thr Ala Glu Glu Ala
625 630 635 640
Leu Ala Gln Asp Gly Glu Ser Tyr Phe Glu Lys Ile Arg Tyr Lys Leu
645 650 655
Leu Pro Gly Ala Ser Lys Met Leu Pro Lys Val Phe Phe Ser Asn Lys
660 665 670
Asn Ile Gly Phe Tyr Asn Pro Ser Asp Asp Ile Leu Arg Ile Arg Asn
675 680 685
Thr Ala Ser His Thr Lys Asn Gly Thr Pro Gln Lys Gly His Ser Lys
690 695 700
Val Glu Phe Asn Leu Asn Asp Cys His Lys Met Ile Asp Phe Phe Lys
705 710 715 720
Ser Ser Ile Gln Lys His Pro Glu Trp Gly Ser Phe Gly Phe Thr Phe
725 730 735
Ser Asp Thr Ser Asp Phe Glu Asp Met Ser Ala Phe Tyr Arg Glu Val
740 745 750
Glu Asn Gln Gly Tyr Val Ile Ser Phe Asp Lys Ile Lys Glu Thr Tyr
755 760 765
Ile Gln Ser Gln Val Glu Gln Gly Asn Leu Tyr Leu Phe Gln Ile Tyr
770 775 780
Asn Lys Asp Phe Ser Pro Tyr Ser Lys Gly Lys Pro Asn Leu His Thr
785 790 795 800
Leu Tyr Trp Lys Ala Leu Phe Glu Glu Ala Asn Leu Asn Asn Val Val
805 810 815
Ala Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Arg His Ser Ile
820 825 830
Lys Ala Ser Asp Lys Val Val His Pro Ala Asn Gln Ala Ile Asp Asn
835 840 845
Lys Asn Pro His Thr Glu Lys Thr Gln Ser Thr Phe Glu Tyr Asp Leu
850 855 860
Val Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe Phe Phe His Val Pro
865 870 875 880
Ile Ser Leu Asn Phe Lys Ala Gln Gly Val Ser Lys Phe Asn Asp Lys
885 890 895
Val Asn Gly Phe Leu Lys Gly Asn Pro Asp Val Asn Ile Ile Gly Ile
900 905 910
Asp Arg Gly Glu Arg His Leu Leu Tyr Phe Thr Val Val Asn Gln Lys
915 920 925
Gly Glu Ile Leu Val Gln Glu Ser Leu Asn Thr Leu Met Ser Asp Lys
930 935 940
Gly His Val Asn Asp Tyr Gln Gln Lys Leu Asp Lys Lys Glu Gln Glu
945 950 955 960
Arg Asp Ala Ala Arg Lys Ser Trp Thr Thr Val Glu Asn Ile Lys Glu
965 970 975
Leu Lys Glu Gly Tyr Leu Ser His Val Val His Lys Leu Ala His Leu
980 985 990
Ile Ile Lys Tyr Asn Ala Ile Val Cys Leu Glu Asp Leu Asn Phe Gly
995 1000 1005
Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys
1010 1015 1020
Phe Glu Lys Ala Leu Ile Asp Lys Leu Asn Tyr Leu Val Phe Lys
1025 1030 1035
Glu Lys Glu Leu Gly Glu Val Gly His Tyr Leu Thr Ala Tyr Gln
1040 1045 1050
Leu Thr Ala Pro Phe Glu Ser Phe Lys Lys Leu Gly Lys Gln Ser
1055 1060 1065
Gly Ile Leu Phe Tyr Val Pro Ala Asp Tyr Thr Ser Lys Ile Asp
1070 1075 1080
Pro Thr Thr Gly Phe Val Asn Phe Leu Asp Leu Arg Tyr Gln Ser
1085 1090 1095
Val Glu Lys Ala Lys Gln Leu Leu Ser Asp Phe Asn Ala Ile Arg
1100 1105 1110
Phe Asn Ser Val Gln Asn Tyr Phe Glu Phe Glu Ile Asp Tyr Lys
1115 1120 1125
Lys Leu Thr Pro Lys Arg Lys Val Gly Thr Gln Ser Lys Trp Val
1130 1135 1140
Ile Cys Thr Tyr Gly Asp Val Arg Tyr Gln Asn Arg Arg Asn Gln
1145 1150 1155
Lys Gly His Trp Glu Thr Glu Glu Val Asn Val Thr Glu Lys Leu
1160 1165 1170
Lys Ala Leu Phe Ala Ser Asp Ser Lys Thr Thr Thr Val Ile Asp
1175 1180 1185
Tyr Ala Asn Asp Asp Asn Leu Ile Asp Val Ile Leu Glu Gln Asp
1190 1195 1200
Lys Ala Ser Phe Phe Lys Glu Leu Leu Trp Leu Leu Lys Leu Thr
1205 1210 1215
Met Thr Leu Arg His Ser Lys Ile Lys Ser Glu Asp Asp Phe Ile
1220 1225 1230
Leu Ser Pro Val Lys Asn Glu Gln Gly Glu Phe Tyr Asp Ser Arg
1235 1240 1245
Lys Ala Gly Glu Val Trp Pro Lys Asp Ala Asp Ala Asn Gly Ala
1250 1255 1260
Tyr His Ile Ala Leu Lys Gly Leu Trp Asn Leu Gln Gln Ile Asn
1265 1270 1275
Gln Trp Glu Lys Gly Lys Thr Leu Asn Leu Ala Ile Lys Asn Gln
1280 1285 1290
Asp Trp Phe Ser Phe Ile Gln Glu Lys Pro Tyr Gln Glu
1295 1300 1305
<210> 9
<211> 1214
<212> PRT
<213> 丁酸弧菌属种NC3005 (Butyrivibrio sp.NC3005)
<400> 9
Met Gly Ile His Gly Val Pro Ala Ala Tyr Tyr Gln Asn Leu Thr Lys
1 5 10 15
Lys Tyr Pro Val Ser Lys Thr Ile Arg Asn Glu Leu Ile Pro Ile Gly
20 25 30
Lys Thr Leu Glu Asn Ile Arg Lys Asn Asn Ile Leu Glu Ser Asp Val
35 40 45
Lys Arg Lys Gln Asp Tyr Glu His Val Lys Gly Ile Met Asp Glu Tyr
50 55 60
His Lys Gln Leu Ile Asn Glu Ala Leu Asp Asn Tyr Met Leu Pro Ser
65 70 75 80
Leu Asn Gln Ala Ala Glu Ile Tyr Leu Lys Lys His Val Asp Val Glu
85 90 95
Asp Arg Glu Glu Phe Lys Lys Thr Gln Asp Leu Leu Arg Arg Glu Val
100 105 110
Thr Gly Arg Leu Lys Glu His Glu Asn Tyr Thr Lys Ile Gly Lys Lys
115 120 125
Asp Ile Leu Asp Leu Leu Glu Lys Leu Pro Ser Ile Ser Glu Glu Asp
130 135 140
Tyr Asn Ala Leu Glu Ser Phe Arg Asn Phe Tyr Thr Tyr Phe Thr Ser
145 150 155 160
Tyr Asn Lys Val Arg Glu Asn Leu Tyr Ser Asp Glu Glu Lys Ser Ser
165 170 175
Thr Val Ala Tyr Arg Leu Ile Asn Glu Asn Leu Pro Lys Phe Leu Asp
180 185 190
Asn Ile Lys Ser Tyr Ala Phe Val Lys Ala Ala Gly Val Leu Ala Asp
195 200 205
Cys Ile Glu Glu Glu Glu Gln Asp Ala Leu Phe Met Val Glu Thr Phe
210 215 220
Asn Met Thr Leu Thr Gln Glu Gly Ile Asp Met Tyr Asn Tyr Gln Ile
225 230 235 240
Gly Lys Val Asn Ser Ala Ile Asn Leu Tyr Asn Gln Lys Asn His Lys
245 250 255
Val Glu Glu Phe Lys Lys Ile Pro Lys Met Lys Val Leu Tyr Lys Gln
260 265 270
Ile Leu Ser Asp Arg Glu Glu Val Phe Ile Gly Glu Phe Lys Asp Asp
275 280 285
Glu Thr Leu Leu Ser Ser Ile Gly Ala Tyr Gly Asn Val Leu Met Thr
290 295 300
Tyr Leu Lys Ser Glu Lys Ile Asn Ile Phe Phe Asp Ala Leu Arg Glu
305 310 315 320
Ser Glu Gly Lys Asn Val Tyr Val Lys Asn Asp Leu Ser Lys Thr Thr
325 330 335
Met Ser Asn Ile Val Phe Gly Ser Trp Ser Ala Phe Asp Glu Leu Leu
340 345 350
Asn Gln Glu Tyr Asp Leu Ala Asn Glu Asn Lys Lys Lys Asp Asp Lys
355 360 365
Tyr Phe Glu Lys Arg Gln Lys Glu Leu Lys Lys Asn Lys Ser Tyr Thr
370 375 380
Leu Glu Gln Met Ser Asn Leu Ser Lys Glu Asp Ile Ser Pro Ile Glu
385 390 395 400
Asn Tyr Ile Glu Arg Ile Ser Glu Asp Ile Glu Lys Ile Cys Ile Tyr
405 410 415
Asn Gly Glu Phe Glu Lys Ile Val Val Asn Glu His Asp Ser Ser Arg
420 425 430
Lys Leu Ser Lys Asn Ile Lys Ala Val Lys Val Ile Lys Asp Tyr Leu
435 440 445
Asp Ser Ile Lys Glu Leu Glu His Asp Ile Lys Leu Ile Asn Gly Ser
450 455 460
Gly Gln Glu Leu Glu Lys Asn Leu Val Val Tyr Val Gly Gln Glu Glu
465 470 475 480
Ala Leu Glu Gln Leu Arg Pro Val Asp Ser Leu Tyr Asn Leu Thr Arg
485 490 495
Asn Tyr Leu Thr Lys Lys Pro Phe Ser Thr Glu Lys Val Lys Leu Asn
500 505 510
Phe Asn Lys Ser Thr Leu Leu Asn Gly Trp Asp Lys Asn Lys Glu Thr
515 520 525
Asp Asn Leu Gly Ile Leu Phe Phe Lys Asp Gly Lys Tyr Tyr Leu Gly
530 535 540
Ile Met Asn Thr Thr Ala Asn Lys Ala Phe Val Asn Pro Pro Ala Ala
545 550 555 560
Lys Thr Glu Asn Val Phe Lys Lys Val Asp Tyr Lys Leu Leu Pro Gly
565 570 575
Ser Asn Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser Asn Ile Gly
580 585 590
Tyr Tyr Asn Pro Ser Thr Glu Leu Tyr Ser Asn Tyr Lys Lys Gly Thr
595 600 605
His Lys Lys Gly Pro Ser Phe Ser Ile Asp Asp Cys His Asn Leu Ile
610 615 620
Asp Phe Phe Lys Glu Ser Ile Lys Lys His Glu Asp Trp Ser Lys Phe
625 630 635 640
Gly Phe Glu Phe Ser Asp Thr Ala Asp Tyr Arg Asp Ile Ser Glu Phe
645 650 655
Tyr Arg Glu Val Glu Lys Gln Gly Tyr Lys Leu Thr Phe Thr Asp Ile
660 665 670
Asp Glu Ser Tyr Ile Asn Asp Leu Ile Glu Lys Asn Glu Leu Tyr Leu
675 680 685
Phe Gln Ile Tyr Asn Lys Asp Phe Ser Glu Tyr Ser Lys Gly Lys Leu
690 695 700
Asn Leu His Thr Leu Tyr Phe Met Met Leu Phe Asp Gln Arg Asn Leu
705 710 715 720
Asp Asn Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Val Phe Tyr Arg
725 730 735
Pro Ala Ser Ile Ala Glu Asn Glu Leu Val Ile His Lys Ala Gly Glu
740 745 750
Gly Ile Lys Asn Lys Asn Pro Asn Arg Ala Lys Val Lys Glu Thr Ser
755 760 765
Thr Phe Ser Tyr Asp Ile Val Lys Asp Lys Arg Tyr Ser Lys Tyr Lys
770 775 780
Phe Thr Leu His Ile Pro Ile Thr Met Asn Phe Gly Val Asp Glu Val
785 790 795 800
Arg Arg Phe Asn Asp Val Ile Asn Asn Ala Leu Arg Thr Asp Asp Asn
805 810 815
Val Asn Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Val
820 825 830
Val Val Ile Asn Ser Glu Gly Lys Ile Leu Glu Gln Ile Ser Leu Asn
835 840 845
Ser Ile Ile Asn Lys Glu Tyr Asp Ile Glu Thr Asn Tyr His Ala Leu
850 855 860
Leu Asp Glu Arg Glu Asp Asp Arg Asn Lys Ala Arg Lys Asp Trp Asn
865 870 875 880
Thr Ile Glu Asn Ile Lys Glu Leu Lys Thr Gly Tyr Leu Ser Gln Val
885 890 895
Val Asn Val Val Ala Lys Leu Val Leu Lys Tyr Asn Ala Ile Ile Cys
900 905 910
Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Gln Lys Val Glu
915 920 925
Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Glu Lys Leu Asn
930 935 940
Tyr Leu Val Ile Asp Lys Ser Arg Glu Gln Val Ser Pro Glu Lys Met
945 950 955 960
Gly Gly Ala Leu Asn Ala Leu Gln Leu Thr Ser Lys Phe Lys Ser Phe
965 970 975
Ala Glu Leu Gly Lys Gln Ser Gly Ile Ile Tyr Tyr Val Pro Ala Tyr
980 985 990
Leu Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Leu Phe Tyr
995 1000 1005
Ile Lys Tyr Glu Asn Ile Glu Lys Ala Lys Gln Phe Phe Asp Gly
1010 1015 1020
Phe Asp Phe Ile Arg Phe Asn Lys Lys Asp Asp Met Phe Glu Phe
1025 1030 1035
Ser Phe Asp Tyr Lys Ser Phe Thr Gln Lys Ala Cys Gly Ile Arg
1040 1045 1050
Ser Lys Trp Ile Val Tyr Thr Asn Gly Glu Arg Ile Ile Lys Tyr
1055 1060 1065
Pro Asn Pro Glu Lys Asn Asn Leu Phe Asp Glu Lys Val Ile Asn
1070 1075 1080
Val Thr Asp Glu Ile Lys Gly Leu Phe Lys Gln Tyr Arg Ile Pro
1085 1090 1095
Tyr Glu Asn Gly Glu Asp Ile Lys Glu Ile Ile Ile Ser Lys Ala
1100 1105 1110
Glu Ala Asp Phe Tyr Lys Arg Leu Phe Arg Leu Leu His Gln Thr
1115 1120 1125
Leu Gln Met Arg Asn Ser Thr Ser Asp Gly Thr Arg Asp Tyr Ile
1130 1135 1140
Ile Ser Pro Val Lys Asn Asp Arg Gly Glu Phe Phe Cys Ser Glu
1145 1150 1155
Phe Ser Glu Gly Thr Met Pro Lys Asp Ala Asp Ala Asn Gly Ala
1160 1165 1170
Tyr Asn Ile Ala Arg Lys Gly Leu Trp Val Leu Glu Gln Ile Arg
1175 1180 1185
Gln Lys Asp Glu Gly Glu Lys Val Asn Leu Ser Met Thr Asn Ala
1190 1195 1200
Glu Trp Leu Lys Tyr Ala Gln Leu His Leu Leu
1205 1210
<210> 10
<211> 1129
<212> PRT
<213> 未知(Unknown)
<220>
<223> 合成序列
<400> 10
Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240
Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415
Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445
Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460
Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685
Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700
Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720
Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735
Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750
Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765
Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780
Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800
Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815
Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 11
<211> 20
<212> RNA
<213> 未知(Unknown)
<220>
<223> 毛螺菌科细菌
<400> 11
aauuucuacu aaguguagau 20
<210> 12
<211> 19
<212> RNA
<213> 氨基酸球菌属种BV3L6 (Acidaminococcus sp.BV3L6)
<400> 12
aauuucuacu cuuguagau 19
<210> 13
<211> 19
<212> RNA
<213> 新凶手弗朗西斯菌(Francisella novicida)
<400> 13
aauuucuacu guuguagau 19
<210> 14
<211> 19
<212> RNA
<213> 猕猴卟啉单胞菌(Porphyromonas macacae)
<400> 14
aauuucuacu auuguagau 19
<210> 15
<211> 20
<212> RNA
<213> 牛眼莫拉氏菌(Moraxella bovoculi)
<400> 15
aauuucuacu guuuguagau 20
<210> 16
<211> 19
<212> RNA
<213> 硫微螺菌属种XS5 (Thiomicrospira sp.XS5)
<400> 16
aauuucuacu guuguagau 19
<210> 17
<211> 19
<212> RNA
<213> 丁酸弧菌属种NC3005 (Btyrivibrio sp.NC3005)
<400> 17
aauuucuacu auuguagau 19
<210> 18
<211> 10
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 18
aaaaaaaaaa 10
<210> 19
<211> 91
<212> RNA
<213> 未知(Unknown)
<220>
<223> 合成序列
<400> 19
gucuagagga cagaauuuuu caacgggugu gccaauggcc acuuuccagg uggcaaagcc 60
cguugagcuu cucaaaucug agaaguggca c 91
<210> 20
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 20
uaauuucuac uaaguguaga ucgucgccgu ccagcucgac c 41
<210> 21
<211> 45
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 21
uaauuucuac uaaguguaga ucaacgucgu gacugggaaa acccu 45
<210> 22
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 22
uaauuucuac uaaguguaga uaacgaacca ccagcagaag a 41
<210> 23
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 23
uaauuucuac uaaguguaga ugaucguuac gcuaacuaug a 41
<210> 24
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 24
uaauuucuac uaaguguaga uccugggugu uccacagcug a 41
<210> 25
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 25
uaauuucuac uaaguguaga ucuacauuac aggcuaacaa a 41
<210> 26
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 26
uaauuucuac uaaguguaga uguacauugc aagauacuaa a 41
<210> 27
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 27
uaauuucuac uaaguguaga uugaaguaga uauggcagca c 41
<210> 28
<211> 41
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 28
uaauuucuac uaaguguaga uacaauaugu gcuucuacac a 41
<210> 29
<211> 40
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 29
uaauuucuac ucuuguagau gaucguuacg cuaacuauga 40
<210> 30
<211> 40
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 30
uaauuucuac uguuguagau gaucguuacg cuaacuauga 40
<210> 31
<211> 111
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 31
gucuagagga cagaauuuuu caacgggugu gccaauggcc acuuuccagg uggcaaagcc 60
cguugagcuu cucaaaucug agaaguggca cgaucguuac gcuaacuaug a 111
<210> 32
<211> 116
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 32
cgucgccguc cagcucgacc guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 33
<211> 116
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 33
aacgaaccac cagcagaaga guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 34
<211> 116
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 34
gaucguuacg cuaacuauga guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 35
<211> 135
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 35
gaucguuacg cuaacuauga guuguagcuc ccuuucucau uucgcagugc gaaagcacug 60
cgaaaugaga accguugcua caauaaggcc gucugaaaag augugccgca acgcucugcc 120
ccuuaaagcu ucugc 135
<210> 36
<211> 139
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 36
gaucguuacg cuaacuauga guuuuagucc cuuuuuaaau uucuuuaugg uaaaauuaua 60
aucucauaag aaauuuaaaa agggacuaaa auaaagaguu ugcgggacuc ugcgggguua 120
caauccccua aaaccgcuu 139
<210> 37
<211> 55
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 37
gccggggugg ugcccauccu ggucgagcug gacggcgacg uaaacggcca caagc 55
<210> 38
<211> 55
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 38
uagcauucca cagacagccc ucauaguuag cguaacgauc uaaaguuuug ucguc 55
<210> 39
<211> 58
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 39
agcttgtctg ccatggacat gcagactata ctgttattgt tgtacagacc gaattccc 58
<210> 40
<211> 58
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 40
gggaattcgg tctgtacaac aataacagta tagtctgcat gtccatggca gacaagct 58
<210> 41
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 41
gcttgtggcc gtttacgtcg ccgtccagct cgaccaggat gggcaccacc ccggc 55
<210> 42
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 42
gccggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagc 55
<210> 43
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 43
gcttgtggcc gtttacgtcg ccgtccagct cgaggaggat gggcaccacc ccggc 55
<210> 44
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 44
gccggggtgg tgcccatcct cctcgagctg gacggcgacg taaacggcca caagc 55
<210> 45
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 45
gcttgtggcc gtttacgtcg ccgtccagct cctccaggat gggcaccacc ccggc 55
<210> 46
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 46
gccggggtgg tgcccatcct ggaggagctg gacggcgacg taaacggcca caagc 55
<210> 47
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 47
gcttgtggcc gtttacgtcg ccgtccagca ggaccaggat gggcaccacc ccggc 55
<210> 48
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 48
gccggggtgg tgcccatcct ggtcctgctg gacggcgacg taaacggcca caagc 55
<210> 49
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 49
gcttgtggcc gtttacgtcg ccgtccacgt cgaccaggat gggcaccacc ccggc 55
<210> 50
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 50
gccggggtgg tgcccatcct ggtcgacgtg gacggcgacg taaacggcca caagc 55
<210> 51
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 51
gcttgtggcc gtttacgtcg ccgtcgtgct cgaccaggat gggcaccacc ccggc 55
<210> 52
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 52
gccggggtgg tgcccatcct ggtcgagcac gacggcgacg taaacggcca caagc 55
<210> 53
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 53
gcttgtggcc gtttacgtcg ccgagcagct cgaccaggat gggcaccacc ccggc 55
<210> 54
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 54
gccggggtgg tgcccatcct ggtcgagctg ctcggcgacg taaacggcca caagc 55
<210> 55
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 55
gcttgtggcc gtttacgtcg cgctccagct cgaccaggat gggcaccacc ccggc 55
<210> 56
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 56
gccggggtgg tgcccatcct ggtcgagctg gagcgcgacg taaacggcca caagc 55
<210> 57
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 57
gcttgtggcc gtttacgtcc gcgtccagct cgaccaggat gggcaccacc ccggc 55
<210> 58
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 58
gccggggtgg tgcccatcct ggtcgagctg gacgcggacg taaacggcca caagc 55
<210> 59
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 59
gcttgtggcc gtttacgagg ccgtccagct cgaccaggat gggcaccacc ccggc 55
<210> 60
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 60
gccggggtgg tgcccatcct ggtcgagctg gacggcctcg taaacggcca caagc 55
<210> 61
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 61
gcttgtggcc gtttagctcg ccgtccagct cgaccaggat gggcaccacc ccggc 55
<210> 62
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 62
gccggggtgg tgcccatcct ggtcgagctg gacggcgagc taaacggcca caagc 55
<210> 63
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 63
gcttgtggcc gagcacgtcg ccgtccagct cgaccaggat gggcaccacc ccggc 55
<210> 64
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 64
gccggggtgg tgcccatcct ggtcgagctg gacggcgacg tgctcggcca caagc 55
<210> 65
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 65
cgacgtaaac ggccacaagc 20
<210> 66
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 66
gacggcgacg taaacggcca caagc 25
<210> 67
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 67
agctggacgg cgacgtaaac ggccacaagc 30
<210> 68
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 68
ggtcgagctg gacggcgacg taaacggcca caagc 35
<210> 69
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 69
atcctggtcg agctggacgg cgacgtaaac ggccacaagc 40
<210> 70
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 70
gcttgtggcc gtttacgtcg 20
<210> 71
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 71
gcttgtggcc gtttacgtcg ccgtc 25
<210> 72
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 72
gcttgtggcc gtttacgtcg ccgtccagct 30
<210> 73
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 73
gcttgtggcc gtttacgtcg ccgtccagct cgacc 35
<210> 74
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 74
gcttgtggcc gtttacgtcg ccgtccagct cgaccaggat 40
<210> 75
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 75
gacgacaaaa ctttagatcg ttacgctaac tatgagggct gtctgtggaa tgcta 55
<210> 76
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 76
tagcattcca cagacagccc tcatagttag cgtaacgatc taaagttttg tcgtc 55
<210> 77
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 77
gacgacaaaa ctttagatcg ttacgctaac tatctgggct gtctgtggaa tgcta 55
<210> 78
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 78
tagcattcca cagacagccc agatagttag cgtaacgatc taaagttttg tcgtc 55
<210> 79
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 79
gacgacaaaa ctttagatcg ttacgctaac ttagagggct gtctgtggaa tgcta 55
<210> 80
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 80
tagcattcca cagacagccc tctaagttag cgtaacgatc taaagttttg tcgtc 55
<210> 81
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 81
gacgacaaaa ctttagatcg ttacgctaag aatgagggct gtctgtggaa tgcta 55
<210> 82
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 82
tagcattcca cagacagccc tcattcttag cgtaacgatc taaagttttg tcgtc 55
<210> 83
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 83
gacgacaaaa ctttagatcg ttacgctttc tatgagggct gtctgtggaa tgcta 55
<210> 84
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 84
tagcattcca cagacagccc tcatagaaag cgtaacgatc taaagttttg tcgtc 55
<210> 85
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 85
gacgacaaaa ctttagatcg ttacggaaac tatgagggct gtctgtggaa tgcta 55
<210> 86
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 86
tagcattcca cagacagccc tcatagtttc cgtaacgatc taaagttttg tcgtc 55
<210> 87
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 87
gacgacaaaa ctttagatcg ttagcctaac tatgagggct gtctgtggaa tgcta 55
<210> 88
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 88
tagcattcca cagacagccc tcatagttag gctaacgatc taaagttttg tcgtc 55
<210> 89
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 89
gacgacaaaa ctttagatcg tatcgctaac tatgagggct gtctgtggaa tgcta 55
<210> 90
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 90
tagcattcca cagacagccc tcatagttag cgatacgatc taaagttttg tcgtc 55
<210> 91
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 91
gacgacaaaa ctttagatcc atacgctaac tatgagggct gtctgtggaa tgcta 55
<210> 92
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 92
tagcattcca cagacagccc tcatagttag cgtatggatc taaagttttg tcgtc 55
<210> 93
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 93
gacgacaaaa ctttagaagg ttacgctaac tatgagggct gtctgtggaa tgcta 55
<210> 94
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 94
tagcattcca cagacagccc tcatagttag cgtaaccttc taaagttttg tcgtc 55
<210> 95
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 95
gacgacaaaa ctttacttcg ttacgctaac tatgagggct gtctgtggaa tgcta 55
<210> 96
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 96
tagcattcca cagacagccc tcatagttag cgtaacgaag taaagttttg tcgtc 55
<210> 97
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 97
gacgacaaaa cagcagatcg ttacgctaac tatgagggct gtctgtggaa tgcta 55
<210> 98
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 98
tagcattcca cagacagccc tcatagttag cgtaacgatc tgctgttttg tcgtc 55
<210> 99
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 99
gacgacaaaa ctttagatcg ttacgctaac tatgagggcg agttgtggaa tgcta 55
<210> 100
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 100
tagcattcca caactcgccc tcatagttag cgtaacgatc taaagttttg tcgtc 55
<210> 101
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 101
gacgacaaaa ctttagatcg ttacgctaac tatgagggcc aaatgtggaa tgcta 55
<210> 102
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 102
tagcattcca catttggccc tcatagttag cgtaacgatc taaagttttg tcgtc 55
<210> 103
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 103
agttgtgtta gtttacctgg gtgttccaca gctgatagtg attgccttga ataaa 55
<210> 104
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 104
tttattcaag gcaatcacta tcagctgtgg aacacccagg taaactaaca caact 55
<210> 105
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 105
agttgtgtta gtttacctgg gtgttccaca gctcttagtg attgccttga ataaa 55
<210> 106
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 106
tttattcaag gcaatcacta agagctgtgg aacacccagg taaactaaca caact 55
<210> 107
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 107
agttgtgtta gtttacctgg gtgttccaca ggagatagtg attgccttga ataaa 55
<210> 108
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 108
tttattcaag gcaatcacta tctcctgtgg aacacccagg taaactaaca caact 55
<210> 109
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 109
agttgtgtta gtttacctgg gtgttccact cctgatagtg attgccttga ataaa 55
<210> 110
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 110
tttattcaag gcaatcacta tcaggagtgg aacacccagg taaactaaca caact 55
<210> 111
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 111
agttgtgtta gtttacctgg gtgttcctga gctgatagtg attgccttga ataaa 55
<210> 112
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 112
tttattcaag gcaatcacta tcagctcagg aacacccagg taaactaaca caact 55
<210> 113
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 113
agttgtgtta gtttacctgg gtgttggaca gctgatagtg attgccttga ataaa 55
<210> 114
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 114
tttattcaag gcaatcacta tcagctgtcc aacacccagg taaactaaca caact 55
<210> 115
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 115
agttgtgtta gtttacctgg gtgaaccaca gctgatagtg attgccttga ataaa 55
<210> 116
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 116
tttattcaag gcaatcacta tcagctgtgg ttcacccagg taaactaaca caact 55
<210> 117
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 117
agttgtgtta gtttacctgg gacttccaca gctgatagtg attgccttga ataaa 55
<210> 118
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 118
tttattcaag gcaatcacta tcagctgtgg aagtcccagg taaactaaca caact 55
<210> 119
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 119
agttgtgtta gtttacctgc ctgttccaca gctgatagtg attgccttga ataaa 55
<210> 120
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 120
tttattcaag gcaatcacta tcagctgtgg aacaggcagg taaactaaca caact 55
<210> 121
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 121
agttgtgtta gtttaccacg gtgttccaca gctgatagtg attgccttga ataaa 55
<210> 122
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 122
tttattcaag gcaatcacta tcagctgtgg aacaccgtgg taaactaaca caact 55
<210> 123
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 123
agttgtgtta gtttaggtgg gtgttccaca gctgatagtg attgccttga ataaa 55
<210> 124
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 124
tttattcaag gcaatcacta tcagctgtgg aacacccacc taaactaaca caact 55
<210> 125
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 125
agttgtgtta gagcacctgg gtgttccaca gctgatagtg attgccttga ataaa 55
<210> 126
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 126
tttattcaag gcaatcacta tcagctgtgg aacacccagg tgctctaaca caact 55
<210> 127
<211> 23
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 127
gcaaaccacc tataggggaa cac 23
<210> 128
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 128
cagccaactc agcttccttt c 21
<210> 129
<211> 23
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 129
catgccgcca cgtctaatgt ttc 23
<210> 130
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 130
ggtgaagcac gcatacctgt g 21
<210> 131
<211> 31
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 131
ttgttggggt aaccaactat ttgttactgt t 31
<210> 132
<211> 29
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 132
cctccccatg tctgaggtac tccttaaag 29
<210> 133
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 133
gcataatcaa ttatttgtta ctgtggtaga taccact 37
<210> 134
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 134
gctatactgc ttaaatttgg tagcatcata ttgc 34
<210> 135
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 135
Ala Ala Ala Ala
1
<210> 136
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 136
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 137
<211> 16
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 137
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 138
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 138
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 139
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 139
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 140
<211> 38
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 140
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 141
<211> 42
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 141
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 142
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 142
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 143
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 143
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 144
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 144
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 145
<211> 12
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 145
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 146
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 146
Asp Arg Leu Arg Arg
1 5
<210> 147
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 147
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 148
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 148
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 149
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 149
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 150
<211> 20
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 150
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 151
<211> 17
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 151
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 152
<211> 17
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 152
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 153
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 153
caaagagaag cctcggcc 18
<210> 154
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 154
gtgttaatac aaaggtacag gaacaaagaa tttg 34
<210> 155
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 155
gtaatttcta ctaagtgtag atagcattaa gtgtcaagtt ct 42
<210> 156
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 156
gtaatttcta ctaagtgtag atagcattaa atgtcaagtt ct 42
<210> 157
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 157
gtaatttcta ctaagtgtag atactagtcc cttgtactga ta 42
<210> 158
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 158
gtaatttcta ctaagtgtag atgcattctg ggattctcta ga 42
<210> 159
<211> 28
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 159
ctatctgaat gaattgattt ggggcttg 28
<210> 160
<211> 26
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 160
gcaatgtcaa aatcgccatt ttaagc 26
<210> 161
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 161
aggcaacgtc caggatagag tg 22
<210> 162
<211> 28
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 162
cagtaagcat tttccactgg tatcccag 28
<210> 163
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 163
actggctttg gtgctatgga ctttactaca ttacaggcta acaaaagtga 50
<210> 164
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 164
actggatatg gtgccatgga ctttagtaca ttgcaagata ctaaatgtga 50
<210> 165
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 165
tttactacat tacaggctaa caaa 24
<210> 166
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 166
tttagtacat tgcaagatac taaa 24
<210> 167
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 167
tttacgtacg ccgtccagct cgacc 25
<210> 168
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 168
aaatgcagcg gcaggtcgag ctgg 24
<210> 169
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 169
tttagatcgt tacgctaact atga 24
<210> 170
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 170
aaatctagca atgcgattga tact 24
<210> 171
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 171
tttatcttct gctggtggtt cgtt 24
<210> 172
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 172
aaatagaaga cgaccaccaa gcaa 24
<210> 173
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 173
aatatgtcat tatgtgctgc catatctact tcagaaact 39
<210> 174
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 174
aatttaacaa tatgtgcttc tacacagtct cctgtacct 39
<210> 175
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 175
tttgagcatt aagtgtcaag ttct 24
<210> 176
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 176
tttgagcatt aaatgtcaag ttct 24
<210> 177
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 177
taaacggcca caagc 15
<210> 178
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 178
gcttgtggcc gttta 15
<210> 179
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> Misc_feature
<222> (5)..(24)
<223> n是A、G、C或T
<400> 179
tttannnnnn nnnnnnnnnn nnnn 24

Claims (54)

1.一种检测样品中的靶DNA的方法,所述方法包括:
(a)使所述样品与以下物质接触:
(i)V型CRISPR/Cas效应蛋白;
(ii)指导RNA,所述指导RNA包含:与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列;和
(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及
(b)测量由所述V型CRISPR/Cas效应蛋白切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
2.如权利要求1所述的方法,其包括使所述样品与前体指导RNA阵列接触,其中所述V型CRISPR/Cas效应蛋白切割所述前体指导RNA阵列以产生所述指导RNA和至少一个另外的指导RNA。
3.如权利要求1或权利要求2所述的方法,其中所述靶DNA是单链的。
4.如权利要求1或权利要求2所述的方法,其中所述靶DNA是双链的。
5.如权利要求1-4中任一项所述的方法,其中所述靶DNA是病毒DNA。
6.如权利要求1-4中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
7.如权利要求1-4中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12蛋白。
8.如权利要求1-6中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12a(Cpf1)或Cas12b(C2c1)蛋白。
9.如权利要求1-6中任一项所述的方法,其中所述V型CRISPR/Cas效应蛋白是Cas12d(CasY)或Cas12e(CasX)蛋白。
10.根据权利要求1-9中任一项所述的方法,其中所述样品包含来自细胞裂解液的DNA分子。
11.根据权利要求1-10中任一项所述的方法,其中所述样品包含细胞。
12.根据权利要求1-11中任一项所述的方法,其中所述接触在体外、离体或体内的细胞内部进行。
13.根据权利要求12所述的方法,其中所述细胞是真核细胞。
14.根据权利要求1-13中任一项所述的方法,其中所述靶DNA能够以低至200fM的浓度被检测到。
15.根据权利要求1-14中任一项所述的方法,其包括确定所述样品中存在的所述靶DNA的量。
16.根据权利要求15所述的方法,其中所述确定包括:
测量所述可检测信号以生成测试测量值;
测量由参考样品或细胞产生的可检测信号以生成参考测量值;以及
将所述测试测量值与所述参考测量值进行比较,以确定所述样品中存在的靶DNA的量。
17.根据权利要求1-16中任一项所述的方法,其中测量可检测信号包括以下一项或多项:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
18.根据权利要求1-17中任一项所述的方法,其中所述单链检测剂DNA包含荧光发射染料对。
19.根据权利要求18所述的方法,其中在所述单链检测剂DNA被切割之前所述荧光发射染料对产生一定量的可检测信号,并且在所述单链检测剂DNA被切割之后所述可检测信号的量减少。
20.根据权利要求18所述的方法,其中所述单链检测剂DNA在被切割之前产生第一可检测信号,并且在所述单链检测剂DNA被切割之后产生第二可检测信号。
21.根据权利要求18-20中任一项所述的方法,其中所述荧光发射染料对是荧光共振能量转移(FRET)对。
22.根据权利要求18所述的方法,其中在所述单链检测剂DNA被切割之后,可检测信号的量增加。
23.根据权利要求18或权利要求22所述的方法,其中所述荧光发射染料对是猝灭剂/荧光剂对。
24.根据权利要求18-23中任一项所述的方法,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
25.根据权利要求24所述的方法,其中所述两个或更多个荧光发射染料对包括荧光共振能量转移(FRET)对和猝灭剂/荧光剂对。
26.根据权利要求1-25中任一项所述的方法,其中所述单链检测剂DNA包含修饰的核碱基、修饰的糖部分和/或修饰的核酸键联。
27.根据权利要求1-26中任一项所述的方法,其中所述方法包括扩增所述样品中的核酸。
28.根据权利要求27所述的方法,其中所述扩增包括等温扩增。
29.根据权利要求28所述的方法,其中所述等温扩增包括重组酶聚合酶扩增(RPA)。
30.根据权利要求27-29中任一项所述的方法,其中所述扩增在所述步骤(a)的接触之前开始。
31.根据权利要求27-29中任一项所述的方法,其中所述扩增与所述步骤(a)的接触一起开始。
32.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:
(a)指导RNA,或编码所述指导RNA的核酸,或包含所述指导RNA的前体指导RNA阵列,或编码所述前体指导RNA阵列的核酸;其中所述指导RNA包含:与V型CRISPR/Cas效应蛋白结合的区域和与靶DNA互补的指导序列;和
(b)为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
33.如权利要求32所述的试剂盒,其还包含V型CRISPR/Cas效应蛋白。
34.如权利要求33所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12蛋白。
35.如权利要求33所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12a(Cpf1)或Cas12b(C2c1)蛋白。
36.如权利要求33所述的试剂盒,其中所述V型CRISPR/Cas效应蛋白是Cas12d(CasY)或Cas12e(CasX)蛋白。
37.如权利要求32-36中任一项所述的试剂盒,其中所述单链检测剂DNA包含荧光发射染料对。
38.如权利要求37所述的试剂盒,其中所述荧光发射染料对是FRET对。
39.如权利要求37所述的试剂盒,其中所述荧光发射染料对是猝灭剂/荧光剂对。
40.如权利要求37-39中任一项所述的试剂盒,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
41.如权利要求40所述的试剂盒,其中所述两个或更多个荧光发射染料对包括产生第一可检测信号的第一荧光发射染料对和产生第二可检测信号的第二荧光发射染料对。
42.如权利要求32-41中任一项所述的试剂盒,其还包含核酸扩增组分。
43.如权利要求42所述的试剂盒,其中所述核酸扩增组分是用于重组酶聚合酶扩增(RPA)的组分。
44.一种切割单链DNA(ssDNA)的方法,所述方法包括:
使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:
(i)V型CRISPR/Cas效应蛋白;和
(ii)指导RNA,所述指导RNA包含:与所述V型CRISPR/Cas效应蛋白结合的区域和与所述靶DNA杂交的指导序列,
其中所述V型CRISPR/Cas效应蛋白切割所述多个非靶ssDNA。
45.如权利要求44所述的方法,其包括使所述样品与前体指导RNA阵列接触,其中所述V型CRISPR/Cas效应蛋白切割所述前体指导RNA阵列以产生所述指导RNA和至少一个另外的指导RNA。
46.如权利要求44或权利要求45所述的方法,其中所述接触是在体外、离体或体内的细胞内部。
47.如权利要求46所述的方法,其中所述细胞是真核细胞。
48.如权利要求47所述的方法,其中所述真核细胞是植物细胞。
49.如权利要求46-48中任一项所述的方法,其中所述非靶ssDNA对于所述细胞是外源的。
50.如权利要求49所述的方法,其中所述非靶ssDNA是病毒DNA。
51.如权利要求44-50中任一项所述的方法,其中所述靶DNA是单链的。
52.如权利要求44-50中任一项所述的方法,其中所述靶DNA是双链的。
53.如权利要求44-52中任一项所述的方法,其中所述靶DNA是病毒DNA。
54.如权利要求44-52中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
CN201880087246.3A 2017-11-22 2018-11-20 用于切割ssdna以及检测靶dna的v型crispr/cas效应蛋白 Pending CN111630163A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762590106P 2017-11-22 2017-11-22
US62/590,106 2017-11-22
US201862626593P 2018-02-05 2018-02-05
US62/626,593 2018-02-05
US15/897,089 US10253365B1 (en) 2017-11-22 2018-02-14 Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
US15/897,089 2018-02-14
PCT/US2018/062052 WO2019104058A1 (en) 2017-11-22 2018-11-20 Type v crispr/cas effector proteins for cleaving ssdnas and detecting target dnas

Publications (1)

Publication Number Publication Date
CN111630163A true CN111630163A (zh) 2020-09-04

Family

ID=65998096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880087246.3A Pending CN111630163A (zh) 2017-11-22 2018-11-20 用于切割ssdna以及检测靶dna的v型crispr/cas效应蛋白

Country Status (10)

Country Link
US (5) US10253365B1 (zh)
EP (1) EP3714050A4 (zh)
JP (1) JP7316275B2 (zh)
KR (1) KR20200103638A (zh)
CN (1) CN111630163A (zh)
AU (1) AU2018373026A1 (zh)
CA (1) CA3081937A1 (zh)
IL (1) IL274275A (zh)
SG (1) SG11202003870PA (zh)
WO (1) WO2019104058A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112980929A (zh) * 2021-04-13 2021-06-18 广州海思医疗科技有限公司 一种快速检测hla-b*1502的试剂盒
CN113293198A (zh) * 2020-09-18 2021-08-24 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
CN113552103A (zh) * 2021-07-20 2021-10-26 济南大学 一种基于CRISPR-Cas系统的检测外泌体的荧光生物传感器
CN113667718A (zh) * 2021-08-25 2021-11-19 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法
CN113699148A (zh) * 2021-07-15 2021-11-26 四川大学 一种超灵敏抗体检测方法
CN114507716A (zh) * 2020-11-16 2022-05-17 北京迅识科技有限公司 检测样品中靶核酸的方法
WO2023115626A1 (zh) * 2021-12-23 2023-06-29 南京师范大学 一种基于CRISPR/Cas12的肝素检测方法及其检测试剂盒

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2828985T3 (es) 2013-06-07 2021-05-28 Massachusetts Inst Technology Detección basada en la afinidad de biomarcadores sintéticos codificados por ligando
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
CA3026112A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
GB2569734B (en) 2016-09-30 2022-09-07 Univ California RNA-guided nucleic acid modifying enzymes and methods of use thereof
EP3523426A4 (en) 2016-09-30 2020-01-22 The Regents of The University of California RNA GUIDED NUCLEIC ACID MODIFYING ENZYMES AND METHOD FOR USE THEREOF
US11584955B2 (en) 2017-07-14 2023-02-21 Shanghai Tolo Biotechnology Company Limited Application of Cas protein, method for detecting target nucleic acid molecule and kit
CN107488710B (zh) * 2017-07-14 2020-09-22 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒
AU2018358051A1 (en) 2017-11-01 2020-05-14 The Regents Of The University Of California CasZ compositions and methods of use
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
US10253365B1 (en) * 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
CN110551800B (zh) * 2018-06-03 2022-08-19 上海吐露港生物科技有限公司 一种耐高温Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
EP4023766B1 (en) * 2018-09-20 2024-04-03 Institute Of Zoology, Chinese Academy Of Sciences Method for detecting nucleic acid
US11407995B1 (en) 2018-10-26 2022-08-09 Inari Agriculture Technology, Inc. RNA-guided nucleases and DNA binding proteins
US11434477B1 (en) 2018-11-02 2022-09-06 Inari Agriculture Technology, Inc. RNA-guided nucleases and DNA binding proteins
EP3931313A2 (en) * 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US11835522B2 (en) 2019-01-17 2023-12-05 Massachusetts Institute Of Technology Sensors for detecting and imaging of cancer metastasis
US10982200B2 (en) * 2019-02-14 2021-04-20 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
AU2020231380A1 (en) 2019-03-07 2021-09-23 The Regents Of The University Of California CRISPR-Cas effector polypeptides and methods of use thereof
CN111812066B (zh) * 2019-04-10 2023-04-28 华东理工大学 基于CRISPR/Cas12a系统的生物传感器、试剂盒及其在小分子检测中的用途
CN110117818A (zh) * 2019-04-16 2019-08-13 天津大学 检测单基因突变的crispr高通量生物芯片
CN110129463B (zh) * 2019-05-06 2020-08-28 浙江大学 一种用于头状葡萄球菌检测的试剂盒
CN110117621B (zh) * 2019-05-24 2021-07-16 青岛农业大学 一种碱基编辑器及其制备方法和应用
TW202113074A (zh) 2019-06-07 2021-04-01 美商斯奎柏治療公司 工程化之casx系統
CA3143923A1 (en) * 2019-07-04 2021-01-07 Riken Method and kit for detecting target nucleic acid fragment
US20220364159A1 (en) * 2019-07-26 2022-11-17 Mammoth Biosciences, Inc. Compositions for detection of dna and methods of use thereof
JP2022543241A (ja) * 2019-08-02 2022-10-11 モンサント テクノロジー エルエルシー Huhエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物
CN110541022B (zh) * 2019-08-09 2022-11-04 福建医科大学孟超肝胆医院(福州市传染病医院) 基于CRISPR-Cas12a系统的结核分枝杆菌复合群检测试剂盒
CN110819652A (zh) * 2019-08-21 2020-02-21 山东金城生物药业有限公司 一种谷氨酸棒杆菌同时基因敲除及基因表达抑制的双功能系统及应用
US20240169179A2 (en) 2019-09-10 2024-05-23 Science Solutions Llc Novel class 2 type ii and type v crispr-cas rna-guided endonucleases
CA3151988A1 (en) * 2019-09-25 2021-04-01 Wenxin Wang Nanoparticle compositions for gene therapy
CN110551812B (zh) * 2019-09-26 2020-08-18 暨南大学 一种诊断脊髓性肌萎缩症的CRISPR-Cas系统及其应用
US20240011002A1 (en) * 2019-10-08 2024-01-11 Massachusetts Institute Of Technology Daughterless male mammals for non-human population suppression
GB201914568D0 (en) * 2019-10-09 2019-11-20 Governing Council Of The Univ Of Toronto A molecular sensing platform and methods of use
CN112708660B (zh) * 2019-10-24 2024-05-03 广州微远医疗器械有限公司 Crispr-poct检测组合物及其应用
WO2021092519A1 (en) * 2019-11-08 2021-05-14 University Of Florida Research Foundation Crispr complex-based detection system and method
CN111394337A (zh) * 2019-11-15 2020-07-10 武汉大学 II类V型CRISPR蛋白Lb2Cas12a及其在基因编辑的应用
EP4065701A4 (en) * 2019-11-27 2023-11-29 Danmarks Tekniske Universitet CONSTRUCTS, COMPOSITIONS AND METHODS THEREOF WITH IMPROVED GENOMEDITING EFFICIENCY AND SPECIFICITY
CN112981004A (zh) * 2019-12-17 2021-06-18 广东菲鹏生物有限公司 一种检测hpv的试剂及其试剂盒和应用
CA3158403A1 (en) * 2019-12-23 2021-07-01 Jennifer A. Doudna Crispr-cas effector polypeptides and methods of use thereof
NL2024572B1 (en) 2019-12-24 2021-09-06 Univ Delft Tech Secure communication using crispr-cas
KR102422254B1 (ko) * 2020-01-02 2022-07-19 서강대학교산학협력단 CRISPR/Cas12a를 이용한 표면증강 라만산란 기반 표적 DNA 검출용 센서
WO2021142109A1 (en) * 2020-01-07 2021-07-15 The Trustees Of Columbia University In The City Of New York Transposition-based diagnostics methods and devices
JP6940086B1 (ja) 2020-01-24 2021-09-22 C4U株式会社 試料中の特定のdnaを検出する方法
MX2022009212A (es) 2020-01-27 2022-11-09 Sherlock Biosciences Inc Ensayos de deteccion mejorados.
US20230087018A1 (en) * 2020-02-06 2023-03-23 The Administrators Of The Tulane Educational Fund Crispr-based assay for detecting tb in bodily fluids
EP4100053A4 (en) * 2020-02-06 2024-03-20 Mammoth Biosciences Inc COMPOSITIONS AND METHODS FOR DETECTING CORONAVIRUS
CN111187856B (zh) * 2020-02-13 2020-11-13 上海科技大学 一种用于新冠病毒核酸快速检测的Cpf1试剂盒及其制备方法与应用
WO2021167687A1 (en) 2020-02-18 2021-08-26 Massachusetts Institute Of Technology Multiplexed in vivo disease sensing with nucleic acid-barcoded reporters
EP3875602A1 (en) 2020-03-05 2021-09-08 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk Onderzoek TNO Nucleic acid fluorescence detection
KR102647766B1 (ko) 2020-03-06 2024-03-13 메타지노미, 인크. 클래스 ii, 타입 v crispr 시스템
WO2021188669A1 (en) * 2020-03-18 2021-09-23 University Of Connecticut Crispr-cas12a reaction for rapid and highly sensitive isothermal nucleic acid detection
US11453907B2 (en) * 2020-03-23 2022-09-27 The Broad Institute, Inc. Crispr effector system based coronavirus diagnostics
CN111394430B (zh) * 2020-03-30 2021-05-25 重庆大学 一种基于CRISPR-Cas12a耦合增强型链置换扩增的检测系统及其应用
CN111257297B (zh) * 2020-03-31 2023-06-16 海南大学 一种基于Cas14a酶的RNA检测方法
WO2021216573A1 (en) * 2020-04-20 2021-10-28 The Regents Of The University Of California Scalable, easy-to-deploy system and reagents thereof for crispr-associated nuclease-based detection of pathogen genetic material
US20230159986A1 (en) * 2020-04-22 2023-05-25 The Regents Of The University Of California Methods for detecting and sequencing a target nucleic acid
EP4139456A4 (en) 2020-04-22 2024-05-22 Harvard College ISOTHERMAL METHODS, COMPOSITIONS, KITS AND SYSTEMS FOR THE DETECTION OF NUCLEIC ACIDS
CN111690717B (zh) * 2020-04-30 2023-05-30 山东舜丰生物科技有限公司 基于crispr技术进行目标核酸检测的方法和系统
WO2021240443A1 (en) * 2020-05-27 2021-12-02 King Abdullah University Of Science And Technology Iscan: an rt-lamp-coupled crispr-cas module for rapid, sensitive detection of sars-cov-2
CN111996236B (zh) * 2020-05-29 2021-06-29 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸检测的方法
WO2021243276A1 (en) * 2020-05-29 2021-12-02 University Of Florida Research Foundation Crispr/cas chain reaction systems and methods for amplifying the detection sensitivity of crispr-based target detection
CN111560482B (zh) * 2020-06-11 2024-02-23 亚能生物技术(深圳)有限公司 基于CRISPR/Cas和核酸试纸的检测方法和人乳头瘤病毒检测试剂盒
CN111593145B (zh) * 2020-06-11 2023-05-30 亚能生物技术(深圳)有限公司 一种CRISPR/Cas12一步核酸检测方法及新型冠状病毒检测试剂盒
WO2021254267A1 (zh) * 2020-06-16 2021-12-23 山东舜丰生物科技有限公司 利用核酸类似物或碱基修饰物进行靶核酸检测的方法
CN111690720B (zh) * 2020-06-16 2021-06-15 山东舜丰生物科技有限公司 利用修饰的单链核酸进行靶核酸检测的方法
CN111876469B (zh) * 2020-06-18 2023-11-24 山东舜丰生物科技有限公司 利用核酸类似物进行靶核酸检测的方法
CN111690773B (zh) * 2020-06-17 2021-08-20 山东舜丰生物科技有限公司 利用新型Cas酶进行目标核酸检测的方法和系统
US20230332255A1 (en) * 2020-07-03 2023-10-19 The Regents Of The University Of California Crispr-cas-based detection of sars-cov-2 using recombinase polymerase amplification
MX2023000778A (es) 2020-07-17 2023-02-22 Univ Boston Sistemas de deteccion viral y usos de los mismos.
CN112795624B (zh) * 2020-07-17 2021-11-19 山东舜丰生物科技有限公司 利用含有无碱基间隔物的核酸检测器检测靶核酸的方法
US11572565B2 (en) 2020-07-21 2023-02-07 Trustees Of Boston University Inducible control of gene expression
KR102457309B1 (ko) * 2020-08-27 2022-10-24 (주)엠비티 크리스퍼-카스 시스템 및 fo-lspr 센서를 이용하여 생물학적 시료 내 표적 핵산을 검출하는 방법 및 이를 구현하기 위한 장치
WO2022045757A1 (ko) * 2020-08-27 2022-03-03 (주)엠비티 생물학적 시료 내 표적 생체 분자를 검출하는 방법 및 이를 위한 일회용 광섬유 센서 및 이의 카트리지
CN113801917B (zh) * 2020-08-28 2022-11-22 山东舜丰生物科技有限公司 基于crispr技术进行多重核酸检测的方法
WO2022061166A1 (en) * 2020-09-17 2022-03-24 Mammoth Biosciences, Inc. Compositions and methods for detection of a nucleic acid
CN112111605A (zh) * 2020-09-21 2020-12-22 中山大学附属第一医院 基于CRISPR-Cas12a和G四链体-血红素的HPV的检测试剂盒
KR102493512B1 (ko) * 2020-10-08 2023-02-01 주식회사 진코어 CRISPR/Cas12a 시스템을 위한 엔지니어링 된 crRNA
KR20220059418A (ko) * 2020-11-02 2022-05-10 주식회사 이지다이아텍 다중 진단을 위한 핵산 분리 및 검출용 미세입자 프로브
WO2022098681A2 (en) 2020-11-03 2022-05-12 Caspr Biotech Corporation Novel class 2 crispr-cas rna-guided endonucleases
EP4263820A1 (en) * 2020-12-17 2023-10-25 Monsanto Technology LLC Engineered ssdnase-free crispr endonucleases
CN112626179B (zh) * 2020-12-21 2023-05-30 重庆医科大学 一种CTSDR与CRISPR/Cas联用检测miRNA的荧光传感器及其制备与应用
CN112905958B (zh) * 2021-01-27 2024-04-19 南京国电南自电网自动化有限公司 基于测控装置的短时数据窗遥测数据状态辨识方法及系统
EP4291643A1 (en) * 2021-02-09 2023-12-20 Mammoth Biosciences, Inc. Programmable nucleases and methods of use
WO2022204427A1 (en) * 2021-03-24 2022-09-29 Northwestern University Crispr-mediated cleavage of oligonucleotide-detectable marker conjugates for detection of target analytes
WO2022221590A1 (en) 2021-04-15 2022-10-20 Amazon Technologies, Inc. Nucleases for signal amplification
KR102512999B1 (ko) * 2021-04-23 2023-03-23 솔바이오 주식회사 금 나노 입자-DNA 복합체 및 CRISPR/Cas12a 복합체를 포함하는 바이오센서, 및 이를 이용한 표적 DNA 검출 방법
WO2022240858A1 (en) * 2021-05-10 2022-11-17 Mammoth Biosciences, Inc. Effector proteins and methods of use
EP4349979A1 (en) 2021-05-27 2024-04-10 Institute Of Zoology, Chinese Academy Of Sciences Engineered cas12i nuclease, effector protein and use thereof
AU2022284804A1 (en) 2021-06-01 2023-12-07 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
US20220389418A1 (en) 2021-06-01 2022-12-08 Helmholtz-Institut Für Rna-Basierte Nfektionsforschung (Hzi) Rna-guided cas nucleases and uses thereof in diagnostics and therapy
CN113308518B (zh) * 2021-06-02 2022-10-11 重庆大学 Dna甲基化的超敏检测方法及其应用
CN113403412A (zh) * 2021-06-24 2021-09-17 中国农业科学院兰州兽医研究所 一种基于等温扩增-CRISPR/Cas12a技术检测弓形虫的试剂盒及其应用
CN113980957A (zh) * 2021-07-02 2022-01-28 苏州系统医学研究所 基于CRISPR/Cas12a的单链DNA探针及检测目标核酸的方法
US20230052518A1 (en) 2021-07-12 2023-02-16 Labsimply, Inc. Nuclease cascade assay
EP4373963A2 (en) 2021-07-21 2024-05-29 Montana State University Nucleic acid detection using type iii crispr complex
CN113552106B (zh) * 2021-07-23 2022-12-30 济南大学 一种检测ATP、谷胱甘肽、Fpg糖基化酶的通用荧光传感器
WO2023039377A1 (en) * 2021-09-08 2023-03-16 Metagenomi, Inc. Class ii, type v crispr systems
CN113684317B (zh) * 2021-09-09 2023-09-26 贵州中医药大学第二附属医院 一种基于CRISPR-Cas12b对乙肝病毒B型和C型的超灵敏快速检测及鉴别系统
CN114381550B (zh) * 2021-12-03 2023-04-28 中国科学院精密测量科学与技术创新研究院 用于hpv分型的多靶标核酸检测试剂盒和检测方法
WO2023114052A1 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
US20230279375A1 (en) 2021-12-13 2023-09-07 Labsimply, Inc. Signal boost cascade assay
WO2023122663A2 (en) * 2021-12-23 2023-06-29 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023133411A2 (en) * 2022-01-04 2023-07-13 Board Of Regents, The University Of Texas System Methods and compositions related to nucleic acid-based fluorescent nanocluster probes
WO2023204667A1 (ko) * 2022-04-21 2023-10-26 주식회사 이지다이아텍 단일 염기 다형성 분석을 위한 미세입자 프로브
KR20230173052A (ko) * 2022-06-16 2023-12-26 주식회사 이지다이아텍 자성입자 및 불활성화된 유전자 가위를 포함하는 진단용 미세입자 프로브, 이를 포함하는 다중진단 시스템 및 다중진단 방법
WO2024076473A1 (en) 2022-10-02 2024-04-11 Vedabio, Inc. Dimerization screening assays
WO2024091907A1 (en) * 2022-10-24 2024-05-02 Mammoth Biosciences, Inc. Compositions and methods for modifying the hpv16 genome
CN115820818B (zh) * 2022-12-13 2024-02-23 博迪泰(厦门)生物科技有限公司 一种一步法核酸检测方法及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems
CN107488710A (zh) * 2017-07-14 2017-12-19 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2015305570C1 (en) * 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
EP3430134B1 (en) * 2015-06-18 2022-09-21 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
CN116814590A (zh) 2015-10-22 2023-09-29 布罗德研究所有限公司 Vi-b型crispr酶和系统
CA3015360A1 (en) * 2016-02-23 2017-08-31 Arc Bio, Llc Methods and compositions for target detection
EP3436818A4 (en) * 2016-03-31 2019-11-06 Ontera Inc. DIFFERENTIATION, THROUGH NANOPORES, OF TARGET POLYNUCLEOTIDES FROM FRAGMENTATION SAMPLE BACKGROUND AND USEFUL LOAD LINK
CA3026110A1 (en) 2016-04-19 2017-11-02 The Broad Institute, Inc. Novel crispr enzymes and systems
CA3026112A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
WO2017184768A1 (en) 2016-04-19 2017-10-26 The Broad Institute Inc. Novel crispr enzymes and systems
US11174515B2 (en) * 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US10253365B1 (en) * 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems
CN107488710A (zh) * 2017-07-14 2017-12-19 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SERGEY SHMAKOV等: "Diversity and evolution of class 2 crispr-Cas systems", 《NATURE REVIEWS MICROBIOLOGY》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113293198A (zh) * 2020-09-18 2021-08-24 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
CN113293198B (zh) * 2020-09-18 2022-12-02 山东舜丰生物科技有限公司 基于crispr技术进行靶核酸多重检测的方法
CN114507716A (zh) * 2020-11-16 2022-05-17 北京迅识科技有限公司 检测样品中靶核酸的方法
WO2022100270A1 (zh) * 2020-11-16 2022-05-19 北京迅识科技有限公司 检测样品中靶核酸的方法
CN112980929A (zh) * 2021-04-13 2021-06-18 广州海思医疗科技有限公司 一种快速检测hla-b*1502的试剂盒
CN112980929B (zh) * 2021-04-13 2021-07-20 广州海思医疗科技有限公司 一种快速检测hla-b*1502的试剂盒
CN113699148A (zh) * 2021-07-15 2021-11-26 四川大学 一种超灵敏抗体检测方法
CN113699148B (zh) * 2021-07-15 2024-01-09 四川大学 一种超灵敏抗体检测方法
CN113552103A (zh) * 2021-07-20 2021-10-26 济南大学 一种基于CRISPR-Cas系统的检测外泌体的荧光生物传感器
CN113667718A (zh) * 2021-08-25 2021-11-19 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法
CN113667718B (zh) * 2021-08-25 2023-11-28 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法
WO2023115626A1 (zh) * 2021-12-23 2023-06-29 南京师范大学 一种基于CRISPR/Cas12的肝素检测方法及其检测试剂盒

Also Published As

Publication number Publication date
US20190241954A1 (en) 2019-08-08
IL274275A (en) 2020-06-30
US11118224B2 (en) 2021-09-14
SG11202003870PA (en) 2020-06-29
CA3081937A1 (en) 2019-05-31
AU2018373026A1 (en) 2020-05-14
US10253365B1 (en) 2019-04-09
KR20200103638A (ko) 2020-09-02
JP2021508238A (ja) 2021-03-04
EP3714050A1 (en) 2020-09-30
WO2019104058A1 (en) 2019-05-31
US11447824B2 (en) 2022-09-20
EP3714050A4 (en) 2021-08-18
US20200299768A1 (en) 2020-09-24
US20210388437A1 (en) 2021-12-16
JP7316275B2 (ja) 2023-07-27
US20200399697A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
JP7316275B2 (ja) ssDNAの切断及び標的DNAの検出ためのV型CRISPR/Casエフェクタータンパク質
CN109641026B (zh) 用于检测靶rna的方法和组合物
US20210317527A1 (en) Reporter nucleic acids for type v crispr-mediated detection
JP6758474B2 (ja) 等温増幅の成分およびプロセス
US20240141412A1 (en) Compositions and methods of a nuclease chain reaction for nucleic acid detection
US9994894B2 (en) Method and components for detecting nucleic acid chains
US20240169179A2 (en) Novel class 2 type ii and type v crispr-cas rna-guided endonucleases
US20220136050A1 (en) Novel class 2 crispr-cas rna-guided endonucleases
EP2882852B1 (en) New dna polymerases with increased substrate scope
CN114592040A (zh) 基于Cas12i的核酸检测方法
WO2022098681A2 (en) Novel class 2 crispr-cas rna-guided endonucleases
WO2023147240A2 (en) Variant type v crispr/cas effector polypeptides and methods of use thereof
EP4213859A1 (en) Activators of type iii cas proteins

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200904