CN114196746A - 核酸的检测 - Google Patents

核酸的检测 Download PDF

Info

Publication number
CN114196746A
CN114196746A CN202111607215.6A CN202111607215A CN114196746A CN 114196746 A CN114196746 A CN 114196746A CN 202111607215 A CN202111607215 A CN 202111607215A CN 114196746 A CN114196746 A CN 114196746A
Authority
CN
China
Prior art keywords
nucleic acid
probe
certain embodiments
target nucleic
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111607215.6A
Other languages
English (en)
Inventor
N.沃尔特
M.特瓦里
A.约翰逊-巴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Michigan
Original Assignee
University of Michigan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Michigan filed Critical University of Michigan
Publication of CN114196746A publication Critical patent/CN114196746A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6832Enhancement of hybridisation reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及核酸的检测。本文提供了与检测和鉴别核酸有关的技术,且具体地,但是非排它地,涉及用于在单分子分辨率以高可靠性检测、鉴别和定量靶核酸的组合物、方法、试剂盒和系统。

Description

核酸的检测
本申请是国际申请日为2017年2月8日的国际申请PCT/US2017/016977进入中国、申请号为201780020624.1的题为“核酸的检测”的发明专利申请的分案申请。本申请要求2016年2月10日提交的美国临时专利申请系列号62/293,589的优先权,其通过引用整体并入本文。
关于联邦资助研究或开发的声明
本发明在美国国立卫生研究院(U.S. National Institutes of Health)颁布的授权GM062357下和在美国海军海军研究办公室(U.S. Navy, Office of Naval Research)颁布的授权W911NF-12-1-0420下在政府支持下完成。政府具有本发明的某些权利。
技术领域
本文提供了与检测和鉴别核酸有关的技术,且具体地,但是非排它地,涉及用于在单分子分辨率以高可靠性检测、鉴别和定量靶核酸的组合物、方法、试剂盒和系统。
背景技术
早期检测对于许多疾病(特别是癌症)的有效治疗而言是关键性的。与鉴别早期阶段疾病的相关可检测生物标志物有关的研究已经指出,核酸会提供癌症和其它病的高度特异性的生物标志物。例如,最近癌细胞衍生的双链DNA (dsDNA)与二级结构化的长非编码RNA (lncRNA)一起已经作为癌症和其它疾病的灵敏的和特异性的生物标志物出现在天然的人生物流体(诸如血液、尿和痰)中。
尽管它们有希望成为诊断生物标志物,但是,核酸生物标志物的灵敏的和特异性的检测已经证实是挑战性的。具体地,用于检测核酸的现有技术利用这样的探针:其与靶分子形成热力学上稳定的复合物且因而受限于与背景信号、假靶标或密切相关的突变体核酸的弱的和经常不可靠的热力学区分。另外,互补DNA或RNA链在样品中的存在严重地限制了靶序列的可达性。
因而,需要无扩增地检测在最低程度上处理的天然生物流体中的核酸的灵敏的和特异性的测定以提供快速的和可靠的核酸生物标志物的鉴别和/或定量。
发明内容
因此,本文提供了特异性的和超灵敏的单个核酸(例如,dsDNA、lncRNA、甲基化的DNA等)靶分子的检测和计数的技术,其基于短的经标记的探针与靶核酸的短暂结合。在某些实施方案中,通过由探针-靶标相互作用产生的动力学“指纹”信号来检测靶核酸。该具有平衡泊松取样的单分子识别(Single-Molecule Recognition with Equilibrium PoissonSampling,SiMREPS)技术提供了单链核酸(参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文)和双链核酸的灵敏检测。在某些实施方案中,双链核酸的检测包括dCas9-引导的捕获和DNA解链的应用。在某些实施方案中,该技术包括使用负载指导RNA(gRNA)的、无催化活性的(“死的”) dCas9酶或以高特异性结合靶核酸的一个或多个区段的酶将未标记的靶标捕获在玻璃或熔化的二氧化硅表面上。在某些实施方案(例如,用于检测lncRNA)中,所述技术进一步包括使用前间区序列邻近基序(PAM)寡核苷酸来提供核酸靶标(例如,lncRNA)的dCas9靶向。
在某些实施方案中,所述技术包括使用分子内SiMREPS探针,例如,捕获探针和查询探针,它们被连接以提供分子内探查机制(参见,例如,图5 a和b;参见下文)。
更广阔地,在某些实施方案中,一种或多种复合物(例如,一种或多种dCas9/gRNA复合物)会识别靶核酸中的特定区段(例如,核苷酸序列)以将所述靶核酸固定化到表面上。此外,实施方案假设,这些相同的或其它的复合物和/或互补寡核苷酸使所述靶核酸的双链区域解链以提供经标记的查询探针的结合(例如,查询探针与第二区段(例如,查询区域)的结合)的入口。在表面捕获(和,在某些实施方案中,一个或多个双链区域的解链)以后观察到短的荧光地标记的DNA查询探针与已经通过dCas9介导的解链造成可接近的靶核酸的第二区段(例如,查询区域)的重复的短暂结合。
此外,除了使用dCas9/gRNA用于靶序列(例如,一个或多个查询区域)的固定化和/或暴露以外,实施方案也提供了这样的技术:其中经标记的(例如,荧光地标记的) dCas9/gRNA复合物提供靶核酸的检测。具体地,所述dCas9/gRNA复合物为SiMREPS提供查询探针,因为在DNA序列上的dCas9/gRNA的采样时间对在所述gRNA和所述靶DNA序列之间形成的碱基对的数目敏感。所述技术的实施方案假定,调节在所述gRNA和所述靶DNA之间形成的碱基对的数目以促进从突变体序列的快速解离,但是从野生型序列缓慢解离,或反之亦然。此外,经工程改造的dCas9蛋白会提供适当的动力学和序列特异性(参见,例如,Kleinstiver等人(2016)“High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wideoff-target effects”Nature 529: 490-495; Slaymaker等人(2015)“Rationallyengineered Cas9 nucleases with improved specificity”Science 351: 84-8),描述了经工程改造的Cas9蛋白,其比天然Cas9更弱地与DNA主链相互作用,从而减小脱靶效应。
在本文描述的特定实施方案中,SiMREPS探针重复地结合靶序列(例如,查询区域),所述靶序列通过dCas9/gRNA与邻近靶区域的一个或多个核酸区域(例如,“相邻区域”)的结合而特别造成可接近的。查询探针与查询区域的重复结合会提供独特的连续动力学“指纹”,从而提供每种观察到的靶分子的大量独立测量。该重复动力学取样会提供两个主要优点:(1)在增加的取样时间与背景信号的任意高区分,基本上消除假阳性信号;和(2)对分子靶标的同一性中的微弱差异的精巧灵敏度,从而允许以非常高的可靠性区分轻微不同的生物标志物(例如,差别在于疾病相关突变的仅一个DNA/RNA碱基、甲基化模式或其它化学标志物)。另外,作为单分子技术,该方案会在有大量密切相关的、但是假的(例如,突变体)靶标存在下检测少量靶分子(诸如源自单个细胞)。不同于需要PCR扩增(低丰度靶标的当前标准)的技术,该技术不利用靶标扩增,且因此需要在靶标检测之前在环境温度仅用例如dCas9/gRNA预处理生物样品,从而避免取样偏倚的引入。另外,作为直接检测技术,它没有像基于扩增的检测方案经常实现的那样丢失靶标上的任何化学标志物。所述技术用于例如从人血清中的循环肿瘤DNA和lncRNA诊断癌症。所述技术也用于病原体和人肿瘤细胞中的药物和抗生素抗性基因检测。
因此,本文提供了用于提供双链靶核酸的可检测指纹的复合物的实施方案,所述复合物包含:双链靶核酸(例如,DNA、RNA、DNA/RNA杂合物),其包含邻近第二区域的第一区域;解链组分(例如,固定化的解链组分),其与所述第一区域相互作用以形成热力学上稳定的复合物并提供单链形式的所述第二区域;和查询探针,其重复结合所述第二区域以提供与所述双链靶核酸结合的可检测指纹。在某些实施方案中,所述双链核酸是包含具有双链二级结构的区域的单链核酸。在某些实施方案中,所述解链组分包含dCas9。在某些实施方案中,所述解链组分包含单链结合蛋白。在某些实施方案中,所述解链组分是蛋白,且在某些实施方案中,所述解链组分是核酸。实施方案包括使用结合双链核酸(例如,双链DNA、双链RNA、双链DNA/RNA杂合物)的蛋白和/或解链组分(例如,蛋白或核酸)以解离双链核酸(例如,核酸的一个区域)以提供单链核酸。在特定实施方案中,所述解链组分包含dCas9/gRNA复合物,其包含与所述第一区域杂交的gRNA。在某些实施方案中,所述解链组分包含PAM聚体,例如,以反式提供给所述靶核酸。
在某些实施方案中,所述查询探针以大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon与所述第二区域重复地杂交。在某些实施方案中,所述查询探针以大于1 min-1的动力学速率常数koff和/或大于1 min-1的动力学速率常数kon与所述第二区域重复地杂交。在某些实施方案中,所述查询探针是荧光地标记的核酸,其以大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon与所述第二区域重复地杂交。在某些实施方案中,所述查询探针是荧光地标记的核酸,其以大于1 min-1的动力学速率常数koff和/或大于1 min-1的动力学速率常数kon与所述第二区域重复地杂交。
在某些实施方案中,所述解链组分包含被固定化至底物的dCas9。
在某些实施方案中,分析数据,例如,在某些实施方案中,所述指纹是通过模式识别分析可检测的。
另外的实施方案包含与所述靶核酸的第三区域相互作用的第二解链组分,所述第三区域邻近所述靶核酸的第二区域。在某些实施方案中,所述第二解链组分包含dCas9。在某些实施方案中,所述第二解链组分包含单链结合蛋白。在某些实施方案中,所述第二解链组分是蛋白,且在某些实施方案中,所述第二解链组分是核酸。在特定实施方案中,所述第二解链组分包含dCas9/gRNA复合物,其包含与所述第三区域杂交的gRNA。在某些实施方案中,所述解链组分包含PAM聚体,例如,以反式提供给所述靶核酸。在某些实施方案中,所述第一和第二解链组分结合所述靶核酸上分开的大约5-15个核苷酸,例如,以提供查询探针对所述查询区域的接近。
所述技术用在核酸的检测、鉴别和/或定量中,例如,在某些实施方案中,所述靶核酸包含突变、单核苷酸多态性或经修饰的碱基。
另外的实施方案提供了用于提供样品中的双链靶核酸的可检测指纹的方法,所述方法包括:将双链靶核酸固定化至固体支持物的分离区域,所述双链靶核酸包含邻近第二区域的第一区域,且所述固体支持物的所述分离区域包含与所述第一区域相互作用的固定化的解链组分;提供查询探针,其重复地结合所述第二区域以提供可检测指纹;和使所述可检测指纹与所述双链核酸结合以鉴别所述双链核酸。一些实施方案包含使用模式识别或类似的分析(例如,机器学习、神经网络、有监督的和/或无监督的学习等)来分析数据以产生或鉴别所述双链核酸的可检测指纹。
在方法的某些实施方案中,所述解链组分包含dCas9。在方法的某些实施方案中,所述解链组分包含单链结合蛋白。在方法的某些实施方案中,所述解链组分是蛋白,且在某些实施方案中,所述解链组分是核酸。在特定方法实施方案中,所述解链组分包含dCas9/gRNA复合物,其包含与所述第一区域杂交的gRNA。在方法的某些实施方案中,所述解链组分包含PAM聚体,例如,以反式提供给所述靶核酸。
另外的实施方案包含提供与所述靶核酸的第三区域相互作用的第二解链组分,所述第三靶区域邻近所述第二区域。例如,一些实施方案包含提供dCas9/gRNA复合物,其包含与所述靶核酸的第三区域互补的gRNA,所述第三区域邻近所述靶核酸的第二区域。有关的实施方案包含提供足以使所述解链组分提供呈第二链形式的第二区域的条件,例如,缓冲的pH条件、温度控制、溶液组分(例如,盐、抗衡离子、辅因子等)等。
一些实施方案包含检测所述查询探针与所述第二区域的重复结合,其具有大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon。一些实施方案包含检测所述查询探针与所述第二区域的重复结合,其具有大于1 min-1的动力学速率常数koff和/或大于1 min-1的动力学速率常数kon。一些实施方案包含检测荧光地标记的核酸与所述第二区域的重复结合,其具有大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon。一些实施方案包含检测荧光地标记的核酸与所述第二区域的重复结合,其具有大于1 min-1的动力学速率常数koff和/或大于1 min-1的动力学速率常数kon
一些实施方案包含从所述可检测指纹计算所述样品中的双链靶核酸的量或浓度。
所述技术的实施方案提供了用于检测双链核酸的系统。在某些实施方案中,所述系统包含:固体支持物,其包含固定化的解链组分;可检测地标记的查询探针,其重复地结合所述双链核酸;荧光检测器;和软件组件,其被构造成执行查询探针结合数据的模式识别分析。系统的实施方案包含本文描述的组合物和/或包含组件(例如,计算机、处理器等)以执行如本文中所述的方法。
所述技术用在用于计算受试者具有癌症或处于具有癌症的风险中的预测因子的方法的实施方案中。例如,所述方法的实施方案包含:确定微RNA生物标志物的存在,确定突变的存在,和确定经修饰的碱基在基因组DNA中的存在。在某些实施方案中,所述预测因子是从与微RNA生物标志物的存在、突变的存在和经修饰的碱基在基因组DNA中的存在有关的变量计算出的值。
有关的实施方案提供了用于检测靶核酸的复合物,所述复合物包含:靶核酸,其包含邻近第二区域的第一区域;可检测地标记的捕获探针,其与所述第一区域杂交;用猝灭剂或荧光受体标记的查询探针,所述猝灭剂或荧光受体与所述捕获探针的标记相容,其中所述查询探针以大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon与所述第二区域重复地杂交。
另外的实施方案将是相关领域的技术人员基于本文所含的教导显而易见的。
附图说明
参考以下附图将更好地理解本技术的这些和其它特征、方面和优点:
图1 a是本文提供的核酸检测技术的一个实施方案的示意图。
图1 b显示了荧光地标记的查询探针的示例性SiMREPS数据,所述查询探针短暂地非特异性地结合至载玻片表面。
图1 c显示了荧光地标记的查询探针的示例性SiMREPS数据,所述查询探针短暂地结合靶核酸。1c和1b的动力学指纹是不同的,从而提供了查询探针的特异性和非特异性结合的不同动力学特征的实施例。
图1 d的一系列直方图指示了在没有(浓灰色条)或有(细线) 1 pM靶核酸(例如,miR-141微RNA)存在下经计数具有给定数目的强度转变的查询探针的数目(Nb+d)。四个直方图绘制了用1、2、5和10分钟的获取时间获得的数据。
图1 e显示了五种miRNA的来自SiMREPS测定的标准曲线的图,产生> 0.99的R2值。SiMREPS技术提供了核酸的高置信度检测。
图2 a的图表明,关于let-7a的荧光查询探针表现出与let-7a结合的长寿命(τon =23.3±8.3 s),但是与let-7c的更短得多的结合(τon = 4.7±3.0 s),这是由于相对于let-7a在let-7c序列中的单个错配(加下划线的“G”)。
图2 b的采样时间分析表明了let-7a (实心圆)和let-7c (空心圆)之间的高置信度单拷贝-水平区分。
图2 c是通过改变τon阈值而构建的受试者操作特征(ROC)图,其用于区分let-7a和let-7c。
图2 d是用于在有或没有miRCURY let-7抑制剂存在下检测粗制的HeLa细胞提取物中的let-7的Nb+d直方图。内源性hsa-let-7a的Nb+d直方图表现出充分限定的峰(细线),其在有let-7抑制剂存在下消失,所述let-7抑制剂被设计成结合和隔离let-7家族成员(浓灰色条)。
图2 e显示了使用关于let-7a的荧光探针和捕获探针在粗制的HeLa提取物中检测到的分子的采样时间。实心和空心圆代表通过τon值的k-均值分簇而分类的两个靶分子簇,其与关于单核苷酸突变体hsa-let-7a和hsa-let-7c的预期τon分布一致。
图2 f显示了掺入人血清中的合成miR-141的定量。
图3的示意图显示了包含dCas9/gRNA的技术的一个实施方案。将基因组靶DNA用dCas9/gRNA短暂地预处理。在该时间中,dCas9/gRNA复合物的指导RNA (gRNA)在邻近查询区域的区域(例如,与查询探针互补)处与靶核酸(例如,基因组DNA)杂交。dCas9/gRNA使靶核酸中的特定DNA序列(例如,查询区域)解链。在将生物素化的dCas9捕获到载玻片表面上(例如,通过生物素-抗生物素蛋白相互作用)以后,使用SiMREPS检测查询探针与靶核酸中的现在可接近的查询区域(其邻近与gRNA杂交的靶核酸的位点)的结合。
图4的示意图显示了包含两个侧接dCas9/gRNA复合物与靶核酸的杂交的技术的一个实施方案。在某些实施方案中,使两个dCas9/gRNA复合物杂交以侧接查询区域会进一步提高靶核酸(例如,查询区域)向查询探针(用于基于SiMREPS的检测)的可达性,且在某些实施方案中,增加特异性。在附图所示的实施方案中,将一个dCas9生物素化用于捕获在表面上,且另一个dCas9未生物素化,尽管在某些实施方案中,所述第二个dCas9被修饰,例如,生物素化。
图5 a的示意图显示了分子内SiMREPS探测的一个实施方案,其中将查询探针和捕获探针连接在连续寡核苷酸上。
图5 b的示意图显示了分子内SiMREPS探测的一个实施方案,其中非连续查询探针和捕获探针通过地址寡核苷酸共定位。
应当理解,附图不一定按比例绘制,附图中的物体也不一定彼此关联地按比例绘制。附图是意图将清楚和理解带给本文中公开的设备、系统和方法的不同实施方案的描述。在可能时,贯穿附图使用相同的附图标记来表示相同或类似的部件。此外,应当理解,附图无意以任何方式限制本教导的范围。
具体实施方式
本文提供了与检测和鉴别核酸有关的技术,且具体地,但是非排它地,涉及用于在单分子分辨率以高可靠性检测、鉴别和定量靶核酸的组合物、方法、试剂盒和系统。
在不同实施方案的该详细描述中,为了解释的目的,阐述了众多具体细节来提供公开的实施方案的彻底理解。但是,本领域技术人员会明白,可以在有或没有这些具体细节的情况下实践这些不同的实施方案。在其它情况下,以框图形式显示了结构和装置。此外,本领域技术人员可以容易地认识到,呈现和执行所述方法的具体顺序是示例性的,且预见到,所述顺序可以被改变且仍然保留在本文中公开的不同实施方案的精神和范围内。
在本申请中引用的所有文献和类似的材料(包括、但不限于,专利、专利申请、文章、书籍、论文和因特网网页)明确地通过引用整体并入用于任意目的。除非另外定义,在本文中使用的所有技术和科学术语具有与本文描述的各个实施方案所属领域的普通技术人员通常理解相同的含义。当在并入的参考文献中的术语的定义看起来不同于在本教导中提供的定义时,以在本教导中提供的定义为准。在本文中使用的段落标题仅仅用于组织目的,不应解释为以任何方式限制所述的主题。
定义
为了便利本技术的理解,在下面定义了许多术语和短语。在详细描述中阐述了另外定义。
在说明书和权利要求书中,下述术语采用在本文中明确地结合的含义,除非上下文另外清楚地指明。本文中使用的短语“在一个实施方案中”不一定表示相同的实施方案,尽管可能如此。此外,本文中使用的短语“在另一个实施方案中”不一定表示不同的实施方案,尽管可能如此。因而,如下所述,可以容易地组合本发明的不同实施方案,而不背离本发明的范围或精神。
另外,如本文中使用的,术语“或”是包含性的“或者” 算符,且等同于术语“和/或”,除非上下文另外清楚地指明。术语“基于”不是排除性的,且允许基于未描述的另外因素,除非上下文另外清楚地指明。另外,在本说明书中,“一个”、“一种”和“所述”的含义包括复数所指。“在……中”的含义包括“在……中”和“在……上”。
如本文中使用的,“核酸”或“核酸序列”表示嘧啶和/或嘌呤碱基(优选地分别胞嘧啶、胸腺嘧啶和尿嘧啶和腺嘌呤和鸟嘌呤)的聚合物或寡聚体(参见Albert L. Lehninger,Principles of Biochemistry, 在793-800 (Worth Pub. 1982))。本技术预见到任何脱氧核糖核苷酸、核糖核苷酸或肽核酸组分、和它们的任何化学变体,诸如这些碱基的甲基化、羟基甲基化或糖基化形式,等。所述聚合物或寡聚体可以在组成上是异源的或同源的,且可以分离自天然存在的来源,或可以人工地或合成地产生。另外,所述核酸可以是DNA或RNA或其混合物,且可以永久地或暂时地以单链或双链形式(包括同源双链体、异源双链体和杂合状态)存在。在某些实施方案中,核酸或核酸序列包含其它种类的核酸结构,例如,DNA/RNA螺旋、肽核酸(PNA)、吗啉代、锁核酸(LNA)和/或核酶。因此,术语“核酸”或“核酸序列”也可以包括这样的链:其包含可以表现出与天然核苷酸相同功能的非天然的核苷酸、修饰的核苷酸和/或非-核苷酸结构单元(例如,“核苷酸类似物”);此外,本文中使用的术语“核酸序列”表示寡核苷酸、核苷酸或多核苷酸、及其片段或部分,且表示基因组或合成起源的DNA或RNA,其可以是单链的或双链的,且表示有义或反义链。
本文中使用的术语“核苷酸类似物”表示修饰的或非天然存在的核苷酸,包括、但不限于:具有改变的堆叠相互作用的类似物诸如7-脱氮嘌呤(即,7-脱氮-dATP和7-脱氮-dGTP);具有替代氢键合构型的碱基类似物(例如,诸如Iso-C和Iso-G和在S. Benner的美国专利号6,001,983(并通过引用并入本文)中描述的其它非标准碱基对);非氢键合类似物(例如,非极性的芳族核苷类似物诸如2,4-二氟甲苯,由B. A. Schweitzer和E. T. Kool,J. Org. Chem., 1994, 59, 7238-7242、B. A. Schweitzer和E. T. Kool, J. Am. Chem.Soc., 1995, 117, 1863-1872描述;它们中的每一篇通过引用并入本文);“通用”碱基诸如5-硝基吲哚和3-硝基吡咯;和通用嘌呤和嘧啶(分别诸如“K”和“P”核苷酸;P. Kong, 等人,Nucleic Acids Res., 1989, 17, 10373-10383, P. Kong等人, Nucleic Acids Res.,1992, 20, 5149-5152)。核苷酸类似物包括在糖部分上具有修饰的核苷酸,诸如二脱氧核苷酸和2'-O-甲基核苷酸。核苷酸类似物包括脱氧核糖核苷酸以及核糖核苷酸的修饰形式。
“肽核酸”是指包含肽-样聚酰胺主链的DNA模仿物。
本文中使用的术语“%序列同一性”表示,在比对两个序列并在必要时引入缺口以达到最大同一性百分比以后,在核酸序列中与参照序列中的对应核苷酸相同的核苷酸或核苷酸类似物的百分比。因此,在根据所述技术的核酸比参照序列长的情况下,不考虑在所述核酸中没有与所述参照序列比对的另外核苷酸用于确定序列同一性。用于比对的方法和计算机程序是本领域众所周知的,包括blastn、Align 2和FASTA。
术语“同源性”和“同源的”表示同一性的程度。可能存在部分同源性或完全同源性。部分同源的序列是与另一个序列具有小于100%同一性的序列。
本文中使用的术语“序列变异”表示核酸序列中两个核酸之间的差异。例如,野生型结构基因和该野生型结构基因的突变体形式可以在序列上相差一个或多个核苷酸的单个碱基置换和/或缺失或插入的存在。就说结构基因的这两种形式在序列上彼此不同。结构基因的第二种突变体形式可能存在。就说该第二种突变体形式在序列上不同于野生型基因和该基因的第一种突变体形式。
如本文中使用的,术语“互补的”或“互补性”参考通过碱基配对规则关联的多核苷酸(例如,核苷酸诸如寡核苷酸或靶核酸的序列)使用。例如,序列“5'-A-G-T-3'”是与序列“3'-T-C-A-5'”互补的。互补性可以是“部分的”,其中核酸的碱基的仅一些根据碱基配对规则匹配。或者,在核酸之间可能存在“完全的”或“总的”互补性。核酸链之间的互补性程度对核酸链之间的杂交的效率和强度具有显著影响。这在扩增反应以及依赖于核酸之间的结合的检测方法中是特别重要的。任一个术语也可以参照各个核苷酸使用,特别是在多核苷酸的背景下。例如,可以为在寡核苷酸内的特定核苷酸指出它与另一个核酸链内的核苷酸的互补性或其缺乏,这不同于所述寡核苷酸的其余部分和所述核酸链之间的互补性或形成对比。
在某些背景下,术语“互补性”和有关的术语(例如,“互补的”、“互补物”)表示可以通过氢键结合另一个核酸序列的核酸序列的核苷酸,例如,能够碱基配对(例如,通过沃森-克里克碱基配对或其它碱基配对)的核苷酸。可以形成碱基对(例如,其彼此互补)的核苷酸是这样的配对:胞嘧啶和鸟嘌呤,胸腺嘧啶和腺嘌呤,腺嘌呤和尿嘧啶,和鸟嘌呤和尿嘧啶。不需要在核酸序列的整个长度上计算百分比互补性。互补性的百分比可以限于碱基配对的核酸序列的特定区域,例如,从第一个碱基配对的核苷酸开始并在最后一个碱基配对的核苷酸处结束。本文中使用的核酸序列的互补物表示这样的寡核苷酸:其当与核酸序列比对使得一个序列的5'末端与另一个序列的3'末端配对时处于“反平行的结合”中。在天然核酸中通常不存在的某些碱基可以被包括在本发明的核酸中,且包括,例如,肌苷和7-脱氮鸟嘌呤。互补性不需要是完美的;稳定的双链体可以含有错配的碱基对或未匹配的碱基。核酸技术领域的技术人员经验地考虑许多变量可以确定双链体稳定性,所述变量包括例如寡核苷酸的长度、寡核苷酸的碱基组成和序列、离子强度和错配碱基对的发生率。
因而,在某些实施方案中,“互补的”表示在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100个或更多个核苷碱基的区域上与第二个核苷碱基序列的互补物具有至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%同一性的第一个核苷碱基序列,或两个序列在严谨杂交条件下杂交。“完全互补的”是指第一个核酸的每个核苷碱基能够在第二个核酸中的对应位置处与每个核苷碱基配对。例如,在某些实施方案中,寡核苷酸(其中每个核苷碱基具有与核酸的互补性)具有这样的核苷碱基序列:其在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100个或更多个核苷碱基的区域上与所述核酸的互补物相同。
“错配”是指不能与在第二个核酸的对应位置处的核苷碱基配对的第一个核酸的核苷碱基。
本文中使用的术语“杂交”参考互补核酸的配对使用。杂交和杂交的强度(即,核酸之间的结合的强度)受诸如以下因素影响:核酸之间的互补程度,涉及的条件的严谨性,和形成的杂合物的Tm。“杂交”方法涉及一个核酸与另一个互补核酸(即,具有互补核苷酸序列的核酸)的退火。含有互补序列的两种核酸聚合物找到彼此并通过碱基配对相互作用退火的能力是充分公认的现象。Marmur和Lane, Proc. Natl. Acad. Sci. USA 46:453 (1960)和Doty等人, Proc. Natl. Acad. Sci. USA 46:461 (1960)对“杂交”过程的最初观察结果以后,已经将该过程细化为现代生物学的基本工具。
本文中使用的术语“Tm”参照“解链温度”使用。解链温度是双链核酸分子的群体变得半解离成单链时的温度。几个用于计算核酸的Tm的方程式是本领域众所周知的。如标准参考文献指出的,可以通过以下方程式计算Tm值的简单估计:Tm = 81.5 + 0.41 * (%G+C)(当核酸是在1 M NaCl的水溶液中时)(参见例如,Anderson和Young, QuantitativeFilter Hybridization, in Nucleic Acid Hybridization (1985)。其它参考文献(例如,Allawi和SantaLucia, Biochemistry 36: 10581-94 (1997)包括更复杂的计算,其考虑结构、环境和序列特征来计算Tm。例如,在某些实施方案中,这些计算会提供关于短核酸探针和靶标的Tm的改进估计(例如,如在实施例中使用的)。
如本文中使用的,当参考核酸使用时,术语“解链”表示核酸的双链核酸或区域解离成核酸的单链核酸或区域。
本文中使用的术语“解链组分”表示与核酸相互作用和将其解链(例如,解离双链区域(例如,单链核酸、DNA的双链体结构或RNA/DNA杂合物的二级结构)以提供单链区域,例如,以提供对查询区域的接近用于查询探针的结合)的物质、分子(例如,生物分子)、或超过一个分子的复合物(例如,超过一个生物分子的复合物)。在示例性实施方案中,解链组分是dCas9/gRNA复合物(例如,在某些实施方案中,包含生物素化的dCas9,和在某些实施方案中,包含非生物素化的dCas9)。但是,所述技术不限于包含dCas9的解链组分。所述技术包含任何实体的应用,所述实体提供查询探针对查询区域的接近并允许靶核酸的SiMREPS测定。
本文中使用的“双链核酸”可以是核酸的部分、较长核酸的区域、或整个核酸。“双链核酸”可以是,例如,但不限于,双链DNA、双链RNA、双链DNA/RNA杂合物等。具有二级结构(例如,碱基配对的二级结构)和/或更高等级结构的单链核酸包含“双链核酸”。例如,三链体结构被视作“双链的”。在某些实施方案中,任何碱基配对的核酸是“双链核酸”。
本文中使用的“非编码RNA”或“ncRNA”是没有翻译成蛋白的功能性RNA分子。以更低频率使用的同义词是非蛋白编码RNA (npcRNA)、非信使RNA (nmRNA)、小非信使RNA(snmRNA)和功能性RNA (fRNA)。术语小RNA (sRNA)经常用于细菌ncRNA。从其将非编码RNA转录成终产物的DNA序列经常称作RNA基因或非编码RNA基因。非编码RNA基因包括非常丰富的和在功能上重要的RNA诸如转移RNA (tRNA)和核糖体RNA (rRNA)、以及RNA诸如snoRNA、微RNA、siRNA和piRNA。在人基因组内编码的ncRNA的数目是未知的,但是,最近的转录组和生物信息学研究提示数千个ncRNA的存在。由于大多数新鉴别的ncRNA尚未验证它们的功能,许多可能是无功能的。
本文中使用的术语“长非编码RNA”或“lncRNA”或“长ncRNA”表示长于大约200个核苷酸的非蛋白编码RNA。本文中使用的该术语用于将lncRNA与小调节性RNA诸如微RNA(miRNA)、短干扰RNA (siRNA)、Piwi-相互作用RNA (piRNA)、小核仁RNA (snoRNA)和其它短RNA区分开。
本文中使用的术语“miRNA”表示微RNA。本文中使用的术语“miRNA靶序列”表示要检测的miRNA (例如,在有其它核酸存在下)。在某些实施方案中,miRNA靶序列是miRNA的变体。
术语“siRNA”表示短干扰RNA。在某些实施方案中,siRNA包含双链体或双链区域,其中双链区域的每条链是约18-25个核苷酸长;所述双链区域可以短至16个碱基对长和长至29个碱基对长,其中所述长度由反义链决定。siRNA经常在每条链的3'末端处含有约2-4个未成对的核苷酸。SiRNA似乎在触发无脊椎动物和脊椎动物中的RNA干扰中和在植物的转录后基因沉默过程中触发序列特异性的RNA降解中作为关键中间体起作用。siRNA的双链体或双链区域的至少一条链与靶RNA分子基本上同源或基本上互补。与靶RNA分子互补的链是“反义”链;与靶RNA分子同源的链是“有义”链,且也与siRNA反义链互补。双链区域的一条链不需要是相反链的精确长度,因而,一条链可以具有比相反互补链少至少一个核苷酸,从而在相反链中产生“气泡”或至少一个未匹配的碱基。双链区域的一条链不需要与相反链恰好互补;因而,所述链(优选地有义链)可以具有至少一个错配的碱基对。
siRNA还可以含有另外的序列;这样的序列的非限制性例子包括连接序列或环,其连接双链体区域的两条链。siRNA的这种形式可以称作“si-样RNA”、“短发夹siRNA”,其中短表示siRNA的双链体区域,或“发夹siRNA”。存在于siRNA中的另外序列的另外非限制性例子包括茎和其它折叠结构。所述另外序列可以具有或不具有已知的功能;这样的功能的非限制性例子包括增加siRNA分子的稳定性,或提供细胞目的地信号。
“前-miRNA”或“前-miR”是指具有发夹结构的非编码RNA,其是双链RNA-特异性的核糖核酸酶(被称作Drosha)对初级-miR的切割的产物。
“茎-环序列”是指具有发夹结构且含有成熟miRNA序列的RNA。前-miRNA序列和茎-环序列可以重叠。茎-环序列的例子存在于称作miRBase (可在环球网在microma.sanger.ac.uk处得到)的miRNA数据库中。
“初级-miRNA”或“初级-miR”是指具有发夹结构的非编码RNA,其为双链RNA-特异性的核糖核酸酶Drosha的底物。
“miRNA前体”是指这样的转录物:其起源于基因组DNA且其包含非编码的结构化RNA,所述RNA包含一个或多个miRNA序列。例如,在某些实施方案中,miRNA前体是前-miRNA。在某些实施方案中,miRNA前体是初级-miRNA。
术语“基因”表示这样的DNA序列:其包含具有非编码功能的RNA(例如,核糖体或转移RNA)、多肽或前体的产生所必需的控制和编码序列。所述RNA或多肽可以由全长编码序列或由编码序列的任何部分编码,只要保留期望的活性或功能。
术语“野生型”表示这样的基因或基因产物:其当从天然存在的来源分离时具有该基因或基因产物的特征。野生型基因是在群体中最频繁地观察到且因而武断地命名为该基因的“正常”或“野生型”形式的基因。相反,术语“修饰的”、“突变体”或“多态的”表示,当与野生型基因或基因产物相比时,表现出序列和/或功能性质的改变(即,改变的特征)的基因或基因产物。应当指出,可以分离天然存在的突变体;这些通过以下事实来鉴别:当与野生型基因或基因产物相比时,它们具有改变的特征。
本文中使用的术语“寡核苷酸”被定义为这样的分子:其包含2个或更多个脱氧核糖核苷酸或核糖核苷酸,优选地至少5个核苷酸,更优选地至少约10-15个核苷酸,和更优选地至少约15-30个核苷酸。确切大小将依赖于许多因素,所述因素又依赖于寡核苷酸的最终功能或用途。所述寡核苷酸可以以任何方式产生,包括化学合成、DNA复制、反转录、PCR或它们的组合。
因为使单核苷酸反应以特定方式制备寡核苷酸使得一个单核苷酸戊糖环的5'磷酸酯经由磷酸二酯键在一个方向连接至它的邻居的3'氧,寡核苷酸的一个末端被称作“5'末端”(如果它的5' 磷酸酯没有连接至单核苷酸戊糖环的3' 氧)和“3'末端”(如果它的3'氧没有连接至随后单核苷酸戊糖环的5' 磷酸酯)。如本文中使用的,核酸序列(即使在较大寡核苷酸的内部)也可以说成具有5'和3'末端。当在5'至3'方向沿着核酸链移动时,如果第一区域的3' 末端是在第二区域的5'末端前面,那么沿着核酸链的第一区域说成在另一个区域的上游。
当两个不同的不重叠的寡核苷酸与相同直链互补核酸序列的不同区域退火且一个寡核苷酸的3'末端指向另一个的5'末端时,前者可以称作“上游”寡核苷酸,且后者可以称作“下游”寡核苷酸。类似地,当两个重叠寡核苷酸与相同直链互补核酸序列杂交时,第一个寡核苷酸定位成,使得它的5'末端是在第二个寡核苷酸的5'末端的上游,且第一个寡核苷酸的3'末端是在第二个寡核苷酸的3'末端的上游,所述第一个寡核苷酸可以被称作“上游”寡核苷酸,且所述第二个寡核苷酸可以被称作“下游”寡核苷酸。
本文中使用的术语“受试者”和“患者”表示任何生物,包括植物、微生物和动物(例如,哺乳动物诸如狗、猫、家畜和人类)。
术语“样品”在本说明书和权利要求书中以它的最宽含义使用。一方面,它意在包括样本或培养物(例如,微生物培养物)。另一方面,它意在包括生物样品和环境样品。样品可以包括合成起源的样本。
本文中使用的“生物样品”表示生物组织或流体的样品。例如,生物样品可以是得自动物(包括人)的样品;流体,固体,或组织样品;以及液体和固体食品和饲料产品和成分,诸如乳制品(dairy items)、蔬菜、肉和肉副产品和废物。生物样品可以得自家养动物的所有不同家族,以及未驯服的或野生的动物,包括、但不限于,动物诸如有蹄动物、熊、鱼、兔类动物、啮齿类动物等。生物样品的例子包括组织的切片、血液、血液级分、血浆、血清、尿或来自其它周围来源的样品,或细胞培养物、细胞菌落、单个细胞或单个细胞的集合。此外,生物样品包括上述样品的集合或混合物。生物样品可以通过从受试者取出细胞样品来提供,但是也可以通过使用以前分离的样品来提供。例如,通过常规活组织检查技术,可以从疑似具有疾病的受试者取出组织样品。在某些实施方案中,血液样品取自受试者。来自患者的生物样品是指来自疑似受疾病影响的受试者的样品。
环境样品包括环境材料诸如表面物质、土壤、水和工业样品,以及得自食物和乳制品加工仪器、仪器、设备、器皿、一次用弃的和非一次用弃的物品的样品。这些例子不应解释为限制可应用于本发明的样品类型。
本文中使用的术语“标记”表示可以用于提供可检测的(优选地可计量的)效应且可以连接至核酸或蛋白的任何原子或分子。标记包括、但不限于:染料(例如,荧光染料或部分);放射性标记诸如32P;结合部分诸如生物素;半抗原诸如地高辛配基;发光的、磷光的或发荧光的部分;质量标签;和单独的或与可以抑制或转移由荧光共振能量转移(FRET)产生的发射波谱的部分组合的荧光染料。标记可以提供可通过荧光、放射性、比色法、重量分析法、X-射线衍射或吸收、磁性、酶活性、质量特征或受质量影响的行为(例如,MALDI飞行时间质谱法;荧光偏振)等检测的信号。标记可以是带电荷的部分(正或负电荷),或者可替换地,可以是电荷中性的。标记可以包括核酸或蛋白序列或由其组成,只要包含所述标记的序列是可检测的。
本文中使用的“支持物”或“固体支持物”表示这样的基质:在其表面上或内部可以固定化核酸分子、微粒等,例如,它们可以与其共价地或非共价地连接,或它们可以部分地或完全地包埋在其内部或表面上,使得它们在很大程度上或完全免于自由扩散或相对于彼此移动。
本文中使用的“部分”表示某物可以分成的两个或更多个部分之一,例如,寡核苷酸、分子、化学基团、结构域、探针等的不同部分。
本文中使用的“查询探针”或“读出探针”是识别核酸(例如,结合核酸,例如,特异性地结合核酸)的任何实体(例如,分子、生物分子等)。在示例性实施方案中,所述查询探针是识别核酸的蛋白(例如,核酸结合蛋白、抗体、抗体片段、转录因子、或结合核酸中的特定序列的任意其它蛋白)。在某些其它示例性实施方案中,所述查询探针是核酸(例如,DNA、RNA、包含DNA和RNA的核酸、包含经修饰的碱基和/或经修饰的碱基间连接的核酸;例如,如上所述的核酸,核酸适体或结合核酸中的特定序列的任意其它核酸)。在某些实施方案中,所述查询探针被例如可检测标记(例如,如本文中所述的荧光部分)标记。在某些实施方案中,所述查询探针包含超过一类分子(例如,超过一种蛋白、核酸、化学接头或化学部分)。
本文中使用的“捕获探针”是识别核酸(例如,结合核酸,例如,特异性地结合核酸)的任何实体(例如,分子、生物分子等)。在示例性实施方案中,所述捕获探针是识别核酸的蛋白(例如,核酸结合蛋白、抗体、抗体片段、转录因子、或结合核酸中的特定序列的任意其它蛋白)。在某些其它示例性实施方案中,捕获探针是核酸(例如,DNA、RNA、包含DNA和RNA的核酸、包含经修饰的碱基和/或经修饰的碱基间连接的核酸;例如,如上文所述的核酸)。在某些实施方案中,捕获探针被例如可检测标记(例如,如本文中所述的荧光部分)标记。在某些实施方案中,所述捕获探针包含超过一类分子(例如,超过一种蛋白、核酸、化学接头或化学部分)。
描述
本文提供了用于特异性地和超灵敏地检测单个核酸的技术的实施方案。如以前描述的(参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文),SiMREPS使用全内部反射荧光(TIRF)显微术、单分子可视化和荧光地标记的探针与靶分子的结合和释放的动力学分析(参见,例如,图1 a)。通过在动力学指纹鉴别(其提供单个核苷酸变体之间的精巧区分)上的简单的无扩增的直接计数来定量靶分子,如以前关于微RNA的检测所证实的(参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文)。本文提供的技术提供了核酸的另外形式(例如,DNA、突变体DNA、甲基化的DNA)的检测,例如,在丰富野生型背景下。
用于核酸检测的现有技术利用与靶分子形成热力学上稳定的复合物的探针,且因而限于相对于背景信号或假靶标的弱的和经常不可靠的热力学区分。相反,本文描述的技术利用在查询区域处重复地结合靶分子的探针和有关的方法来记录对于每个观察的靶分子而言发生的大数目的独立结合事件。该重复的动力学取样会提供靶标的独特动力学“指纹”,并提供高度特异性的和灵敏的核酸检测。在某些实施方案中,所述技术提供了相差少至一个核苷酸的两种核酸分子的区分。在某些实施方案中,当两种核酸分子以大过量存在时(例如,10×; 100×; 1000×; 10,000×;或1,000,000×或更多倍过量),所述技术提供了两种核酸分子的区分。参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文。
在某些实施方案中,检测经标记的核酸,例如,使用仪器来检测由所述标记产生的信号。例如,一些实施方案包含使用可检测地标记的(例如,荧光地标记的)查询探针和荧光发射的检测器,诸如荧光显微术技术。在某些实施方案中,所述技术用作诊断工具用于鉴别生物样品中的突变体或异常地表达的核酸靶标。参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文。
在某些实施方案中,该方案涉及与固体支持物(例如,玻璃或熔化的二氧化硅)连接的dCas9/gRNA复合物对未标记的核酸的捕获和查询区域的解链,随后观察短的可检测地标记的(例如,荧光地标记的)核酸(例如,DNA)查询探针与所述查询区域的重复的短暂结合。
在某些实施方案中,所述dCas9/gRNA复合物连接或固定至固体支持物。在某些实施方案中,所述dCas9/gRNA复合物包含这样的部分:其通过所述部分与连接至固体支持物的第二部分的相互作用,提供dCas9/gRNA复合物向固体支持物的固定化。所述dCas9/gRNA复合物可以直接地或间接地固定至固体支持物。
多种材料中的任一种可以用作dCas9/gRNA复合物的支持物,例如,由硝酸纤维素、尼龙、玻璃、聚丙烯酸酯、混合聚合物、聚苯乙烯、硅烷聚丙烯和磁性可吸引的材料制成的基质或颗粒。平坦表面是如本文中所述的显微术成像的优选支持物。dCas9/gRNA复合物可以如下固定化:将它直接连接至固体支持物,例如,通过使用多种共价键、螯合作用或离子相互作用中的任一种,或可以如下固定化:将它经由一个或多个连接至支持物的接头间接地连接。在某些实施方案中,所述接头是核酸;在某些实施方案中,所述接头是包含这样的一个或多个核苷酸的核酸,所述核苷酸不意图与靶核酸捕获区域杂交(例如,其不杂交),但是其意图充当dCas9/gRNA复合物和它的固体支持物之间的间隔物。
在某些实施方案中,所述dCas9/gRNA复合物包含生物素基团(例如,所述dCas9/gRNA复合物被生物素化),且所述固体支持物包含抗生蛋白链菌素基团(例如,通过接头部分例如聚乙二醇(PEG)接头连接至固体支持物)。生物素和抗生蛋白链菌素的特异性相互作用因而将所述捕获探针固定化至所述固体支持物(图1a、3和4)。
多种其它的化学方法可以用于将dCas9/gRNA复合物固定化至固体支持物。这样的方法的一个例子是使用马来酰亚胺基团和巯基(-SH)基团的组合。在该方法中,将巯基(-SH)基团键合至dCas9/gRNA复合物,且固体支持物包含马来酰亚胺基团。因此,dCas9/gRNA复合物的巯基基团与固体支持物上的马来酰亚胺基团反应以形成共价键,由此将dCas9/gRNA复合物固定化。马来酰亚胺基团的引入可以利用这样的方法:首先实现玻璃基底和氨基硅烷偶联剂之间的反应,并然后通过氨基基团与EMCS试剂(N-(6-马来酰亚胺基己酰氧基)琥珀酰亚胺,可得自Dojindo)的反应将马来酰亚胺基团引入在所述玻璃基底上。当通过自动化DNA合成仪合成DNA时,使用5′-Thiol-Modifier C6 (可得自Glen Research)可以完成巯基基团向DNA的引入。
替代上述的巯基基团和马来酰亚胺基团的组合,在某些实施方案中,使用例如环氧基团(在固体支持物上)和氨基基团(dCas9/gRNA复合物)的组合作为用于固定化的官能团的组合。使用不同种类的硅烷偶联剂的表面处理也是有效的。用于将蛋白连接至固体支持物和固体表面的其它技术是本领域已知的。
泊松过程
通过记录与靶标(例如,查询区域)结合的探针(例如,查询探针)的特征动力学,所述技术的实施方案与单分子识别有关。在特定实施方案中,该过程是泊松过程。泊松过程是计数事件的数目和在给定的时间区间中发生事件(例如,可检测地标记的(例如,荧光的)查询探针与固定化的靶标的短暂结合)的次数的连续时间随机过程。每对连续事件之间的时间区间具有指数分布,且每个区间假定独立于其它区间。泊松分布是表达在给定时间区间中发生给定数目的事件的概率的离散概率分布(如果这些事件以已知的平均比率发生且独立于自最后事件以来的时间)。泊松分布还可以用于在其它指定区间(诸如距离、面积或体积)中的事件的数目。
泊松分布是一般二项式分布的特殊情况,其中试验的数目n是大的,成功的概率p是小的,且乘积np = λ是中等的。在泊松过程中,事件的数目N在任何任意时间tj的概率遵循泊松概率分布P j (t)
Figure 419964DEST_PATH_IMAGE001
也就是说,直到时间t发生的事件的数目N具有含参数λt的泊松分布。与泊松过程和泊松分布有关的统计和数学方法是本领域已知的。参见,例如,“随机Processes (i):Poisson Processes and Markov Chains”,见Statistics for Biology and Health - Statistical Methods in Bioinformatics (Ewans和Grant, 编), Springer (New York,2001), 第129页以及以后,通过引用整体并入本文。软件包诸如Matlab和R可以用于执行与泊松过程、概率和分布有关的数学和统计方法。
检测的动力学
所述技术的特定实施方案涉及通过分析查询探针与要检测的靶核酸的查询区域的相互作用的动力学来检测核酸。关于查询探针Q (例如,在平衡浓度[Q])与靶核酸T (例如,在平衡浓度[T])的相互作用,动力学速率常数k on 描述了复合物QT的时间依赖性形成,所述复合物QT包含与靶核酸T的查询区域杂交的查询探针Q。在特定实施方案中,尽管QT复合物的形成与依赖于查询探针浓度且具有M-1min-1 (等)的单位的二阶速率常数有关,但是QT复合物的形成足以通过k on 来描述,所述k on 是与QT复合物的形成有关的假-一阶速率常数。因而,本文中使用的k on 是表观(“假”)一阶速率常数。
同样地,动力学速率常数k off 描述了复合物QT向查询探针Q和靶核酸T的时间依赖性解离。动力学速率通常在本文中以min-1或s-1的单位提供。在结合状态的查询探针Q的“采样时间”(τon)是,在查询探针Q结合靶核酸T的查询区域以形成QT复合物的每个情况中,探针Q与靶核酸T的查询区域杂交的时间区间(例如,时间长度)。在未结合状态的查询探针Q的“采样时间”(τoff)是,在查询探针Q结合靶核酸T的查询区域以形成QT复合物的每个情况之间,探针Q没有与靶核酸T的查询区域杂交的时间区间(例如,时间长度) (例如,在查询探针Q与靶核酸T的连续结合事件之间从靶核酸T解离查询探针Q的时间)。可以将采样时间提供为包含众多结合和非结合事件的平均值或加权平均值。
此外,在某些实施方案中,将查询探针(例如,可检测地标记的查询探针(例如,荧光探针),例如,核酸探针诸如DNA或RNA探针)与固定化的靶标的重复随机结合建模为每单位时间以恒定概率发生的泊松过程,且其中每单位时间的结合和解离事件的数目的标准差(Nb+d)增加为(Nb+d)1/2。因而,统计噪音随着观察时间增加变成Nb+d的较小分数。因此,在某些实施方案中根据需要延长观察以实现靶标和脱靶结合之间的区分。并且,随着获取时间增加,在Nb+d直方图中的信号和背景峰变得逐渐分离,且信号分布的宽度随着Nb+d的平方根增加,这与动力学Monte Carlo模拟一致。大约10分钟(例如,大约1-100分钟,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100分钟)的获取时间会产生信号与Nb+d的背景分布的充分(例如,完全)分离,从而提供基本上无背景的靶标定量。参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文。
此外,在某些实施方案中,选择探针长度以在方便的实验时间规模提供信号和背景峰的充分分离。具体地,查询探针交换的动力学与查询探针和靶核酸之间的互补碱基的数目有关。例如,在某些实施方案中,短DNA查询探针与它的互补物的相互作用作为形成的碱基对的数目的大约指数函数增加,而对于包含至少6-7个碱基对的相互作用而言,结合的速率常数仅受弱影响。因而,改变查询探针长度会提供调节动力学行为以改善查询探针与靶标的结合事件从背景结合的区分。具体地,9个核苷酸至10个核苷酸的查询(例如,荧光)探针长度(提供17.5℃至25℃的理论Tm值)会产生与背景信号区分的快速靶标结合,如在有和没有靶标存在下每个候选物分子的强度转变直方图所显示的。参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文。此外,在某些实施方案中,相对于双链体的解链温度,结合和解离的动力学与探针长度更密切相关。尽管一些实施方案包含使用具有9-10个核苷酸的长度的探针,所述技术不受该长度限制。实际上,所述技术预见到长于或短于9-10个核苷酸的探针的应用,例如,如到处讨论的。
尽管本文公开内容提及某些举例说明的实施方案,应当理解,这些实施方案作为示例且不作为限制呈现。
双链核酸的检测
所述技术的实施方案提供了双链核酸的检测。一些实施方案提供了包含多个分子的组合物、反应混合物和复合物,所述分子用于检测一种或多种核酸。组合物、反应混合物和复合物的一些实施方案包含:要检测、鉴别、定量和/或表征的核酸(例如,靶核酸);固体基底,其包含与固体表面连接的dCas9/gRNA复合物,其以高特异性结合靶标的一个或多个区域;和可检测地标记的(例如,荧光的)查询探针。一些实施方案进一步包含前间区序列邻近基序(PAM) DNA寡核苷酸。
所述SiMREPS技术利用短(6-12-核苷酸)荧光地标记的DNA探针与固定化在玻璃表面上的未标记的核酸靶标(例如,miRNA)的直接结合(图1 a) (参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文)。使用TIRF显微术(Walter等人(2008)“Do-it-yourself guide: how to use the modern single-molecule toolkit”Nat Methods 5:475-89),检测与固定化的靶标的非特异性表面结合(图1 b)和特异性结合(图1 c)。但是,探针与靶标的平衡结合会产生特征性的动力学特征或指纹,其可以实现相对于背景结合的超高区分(对比图1 b和图1 c)。因为探针与固定化的靶标的短暂结合类似于泊松过程,结合和解离事件的数目的标准差(Nb+d)增加为
Figure 274788DEST_PATH_IMAGE002
。随着实验性获取时间增加,在Nb+d的直方图中的信号和背景峰逐渐更好地消退(图1 d) (参见,例如,Johnson-Buck等人. (2015)“Kinetic fingerprinting to identify and count single nucleic acids”Nat Biotechnol 33: 730-2),从而允许靶标和脱靶结合之间的任意高区分。
SiMREPS用于定量RNA (参见,例如,美国专利申请系列号14/589,467, 通过引用整体并入本文)。具体地,以前的实验定量在癌症和其它疾病中失调的四种人miRNA。对于所有靶标-探针对实现区分(例如,特异性= 1),且标准曲线显示对靶标浓度的线性依赖(图1e)。单个荧光探针在两种相差单个核苷酸的微RNA之间以最高特异性区分(图2 a-c)。SiMREPS检测复杂生物基质中的靶标(图2 d, e)。也在掺入不同的靶标浓度以后在血清样品中检测前列腺癌生物标志物hsa-miR-1418。测量的浓度与标称的掺入浓度强烈相关(图2f, R >0.999,斜率= 1.07)。
在应用SiMREPS技术来检测双链核酸中的一个挑战是,查询探针与靶核酸的短暂结合(例如,在查询区域处)会竞争互补链在靶部位处与查询区域(例如,dsDNA)的结合。因此,本文提供了这样的技术:其中SiMREPS用于检测双链DNA。为了克服该挑战,所述技术的一些实施方案包含使用无催化活性的(“死的”) dCas9酶(其负载了特定引导RNA (gRNA))来以序列特异性的方式局部地解链dsDNA结构,从而提供SiMREPS探针的接近(图3)。有关的实施方案包含使用结合双链核酸(例如,双链DNA、双链RNA、双链DNA/RNA杂合物)的蛋白和/或解链组分(例如,蛋白或核酸)来解离双链核酸(例如,核酸的区域)以提供单链核酸。
dCas9/gRNA复合物
所述技术包含使用序列特异性的核酸结合组分(例如,分子、生物分子或一个或多个分子和/或生物分子的复合物)来固定化核酸和/或将双链核酸(例如,双链核酸的区域)转化成单链区域。在示例性实施方案中,所述序列特异性的核酸结合组分包含无酶活性的或“死的”Cas9蛋白(“dCas9”)和指导RNA (“gRNA”)。尽管核酸结合分子诸如簇集的、规则间隔的短回文重复(CRISPR)和CRISPR-相关蛋白(Cas) (CRISPR/Cas)系统已经被广泛地用于不同类型和物种的细胞中的基因组编辑,重组的和经工程改造的核酸结合蛋白用于本技术中以解链双链核酸和提供单链核酸用于探针结合。
发现Cas9蛋白是细菌适应性免疫系统的组分(参见,例如,Barrangou等人.(2007)“CRISPR provides acquired resistance against viruses in prokaryotes”Science 315: 1709-1712)。Cas9是RNA引导的内切核酸酶,其使用gRNA和外源DNA之间的RNA:DNA碱基配对靶向和破坏细菌中的外源DNA以提供序列特异性。近年来,Cas9/gRNA复合物已经用在基因组编辑中(参见,例如,Doudna等人. (2014)“The new frontier ofgenome engineering with CRISPR-Cas9”Science 346: 6213)。
因此,一些Cas9/RNA复合物包含两种RNA分子:(1) CRISPR RNA (crRNA),加工与靶核苷酸序列互补的核苷酸序列;和(2)反式活化crRNA (tracrRNA)。在该模式中,Cas9作为RNA引导的核酸酶起作用,其使用crRNA和tracrRNA来识别和切割靶序列。近年来,模仿退火的crRNA/tracrRNA的结构的单个嵌合的指导RNA (sgRNA)已经变得比crRNA/tracrRNA更广泛地使用,因为gRNA方案会提供具有仅两种组分(例如,Cas9和sgRNA)的简化系统。因而,与核酸的序列特异性结合可以被天然双RNA复合物(例如,包含crRNA、tracrRNA和Cas9)或嵌合的单个指导RNA (例如,sgRNA和Cas9)引导(参见,例如,Jinek等人. (2012)“AProgrammable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity”Science 337:816-821)。
如本文中使用的,crRNA (2-RNA系统)或sgRNA (单个引导系统)的靶向区域被称作“指导RNA”(gRNA)。在某些实施方案中,所述gRNA包含10-50个碱基、由10-50个碱基组成或基本上由10-50个碱基组成,例如,15-40个碱基,例如,15-30个碱基,例如,15-25个碱基(例如,10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个碱基)。本领域中已知用于确定gRNA的长度的方法,所述gRNA为Cas9提供最有效的靶标识别。参见,例如,Lee等人.(2016)“The Neisseria meningitidis CRISPR-Cas9 System Enables Specific GenomeEditing in Mammalian Cells”Molecular Therapy, 2016年1月19日; doi:10.1038/mt。
因此,在某些实施方案中,所述gRNA是短合成RNA,其包含用于Cas9-结合的“支架”序列和与核酸靶标互补的用户限定的大约20-核苷酸“靶向”序列。
在某些实施方案中,DNA靶向特异性由两个因素决定:1)与gRNA靶向序列匹配的DNA序列,和在靶序列直接下游的前间区序列邻近基序(PAM)。一些Cas9/gRNA复合物识别这样的DNA序列:其包含前间区序列邻近基序(PAM)序列和与gRNA互补的邻近大约20个碱基。规范PAM序列是NGG或NAG(对于来自酿脓链球菌(Streptococcus pyogenes)的Cas9)和NNNNGATT(对于来自脑膜炎奈瑟球菌(Neisseria meningitidis)的Cas9)。在通过gRNA与DNA靶序列的杂交实现DNA识别以后,Cas9经由固有的核酸酶活性切割DNA序列。为了基因组编辑和其它目的,已经最经常使用来自酿脓链球菌(S. pyogenes)的CRISPR/Cas系统。使用该系统,人们可以如下靶向给定的靶核酸(例如,用于编辑或其它操作):设计gRNA,其具有与PAM的5′-侧大约20-碱基DNA序列互补的核苷酸序列。本领域已知用于确定PAM序列的方法,其为Cas9提供最有效的靶标识别。参见,例如,Zhang等人. (2013)“Processing-independent CRISPR RNAs limit natural transformation in Neisseria meningitidis”Molecular Cell 50: 488-503; Lee等人, 出处同上。
本技术包含使用Cas9的无催化活性形式(“死的Cas9”或“dCas9”),其中引入使核酸酶活性失能的点突变。在某些实施方案中,所述dCas9蛋白来自酿脓链球菌。在某些实施方案中,所述dCas9蛋白包含在以下位置的突变:例如,D10、E762、H983和/或D986;和H840和/或N863,例如,D10和H840,例如,D10A或D10N和H840A或H840N或H840Y。在某些实施方案中,将dCas9提供为融合蛋白,其包含用于将dCas9连接至固体表面的功能结构域(例如,表位标签、接头肽等)。
dCas9/gRNA复合物用由gRNA提供的序列特异性结合靶核酸,但是不会切割所述核酸。以该形式,dCas9/gRNA以序列特异性的方式“解链”靶序列以提供靶核酸的单链区域(参见,例如,Qi等人. (2013)“Repurposing CRISPR as an RNA-guided platform forsequence-specific control of gene expression”Cell 152(5): 1173-83)。
此外,当Cas9/gRNA系统和dCas9/gRNA系统最初靶向邻近PAM的序列时,本文中使用的dCas9/gRNA系统已经经过工程改造以靶向用于结合的任何核苷酸序列。并且,由紧凑基因编码的Cas9和dCas9直系同源物(例如,来自金黄色葡萄球菌(Staphylococcus aureus)的Cas9)是已知的(参见,例如,Ran等人. (2015)“In vivo genome editing usingStaphylococcus aureus Cas9”Nature 520: 186-191),其改善Cas9组分的体外克隆和操作。
许多细菌表达Cas9蛋白变体。来自酿脓链球菌的Cas9目前是最常用的;一些其它Cas9蛋白与酿脓链球菌Cas9具有高水平的序列同一性,并使用相同的指导RNA。其它Cas9蛋白是更不同的,使用不同的gRNA,并同样识别不同的PAM序列(由所述蛋白指定的2-5核苷酸序列,其邻近由所述RNA指定的序列)。Chylinski等人分类了来自一个大细菌集合的Cas9蛋白(RNA Biology 10:5, 1-12; 2013),并将许多Cas9蛋白列出在附图1及其补充表格1中,它们通过引用并入本文。另外的Cas9蛋白描述在Esvelt等人, Nat Methods. 2013年11月;10(11):1116-21和Fonfara等人, “Phylogeny of Cas9 determines functionalexchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cassystems.”Nucleic Acids Res. 2013年11月22日. [印刷前的电子出版] doi:10.1093/nar/gkt1074。
在本文描述的技术中使用不同物种的Cas9(和因而dCas9)分子。尽管酿脓链球菌和嗜热链球菌(S. thermophilus)Cas9分子被广泛使用,本文中列出的其它物种的Cas9蛋白的Cas9分子(源自它或基于它)用在所述技术的实施方案中。因此,所述技术提供了酿脓链球菌和嗜热链球菌Cas9和dCas9分子的替换,来自其它物种的Cas9和dCas9分子可以替换它们,例如:
GenBank登录号 细菌
303229466 非典型韦荣氏球菌(Veillonella atypica)ACS-134-V-Col7a
34762592 具核梭杆菌文氏亚种(Fusobacterium nucleatum subsp.vincentii)
374307738 子宫产线菌(Filifactor alocis)ATCC 35896
320528778 Solobacterium moorei F0204
291520705 尖锐粪球菌(Coprococcus catus)GD-7
42525843 齿垢密螺旋体(Treponema denticola)ATCC 35405
304438954 Peptoniphilus duerdenii ATCC BAA-1640
224543312 Catenibacterium mitsuokai DSM 15897
24379809 变异链球菌(Streptococcus mutans)UA159
15675041 酿脓链球菌(Streptococcus pyogenes)SF370
16801805 无害李斯特菌(Listeria innocua)Clip11262
116628213 嗜热链球菌(Streptococcus thermophilus)LMD-9
323463801 伪中间葡萄球菌(Staphylococcus pseudintermedius)ED99
352684361 Acidaminococcus intestini RyC-MR95
302336020 Olsenella uli DSM 7084
366983953 Oenococcus kitaharae DSM 17330
310286728 两歧双歧杆菌(Bifidobacterium bifidum)S17
258509199 鼠李糖乳杆菌(Lactobacillus rhamnosus)GG
300361537 加氏乳杆菌(Lactobacillus gasseri)JV-V03
169823755 Finegoldia magna ATCC 29328
47458868 运动支原体(Mycoplasma mobile)163K
284931710 鸡败血支原体(Mycoplasma gallisepticum)F株
363542550 羊肺炎支原体(Mycoplasma ovipneumoniae)SC01
384393286 犬支原体(Mycoplasma canis)PG 14
71894592 关节液支原体(Mycoplasma synoviae)53
238924075 直肠真杆菌(Eubacterium rectale)ATCC 33656
116627542 嗜热链球菌(Streptococcus thermophilus)LMD-9
315149830 粪肠球菌(Enterococcus faecalis)TX0012
315659848 路邓葡萄球菌(Staphylococcus lugdunensis)M23590
160915782 细长真杆菌(Eubacterium dolichum)DSM 3991
336393381 棒状乳杆菌极曲亚种(Lactobacillus coryniformissubsp. torquens)
310780384 多营养型泥杆菌(Ilyobacter polytropus)DSM 2926
325677756 白色瘤胃球菌(Ruminococcus albus)8
187736489 Akkermansia muciniphila ATCC BAA-835
117929158 解纤维热酸菌(Acidothermus cellulolyticus)11B
189440764 长双歧杆菌(Bifidobacterium longum)DJO10A
283456135 齿双歧杆菌(Bifidobacterium dentium)Bd1
38232678 白喉棒杆菌(Corynebacterium diphtheriae)NCTC 13129
187250660 Elusimicrobium minutum Pei191
319957206 Nitratifractor salsuginis DSM 16511
325972003 Sphaerochaeta globus str. Buddy
261414553 产琥珀酸丝状杆菌产琥珀酸亚种(Fibrobactersuccinogenes subsp. succinogenes)
60683389 脆弱拟杆菌(Bacteroides fragilis)NCTC 9343
256819408 黄褐二氧化碳噬纤维菌(Capnocytophaga ochracea)DSM7271
90425961 沼泽红假单胞菌(Rhodopseudomonas palustris)BisB18
373501184 Prevotella micans F0438
294674019 栖瘤胃普雷沃氏菌(Prevotella ruminicola)23
365959402 Flavobacterium columnare ATCC 49512
312879015 Aminomonas paucivorans DSM 12260
83591793 深红红螺菌(Rhodospirillum rubrum)ATCC 11170
294086111 Candidatus Puniceispirillum marinum IMCC1322
121608211 Verminephrobacter eiseniae EF01-2
344171927 Ralstonia syzygii R24
159042956 Dinoroseobacter shibae DFL 12
288957741 固氮螺菌属(Azospirillum)sp- B510
92109262 汉堡硝化杆菌(Nitrobacter hamburgensis)X14
148255343 慢生根瘤菌属(Bradyrhizobium)sp- BTAi1
34557790 产琥珀酸沃林氏菌(Wolinella succinogenes)DSM 1740
218563121 空肠弯曲杆菌空肠亚种(Campylobacter jejuni subsp.jejuni)
291276265 鼬鼠螺杆菌(Helicobacter mustelae)12198
229113166 蜡状芽孢杆菌(Bacillus cereus)Rock1-15
222109285 Acidovorax ebreus TPSY
189485225 未培养的白蚁组1
182624245 产气荚膜梭菌(Clostridium perfringens)D株
220930482 解纤维梭菌(Clostridium cellulolyticum)H10
154250555 Parvibaculum lavamentivorans DS-1
257413184 Roseburia intestinalis L1-82
218767588 脑膜炎奈瑟球菌(Neisseria meningitidis)Z2491
15602992 多杀巴斯德氏菌多杀亚种(Pasteurella multocidasubsp. multocida)
319941583 Sutterella wadsworthensis 3 1
254447899 γ变形杆菌(gamma proteobacterium)HTCC5015
54296138 嗜肺军团菌巴黎株(Legionella pneumophila str.Paris)
331001027 Parasutterella excrementihominis YIT 11859
34557932 产琥珀酸沃林氏菌(Wolinella succinogenes)DSM 1740
118497352 新凶手弗朗西丝氏菌(Francisella novicida)U112。
本文描述的技术包括从任何Cas9蛋白(例如,上面列出的)和相容的它们的对应指导RNA或其它指导RNA衍生出的dCas9的应用。已经证实来自嗜热链球菌(Streptococcus thermophilus)LMD-9 CRISPR1系统的Cas9在人细胞中起作用(参见,例如,Cong等人(2013)Science 339: 819)。另外,Jinek在体外证实,来自嗜热链球菌和无害李斯特菌(L. innocua)的Cas9直系同源物可以由双重酿脓链球菌gRNA引导以切割靶质粒DNA。
在某些实施方案中,本技术包含来自酿脓链球菌的Cas9蛋白,其在细菌中编码或经过密码子优化用于在哺乳动物细胞中表达,其含有在D10、E762、H983或D986和H840或N863处的突变,例如,D10A/D10N和H840A/H840N/H840Y,以使得所述蛋白的核酸酶部分无催化活性;在这些位置处的置换在某些实施方案中是丙氨酸(Nishimasu (2014) Cell 156:935-949),或者在某些实施方案中是其它残基,例如,谷氨酰胺、天冬酰胺、酪氨酸、丝氨酸或天冬氨酸盐,例如,E762Q、H983N、H983Y、D986N、N863D、N863S或N863H。用在本文提供的技术中的一种酿脓链球菌dCas9蛋白的序列描述在US20160010076(其通过引用整体并入本文)中。
例如,在某些实施方案中,在本文中使用的dCas9与酿脓链球菌Cas9的序列具有至少约50%同一性,例如,与包含D10A和H840A置换的dCas9的下述序列具有至少50%同一性(SEQ ID NO: 1)。
Figure 54525DEST_PATH_IMAGE003
Figure 885952DEST_PATH_IMAGE004
Figure 638008DEST_PATH_IMAGE005
Figure 398153DEST_PATH_IMAGE006
在某些实施方案中,所述技术包含使用这样的核苷酸序列:其与编码SEQ ID NO:1所述的蛋白的核苷酸序列具有大约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%同一性。
在某些实施方案中,本文中使用的dCas9与无催化活性的酿脓链球菌Cas9的序列具有至少约50%同一性,即,与SEQ ID NO:1具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%同一性,其中维持在D10和H840处的突变,例如,D10A/D10N和H840A/H840N/H840Y。
在某些实施方案中,来自SEQ ID NO:1的任何差异是在非保守区中,如通过Chylinski等人, RNA Biology 10:5, 1-12; 2013 (例如,在附图1及其补充表1中);Esvelt等人, Nat Methods. 2013年11月; 10(11):1116-21和Fonfara等人, Nucl. AcidsRes. (2014) 42 (4): 2577-2590[2013年11月22日印刷之前的电子公开] doi:10.1093/nar/gkt1074中所述的序列的序列比对所鉴别的,且其中维持在D10和H840处的突变,例如,D10A/D10N和H840A/H840N/H840Y。
为了确定两个序列的同一性百分比,为了最佳对比目的而比对所述序列(根据最佳比对的需要将缺口引入第一个和第二个氨基酸或核酸序列中的一个或两个,并可以为了对比目的忽视不同源的序列)。为对比目的比对的参照序列的长度是比对的参照序列的长度的至少50%(在某些实施方案中,约50%、55%、60%、65%、70%、75%、85%、90%、95%或100%)。然后对比在对应位置处的核苷酸或残基。当在第一个序列中的位置被与第二个序列中的对应位置相同的核苷酸或残基占据时,那么所述分子在该位置处是相同的。两个序列之间的同一性百分比是所述序列共有的相同位置的数目的函数,考虑缺口的数目和每个缺口的长度,所述缺口为了两个序列的最佳比对而需要引入。使用数学算法可以实现两个序列之间的序列对比和同一性百分比确定。为了本申请的目的,使用Needleman和Wunsch ((1970)J. Mol. Biol. 48:444-453)算法(其已经整合进GCG软件包的GAP程序中),使用Blosum 62评分矩阵(其具有12的缺口罚分、4的缺口延伸罚分和5的移码缺口罚分),确定两个氨基酸序列之间的同一性百分比。
因此,本文提供了基于dCas9/gRNA的方案,其使用SiMREPS探针检测双链核酸(例如,双链基因组DNA)。所述技术的实施方案包含,使用加载gRNA的无酶活性的dCas9酶或以高特异性和稳定性结合靶标的一个或多个区段(例如,在与gRNA互补的位点处形成大约20碱基对;图3)的酶,将未标记的基因组DNA靶标捕获在玻璃或熔化的二氧化硅表面上。在生物素化的dCas9对核酸靶标的表面捕获以后,观察SiMREPS探针向所述靶标的第二区段(其已经通过dCas9/gRNA介导的解链造成可接近)的重复短暂结合。
因而,在某些实施方案中,包含指导RNA (gRNA)(其包含适当序列)的生物素化的dCas9捕获靶核酸。另外,在gRNA帮助下,dCas9将DNA解链,这产生单链的且查询探针可接近的互补的非模板DNA链。在某些实施方案中,所述技术包含使用第二种非生物素化的dCas9,其包含结合靶核酸的第二种gRNA (图4)。第二种dCas9/gRNA在离第一种dCas9/gRNA(其是查询探针的大约大小,例如,5-30个核苷酸)一定距离处结合靶核酸。也就是说,生物素化的dCas9/gRNA (捕获dCas9/gRNA)和第二种dCas9/gRNA结合这样的区域:其邻近查询探针所结合的靶核酸的区域。两种dCas9/gRNA复合物将它们之间的核酸区域解链以提供可用于查询探针结合的单链查询区域。因此,两种dCas9/gRNA复合物之间的间距对于它们之间的查询探针的结合而言是适当的。
方法
在某些实施方案中,所述技术提供了用于检测双链核酸的方法。例如,在某些实施方案中,将核酸(例如,基因组DNA)靶DNA用dCas9/gRNA短暂地预处理(例如,在环境(“室”)温度或附近)。接着,dCas9/gRNA复合物的指导RNA (gRNA)在邻近查询区域的区域(例如,与查询探针互补的靶核酸区域)与靶核酸(例如,基因组DNA)杂交。所述dCas9/gRNA在靶核酸处将特定DNA序列(例如,查询区域)解链。方法包括将dCas9 (例如,生物素化的dCas9)捕获在载玻片表面上(例如,通过生物素-抗生物素蛋白相互作用)。在将dCas9/gRNA-靶核酸捕获和固定化至表面以后,使用SiMREPS来检测查询探针与靶核酸中的查询区域的结合,所述查询区域邻近与gRNA杂交的靶核酸的位点。参见,例如,图3。
在某些实施方案中,使用两种dCas9/gRNA复合物来制备查询探针可接近的靶核酸的查询区域。在某些实施方案中,使两种dCas9/gRNA复合物杂交以侧接所述查询区域会提高靶核酸(例如,查询区域)向用于基于SiMREPS的检测的查询探针的可达性。将一种dCas9生物素化以捕获在表面上;另一种(例如,第二种) dCas9任选地生物素化(在优选的实施方案中,所述第二种dCas9没有生物素化)。参见,例如,图4。被与靶核酸结合的两种dCas9/gRNA复合物结合的区域之间的空间会为查询探针与靶核酸的查询区域的结合提供适当空间。
在某些实施方案中,当它接近固体支持物的表面(例如,在固体支持物的表面的约100 nm内)时,所述可检测的(例如,荧光的)查询探针会产生荧光发射信号。当未结合的查询探针快速地扩散且因而不可单独地检测时;因此,当处于未结合状态时,所述查询探针产生低水平的扩散背景荧光。结果,在某些实施方案中,结合的查询探针的检测包含使用全内部反射荧光显微术(TIRF)、HiLo显微术(参见,例如,US20090084980、EP2300983 B1、WO2014018584 A1、WO2014018584 A1,通过引用并入本文)、共焦扫描显微术或包含照明方案的其它技术,所述照明方案仅照亮(例如,激发)在固体支持物表面附近或上面的那些查询探针分子。因而,在某些实施方案中,仅与表面附近或上面的固定化靶标结合的查询探针会产生点样发射信号(例如,“斑点”),其可以证实为源自单个分子。
一般而言,观察包括在靶核酸所固定化(例如,通过特异性地结合至附着于表面的dCas9/gRNA)的固体支持物上的许多离散位置处监测荧光发射,例如,在许多闪耀的荧光“斑点”处,例如,其可以处于“开”和“关”状态。记录在每个离散位置处(例如,在固体支持物上的每个“斑点”处)荧光发射的存在(斑点处于“开”)和荧光发射的不存在(斑点处于“关”)。每个斑点“闪耀”- 例如,随着查询探针结合在该斑点处的固定化的靶核酸和随着查询探针从在该斑点处的固定化的靶核酸解离,斑点分别在“开”和“关”状态之间交替。
收集的数据会提供查询探针结合每个固定化的靶标的次数(例如,每个斑点闪耀”开”的次数)的确定和查询探针保持结合的时间的量(例如,斑点在“关”闭之前保持“开”的时间的长度)的测量。
在某些实施方案中,所述查询探针包含具有发射波长的荧光标记。在荧光标记的发射波长处的荧光发射的检测指示,所述查询探针结合至固定化的靶核酸。所述查询探针与靶核酸的结合是“结合事件”。在所述技术的某些实施方案中,结合事件具有这样的荧光发射:其具有大于限定的阈值的测量强度。例如,在某些实施方案中,结合事件具有高于背景荧光强度(例如,在没有靶核酸存在下观察到的荧光强度)的荧光强度。在某些实施方案中,结合事件具有比背景荧光强度(例如,在没有靶核酸存在下观察到的荧光强度)高至少1、2、3、4个或更多个标准差的荧光强度。在某些实施方案中,结合事件具有比背景荧光强度(例如,在没有靶核酸存在下观察到的荧光强度)高至少2个标准差的荧光强度。在某些实施方案中,结合事件具有是背景荧光强度(例如,在没有靶核酸存在下观察到的平均荧光强度)的至少1.5、2、3、4或5倍的荧光强度。
因此,在某些实施方案中,在具有高于限定的阈值(例如,比背景强度高至少2个标准差)的强度的荧光探针的发射波长处检测荧光指示,结合事件已经发生(例如,在靶核酸所固定化的固体支持物上的离散位置)。并且,在某些实施方案中,在具有高于限定的阈值(例如,比背景强度高至少2个标准差)的强度的荧光探针的发射波长处检测荧光指示,结合事件已经开始。因此,在某些实施方案中,在具有高于限定的阈值(例如,比背景强度高至少2个标准差)的强度的荧光探针的发射波长处检测荧光的缺失指示,结合事件已经结束(例如,所述查询探针已经从靶核酸解离)。当结合事件开始时和当结合事件结束时之间的时间长度(例如,在具有高于限定的阈值(例如,比背景强度高至少2个标准差)的强度的荧光探针的发射波长处检测到荧光的时间长度)是结合事件的采样时间。“转换”表示查询探针与靶核酸的结合和解离(例如,开/关事件)。
根据所述技术的方法包含,在是“获取时间”的确定的时间区间(例如,几十至几百至几千秒的时间区间,例如,5、10、15、20、25、30、35、40、45、50、55或60秒;例如,5、10、15、20、25、30、35、40、45、50、55或0分钟;例如,1、1.5、2、2.5或3小时)中,计数在固体支持物上的每个离散位置处发生的查询探针结合事件的数目。在某些实施方案中,所述获取时间是大约1-10秒至1-10分钟(例如,大约1-100秒,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100秒,例如,1-100分钟,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100分钟)。
此外,查询探针在结合事件中保持结合至靶核酸的时间长度是结合事件的“采样时间”。在获取时间中检测到的结合事件的数目和/或为结合事件记录的采样时间的长度是与靶核酸结合的查询探针的特征,且因而提供以下指示:所述靶核酸被固定化在所述离散位置,且因而所述靶核酸存在于样品中。
在确定的时间区间中(例如,在获取时间中)监测(例如,使用光源来激发荧光探针并检测来自结合的查询探针的荧光发射,例如,使用荧光显微镜)和/或记录查询探针与固定化的靶核酸的结合和/或查询探针从固定化的靶核酸的解离。确定在获取时间中查询探针结合核酸的次数和/或在每个结合事件中查询探针保持结合至核酸的时间长度和在每个结合事件之间查询探针保持未结合至核酸的时间长度(例如,分别在结合和未结合状态的“采样时间”),例如,通过使用计算机和软件(例如,使用隐藏的Markov模型和Poisson统计学分析数据)。
在某些实施方案中,测量对照样品(例如,在没有靶标存在下)。在对照样品中检测到的荧光是“背景荧光”或“背景(荧光)强度”或“基线”。
在某些实施方案中,将包含在查询探针的发射波长处的荧光强度的测量结果的数据记录为时间的函数。在某些实施方案中,从所述数据确定(例如,通过确定荧光强度高于阈值背景荧光强度的次数和时间长度)结合事件的数目和结合事件的采样时间(例如对于每种固定化的核酸)。在某些实施方案中,为靶核酸所固定化的固体支持物上的每个离散位置计数转换(例如,查询探针的结合和解离)。在某些实施方案中,使用转换的阈值数目将靶核酸在固体支持物上的离散位置的存在与背景信号、非靶核酸和/或查询探针的假结合的存在区分开。在某些实施方案中,在获取时间中记录的大于10的转换数目指示靶核酸在固体支持物上的离散位置的存在。
在某些实施方案中,确定每个固定化的靶标的转换次数的分布- 例如,为观察的每个固定化的核酸靶标计数转换数目。在某些实施方案中,产生直方图。在某些实施方案中,确定分布的特征参数,例如,确定分布的平均值、中位值、峰、形状等。在某些实施方案中,通过识别数据中的模式和规律的算法来分析数据和/或参数(例如,荧光数据(例如,在时域中的荧光数据)、动力学数据、分布的特征参数等),例如,使用人工智能、模式识别、机器学习、统计推论、神经网等。在某些实施方案中,所述分析包含频率分析的应用,且在某些实施方案中,所述分析包含贝叶斯分析的应用。在某些实施方案中,使用已知的“训练”数据(例如,使用监督学习)训练模式识别系统,且在某些实施方案中,使用算法来发现以前未知的模式(例如,无监督学习)。参见,例如,Duda, 等人. (2001) Pattern classification(第2版), Wiley, New York; Bishop (2006) Pattern Recognition and Machine Learning, Springer。
模式识别(例如,使用训练集、监督学习、无监督学习和未知样品的分析)将鉴别的模式与核酸关联,使得特定模式会提供用于核酸的检测、定量和鉴别中的特定核酸的“指纹”。
在某些实施方案中,从靶核酸产生的分布显著不同于从非靶核酸产生的分布或在没有靶核酸存在下产生的分布。在某些实施方案中,为多个固定化的靶核酸确定转换的平均数目。在某些实施方案中,为包含靶核酸的样品观察到的转换的平均数目与时间呈大约线性关系,且具有正斜率(例如,转换的平均数目作为时间的函数大约线性地增加)。
在某些实施方案中,使用统计学(例如,Poisson统计学)处理数据以确定在固体支持物上的每个离散位置处作为时间的函数发生转换的概率。在某些特定实施方案中,在固体支持物上的离散位置处作为时间的函数发生转换事件的相对恒定的概率指示靶核酸在固体支持物上的所述离散位置处的存在。在某些实施方案中,从在固体支持物上的离散位置处作为时间的函数发生转换事件的概率计算与事件数目和消逝时间有关的相关系数。在某些实施方案中,当从在固体支持物上的离散位置处作为时间的函数发生转换事件的概率计算时大于0.95的与事件数目和消逝时间有关的相关系数指示靶核酸在固体支持物上的所述离散位置处的存在。
在某些实施方案中,使用结合的查询探针(τon)和未结合的查询探针(τoff)的采样时间来鉴别靶核酸在样品中的存在和/或将包含靶核酸的样品与包含非靶核酸和/或不包含靶核酸的样品区分开。例如,靶核酸的τon大于非靶核酸的τon;并且,靶核酸的τoff小于非靶核酸的τoff。在某些实施方案中,测量阴性对照和样品的τon和τoff指示靶核酸在样品中的存在或不存在。在某些实施方案中,为在固体支持物上成像的多个斑点中的每一个,例如,为对照(例如,阳性和/或阴性对照)和疑似包含靶核酸的样品,确定多个τon和τoff值。在某些实施方案中,为在固体支持物上成像的多个斑点中的每一个,例如,为对照(例如,阳性和/或阴性对照)和疑似包含靶核酸的样品,确定平均τon和/或τoff。在某些实施方案中,所有成像的斑点的τon相对于τoff (例如,平均τon和τoff,按时间平均的τon和τoff,等)的图指示靶核酸在样品中的存在或不存在。
应用
所述技术用于检测核酸,例如,单链和双链核酸。因此,所述技术提供了DNA (例如,包含经修饰的碱基的DNA,例如,甲基化的DNA、未甲基化的DNA)和RNA (例如,lncRNA、miRNA等)的不同形式的检测,例如,以提供在共同平台上的多核酸检测。因此,所述技术用在示例性的应用中,例如,检测微RNA、RNA、突变体DNA等位基因、野生型DNA等位基因和基因座特异性的甲基化的DNA中的一种或多种,都在SiMREPS平台上。在某些实施方案中,这些类型的核酸的检测发生在相同样品中。
例如,所述技术用于检测甲基化的DNA。甲基化的DNA是许多健康和疾病状态的标志物,包括、例如,基于特定甲基化位点的存在鉴别处于较高结直肠癌风险的患者。甲基化的DNA也为结直肠癌以及癌前腺瘤和发育异常病变的早期检测提供了诊断试验的基础。当前通过DNA的亚硫酸氢钠处理(其将未甲基化的胞嘧啶脱氨以在DNA中产生尿嘧啶)执行在特定位点处的甲基化的DNA的检测,随后使用选择性地扩增甲基化的DNA片段(例如,5-mC或5-hmC,其被保护免于亚硫酸氢钠的转化)或未甲基化的片段(其中设计引物以结合预期的转化的序列,其含有尿嘧啶替代胞嘧啶)的独特引物集合进行PCR。另一个方案是,执行亚硫酸氢盐处理的和/或未处理的DNA的下一代测序以推断甲基化的碱基。
尽管继之以PCR或下一代测序的亚硫酸氢盐转化是常用的方案,它们遭受显著的限制。惊人的是,基于亚硫酸氢盐的技术的这些限制中的一些为使用本文提供的SiMREPS技术的甲基化的DNA的检测提供了优点。首先,亚硫酸氢盐处理不仅将胞嘧啶脱氨,而且将所述DNA随机地片段化成较短的片段,从而产生设计PCR引物的挑战,特别是随着序列长度达到非常短。另外,在亚硫酸氢盐转化以后,在胞嘧啶处已经经历脱氨的DNA区域不再是互补的且因此不是双链的,这使得PCR具有稍微更多的挑战,因为仅一条链可以用任何给定的PCR引物集合扩增。另一方面,SiMREPS方案根本上受益于双链核酸向单链核酸的转化以及核酸向短片段的片段化。
在某些实施方案中,检测核酸修饰(例如,经修饰的碱基、核苷酸类似物等)的存在或不存在。例如,在某些实施方案中,检测影响基因表达的核酸的后天修饰。在某些实施方案中,检测DNA的甲基化。在某些实施方案中,所述技术用于检测核苷酸类似物、核苷酸碱基-或核苷和/或包含碱基的核苷酸–除了腺嘌呤、胸腺嘧啶、鸟苷、胞嘧啶和尿嘧啶以外(例如,鉴别其存在或不存在)。例如,在某些实施方案中,所述技术用于检测、鉴别和/或定量核苷酸、核苷和/或碱基,包括、但不限于,例如,5-甲基胞嘧啶(5mC)、5-羟基甲基胞嘧啶(5hmC)、5-甲酰基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)、N(6)-甲基腺苷(m(6)A)、假尿苷(Ψ)、二氢尿苷(D)、肌苷(I)、7-甲基鸟苷(m7G)、次黄嘌呤、黄嘌呤、2,6-二氨基嘌呤和6,8-二氨基嘌呤。
在一个示例性实施方案中,包含通过SiMREPS检测甲基化的DNA的技术包括,分析用亚硫酸氢盐处理过的样品和没有用亚硫酸氢盐处理过的样品。实施方案提供了使用SiMREPS查询探针,其将由未甲基化的胞嘧啶向尿嘧啶的转化预见到的序列与如果在给定位点处的胞嘧啶没有转化成尿嘧啶(由于甲基化)所预见到的序列区分开。在某些实施方案中,将两种查询探针同时提供在样品室中,且每种探针包含不同的荧光团。在某些实施方案中,当用存在的两种查询探针(例如,一种探针结合甲基化的序列,且第二种探针结合转化尿嘧啶的序列,各自具有单独荧光团)使SiMREPS实验成像时实时提供亚硫酸氢盐试剂,其中在一种颜色闪耀的DNA片段将基于转换而转变成在另一种颜色闪耀。将亚硫酸氢盐处理过的样品等分试样与未处理的等分试样对比,这样的测定会在测量中提供更大准确度和精确度,这是当前PCR或基于下一代测序的方案所需要的。在某些实施方案中,所述技术是例如使用微流体和/或多谱成像的多路分析。除了硫酸氢盐修饰以外,所述技术包含使用其它试剂,其将DNA或RNA上的另外化学标志物转化成通过SiMREPS容易检测到的修饰。
在某些实施方案中,所述技术用于在同一个平台上检测突变体DNA、甲基化的DNA和微RNA生物标志物的组合。例如,这样的技术用于检测结直肠癌和晚期腺瘤,例如,通过分析粪便样品。所述技术提供了突变体DNA的检测(例如,检测在1,000,000个野生型分子的背景中的1个突变体分子;例如,检测在野生型DNA的背景中的KRAS突变体DNA)。此外,所述技术也提供了用于测量所有三类标志物(甲基化的DNA、miRNA和/或突变体DNA)的技术。所述技术用于分析缓冲溶液中的核酸;所述技术用于分析从粪便提取的基质中的核酸。平均粪便重量为200 g,且包含大约1000万二倍体-基因组当量的人DNA。1:1,000,000的灵敏度会提供在从典型全粪便提取的DNA中少至10个突变体分子的检测。这比当前临床上使用的KRAS测定灵敏10,000倍,且比最佳表现的研究级方法灵敏100倍。参见,例如,Domagała等人. (2012)“KRAS mutation testing in colorectal cancer as an example of thepathologist's role in personalized targeted therapy: a practical approach”PolJ Pathol 63(3): 145-64; Gerecke等人. (2013)“Ultrasensitive detection ofunknown colon cancer-initiating mutations using the example of theAdenomatous polyposis coli gene”Cancer Prev Res (Phila). 6(9): 898-907。性能上的这种惊人进步由SiMREPS技术的动力学指纹法固有的等位基因区分的任意特异性提供。
检测癌症的生物标志物
尽管存在它的侵袭力、高成本、低患者顺应性和并发症风险,结肠镜检查在美国是结直肠癌(CRC)的主要筛查方案。新诊断(诸如基于粪便的结直肠癌筛查)受限于检测晚期腺瘤(AA)的低灵敏度,所述晚期腺瘤(AA)的除去会阻止CRC。当前的最佳表现的基于粪便的试验分析粪便DNA (突变体DNA和甲基化)和潜血,然而是技术上复杂的、昂贵的($500/试验),且被在高野生型DNA背景中检测罕见突变体DNA等位基因的有限能力挑战。
本文描述的检测技术提供了在粪便中的罕见突变体DNA等位基因的低成本快速测量的新技术,其具有精巧的分析特异性,在单个平台上同时测量潜血(例如,使用潜血的微RNA标志物)和甲基化的DNA。所述技术提供了增加的灵敏度,用于在比当前现有技术低超过10倍的成本检测晚期腺瘤。
所述技术提供了以在比当前方法更高的特异性数量级定量罕见突变体DNA等位基因,从而导致显著地敏化的AA检测。在某些实施方案中,检测限定腺瘤的突变诸如在APC基因中。
所述技术提供了多种粪便生物标志物类型的测量,都在单个平台上。在某些实施方案中,除了突变体DNA以外,在所述平台上检测的标志物包括微RNA (参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文)、粪便潜血标志物(例如,粪便潜血的微RNA标志物)和甲基化的DNA。
RNA的检测
在某些实施方案中,要检测、表征、定量和/或鉴别的核酸(例如,靶核酸)是RNA(例如,lncRNA,例如,长于大约200个核苷酸的非蛋白编码RNA)。实施方案假定,将核酸(例如,RNA,例如,lncRNA)的二级结构解链以提供用于SiMREPS检测的查询探针对查询区域的接近。例如,在某些实施方案中,所述技术包含使用dCas9/gRNA,其使用辅助PAM寡核苷酸(例如,PAM聚体)识别和解链RNA中的二级结构化的靶标。在某些实施方案中,所述技术包含使用两种dCas9/gRNA复合物,其使用辅助PAM寡核苷酸(例如,PAM聚体)识别和解链RNA中的二级结构化的靶标。
在某些实施方案中,当PAM作为单独DNA寡核苷酸以反式存在(“呈递PAM的寡核苷酸”或“PAM聚体”)时,所述dCas9结合与gRNA序列匹配的单链RNA靶标。因此,在某些实施方案中,PAM聚体提供了dCas9/gRNA与单链RNA靶标(例如,lncRNA)的位点特异性结合。此外,所述技术提供了使用PAM聚体来指导dCas9结合特定RNA靶标并解链二级结构以使查询区域可用于SiMREP测定中的查询探针的结合。参见,例如,O’Connell等人. 2014“ProgrammableRNA recognition and cleavage by CRISPR/Cas9”Nature 516: 263-6。因而,实施方案提供了包含dCas9、gRNA (例如,dCas9/gRNA复合物)和PAM聚体的组合物。
微RNA的检测
在某些实施方案中,要检测、表征、定量和/或鉴别的核酸(例如,靶核酸)是微RNA。微RNA (miRNA或µRNA)是调节基因表达的大约21-23个核苷酸长度的单链RNA分子。miRNA由基因(从其DNA转录出它们)编码,但是miRNA没有翻译成蛋白(参见,例如,Carrington等人,2003,其特此通过引用并入)。编码miRNA的基因比经加工的成熟的miRNA分子长得多。参见,例如,美国专利申请系列号14/589,467,通过引用整体并入本文。
基因组畸变的检测
在某些实施方案中,所述SiMREPS技术提供了基于检测在比较基因组杂交以后的未配对区域来鉴别和/或计数在DNA样品中的基因组畸变(例如,除了简单点突变以外)。在某些实施方案中,SiMREPS用于确定样品中的总基因组不稳定性程度,例如,如缺失和插入相对于参照正常DNA样品的存在所证实的。示例性实施方案包含,提供正常的DNA (例如,来自具有实体瘤如肺癌的患者的正常血细胞的野生型DNA),并将它与匹配的肿瘤DNA (或甚至无循环细胞的DNA)混合,并将所述DNA片段化,使得它作为片段存在并固定化在表面上,可能通过末端修饰(例如,生物素化)或其它方案。大多数DNA将形成杂交的DNA区段,但是缺失或插入的区域作为双链体存在,其中一条链凸出。在某些实施方案中,以对于有效检测而言适当的比率提供正常DNA和肿瘤DNA。实施方案提供了基于SiMREPS的亲和试剂,其用于检测这些未匹配的区域,并且计数它们会提供基因组不稳定性的量度,这在某些实施方案中例如用作癌症风险的生物标志物。在某些实施方案中,所述技术用在关于染色体异常的产前筛查中。在某些实施方案中,所述亲和试剂是单链的DNA结合蛋白,被修饰成不切割核酸的霍利迪连结体重组酶,例如,用于鉴别平衡的染色体易位等。
在某些实施方案中,所述技术用于检测例如具有微卫星-不稳定的结直肠癌的患者中的微卫星重复畸变。因此,实施方案包含提供一组与不同微卫星基因座对应的SiMREPS探针,其表现出差别的动力学结合性能,这取决于所述微卫星重复是否已经在样品中扩增。在某些实施方案中,所述技术包含比较DNA杂交方案,其中扩增的微卫星重复序列与没有扩增的微卫星重复序列的杂交会产生未配对的区段,其使用基于SiMREPS的方案、使用DNA探针或其它有效的亲和SiMREPS读出试剂检测。
双功能的亲和试剂
在某些实施方案中,所述技术包含通过掺入双功能的亲和试剂用SiMREPS检测蛋白和其它分析物,所述双功能的亲和试剂结合靶分析物并包含可以使用SiMREPS读出探针计数的核酸。作为一个例子,一些实施方案包含使用与短DNA寡核苷酸连接的抗体,使得如果靶蛋白分析物被固定化在载玻片的表面上(例如通过简单地干燥在所述表面上,或其它非特异性的或特异性的捕获方法),使用缀合的DNA的基于SiMREPS的读出来测量所述抗体与靶蛋白分析物的结合。这将允许将多种抗体多路化和通过与不同抗体连接的不同DNA序列“条形码”区分。实施方案假定所述样品是多种类型,甚至包括细胞或细胞裂解物。亲和试剂包括与DNA条形码连接的DNA或RNA结合蛋白、适体、抗体和抗体片段。
非核酸SiMREPS探针
实施方案提供了非核酸的探针。例如,实施方案提供了与靶分析物(其具有适合SiMREPS的稳定性)具有结合相互作用的抗体或其它亲和试剂,例如,提供“闪耀”信号和在某些实施方案中提供动力学结合指纹的短暂结合。在某些实施方案中,将所述非核酸查询探针工程改造以相对于非工程化形式弱化它的结合,例如,以提供在热力学上不太稳定的结合和/或缔合。除了抗体以外,实施方案包含是蛋白的靶分析物和查询探针,例如,其中一种结合配偶体是亲和试剂,且另一种是正在测量的靶分析物。实施方案包含使用结合任何配体的适体、结合糖基化的蛋白的凝集素、结合脂质的蛋白或其它分子等。所述技术包含使用具有适合在SiMREPS平台上检测的短暂结合行为的任何结合对,例如,其产生动力学指纹。
分子内SiMREPS探测
在某些实施方案中,所述技术提供了捕获探针和查询探针,它们连接以提供分子内探查机制(参见,例如,图5 a和b)。所述探针是不对称的,所以当靶核酸结合(例如,具有热力学稳定性,例如,不可逆地)捕获序列时,所述靶核酸发生与所述查询探针的短暂结合。查询探针的短暂结合和解离会产生供体荧光团强度或FRET的时间依赖性变化,其动力学是对所述靶核酸的序列敏感的。在某些实施方案中,地址链使查询/捕获复合物结合至所述表面,以提供对短暂结合动力学产生控制的刚度,并提供将许多不同的查询/捕获序列固定化至成像表面的不同区域的方式(例如,如在DNA微阵列中)。
在某些实施方案中,分子内SiMREPS探测会提供更快的获得。具体地,查询探针的结合是快速的,因为所述结合是靶核酸结合捕获探针以后的分子内杂交反应。此外,在某些实施方案中,成像时间与SiMREPS技术的其它实施方案相比减小。例如,相同数目的结合和解离事件在分子内SiMREPS实验的某些实施方案中在1-10秒中发生,而在SiMREPS技术的其它实施方案中在10分钟中发生。分子内SiMREPS技术提供了通过空间分离对实验的并行化。在某些实施方案中,所述分子内SiMREPS技术会减小提供有效检测的查询探针的浓度。所述分子内SiMREPS技术提供了一种平台,在某些实施方案中,其包含许多不同的捕获/查询探针,它们以地址链指定的方式固定化在成像表面的不同区域内。作为一个例子,人们可能使用含有数千个不同序列的标准微阵列芯片;这些序列可以充当用于固定化SiMREPS捕获/查询探针的地址链,从而允许在单个芯片上数千个靶序列(微RNA、lncRNA、转化成单链形式的DNA)的SiMREPS测定。
值得注意的是,在某些实施方案中,所述地址链在序列上与任何靶标无关,因为相互作用通过查询探针和捕获探针间接地发生。实际上,不需要地址链与靶标有关。此外,实施方案假定,所述查询探针和捕获探针包含除了DNA序列以外的亲和试剂,诸如在本申请中在别处讨论的dCas9/gRNA复合物。
实施方案会提供荧光团向激发源的暴露的控制,例如,以减少或最小化在分析之前的光漂白。在某些实施方案中,动力学特征会提供校正机制来鉴别和校正假阳性检测,例如,源自捕获/查询探针在成像表面的错误部分(在它的地址区域以外)上的沉积。实施方案也提供了这样的技术:其中通过将查询探针和捕获探针分成两个非连续探针而最小化或减少假阳性,所述非连续探针在结合地址序列后共定位(参见,例如,图5 b)。
荧光部分
在某些实施方案中,核酸包含荧光部分(例如,发荧光的染料,也被称作“荧光团”或“荧光剂(fluor)”)。多种荧光部分是本领域已知的,且已知在将核苷酸掺入寡核苷酸中之前将荧光部分连接至核苷酸的方法和在寡核苷酸合成以后将荧光部分添加至寡核苷酸的方法。
可以用作荧光部分的化合物的例子包括、但不限于呫吨、蒽、花青、卟啉和香豆素染料。与本技术一起使用的呫吨染料的例子包括、但不限于荧光素、6-羧基荧光素(6-FAM)、5-羧基荧光素(5-FAM)、5-或6-羧基-4, 7, 2', 7'- 四氯荧光素(TET)、5-或6-羧基-4'5'2'4'5'7' 六氯荧光素(HEX)、5'或6'-羧基-4',5'-二氯-2,'7'-二甲氧基荧光素(JOE)、5-羧基-2',4',5',7'-四氯荧光素(ZOE)、rhodol、罗丹明、四甲基罗丹明(TAMRA)、4,7-二氯四甲基罗丹明(DTAMRA)、罗丹明X (ROX)和德克萨斯红。可以与本发明一起使用的花青染料的例子包括、但不限于Cy 3、Cy 3B、Cy 3.5、Cy 5、Cy 5.5、Cy 7和Cy 7.5。与本技术一起使用的其它荧光部分和/或染料包括、但不限于能量转移染料、复合染料和产生荧光信号的其它芳族化合物。在某些实施方案中,所述荧光部分包含量子点。
在某些实施方案中,所述荧光部分包含荧光蛋白(例如,绿色荧光蛋白(GFP)、经修饰的GFP的衍生物(例如,包含S65T的GFP、增强的GFP (例如,包含F64L))、或本领域已知的其它荧光蛋白,例如,蓝色荧光蛋白(例如,EBFP、EBFP2、蓝铜矿、mKalama1)、蓝绿色荧光蛋白(例如,ECFP、Cerulean、CyPet、mTurquoise2)和黄色荧光蛋白衍生物(例如,YFP、Citrine、Venus、YPet)。实施方案假定,所述荧光蛋白可以共价地或非共价地键合至一种或多种查询和/或捕获探针。
荧光染料包括、但不限于:d-罗丹明受体染料,包括Cy 5、二氯[R110]、二氯[R6G]、二氯[TAMRA]、二氯[ROX]等,荧光素供体染料,包括荧光素、6-FAM、5-FAM等;吖啶,包括吖啶橙、吖啶黄、二氨基吖啶、pH 7等;芳烃,包括2-甲基苯并噁唑、对-二甲基氨基苯甲酸乙酯、苯酚、吡咯、苯、甲苯等;芳基次甲基染料,包括金胺O、结晶紫、结晶紫、甘油、孔雀石绿等;香豆素染料,包括7-甲氧基香豆素-4-乙酸、香豆素1、香豆素30、香豆素314、香豆素343、香豆素6等;花青染料,包括1,1'-二乙基-2,2'-花青碘化物、隐花青、吲哚羰花青(C3)染料、吲哚二羰花青(C5)染料、吲哚三羰花青(C7)染料、氧杂羰花青(C3)染料、氧杂二羰花青(C5)染料、氧杂三羰花青(C7)染料、碘化频那氰醇、Stains all、硫杂羰花青(C3)染料、乙醇、硫杂羰花青(C3)染料、正丙醇、硫杂二羰花青(C5)染料、硫杂三羰花青(C7)染料等;二吡咯甲烯染料,包括N,N'-二氟硼基-1,9-二甲基-5-(4-碘苯基)-二吡咯甲烯、N,N'-二氟硼基-1,9-二甲基-5-[(4-(2-三甲基甲硅烷基乙炔基)、N,N'-二氟硼基-1,9-二甲基-5-苯基二吡咯甲烯等;部花青,包括4-(二氰基亚甲基)-2-甲基-6-(对二甲基氨基苯乙烯基)-4H-吡喃(DCM)、乙腈、4-(二氰基亚甲基)-2-甲基-6-(对二甲基氨基苯乙烯基)-4H-吡喃(DCM)、甲醇、4-二甲基氨基-4'-硝基均二苯乙烯、部花青540等;各种染料,包括4',6-二脒基-2-苯基吲哚(DAPI)、二甲基亚砜、7-苄基氨基-4-硝基苯并-2-氧杂-1,3-二唑、丹磺酰基甘氨酸、丹磺酰基甘氨酸、二氧杂环己烷、Hoechst 33258、DMF、Hoechst 33258、萤光黄CH、吡罗昔康、硫酸奎宁、硫酸奎宁、方酸菁染料III等;亚苯基寡聚物(Oligophenylenes),包括2,5-二苯基噁唑(PPO)、联苯、POPOP、对四联苯、对三联苯等;噁嗪,包括高氯酸甲酚紫、尼罗蓝、甲醇、尼罗红、乙醇、噁嗪1、噁嗪170等;多环芳烃,包括9,10-双(苯基乙炔基)蒽、9,10-二苯基蒽、蒽、萘、苝、芘等;多烯/多炔,包括1,2-二苯基乙炔、1,4-二苯基丁二烯、1,4-二苯基丁二炔、1,6-二苯基己三烯、β-胡萝卜素、均二苯乙烯等;氧化还原活性生色团,包括蒽醌、偶氮苯、苯并醌、二茂铁、核黄素、三(2,2'-二吡啶基钌(II)、四吡咯、胆红素、叶绿素a、乙醚、叶绿素a、甲醇、叶绿素b、二质子化的四苯基卟啉、高铁血红素、八乙基卟啉镁、八乙基卟啉镁(MgOEP)、酞菁镁(MgPc)、PrOH、酞菁镁(MgPc)、吡啶、四间三甲基苯基卟啉镁(MgTMP)、四苯基卟啉镁(MgTPP)、八乙基卟啉、酞菁(Pc)、卟吩、ROX、TAMRA、四叔丁基氮杂卟吩、四叔丁基萘酞菁、四(2,6-二氯苯基)卟啉、四(邻-氨基苯基)卟啉、四间三甲基苯基卟啉(TMP)、四苯基卟啉(TPP)、维生素B12、八乙基卟啉锌(ZnOEP)、酞菁锌(ZnPc)、吡啶、四间三甲基苯基卟啉锌(ZnTMP)、四间三甲基苯基卟啉锌残基阳离子、四苯基卟啉锌(ZnTPP)等;呫吨,包括曙红Y、荧光素、碱性乙醇、荧光素、乙醇、罗丹明123、罗丹明6G、罗丹明B、玫瑰红、磺酰罗丹明101等;或它们的混合物或组合或它们的合成衍生物。
已知几类发荧光的染料和具体化合物对于本技术的特定实施方案是适当的:呫吨衍生物诸如荧光素、罗丹明、俄勒冈绿、曙红和德克萨斯红;花青衍生物诸如花青、吲哚羰花青、氧杂羰花青、硫杂羰花青和部花青;萘衍生物(丹磺酰基和氟硅酸钠(prodan)衍生物);香豆素衍生物;噁二唑衍生物诸如吡啶基噁唑、硝基苯并噁二唑和苯并噁二唑;芘衍生物诸如级联蓝(cascade blue);噁嗪衍生物诸如尼罗红、尼罗蓝、甲酚紫和噁嗪170;吖啶衍生物诸如二氨基吖啶、吖啶橙和吖啶黄;芳基次甲基衍生物诸如金胺、结晶紫和孔雀石绿;和四吡咯衍生物诸如卟吩、酞菁、胆红素。在某些实施方案中,染料的荧光部分是呫吨、荧光素、罗丹明、BODIPY、花青、香豆素、芘、酞菁、藻胆蛋白、ALEXA FLUOR®350、ALEXA FLUOR®405、ALEXA FLUOR®430、ALEXA FLUOR®488、ALEXA FLUOR®514、ALEXA FLUOR®532、ALEXAFLUOR®546、ALEXA FLUOR®555、ALEXA FLUOR®568、ALEXA FLUOR®568、ALEXA FLUOR®594、ALEXA FLUOR®610、ALEXA FLUOR®633、ALEXA FLUOR®647、ALEXA FLUOR®660、ALEXAFLUOR®680、ALEXA FLUOR®700、ALEXA FLUOR®750或方酸菁染料。在某些实施方案中,所述标记是在例如以下文献中描述的荧光地可检测的部分:Haugland (2005年9月)MOLECULAR PROBES HANDBOOK OF FLUORESCENT PROBES AND RESEARCH CHEMICALS (第10版),其通过引用整体并入本文。
在某些实施方案中,所述标记(例如,荧光地可检测的标记)是可得自ATTO-TECGmbH (Am Eichenhang 50, 57076 Siegen, 德国)的标记,例如,如在以下文献中所述:美国专利申请公开号20110223677、20110190486、20110172420、20060179585和20030003486;和美国专利号7,935,822,它们都通过引用并入本文(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO740)。
本领域普通技术人员会认识到,同样可以使用具有在这些范围以外的发射峰值的染料。在某些情况下,在500 nm至700 nm范围内的染料具有在可见光谱中的优点,且可以使用现有的光电倍增管检测。在某些实施方案中,可利用的染料的宽范围允许选择染料集合,其具有跨检测范围分布的发射波长。能够区分许多染料的检测系统是本领域已知的。
样品
在某些实施方案中,从含有多种其它组分(诸如蛋白、脂质和非模板核酸)的生物样品分离核酸(例如,DNA或RNA)。核酸模板分子可以得自任何材料(例如,细胞材料(活的或死的)、细胞外材料、病毒材料、环境样品(例如,宏基因组样品)、合成材料(例如,扩增子诸如通过PCR或其它扩增技术提供)),得自动物、植物、细菌、古细菌、真菌或任意其它生物。用于用在本技术中的生物样品包括病毒颗粒或其制品。核酸分子可以直接得自生物体或得自从生物体得到的生物样品,例如,得自血液、尿、脑脊液、精液、唾液、痰、粪便、毛发、汗液、泪水、皮肤和组织。示例性的样品包括、但不限于全血、淋巴流体、血清、血浆、口颊细胞、汗液、泪水、唾液、痰、毛发、皮肤、活组织检查、脑脊液(CSF)、羊水、精液、阴道排泄物、浆液、滑液、心包液、腹膜液、胸膜液、漏出液、渗出物、囊液、胆汁、尿、胃液、肠液、粪便样品和拭子、抽吸物(例如,骨髓、细针等)、洗液(例如,口腔、鼻咽、支气管、支气管肺泡、眼、直肠、肠、阴道、表皮等)和/或其它样本。
任何组织或体液样本可以用作用在所述技术中的核酸的来源,包括法医样本、存档的样本、保留的样本和/或储存长时间段的样本,例如,新鲜-冷冻的、甲醇/乙酸固定的、或福尔马林固定的石蜡包埋的(FFPE)样本和样品。核酸模板分子还可以分离自培养的细胞,诸如原代细胞培养物或细胞系。可以用病毒或其它细胞内病原体感染从其得到模板核酸的细胞或组织。样品还可以是从生物样本、cDNA文库、病毒或基因组DNA提取的总RNA。样品也可以是来自非细胞起源的分离的DNA,例如已经在冰柜中储存的扩增的/分离的DNA。
例如,通过从生物样品提取,例如,通过多种技术诸如Maniatis, 等人. (1982)Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, N.Y. (参见,例如,第280-281页)描述的那些,可以得到核酸分子。
在某些实施方案中,所述技术提供了核酸的大小选择,例如,以除去非常短的片段或非常长的片段。
在某些实施方案中,所述技术用于原位鉴别核酸。具体地,所述技术的实施方案提供了在不从组织、细胞等提取核酸的情况下直接在组织、细胞等中鉴别核酸(例如,在透化所述组织、细胞等以后)。在与原位检测有关的技术的某些实施方案中,在体内、离体和/或在体外应用所述技术。在某些实施方案中,所述样品是粗制的样品、最低程度上处理的细胞裂解物或生物流体裂解物。在某些实施方案中,在没有核酸纯化下在粗制的裂解物中检测核酸。
试剂盒
一些实施方案涉及用于检测核酸的试剂盒。例如,在某些实施方案中提供了试剂盒,其包含固体支持物(例如,显微镜载玻片、珠子、盖玻片、抗生物素蛋白(例如,抗生蛋白链菌素)-缀合的显微镜载玻片或盖玻片、包含零模式波导阵列的固体支持物等)、dCas9/gRNA (例如,包含生物素化的dCas9)和如本文中所述的查询探针。一些实施方案进一步提供了非生物素化的dCas9/gRNA。
一些实施方案进一步提供了在因特网上或可从因特网下载的计算机可读形式的软件,其用于收集和分析如本文中所述的查询探针结合事件和采样时间。在某些实施方案中,用于多路检测的试剂盒包含两种或更多种查询探针,各自包含与一种或多种靶核酸的不同查询区域互补的序列,且各自包含不同的荧光部分。在某些实施方案中,查询探针与一种或多种核酸靶标的查询区域互补。试剂盒的一些实施方案包含一种或多种阳性对照和/或一种或多种阴性对照。一些实施方案包含一系列具有已知浓度的对照,例如,以产生浓度的标准曲线。
系统
所述技术的一些实施方案提供了用于检测和定量靶核酸的系统。根据所述技术的系统包含,例如,固体支持物(例如,显微镜载玻片、盖玻片、抗生物素蛋白(例如,抗生蛋白链菌素)-缀合的显微镜载玻片或盖玻片、包含零模式波导阵列的固体支持物等)、dCas9/gRNA (例如,包含生物素化的dCas9)和如本文中所述的查询探针。一些实施方案进一步提供了非生物素化的dCas9/gRNA。
一些实施方案进一步包含荧光显微镜,其包含照明结构来激发结合的查询探针(例如,棱镜-型全内部反射荧光(TIRF)显微镜、物镜-型TIRF显微镜、近-TIRF或HiLo显微镜、共焦激光扫描显微镜、零模式波导、和/或能够在将照明限于表面附近的空间的小区域的同时平行监测载玻片或盖玻片的大面积(> 100 μm2)的照明结构)。一些实施方案包含荧光检测器,例如,包含强化电荷耦合器件(ICCD)、电子扩大电荷耦合器件(EM-CCD)、互补金属氧化物半导体(CMOS)、光电倍增管(PMT)、雪崩光电二极管(APD)的检测器,和/或另一种能够检测来自单个生色团的荧光发射的检测器。一些实施方案包含计算机和编码指令用于所述计算机执行的软件。
一些实施方案包含光学器件,诸如透镜、镜子、分色镜、滤光器等,例如,以在特定波长范围或多个波长范围内选择性地检测荧光。
例如,在某些实施方案中,使用基于计算机的分析软件将检测测定产生的原始数据(例如,一种或多种核酸(例如,一种或多种生物标志物)的存在、不存在或量)转化成对于临床医师具有预测价值的数据。临床医师可以使用任意合适的工具访问预测数据。
例如,一些实施方案包含计算机系统,在其上面可以实现本技术的实施方案。在不同的实施方案中,计算机系统包括总线或其它用于传达信息的通信机构和用于处理信息的与所述总线偶联的处理器。在不同的实施方案中,所述计算机系统包括与所述总线偶联的存储器,其可以是随机存取存储器(RAM)或其它动态存储装置,和要由所述处理器执行的指令。存储器也可以用于在执行由所述处理器执行的指令的过程中存储临时变量或其它中间信息。在不同的实施方案中,所述计算机系统还可以包括只读存储器(ROM)或与所述总线偶联的其它静态存储装置,其用于为所述处理器存储静态信息和指令。可以提供存储装置,诸如磁盘或光盘,并与所述总线偶联,用于存储信息和指令。
在不同的实施方案中,所述计算机系统经由所述总线偶联至显示器,诸如阴极射线管(CRT)或液晶显示器(LCD),用于将信息显示给计算机用户。输入装置(包括字母数字键和其它键)可以偶联至所述总线用于将信息和命令选择传达给处理器。另一类用户输入装置是光标控制,诸如鼠标、跟踪球或光标方向键,其用于将方向信息和命令选择传达给处理器和用于控制显示器上的光标移动。该输入装置通常具有在两个轴(第一轴(例如,x)和第二轴(例如,y))上的两个自由度,其允许所述装置在平面中指定位置。
计算机系统可以执行本技术的实施方案。与本技术的某些实现相一致,计算机系统响应于处理器可以提供结果,所述处理器执行在存储器中所含的一个或多个指令的一个或多个序列。这样的指令可以从另一种计算机可读介质(诸如存储装置)读入存储器中。在存储器中所含的指令的序列的执行,可以造成所述处理器执行本文所述的方法。可替换地,可以替代软件指令或与软件指令组合地使用硬线电路来实现本教导。因而,本技术的实现不限于硬件电路和软件的任何具体组合。
本文中使用的术语“计算机可读介质”表示参与将指令提供给处理器用于执行的任何介质。这样的介质可以呈许多形式,包括、但不限于,非易失性介质、易失性介质和传输介质。非易失性介质的例子可以包括、但不限于光盘或磁盘,诸如存储装置。易失性介质的例子可以包括、但不限于动态存储器。传输介质的例子可以包括、但不限于同轴电缆、铜丝和纤维光学器件,包括包含总线的导线。
计算机可读介质的常见形式包括,例如,软盘、软磁盘、硬盘、磁带或任意其它磁性介质、CD-ROM、任意其它光学介质、穿孔卡片、纸带、具有孔模式的任意其它物理介质、RAM、PROM和EPROM、FLASH-EPROM、任意其它存储芯片或筒、或计算机可以从其读出的任意其它实体介质。
计算机可读介质的不同形式可以参与将一个或多个指令的一个或多个序列携带至处理器用于执行。例如,所述指令可以最初携带在远程计算机的磁盘上。所述远程计算机可以将所述指令负载进它的动态存储器中并通过网络连接(例如,LAN、WAN、因特网、电话线)发送所述指令。局部计算机系统可以接收所述数据并将它传递至总线。所述总线可以将所述数据携带至存储器,所述处理器从其取回和执行指令。由所述存储器接收的指令可以任选地在所述处理器执行之前或之后储存在存储装置上。
根据不同的实施方案,将被构造成由处理器执行以实现方法的指令储存在计算机可读介质上。所述计算机可读介质可以是储存数字信息的装置。例如,计算机可读介质包括光盘只读存储器(CD-ROM),如本领域已知的用于存储软件。所述计算机可读介质被处理器访问,所述处理器适合用于执行被构造成执行的指令。
根据这样的计算机系统,本文提供的技术的一些实施方案进一步包含用于收集、存储和/或分析数据(例如,核酸的存在、不存在、浓度)的功能。例如,一些实施方案预见到这样的系统:其包含处理器、存储器和/或数据库,例如,用于存储和执行指令,分析荧光、图像数据,使用所述数据执行计算,转化所述数据,和存储所述数据。在某些实施方案中,算法将统计模型(例如,泊松模型或隐马尔可夫模型)应用于所述数据。
许多诊断涉及确定一种或多种核酸(例如,核酸生物标志物)的存在或核苷酸序列。因而,在某些实施方案中,包含变量(其代表多个核酸的存在、不存在、浓度、量或序列性质)的方程式会产生这样的值:其用于做出诊断或评估核酸的存在或特性。这样,在某些实施方案中,该值由装置呈现,例如,由与结果有关的指示器(例如,LED、在显示器上的图标、声音等)呈现。在某些实施方案中,装置存储所述值,传递所述值,或使用所述值用于另外的计算。在某些实施方案中,方程式包含变量,其代表基因组DNA中的甲基化位点、微RNA、突变基因生物标志物或染色体畸变中的一个或多个的存在、不存在、浓度、量或序列性质。
因而,在某些实施方案中,本技术提供了另外益处:临床医师(其可能没有经过遗传学或分子生物学培训)不需要理解原始数据。所述数据以它的最有用形式直接呈现给临床医师。所述临床医师然后能够利用所述信息来优化受试者的护理。本发明预见到能够接收、处理来自进行测定的实验室、信息提供者、医学人员和/或受试者的信息和将信息传递给进行测定的实验室、信息提供者、医学人员和/或受试者的任何方法。例如,在本技术的某些实施方案中,从受试者得到样品并呈递给位于世界上的任何部分(例如,在这样的国家:其不同于受试者所居住的国家或最终使用所述信息的国家)的分析服务(profilingservice)(例如,在医疗设备处的临床实验室,基因组分析商业,等)以产生原始数据。在所述样品包含组织或其它生物样品的情况下,所述受试者可以访问医学中心以获得样品和送至分析中心,或受试者可以自己收集样品并直接地将它送至分析中心。在样品包含以前确定的生物学信息的情况下,所述信息可以由受试者直接送至分析服务(例如,可以由计算机扫描含有信息的信息卡,并使用电子通信系统将数据传送至分析中心的计算机)。一旦被分析服务接收到,样品就被处理并产生对于受试者需要的诊断或预后信息而言特异性的概况(profile)。然后以适合主治临床医师解释的形式制备概况数据。例如,不是提供原始表达数据,制备的形式可能代表受试者的诊断或风险评估,以及关于具体治疗选择的推荐。所述数据可以通过任意合适的方法显示给临床医师。例如,在某些实施方案中,所述分析服务产生这样的报告:其可以为临床医师打印(例如,在护理地点)或在计算机监视器上显示给临床医师。在某些实施方案中,首先在护理地点处或在当地设备处分析信息。然后将原始数据发送至中心处理设备用于进一步分析和/或将原始数据转化成对于临床医师或患者有用的信息。所述中心处理设备提供数据分析的私密性(所有数据都以一致的安全协议存储在中心设备中)、速度和均匀度的优点。所述中心处理设备然后可以在受试者的治疗以后控制数据的命运。例如,使用电子通信系统,中心设备可以将数据提供给临床医师、受试者或研究人员。在某些实施方案中,所述受试者能够使用电子通信系统访问数据。所述受试者可以基于结果选择进一步干预或咨询。在某些实施方案中,将所述数据用于研究用途。例如,可以将所述数据用于进一步优化标志物的包含或消除作为与疾病有关的特定情况的有用指示。
在以上说明书中提及的所有出版物和专利都通过引用整体并入本文用于所有目的。本领域技术人员会明白所述技术的组合物、方法和用途的各种修改和变化,而不脱离所述技术的范围和精神。尽管已经结合具体示例性实施方案描述了所述技术,但是应当理解,要求保护的发明不应当不适当地限于这样的具体实施方案。实际上,本领域技术人员显而易见的所述的用于实现本发明的模式的各种修改意图是在以下权利要求的范围内。
序列表
<110> 密歇根大学董事会THE REGENTS OF THE UNIVERSITY OF MICHIGAN
<120> 核酸的检测
<130> UM-34722/WO-1/ORD
<150> US 62/293,589
<151> 2016-02-10
<160> 1
<170> PatentIn 3.5版
<210> 1
<211> 1368
<212> PRT
<213> 酿脓链球菌
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365

Claims (15)

1.一种用于检测靶核酸的复合物,所述复合物包含:
1) 靶核酸,其包含邻近第二区域的第一区域;
2) 与所述第一区域杂交的可检测地标记的捕获探针;
3) 用猝灭剂或荧光受体标记的查询探针,所述猝灭剂或荧光受体与所述捕获探针的标记相容,
其中所述查询探针以大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon重复地杂交所述第二区域。
2.权利要求1的复合物,其中所述捕获探针和所述查询探针连接以提供分子内探针。
3.权利要求1的复合物,其中所述靶核酸具有热力学稳定性地结合所述捕获序列,且所述靶核酸发生与所述查询探针的短暂结合。
4.权利要求1的复合物,进一步包含使所述查询探针和所述捕获探针结合至表面的地址链。
5.权利要求4的复合物,其中微阵列包含所述地址链。
6.权利要求4的复合物,其中所述地址链在序列上与所述靶核酸无关,这是因为相互作用通过所述查询和捕获探针间接地发生。
7.一种用于检测靶核酸的方法,所述方法包括:
a) 使可检测地标记的捕获探针与包含邻近第二区域的第一区域的靶核酸的所述第一区域杂交;
b) 提供用猝灭剂或荧光受体标记的查询探针,所述猝灭剂或荧光受体与所述捕获探针的标记相容,
其中所述查询探针以大于0.1 min-1的动力学速率常数koff和/或大于0.1 min-1的动力学速率常数kon重复地杂交所述第二区域;和
c) 记录所述查询探针标记的荧光强度的时间依赖性变化。
8.权利要求7的方法,其中所述捕获探针和所述查询探针连接以提供分子内探针。
9.权利要求7的方法,其中:
- 使用荧光强度的时间依赖性变化中转换的数目将靶核酸与背景信号、非靶核酸和/或所述查询探针的假结合区分开;
- 使用采样时间来鉴别所述靶核酸的存在;
- 使用荧光强度的时间依赖性变化的统计分析来检测、定量和/或鉴别所述靶核酸;和/或
- 使用荧光强度的时间依赖性变化的模式来检测、定量和/或鉴别所述靶核酸。
10.权利要求7的方法,进一步包括使所述查询探针和所述捕获探针结合至表面的地址链。
11.权利要求10的方法,其中微阵列包含所述地址链。
12.权利要求7的方法,其中记录所述查询探针标记的荧光强度的时间依赖性变化包括成像。
13.权利要求7的方法,其中将所述查询探针标记的荧光强度的时间依赖性变化记录1-10秒。
14.权利要求10的方法,其中所述微阵列包含固定化在成像表面的不同区域内的许多不同的捕获和查询探针。
15.权利要求14的方法,其中所述方法提供了通过空间分离对实验的并行化。
CN202111607215.6A 2016-02-10 2017-02-08 核酸的检测 Pending CN114196746A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662293589P 2016-02-10 2016-02-10
US62/293589 2016-02-10
PCT/US2017/016977 WO2017139354A1 (en) 2016-02-10 2017-02-08 Detection of nucleic acids
CN201780020624.1A CN109072205A (zh) 2016-02-10 2017-02-08 核酸的检测

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780020624.1A Division CN109072205A (zh) 2016-02-10 2017-02-08 核酸的检测

Publications (1)

Publication Number Publication Date
CN114196746A true CN114196746A (zh) 2022-03-18

Family

ID=59563387

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202111607215.6A Pending CN114196746A (zh) 2016-02-10 2017-02-08 核酸的检测
CN201780020624.1A Pending CN109072205A (zh) 2016-02-10 2017-02-08 核酸的检测

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201780020624.1A Pending CN109072205A (zh) 2016-02-10 2017-02-08 核酸的检测

Country Status (6)

Country Link
US (2) US20190048415A1 (zh)
EP (3) EP4155397A1 (zh)
JP (3) JP2019513345A (zh)
CN (2) CN114196746A (zh)
ES (1) ES2835101T3 (zh)
WO (1) WO2017139354A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102145677B1 (ko) 2012-02-03 2020-08-18 캘리포니아 인스티튜트 오브 테크놀로지 다중화된 생화학적 분석에서의 시그널 인코딩 및 디코딩
CN104662172B (zh) 2012-08-03 2018-07-06 加州理工学院 Pcr中具有减少的硬件和要求的多重化和定量
US10093967B2 (en) 2014-08-12 2018-10-09 The Regents Of The University Of Michigan Detection of nucleic acids
US11111492B2 (en) * 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
CA3055565A1 (en) 2017-03-08 2018-09-13 The Regents Of The University Of Michigan Analyte detection
JP7270992B2 (ja) * 2017-12-14 2023-05-11 ザ リージェンツ オブ ザ ユニバーシティ オブ ミシガン 分析物の濃縮
US11561221B2 (en) * 2018-05-02 2023-01-24 Trustees Of Boston University Dynamic tracking of captured targets for enhanced digital biosensing
WO2020014388A1 (en) * 2018-07-11 2020-01-16 ChromaCode, Inc. Methods for quantitation of analytes in multiplexed biochemical reactions
EP3827012A4 (en) * 2018-07-24 2022-04-06 The Regents of the University of Michigan INTRAMOCULAR KINETIC PROBES
CN111690724B (zh) * 2019-03-15 2022-04-26 北京大学 一种检测双链断裂产生试剂活性的方法
CN110208226B (zh) * 2019-04-15 2020-06-16 北京化工大学 一种高度特异性的单分子荧光检测方法
WO2021008805A1 (en) * 2019-07-12 2021-01-21 Illumina Cambridge Limited Compositions and methods for preparing nucleic acid sequencing libraries using crispr/cas9 immobilized on a solid support
WO2021155775A1 (zh) * 2020-02-03 2021-08-12 苏州克睿基因生物科技有限公司 一种检测靶核酸的方法和试剂盒
EP4121556A4 (en) * 2020-03-19 2024-04-17 Univ Michigan Regents ANALYTE DETECTION
AU2021279039A1 (en) * 2020-05-29 2023-01-19 Mammoth Biosciences, Inc. Programmable nuclease diagnostic device
CN112063604A (zh) * 2020-09-15 2020-12-11 济南国科医工科技发展有限公司 功能化的dCas9修饰蛋白及其在检测核酸中的应用
CN116802287A (zh) * 2021-01-05 2023-09-22 学校法人川崎学园 包括人类在内的生物体细胞中的转录产物、转染rna及其纯化复合物的工具
WO2022163770A1 (ja) * 2021-01-28 2022-08-04 国立研究開発法人理化学研究所 ゲノム編集ツールの評価方法
WO2023122427A1 (en) * 2021-12-21 2023-06-29 Foundation Medicine, Inc. Methods and systems for predicting genomic profiling success

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
DE69637518D1 (de) * 1995-12-22 2008-06-19 Dade Behring Marburg Gmbh Homogene vervielfältigung und nachweis von nukleinsäuren
US6514768B1 (en) * 1999-01-29 2003-02-04 Surmodics, Inc. Replicable probe array
JP4527338B2 (ja) 1999-11-16 2010-08-18 キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング 核酸分子に標識を付けるための染料標識オリゴヌクレオチド
JP2003180374A (ja) * 2001-10-12 2003-07-02 Adgene Co Ltd 核酸溶解曲線を応用した核酸変異検出法
DE10259374A1 (de) 2002-12-18 2004-07-08 Atto-Tec Gmbh Carboxamid-substituierte Farbstoffe für analytische Anwendungen
WO2004097043A1 (en) * 2003-04-25 2004-11-11 The University Of Manchester Exciplexes
DE10329860A1 (de) 2003-07-02 2005-01-20 Atto-Tec Gmbh Sulfonamidderivate polycyclischer Farbstoffe für analytische Anwendungen
ES2718482T3 (es) * 2004-06-01 2019-07-02 Alere San Diego Inc Kit para amplificación de recombinasa polimerasa
US8198604B2 (en) 2007-09-28 2012-06-12 Trustees Of Boston University System and method for providing enhanced background rejection in thick tissue with differential-aberration two-photon microscopy
CN102057397A (zh) 2008-06-05 2011-05-11 波士顿大学理事会 使用结构和均匀照明产生光学截面图像的系统和方法
NZ728024A (en) * 2012-05-25 2019-05-31 Univ California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
US9091862B2 (en) 2012-07-24 2015-07-28 Trustees Of Boston University Partitioned aperture wavefront imaging method and system
KR102405549B1 (ko) 2013-03-15 2022-06-08 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
CA2919833A1 (en) * 2013-07-30 2015-02-05 President And Fellows Of Harvard College Quantitative dna-based imaging and super-resolution imaging
US9850525B2 (en) * 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
SG11201702066UA (en) * 2014-07-21 2017-04-27 Illumina Inc Polynucleotide enrichment using crispr-cas systems
US10093967B2 (en) * 2014-08-12 2018-10-09 The Regents Of The University Of Michigan Detection of nucleic acids
AU2015305570C1 (en) * 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
US11180792B2 (en) * 2015-01-28 2021-11-23 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
KR102535217B1 (ko) * 2015-04-24 2023-05-19 에디타스 메디신, 인코포레이티드 Cas9 분자/가이드 rna 분자 복합체의 평가
KR101710026B1 (ko) * 2016-08-10 2017-02-27 주식회사 무진메디 Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물
CN109790541B (zh) * 2016-09-29 2022-12-09 豪夫迈·罗氏有限公司 分析并优化基因编辑模块和递送方案的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALEXANDER JOHNSON-BUCK等: "Kinetic fingerprinting to identify and count single nucleic acids", NATURE BIOTECHNOLOGY, vol. 33, no. 7, 22 June 2015 (2015-06-22), pages 1 - 2 *

Also Published As

Publication number Publication date
EP3800249A1 (en) 2021-04-07
ES2835101T3 (es) 2021-06-21
JP2021129581A (ja) 2021-09-09
EP3414327A4 (en) 2019-10-16
EP3414327B1 (en) 2020-09-30
US20190048415A1 (en) 2019-02-14
JP2019513345A (ja) 2019-05-30
EP4155397A1 (en) 2023-03-29
EP3414327A1 (en) 2018-12-19
WO2017139354A1 (en) 2017-08-17
CN109072205A (zh) 2018-12-21
EP3800249B1 (en) 2022-06-22
JP2023153898A (ja) 2023-10-18
US20210348230A1 (en) 2021-11-11
JP7327826B2 (ja) 2023-08-16

Similar Documents

Publication Publication Date Title
US20210348230A1 (en) Detection of nucleic acids
US11519032B1 (en) Transposition of native chromatin for personal epigenomics
US20230070399A1 (en) Methods and systems for processing time-resolved signal intensity data
CN104372080B (zh) 多核苷酸作图和测序
CN105899680A (zh) 核酸探针和检测基因组片段的方法
US20210318296A1 (en) Intramolecular kinetic probes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination