CN114729892A - 用于分子谱分析的多焦点成像的方法 - Google Patents

用于分子谱分析的多焦点成像的方法 Download PDF

Info

Publication number
CN114729892A
CN114729892A CN202080080598.3A CN202080080598A CN114729892A CN 114729892 A CN114729892 A CN 114729892A CN 202080080598 A CN202080080598 A CN 202080080598A CN 114729892 A CN114729892 A CN 114729892A
Authority
CN
China
Prior art keywords
nucleic acid
sample
binding
amplified nucleic
detectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080080598.3A
Other languages
English (en)
Inventor
J·R·莫菲特
H·P·巴布科克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Childrens Medical Center Corp
Original Assignee
Harvard College
Childrens Medical Center Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Childrens Medical Center Corp filed Critical Harvard College
Publication of CN114729892A publication Critical patent/CN114729892A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/645Specially adapted constructive features of fluorimeters
    • G01N21/6456Spatial resolved fluorescence measurements; Imaging
    • G01N21/6458Fluorescence microscopy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B21/00Microscopes
    • G02B21/36Microscopes arranged for photographic purposes or projection purposes or digital imaging or video purposes including associated control and data processing arrangements
    • G02B21/365Control or image processing arrangements for digital or video microscopes
    • G02B21/367Control or image processing arrangements for digital or video microscopes providing an output produced by processing a plurality of individual source images, e.g. image tiling, montage, composite images, depth sectioning, image comparison
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N2021/6417Spectrofluorimetric devices
    • G01N2021/6421Measuring at two or more wavelengths
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • G01N2021/6441Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks with two or more labels

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Multimedia (AREA)
  • Optics & Photonics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Microscoopes, Condenser (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开一般而言涉及用于多焦点成像用于确定细胞或其它样品中的核酸的系统和方法。样品暴露于多个核酸探头。对于每个核酸探头,使用聚焦在样品内的不同焦平面上的至少2个检测器捕获样品的图像。例如,通过使用多个相机,对同一样品成像,但其中至少一些聚焦在样品内的不同焦平面上,可以同时确定多个焦平面。因此,样品可以在3个维度上成像,例如,而无需样品重新聚焦。在某些情况下,这可以提高成像在空间和/或时间上的分辨率。各种实施例可以用于增加基于图像的方法中的成像吞吐量和/或分辨率,例如,用于单细胞分子谱分析,诸如多路复用的误差稳健荧光原位杂交(MERFISH),或用于其它应用。使用捕获的图像确定样品内的核酸探头的结合、丰度和/或空间分布。

Description

用于分子谱分析的多焦点成像的方法
相关申请
本申请要求Moffitt等人于2019年11月20日提交的标题为“Systems and Methodsfor Multi-Focal Imaging for Molecular Profiling”的美国临时专利申请序列No.62/938,194的权益,该申请通过引用整体并入本文。
技术领域
本公开一般而言涉及用于多焦点成像的系统和方法。
背景技术
经由大规模多路复用原位成像对单细胞和其它生物样品进行深度分子谱分析(molecular profiling)的方法已成为解决各种生物学问题的有力方法。在这些方法中,大量不同分子靶标的二维分布经由多路复用宽视场成像模态在生物样品中确定,并且这种测量被扩展以通过对多个不同焦平面进行成像,即收集z栈,来确定样品的三维分布。但是,吞吐量—每单位时间可以表征的样品体积或细胞数量—通常受到样品成像速度和样品被重新聚焦速度的限制。类似地,这些样品中不同分子种类的分辨率通常会受到沿着轴向轴的光学点扩散函数的显著更大程度的限制。因此,需要改进的成像模态,其允许每单位时间收集更多的图像以增加此类样品的吞吐量,和/或可以提供沿着z轴增加的光学分辨率。
发明内容
本公开一般而言涉及用于多焦点成像的系统和方法。在一些情况下,本公开的主题涉及相互关联的产品、特定问题的替代解决方案和/或一个或多个系统和/或物品的多种不同用途。
一组实施例一般而言涉及一种方法,该方法包括将样品暴露于多个核酸探针(probe);对于核酸探针中的每个核酸探针,使用聚焦在样品内不同焦平面上的至少4个检测器来捕获样品的图像;使用图像确定样品内核酸探针的结合;以及确定样品内与多个核酸探针的结合对应的核酸的丰度和/或空间分布。
另一组实施例一般而言涉及一种方法,该方法包括将样品暴露于多个核酸探针;对于核酸探针中的每个核酸探针,将核酸探针暴露于能够与其结合的扩增(amplifier)核酸,其中最大有限数量的扩增核酸能够直接或间接结合核酸探针;以及对于核酸探针中的每个核酸探针,使用聚焦在样品内不同焦平面上的至少4个相机来捕获样品的图像。
在又一组实施例中,该方法包括使用MERFISH分析样品,其中分析的动作包括使用多个相机捕获图像。在还有的另一方面,该方法包括使用多个相机确定样品内核酸的丰度和/或空间分布。根据又一方面,该方法包括可选地同时确定样品(诸如单细胞)中成百上千的核酸种类(诸如RNA和/或DNA)的复制数量和/或空间分布。
在另一方面,本公开包括制造本文描述的实施例中的一个或多个(例如,用于多焦点成像的设备)的方法。在还有的另一方面,本公开包括使用本文描述的实施例中的一个或多个(例如,用于多焦点成像的设备)的方法。
当结合附图考虑时,本公开的其它优点和新颖特征将从以下对本公开的各种非限制性实施例的详细描述中变得清晰。
附图说明
将参考附图以示例的方式描述本公开的非限制性实施例,这些附图是示意性的并且不旨在按比例绘制。在图中,所示出的每个相同或几乎相同的组件通常由单个数字表示。为了清楚起见,没有在每个图中都标记每个组件,也没有在本公开的每个实施例中都标记不需要说明来允许本领域普通技术人员理解本公开的每个组件。在图中:
图1是根据本公开的一个实施例的设备的示意图;
图2是根据本公开的另一个实施例的设备的示意图;以及
图3A-3E是使用初级和二级扩增核酸来扩增信号的实施例的示意图;以及。
图4是根据本公开的另一个实施例的设备的示意图。
具体实施方式
本公开一般而言涉及用于多焦点成像,例如,用于确定细胞或其它样品中的核酸的系统和方法。在一些情况下,例如,通过使用多个检测器,诸如多个相机,对同一样品成像,但其中至少一些聚焦在样品内的不同焦平面上,可以同时确定多个焦平面。因此,样品可以在3个维度上成像,例如,而无需样品重新聚焦。在某些情况下,这可以提高成像在空间和/或时间上的分辨率。各种实施例可以用于增加基于图像的方法中的成像吞吐量和/或分辨率,例如,用于单细胞分子谱分析,诸如多路复用的误差稳健荧光原位杂交(MERFISH),或用于其它应用。
例如,某些方面一般而言涉及利用相机组的系统,该相机组中的所有相机同时对同一样品进行成像,以允许收集整个z栈和全体积成像而无需样品重新聚焦和/或增加解析分子靶标沿着轴向方向的地点的能力。这些可以增加基于图像的方法中的成像吞吐量和/或分辨率,例如,用于单细胞分子谱分析或其它应用。
许多生物学问题需要在其天然生物学背景下测量单细胞内的基因组规模分子谱。为了满足这一需求,最近开发了大规模多路复用分子成像技术,该技术可以对单细胞的分子特性进行基因组规模谱分析。此类技术可以用于靶向细胞内多种不同类型的分子,包括但不限于基因组位点(loci)、mRNA和/或蛋白质。
分子特异性可以通过使用与关注的分子结合的探针来实现。例如,DNA寡核苷酸可以用于使用诸如原位杂交(ISH)或荧光原位杂交(FISH)之类的技术,使用与对应靶标的序列部分互补的序列选择性地标记不同的核酸种类。类似地,核酸适体或抗体可以用于选择性地标记不同的蛋白质或使用诸如免疫荧光或免疫组织化学之类的技术进行了选择性转译后修饰的蛋白质。这些探针的结合可以通过用光学可检测组成部分(moiety)(诸如,荧光团)标记它们,然后用各种荧光显微镜方法对样品进行成像来确定。通过使用光学可区分的荧光团,可以在同一样品内同时确定不同的分子。替代地,通过重复染色和成像样品的方法,可以将不同分子种类的数量大大增加至超过可区分荧光团的数量。在一些情况下,这种同一样品的重复染色和成像处理可以用于构建允许识别大量分子靶标的组合条形码。
例如,MERFISH是单分子FISH的大规模多路复用形式。在MERFISH的一个实施例中,可以将独特的二进制条形码分配给每个靶向核酸种类。这些条形码然后被转译成编码探针,这些探针靶向这些核酸种类中的每一种,并将对应的条形码分配给这些分子。在该方法的一种实施方式中,为二进制条形码中的每个位设计独特的寡核苷酸序列—读出序列。然后,每个靶向核酸的特定条形码确定在靶向对应核酸靶标的编码探针上存在的读出序列的组合。具体而言,如果条形码在给定位中包含“1”,那么对应的编码探针将包含该读出序列;如果它在该位中包含“0”,那么这些探针将不包含该读出序列。这些探针例如使用原位杂交方法与生物样品杂交。为了确定哪些分子靶标被包含给定读出序列的探针标记,然后可以将样品与与该读出序列互补的荧光标记的读出探针杂交。对样品进行成像,并且测量的荧光分布可以用于确定具有在与靶标读出序列对应的位中包含“1”的条形码的分子的地点。然后可以从样品中去除荧光信号,并且可以用与不同读出序列互补的不同荧光标记的读出探针对样品进行染色,以确定在该位中包含“1”的分子靶标。对样品进行成像,去除荧光信号,并重复此处理,直到条形码中的所有位都已被测量。如果多个可区分的荧光团与不同的读出探针相关联,那么可以同时对多个读出探针进行染色,并且可以使用多色荧光成像同时探测多个位的值。
应该理解的是,本文还设想了采用更一般的条形码方法的类似方法。例如,一些条形码方法可能涉及三进制组或更大的条形码字母表。在一些情况下,读出序列中的一些或全部可以被分配给字母表的所有可能值,例如,一个独特读出序列与给定位处的“1”值相关联并且不同的独特读出序列与在那个位处的“0”值相关联。作为又一个示例,信号的缺失可以与给定条形码条目处的值之一相关联。
这样的测量会引起读出误差—其中给定位的值没有被正确测量。这些测量误差对于多路测量来说可能是有问题的,因为它们可以将一个条形码转换成另一个条形码和/或导致分子靶标的错误识别。多种机制可能导致这些读数误差,诸如核酸探针中的一些缺乏结合或一些探针与错误的分子靶标错误结合。为了克服这些误差,MERFISH可以利用二进制或其它条形码方案,这些方案可以检测和/或纠正已被错误测量的位或其它元素。在这种方法中,可以使用多种抗误和纠错编码方案,包括汉明码、恒权汉明码、格雷(Golay)码、Turbo码、Reed-Solomon码、Reed-Solomon纠删码等。此外,不使用二进制条形码的编码方案仍然可以被表示为二进制条形码。因此,假设二进制条形码没有丧失一般性。这些条形码的误差检测和纠正能力来自于,例如,将一个有效条形码与另一个分开的汉明距离—例如,将一个条形码转换成另一条形码必须被破坏的位数。诸如汉明码之类的条形码方案被设计为使得所有有效的条形码都被最小的汉明距离分开。但是,也可以通过随机选择所有可能的条形码的适当小的子集来生成其它条形码方案,使得大多数生成的条形码被最小的期望汉明距离分开,因此具有期望的误差检测和纠正特性。任何使用由某个最小汉明距离分开的条形码的编码方案都可以在此类应用中使用,以提供某种程度的误差检测和/或纠正。如本领域普通技术人员将理解的,两个等长条形码之间的“汉明距离”是对应符号不同的位置的数量。换句话说,汉明距离测量将一个条形码改变为另一个条形码所需的最小替换次数,或可能将一个条形码变换成另一个条形码的最小误差数。
在各种实施例中,广范围的二维成像模态可以与MERFISH和其它基于图像的分子谱分析技术一起使用。例如,可以使用广域成像技术,诸如落射荧光显微镜或旋转盘共聚焦显微镜。类似地,在一些情况下,也可以使用二维扫描模态,诸如扫描点或线共焦。此外,还可以使用超分辨率成像模态,包括随机光学重建显微镜(STORM)、受激发射耗尽显微镜(STED)或结构化照明显微镜。物理扩展样品的样品制备方法(诸如,扩展显微镜)可以与任何这些成像模态组合,以进一步提高分辨率。
在一些情况下,这些成像模态在给定时间对单个光学平面进行成像,因此可以产生二维(2D)图像。但是,在三维(3D)中重建生物样品的分子谱通常有很大的好处。为了使用此类方法重建3D分布,通常通过改变成像物镜和样品之间的距离来重新聚焦样品,使得成像系统被聚焦在样品内的不同轴向平面上。收集2D图像。调整成像系统的聚焦,并且收集另一个图像。通过迭代该处理,可以使用每一个在不同焦平面上收集的一系列2D图像来重建3D体积。在该处理中,可以使用单个相机或点或线检测器来重建3D体积。
这些收集关于3D体积的信息的方法的一个缺点是它们可能慢。首先,以串行方式收集不同焦平面(或z位置)的图像。因此,为了收集N个差异图像栈,需要至少N倍于一个图像的曝光时间。其次,将系统从一个焦平面重新聚焦到另一个焦平面通常需要系统的一些物理移动,无论是物镜的移动还是样品的移动,并且系统进行这种移动并正确稳定在新位置所需的时间是有限的。
因而,某些实施例一般而言涉及允许在多个焦平面同时进行广域或点扫描图像的方法和装置。在一些情况下,这些可以用于显著提高高度多路复用、基于图像的生物样品中分子谱分析方法的性能。在一些实施例中,这些方法利用一个或多个检测器组,而不是利用一个或两个检测器对样品成像的典型光学仪器。装置可以包括多个检测器,例如,不少于2、4、8、16或32个检测器,其中每个检测器在样品的相同2D地点对不同焦平面成像。为了将来自这部分样品的光分布在单个检测器组内的检测器上,可以使用部分反射镜(例如,50%的反射镜)。每个检测器组内的光学器件可以被配置为使得组内的每个检测器对样品中的相同2D地点成像,但可以在该平面处对不同的焦点(z)位置或焦点偏移进行成像。在一些情况下,系统可以能够同时对期望z栈中的焦平面中的全部或部分进行成像。例如,参见图1。
图1是图示装置的一个实施例的示意图。在该非限制性示例中,照明系统提供光以激发样品中的荧光,并经由分色镜耦合到成像物镜中。样品的荧光经由管状透镜收集并导入到检测器组中。在检测器组内,部分反射镜将发射的光分成两条光路。一系列附加的部分反射镜将这些路径中的每一条分成四条路径,然后这四条路径中的每一条经由另一组部分反射镜被分成附加的两条路径。这些镜子中的每一个都可以被调整以允许系统对准。然后将来自每条路径的光聚焦到与每条路径相关联的检测器上,以在该检测器处形成样品平面的图像。通过调整每个检测器与其对应的成像透镜之间的相对距离,可以选择由给定检测器成像的样品中的特定焦平面。通过系统地对准所有透镜,阵列中的每个检测器都可以对样品中的不同焦平面进行成像。
在一些实施例中,检测器是相机。相机可以包括二维像素阵列,并且可以能够量化照射在每个像素上的光量。在其它实施例中,检测器可以是点检测器,例如光电检测器或雪崩光电二极管。在还有的其它实施例中,检测器可以是像素的一维阵列,例如,行检测器。在其它实施例中,检测器可以由附加的检测器组组成,每个检测器检测样品的某个不同特性或参数,例如,发射光的颜色、发射光的定时等。
在一些实施例中,通过这样的系统在给定地点平行收集多个焦平面可以将对样品成像所需的时间减少成比例的量。例如,如果使用8个相机对8图像z栈中的8个不同焦平面进行成像,那么收集此栈所需的时间,与扫描系统焦点并以连续方式收集这些图像的标准方法不同,可以被减少例如至少8倍。在其它实施例中,例如,如果系统需要相当大的时间量在收集z栈中每个图像之间进行重新聚焦,那么使用这种相机组可以减少收集这种z-栈所需的时间多于与相机数量成比例的量。
在一些实施例中,检测器组的使用可以减少收集z栈图像的时间,并且在某些情况下,减少超过简单地通过增加所使用的检测器的数量期望的量(例如,可能期望通过使用2个相机将时间减少2倍)。例如,如果在检测器组中使用的曝光时间大于其中用单个检测器经由多轮样品重新聚焦和成像采集z栈的可比较成像实验中使用的曝光时间,那么可能发生这种时间减少。
作为说明性的非限制性示例,考虑具有100Hz帧速率的相机和需要100ms以将物镜重新定位在新焦平面处的显微镜系统。由于每个图像的曝光时间(10ms)比重新聚焦系统所需的时间要快得多,因此必须等待系统完成重新聚焦处理才能收集图像。因此,收集由8个图像组成的z栈所需的时间将是曝光所有8个图像所需的时间(80ms)加上执行必要的7个重新聚焦事件所需的时间(700ms)。作为对照,使用诸如这里描述的多个相机,重新聚焦不是必需的,并且这样的组中的所有8个相机可以同时曝光。因此,使用单个相机和重新聚焦来重建完整z栈所需的总时间(780ms)使用这里描述的相机组系统,可以减少到仅10ms,例如,与仅单个相机的时间相当。
至少在某些实施例中,在多个相机之间划分光可能会减少每个相机接收到的信号。在一些情况下,如有必要,可以克服这种光信号的减少,例如,通过扩增来自单个分子靶标的信号。合适的方法包括但不限于增加照明强度、使用更亮的荧光分子或使样品暴露更长持续时间。在一些情况下,也可以使用增加与每个分子靶标结合的荧光分子数量的方法。例如,可以将多个不同的FISH探针靶向各个核酸,或者可以将多个荧光团固定到第一抗体或第二抗体等。
在一些实施例中,可以复制荧光标记探针的结合部位。此类方法包括但不限于滚环扩增(RCA)、杂交链式反应(HCR)、clampFISH、分支DNA(bDNA)扩增等。这些和其它方法可以用于一些实施例中以增加来自各个分子靶标的信号,例如,使得可以使用多个相机。
在另一个实施例中,利用多个相机组,从物镜收集的光使用诸如二向色镜之类的光学器件经由颜色分离,使得各个颜色通道被引导到各个相机组(图2)。在每个相机组中,各个相机可以聚焦在不同的焦平面上,并且可以使用各个相机组对相同的样品体积进行成像,但在不同的颜色通道中。在一些情况下,可以在多个颜色通道中并行收集全部或部分z栈,从而在单个相机曝光所需的时间内收集多色z栈。
在一些实施例中,可以减少对样品成像所需的时间。例如,例如使用多种不同颜色收集完整z栈图像将意味着可以在一轮染色成像中测量多个读出探针,而不是需要对每位进行一轮成像。这种方法的非限制性示例在示例2中示出。
在一些实施例中,相机组可以被设计为使得分离每个成像光学平面的轴向距离是均匀的,而在其它实施例中,成像平面之间的间距可能不均匀或不同。在某些实施例中,相机组可以被设计为使得由每个相机成像的焦平面可以独立于由同一组内的相机成像的其它平面被快速改变。在某些情况下,改变相机组内成像焦平面之间的间距的能力可以优化给定测量的z栈特性。例如,在细胞内分子谱的测量中,可能不需要在紧密间隔的光学平面内对相同的分子进行成像,而是将光学平面分开等于或大于成像系统的点扩散函数的轴向范围的距离,使得来自单个分子的信号仅出现在一个光学平面中。在这种成像模态中,每个图像将表示各个细胞内分子谱的统计上不同的测量。作为对照,在其它应用中,减少成像光学平面之间的间距可能是有益的,使得间距等于或小于光学点扩散函数的轴向范围,因此来自单个分子的信号将出现在相机组内的多个相机上。
根据本公开的一些实施例,有多种方式可以分析来自多焦点相机组的数据以重建成像系统的特性。例如,如上所述,独立平面可以被独立分析,并且可以用于提供样品区域(例如,各个细胞)内表达谱的统计独立测量。在一些情况下,来自多个平面的信息可以共同用于z栈的分析。换句话说,来自一个z平面的图像可以用于分析来自不同z平面的图像。例如,在某些实施例中,从单个相机组收集的图像可以与光学反卷积算法组合使用,从而例如以高于系统的光学分辨率的分辨率重建样品的成像体积内分子分布的3D图像。此外,在一些实施例中,可以使用多平面定位算法分析此类图像,以允许以低于衍射极限的分辨率确定单个分子的3D地点。此外,在一些实施例中,可以使用光学重建技术将一个平面中的焦点对准(in-focus)强度信息与第二平面中收集到的离焦光(out-of-focus light)组合,以确定来自样品的发射光的强度和相位,并且因此重建成像体积中荧光信号的完整3D分布。
在一些实施例中,对于采用多个相机组的系统,每个相机组专用于单独的颜色通道,可以针对这些颜色通道中的每一个独立地执行这种分析。但是,在某些情况下,也可以组合从不同颜色组收集到的图像中的信息。例如,如果各个相机组从不同荧光团的发射光谱的不同部分收集光,那么可以使用诸如光谱分离之类的方法来确定具有不同但重叠发射光谱的两个或更多个荧光团的分布。
在又一个实施例中,可以用点检测器组代替基于相机的广域成像。在一些实施例中,沿着整个样品的轴向位置移位的一组照明斑点(spots)可以映射到点检测器组中的每个点检测器。通过同时扫描照明斑点和样品中点检测器收集光的位置,可以构建扫描图像的z栈,其中不同的z平面同时成像。这也可以与其它检测器一起使用,诸如行照明和行检测器。通过适当地掩蔽发射的光,可以以共焦模态执行这种测量。在各种实施例中,任何类型的光敏检测器都可以用在这样的组中,以允许广泛的成像模态,包括宽视场和扫描,以同时表征样品中的多个轴向位置。
在又一个实施例中,一个组内的检测器以及可能跨多个组的检测器可以通过电子设备同步,从而每个检测器同时开始和完成其采集。在一些实施例中,可以在组内的不同检测器的采集开始之间设置定义的时间延迟。类似地,至少在一些实施例中,相机组之间的采集可以同时开始或以特定时间延迟发生,使得采集持续时间完全、部分或根本不重叠等。存在多种方法可以控制这种类型的采集定时。在一些实施例中,可以通过参考由该组中的一个“主”检测器产生的定时信号来设置组内每个检测器的采集定时。在一些情况下,组内所有检测器的定时可以由单独的组中的相机产生的定时信号来设置。在其它实施例中,组内的所有相机的定时可以由诸如信号发生器或计算机之类的外部源产生的定时信号来设置。在一些实施方式中,当一些或所有相机指示它们准备好接收触发时,相机的外部定时可以自身被触发。
在一些实施例中,由每个检测器组产生的数据可以经由信号采集系统(例如计算机)来收集。在一些实施例中,由组内各个检测器产生的数据各自可以通过专用信号采集系统(即计算机)来采集。
在一些实施例中,采集的数据可以存储在由组内所有检测器共享的存储系统(例如硬盘驱动器)上。在某些实施例中,采集的数据可以存储在对于每个检测器独特的存储系统上。在一些情况下,这些数据可以通过组内或系统内的所有检测器共享的计算资源,或经由对于每个检测器和存储系统独特的计算资源等被聚合、组合和/或移动到单独的存储装置。在一些实施方式中,单板计算机或与组中的相机相关联的其它计算机可以包含内部存储系统,诸如固态驱动器,以允许图像从一个或多个相机实时流传输到该内部存储装置。该存储装置可以用作临时存储装置,以在传输到其它外部系统之前存储数据。
在一些实施例中,可以使用诸如以太网通信之类的系统(例如,流传输到云存储,或本领域普通技术人员已知的用于数据传输的其它技术)将数据实时流传输到场外存储系统。
在一些实施例中,可以例如实时处理收集到的数据。例如,在某些实施例中,在组内的所有检测器之间共享或对于组内的每个检测器独特的计算资源可以用于处理数据。这样的处理可以包括但不限于诸如图像反卷积、低通滤波、高通滤波、特征识别等的计算任务。在一些实施例中,特征识别涉及在这些检测器收集到的图像中识别点状或斑点状特征,例如,拟合点扩散函数以确定荧光发射器的质心。在一些实施例中,可以一起分析来自组中多个检测器的表示来自多个焦平面的信息的数据。例如,在图像反卷积的上下文中,3D反卷积算法可以应用于整个z栈,以更高分辨率重建3D分布。作为另一个非限制性示例,斑点拟合算法可以用于识别此类z栈中各个荧光发射器的3D质心。
在一些实施例中,图像分析的全部或部分可以经由检测器组的检测器内的专用功能来执行。例如,各个相机或其它检测器可以包含允许对收集到的图像进行去卷积、识别特定关注区域、识别诸如荧光斑点之类的特征等功能。在一些情况下,只有这些分析结果可以被保存和/或发送到计算机等。
在一些实施例中,在执行这种分析之后,可以丢弃来自样品的采集图像。
在一些实施例中,运行单个主控制程序的单个计算机可以用于协调从附接到单个显微镜的所有检测器组中的所有检测器的数据收集。在某些情况下,每个检测器组可以经由其自己的运行单独程序的计算机进行控制,并且在一些情况下,这些计算机可以经由运行软件的主计算机进行控制,该软件与与每个检测器组相关联的计算机上运行的程序进行通信和协调。在一些实施例中,组内的每个检测器可以由与运行控制程序的那个相机相关联的计算机控制。在某些实施例中,这些计算机又可以由与每个检测器组相关联的主计算机控制,该主计算机可以运行负责与组上所有计算机通信的主控制程序。
此外,在一些实施例中,相机集合,例如,2、3、4或更多个相机可以由单个计算机控制,例如,使得相机组由多于一个计算机但比相机总数少的计算机控制。此外,在一些实施例中,负责控制相机组系统的小分组的单板计算机又可以由负责控制成像系统的其它方面的单独计算机(诸如塔式计算机或个人计算机)控制。单板计算机可以包含多个CPU或GPU,这可以促进实时处理来自相机组内各个相机或相机集合的数据。这些计算机之间的通信可以例如经由各种速度(例如10Gb或1Gb)例如使用以太网或无线通信方法来执行。此外,还可以经由USB、串口、数字TTL等执行通信。
在一些实施例中,可以至少部分地经由机器学习方法来执行对图像的分析。例如,在一个实施例中,神经网络可以使用合适的样品用在各个检测器或检测器组中的所有检测器上收集到的数据子集来训练,然后这样的网络可以用于分析由检测器组内的各个检测器收集到的数据,或者对组内的所有检测器执行联合分析等。在一些实施例中,可以使用这样的分析来代替对由检测器组中的每个检测器成像的光学平面的间距的精确校准。在一些实施例中,这种分析可以用于例如相对于其它分析方法增加识别这种图像的关注特征的速度。在某些情况下,此类方法可以用于增加从检测器组中的所有检测器重建的图像的有效分辨率。在一些实施例中,此类方法可以用于联合分析从对样品的不同部分成像的多个检测器组(诸如例如不同颜色的荧光发射器)收集到的数据。例如,此类方法可以用于区分比用于对样品成像的检测器组的数量多的荧光团的发射。
广泛的机器学习方法是可用的,包括但不限于支持向量机、线性和非线性回归以及不同形式的神经网络。此外,还有多种技术用于实现此类分析,包括实时,即在保存图像之前运行此分析的方法。这些方法包括但不限于现场可编程门阵列(FPGA)、图形处理器单元(GPU)、CPU等。
在一些实施例中,本文讨论的任何光学装置可以用于例如多路复用的单分子RNA成像测量、多路复用的免疫荧光成像、多路复用的基因组测量,或组合上述技术和/或附加技术中的两个或更多个的多模态测量。在某些情况下,诸如本文描述的那些光学装置可以用于实时追踪物体在3D空间中的移动,例如,跟踪单个细胞内的荧光标记分子。
某些实施例涉及用于对准和/或维持此类系统的对准的系统和方法。例如,固定的基准点集合,例如嵌入在水凝胶中或放置在样品表面上的荧光珠,可以沿着光轴进行扫描,并且给定基准点在每个检测器上焦点对准的相对扫描位置可以用于确定由每个检测器成像的焦平面之间的相对偏移,和/或调整每个检测器的成像焦点位置以匹配预定的、期望的焦平面。
在一些实施例中,诸如准直激光器之类的参考光源被引导通过检测器组,例如以对准系统。在一些实施例中,可以扫描与每个检测器相关联的聚焦或成像透镜以确定该对准源的最佳焦点位置。然后,成像透镜可以从该焦点的位置移动预定偏移量。在其中一些检测器共享成像透镜的一些实施例中,可以通过沿着光轴移动每个检测器来执行可比较的对准。类似地,组中每个检测器的对准可以由每个检测器上的该对准源的图像,例如,由该对准源形成的斑点的测量宽度来设置。类似地,可以移动每个反射镜、透镜或检测器以对准由检测器阵列中的每个元件构造的图像,使得这些图像的2D位置对准。例如,对于相机,这种对准可以将检测器组中两个不同相机中的对应像素的位置配准到样品中的相同地点。可以以优于例如5nm、10nm、20nm、30nm、50nm、100nm、200nm、500nm或1000nm的准确度执行这种对准。类似地,与每个检测器相关联的期望焦平面的对准可以以优于例如10nm、25nm、100nm、200nm、500nm和1000nm的准确度完成。
本公开不仅限于以上示例。其它实施例也是可能的。因而,更一般地,本公开的各个方面涉及用于多焦点成像的各种系统和方法。
例如,本公开的某些实施例一般而言涉及使用多个检测器的系统和方法,这些检测器聚焦在例如样品中的各种焦平面上。检测器的示例包括但不限于相机、光电检测器、光电二极管等。相机的示例包括但不限于CCD相机、CMOS相机或光学相机。在一些情况下,相机包括二维像素阵列,其可以用于量化到达每个像素的光量。许多这样的相机是可以商购的,并且通常成本相对低。检测器的其它示例包括行检测器或点检测器,诸如光电检测器或光电二极管。检测器可以独立地相同或不同。例如,在一些情况下,检测器可以检测样品的各种特性,例如,发射光的颜色、发射光的定时等。
检测器可以各自聚焦在不同的焦平面上,和/或检测器中的2个或更多个可以聚焦在相同的平面上。例如,在一些实施例中,焦平面被定位成彼此相对靠近。例如,焦平面可以被定位在距最近的相邻焦平面不超过1000nm处,并且在一些情况下,距最近的相邻焦平面不超过750nm、不超过600nm、不超过500nm、不超过300nm、不超过200nm、不超过100nm、不超过75nm、不超过60nm、不超过50nm、不超过40nm、不超过30nm、不超过20nm、或不超过10nm处。焦平面也可以均匀分布(例如、每个相邻焦平面之间的距离大致相同),或者在一些实施例中不均匀分布。在一些情况下,焦平面基本上彼此平行。
在某些实施例中,使用多个焦平面可以允许以例如优于1000nm、750nm、600nm、500nm、300nm、200nm、100nm、75nm、60nm、50nm、40nm、30nm、20nm或10nm的相对高的分辨率确定样品内实体的z(轴向)位置。在一些情况下,分辨率可能与焦平面的分离相关。
焦平面可以至少部分地通过定位成单独影响检测器中的一些或全部的成像透镜来定义,例如,如图1中所示。因此,例如,每个检测器可以受到可以用于控制该特定检测器的焦平面的相应成像透镜的影响。但是,应该理解的是,诸如透镜、反射镜、分束器等的其它光学元件也可以存在于例如从样品通向检测器的光路内。此外,在某些情况下,并非所有检测器都可能受到各个成像透镜的影响。
在一些情况下,成像透镜可以单独聚焦,例如,通过独立地将透镜移动到允许图像聚焦在检测器上的位置,或通过其它聚焦技术。在一些情况下,可以控制多个成像透镜以通过使用成像透镜将检测器中的一些或全部聚焦到样品上(例如,聚焦到测试图像上),然后将透镜中的一些或全部移动各种量以更改该透镜的焦平面来聚焦在不同的成像平面上。例如,至少一些透镜可以移动偏移量(或多个偏移量)以使焦平面也偏移。例如,将透镜移动偏移量可能导致焦平面也移动偏移量,并且透镜的偏移量可能与焦平面的偏移量成比例。在一些情况下,偏移量是固定量。因此,例如,第一透镜可以被移动第一偏移量并且第二透镜可以被移动第二偏移量(例如,等于第一偏移量的2倍)等,以使得成像透镜的焦平面不同。此外,在某些实施例中,可以通过沿着光轴移动检测器本身例如而不必移动透镜来执行聚焦。
在一些情况下,相机和透镜的布置可以有效地互连与成像的不同方面相关联的相机。例如,通过创建两个8相机组,可以使用16个相机在8个图像平面中对2种颜色进行成像,这两个8相机组由分色分束器进行光学分离,分束器将两个通道中的光分开并将每个色带引导到两个8相机组中的每一个。作为另一个示例,可以使用一系列独立于颜色来分离光的非二向色分束器将收集到的光分成8条单独的光路,每个光路包含二向色分束器,该分束器将两个不同颜色的光带单独引导到与8条光路中的每一条相关联的两个相机。在一些情况下,通过将光学元件放置在不同的地点处,可以实现范围广泛的不同相机组组织,这些组织仍然导致同时收集双色、8个光学平面图像,或其它布置,诸如本文讨论的那些布置。此外,将认识到的是,这种方法的泛化可以容易地扩展到超过两种颜色(例如,3、4、5、6等种颜色)、不同数量的光学平面(例如,4个平面、6个平面、10个平面、12个平面、14个平面、16个平面等)和/或其它可以进行区分的光特性,诸如偏振。
在一些情况下,可以使用相对大量的检测器。例如,来自样品的光可以被分成不同的通路(例如,使用分束器)以将光引导到各种检测器中。因此,例如,基于使用的分束器的数量n,可能存在2n个检测器。例如,如果使用2个分束器,那么可能存在22=4个检测器;如果使用3个,那么可能存在23=8个检测器,等等。作为其它示例,可以使用4、5、6、7、8个或更多个分束器,例如,对应于使用至少16、32、64、128个等,或更多个检测器。
检测器可以独立地相同或不同。例如,可以转动检测器以捕获基本相同的频率,和/或可以设置一些检测器或检测器的分组来捕获不同的频率,例如,从样品中捕获不同的“颜色”。例如,可以存在用于捕获第一颜色的第一分组或第一组相机和用于捕获第二颜色的第二分组或第二组相机。
此外,检测器可以独立地设置为同时或在不同时间捕获图像。例如,可以存在用于在第一时间捕获图像的第一分组或第一组相机,以及用于在第二时间捕获图像的第二分组或第二组相机。如果使用了足够的检测器,那么在某些实施例中也可以创建样品的“电影”。此外,诸如本文所述的任何这些技术可以组合在一起,例如用于以两种或更多种颜色捕获样品的“电影”。
在一些情况下,到达每个检测器的光量受光通过的分束器的数量影响。因此,例如,在通过3个分束器后到达检测器的光可能是原始强度的1/8(1/23)。因此,在某些实施例中,来自样品的光可以被扩增,例如,样品上的信号传导(signaling)实体可以被扩增以增加产生的光量,使得到达每个检测器的光具有足够的强度用于分析。信号传导实体的示例包括但不限于本文所公开的那些,并且在下文和美国专利申请序列No.62/779,333中提供了扩增信号传导实体的一些非限制性方法,该专利通过引用整体并入本文。
因此,某些方面涉及确定可以包括细胞培养物、细胞悬液、生物组织、活组织检查、生物体等的样品。样品也可以是无细胞的,但在一些情况下仍然含有核酸。如果样品含有细胞,那么该细胞可以是人类细胞,或任何其它合适的细胞,例如,哺乳动物细胞、鱼细胞、昆虫细胞、植物细胞等。在一些情况下,可以存在一个以上的细胞。
在样品内,待确定的靶标可以包括核酸、蛋白质等。待确定的核酸可以包括例如DNA(例如,基因组DNA)、RNA或存在于细胞(或其它样品)内的其它核酸。核酸可以是细胞内源的,或添加到细胞。例如,核酸可以是病毒的,或人工产生的。在一些情况下,待确定的核酸可以由细胞表达。在一些实施例中,核酸是RNA。RNA可以是编码和/或非编码RNA。例如,RNA可以编码蛋白质。可以在细胞内研究的RNA的非限制性示例包括mRNA、siRNA、rRNA、miRNA、tRNA、lncRNA、snoRNA、snRNA、exRNA、piRNA等。
在一些情况下,可以研究细胞内的大部分核酸。例如,在一些情况下,可以确定细胞内存在的足够量的RNA,以便产生细胞的部分或完整转录组。在一些情况下,在细胞内确定至少4种类型的mRNA,并且在一些情况下,可以在细胞内确定至少3种、至少4种、至少7种、至少8种、至少12种、至少14种、至少15种、至少16种、至少22种、至少30种、至少31种、至少32种、至少50种、至少63种、至少64种、至少72种、至少75种、至少100种、至少127种、至少128种、至少140种、至少255种、至少256种、至少500种、至少1,000种、至少1,500种、至少2,000种、至少2,500种、至少3,000种、至少4,000种、至少5,000种、至少7,500种、至少10,000种、至少12,000种、至少15,000种、至少20,000种、至少25,000种、至少30,000种、至少40,000种、至少50,000种、至少75,000种或至少100,000种类型的mRNA。
在一些情况下,可以确定细胞的转录组。应该理解的是,转录组通常包括细胞内产生的所有RNA分子,而不仅仅是mRNA。因此,例如,在某些情况下,转录组还可以包括rRNA、tRNA、siRNA等。在一些实施例中,可以确定细胞的转录组的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%。
在一些实施例中,待确定的其它靶标可以包括与核酸、蛋白质等链接的靶标。例如,在一个实施例集合中,能够识别靶标的结合实体可以与核酸探针偶联。结合实体可以是可以例如特异性或非特异性识别靶标的任何实体。非限制性示例包括酶、抗体、受体、互补核酸链、适体等。例如,寡核苷酸链接的抗体可以用于确定靶标。靶标可以结合寡核苷酸链接的抗体,并且寡核苷酸如本文所讨论的那样确定。
靶标,诸如细胞或其它样品内的核酸的确定可以是定性的和/或定量的。此外,确定也可以是空间的,例如,可以在二维或三维上确定细胞或其它样品内的核酸或其它靶标的位置。在一些实施例中,可以确定细胞或其它样品内的核酸或其它靶标的位置、数量和/或浓度。
在一些情况下,可以确定细胞基因组的重要部分。确定的基因组区段可以是连续的或散布在基因组上。例如,在一些情况下,在细胞内确定至少4个基因组区段,并且在一些情况下,可以在细胞内确定至少3个、至少4个、至少7个、至少8个、至少12个、至少14个、至少15个、至少16个、至少22个、至少30个、至少31个、至少32个、至少50个、至少63个、至少64个、至少72个、至少75个、至少100个、至少127个、至少128个、至少140个、至少255个、至少256个、至少500个、至少1,000个、至少1,500个、至少2,000个、至少2,500个、至少3,000个、至少4,000个、至少5,000个、至少7,500个、至少10,000个、至少12,000个、至少15,000个、至少20,000个、至少25,000个、至少30,000个、至少40,000个、至少50,000个、至少75,000个或至少100,000个基因组区段。
在一些情况下,可以确定细胞的整个基因组。应该理解的是,基因组通常包括细胞内产生的所有DNA分子,而不仅仅是染色体DNA。因此,例如,在一些情况下,例如,除了(或代替)染色体DNA,基因组还可以包括线粒体DNA、叶绿体DNA、质粒DNA等。在一些实施例中,可以确定细胞的基因组的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或100%。
如本文所讨论的,各种核酸探针可以用于确定细胞或其它样品内的一个或多个靶标。探针可以包括核酸(或可以例如特异性地与核酸杂交的实体),诸如DNA、RNA、LNA(锁定核酸)、PNA(肽核酸)和/或它们的组合。在一些情况下,核酸探针内也可能存在附加组分,例如,如下面所讨论的。此外,可以使用任何合适的方法将核酸探针引入到细胞中。
例如,在一些实施例中,在引入核酸探针之前固定细胞,例如,以保留细胞内核酸或其它靶标的位置。用于固定细胞的技术是本领域普通技术人员已知的。作为非限制性示例,可以使用诸如甲醛、多聚甲醛、戊二醛、乙醇、甲醇、丙酮、乙酸等的化学物质固定细胞。在一个实施例中,可以使用HEPES-谷氨酸缓冲液介导的有机溶剂(HOPE)固定细胞。
可以使用任何合适的方法将核酸探针引入到细胞(或其它样品)中。在一些情况下,细胞可以被充分透化,使得可以通过在细胞周围流动含有核酸探针的流体将核酸探针引入到细胞中。在一些情况下,作为固定处理的一部分,细胞可能被充分透化;在其它实施例中,细胞可以通过暴露于某些化学物质诸如乙醇、甲醇、辛基酚聚乙二醇醚(Triton)等而被透化。此外,在一些实施例中,可以使用诸如电穿孔或显微注射之类的技术将核酸探针引入到细胞或其它样品中。
因此,某些方面一般而言涉及被引入到细胞(或其它样品)中的核酸探针。取决于应用,探针可以包括通常通过Watson-Crick碱基配对,可以与核酸杂交的多种实体中的任何一种,诸如DNA、RNA、LNA、PNA等。核酸探针通常包含能够结合靶标的至少一部分(例如靶标核酸)的靶标序列。在一些情况下,结合可以是特异性结合(例如,经由互补结合)。当被引入到细胞或其它系统中时,靶标序列可以能够结合到特定靶标(例如,mRNA或如本文讨论的其它核酸)。如下文所讨论的,核酸探针还可以包含一种或多种读取序列。
在一些情况下,可以将多于一种类型的核酸探针例如顺序地或同时地应用于样品。例如,可以有至少2种、至少5种、至少10种、至少25种、至少50种、至少75种、至少100种、至少300种、至少1,000种、至少3,000种、至少10,000种或至少30,000种应用于样品的可区分的核酸探针。在一些情况下,可以顺序地添加核酸探针。但是,在一些情况下,可以同时添加一种以上的核酸探针。
核酸探针可以包括一个或多个靶标序列,其可以定位在核酸探针内的任何位置。靶标序列可以包含与靶标的一部分(例如,靶标核酸)基本上互补的区域。例如,在一些情况下,这些部分可以是至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%互补,例如,以产生特异性结合。通常,互补性是基于Watson-Crick核苷酸碱基配对确定的。
在一些情况下,靶标序列可以是至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个或至少450个核苷酸长度。在一些情况下,靶标序列可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个或不超过10个核苷酸长度。任何这些的组合也是可能的,例如,靶标序列可以具有10至30个核苷酸之间、20至40个核苷酸之间、5至50个核苷酸之间、10至200个之间的核苷酸,或25至35个核苷酸之间、10至300个核苷酸之间等的长度。
核酸探针的靶标序列可以参考怀疑存在于细胞或其它样品中的靶标来确定。例如,可以使用蛋白质的序列来确定蛋白质的靶标核酸,例如,通过确定表达形成蛋白质的核酸。在一些情况下,仅使用编码蛋白质的核酸的一部分,例如,具有如上所讨论的长度。此外,在一些情况下,可以使用可以用于识别特定靶标的多于一种的靶标序列。例如,可以顺序和/或同时使用多个探针,它们可以结合或杂交到相同靶标的相同或不同区域。杂交通常是指互补单链核酸通过Watson-Crick核苷酸碱基配对(例如,氢键、鸟嘌呤-胞嘧啶和腺嘌呤-胸腺嘧啶)关联以形成双链核酸的退火处理。
在一些实施例中,核酸探针还可以包含一个或多个“读取”序列。读取序列可以用于识别核酸探针,例如,通过与信号传导实体关联,如下所讨论的。在一些实施例中,核酸探针可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个、20或更多个、24或更多个、32或更多个、40或更多个、48或更多个、50或更多个、64或更多个、75或更多个、100或更多个、128或更多个读取序列。读取序列可以定位在核酸探针内的任何位置。如果存在多于一个读取序列,那么读取序列可以彼此相邻定位,和/或与其它序列散置。
读取序列可以是任何长度。如果使用多于一个读取序列,那么读取序列可以独立地具有相同或不同的长度。例如,读取序列可以是至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400或至少450个核苷酸长度。在一些情况下,读取序列可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20或不超过10个核苷酸长度。任何这些的组合也是可能的,例如,读取序列可以具有10至30个核苷酸之间、20至40个核苷酸之间、5至50个核苷酸之间、10至200个核苷酸之间,或25至35个核苷酸之间、10至300个核苷酸之间等的长度。
在一些实施例中,读取序列可以是任意的或随机的。在某些情况下,选择读取序列以降低或最小化与细胞或其它样品的其它组分的同源性,例如,使得读取序列本身不与怀疑在细胞或其它样品内的其它核酸结合或杂交。在一些情况下,同源性可以小于10%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%或小于1%。在一些情况下,可能存在少于20个碱基对、少于18个碱基对、少于15个碱基对、少于14个碱基对、少于13个碱基对、少于12个碱基对、少于11个碱基对或少于10个碱基对的同源性。在一些情况下,这样的碱基对是连续的。
在一个实施例集合中,核酸探针群体可以包含一定数量的读取序列,在一些情况下,其可能少于核酸探针的靶标数量。本领域普通技术人员将意识到,如果存在一个信号传导实体和n个读取序列,那么通常可以唯一识别2n-1个不同的核酸靶标。但是,并非所有可能的组合都需要被使用。例如,核酸探针群体可以靶向12个不同的核酸序列,但包含不超过8个读取序列。作为另一个示例,核酸群体可以靶向140种不同的核酸种类,但包含不超过16个读取序列。不同的核酸序列靶标可以通过在每个探针内使用不同的读取序列组合来单独识别。例如,每个探针可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16等或更多个读取序列。在一些情况下,核酸探针群体可以各自包含相同数量的读取序列,但是在其它情况下,各种探针上可能存在不同数量的读取序列。
作为非限制性示例,第一核酸探针可以包含第一靶标序列、第一读取序列和第二读取序列,而第二不同的核酸探针可以包含第二靶标序列,相同的第一读取序列,但是第三读取序列而不是第二读取序列。这样的探针因此可以通过确定存在的或与给定探针或地点相关联的各种读取序列来区分,如本文所讨论的。例如,可以使用如下所讨论的“码字”顺序识别和编码探针。可选地,还可以对码字进行误差检测和/或误差纠正。
此外,在某些实施例中,核酸探针群体(及其对应的编码探针上的互补部位)可以使用4个天然存在的核苷酸碱基中的仅2个或仅3个来制备,诸如在探针群体内省略所有“G”或省略所有“C”。在某些实施例中,缺少“G”或“C”的序列可以形成非常少的二级结构,并且可以有助于更均匀、更快的杂交。因此,在一些情况下,核酸探针可以仅包含A、T和G;仅A、T和C;仅A、C和G;或仅T、C和G。
在一方面,核酸探针上的读取序列可以能够(例如,特异性地)结合初级扩增核酸上的对应识别序列。因此,当核酸探针识别生物样品内的靶标,例如DNA或RNA靶标时,初级扩增核酸也能够经由核酸探针,利用核酸探针的读取序列和初级扩增核酸上的对应识别序列之间的相互作用,例如互补结合,与靶标关联。例如,识别序列可以能够识别靶标读取序列,但基本上不能识别或结合其它非靶标读取序列。取决于应用,初级扩增核酸还可以包含能够与核酸杂交的多种实体中的任何一种,例如DNA、RNA、LNA和/或PNA等。例如,这样的实体可以形成识别序列的部分或全部。
在一些情况下,识别序列可以与靶标读取序列基本上互补。在一些情况下,序列可以是至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%互补。通常,互补性是基于Watson-Crick核苷酸碱基配对确定的。靶标读取序列的结构可以包括先前描述的那些结构。
在一些情况下,识别序列可以是至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个或至少450个核苷酸长度。在一些情况下,识别序列可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个或不超过10个核苷酸长度。任何这些的组合也是可能的,例如,识别序列可以具有10至30个核苷酸之间、20至40个核苷酸之间、5至50个核苷酸之间、10至200个核苷酸之间,或25至35个核苷酸之间、10至300个核苷酸之间等的长度。
在一些实施例中,初级扩增核酸还可以包含能够结合二级扩增核酸的一个或多个读取序列,如下文所讨论的。例如,初级扩增核酸可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个、20或更多个、32或更多个、40或更多个、50或更多个、64或更多个、75或更多个、100或更多个、128或更多个读取序列。读取序列可以定位在初级扩增核酸内的任何位置。如果存在多于一个读取序列,那么读取序列可以彼此相邻定位,和/或与其它序列散置。在一个实施例中,初级扩增核酸在第一端包含识别序列,并且在第二端包含多个读取序列。
在一些情况下,初级扩增核酸内的读取序列可以是至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个或至少450个核苷酸长度。在一些情况下,读取序列可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20个或不超过10个核苷酸长度。任何这些的组合也是可能的,例如,读取序列可以具有10至20个核苷酸之间、10至30个核苷酸之间、20至40个核苷酸之间、5至50个核苷酸之间、10至200个核苷酸之间,或25至35个核苷酸之间、10至300个核苷酸之间等的长度。
在初级扩增核酸内可以有任意数量的读取序列。例如,可以有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个读取序列存在于初级扩增核酸内。如果初级扩增核酸内存在多于一个读取序列,那么读取序列可以相同或不同。在一些情况下,例如,读取序列可以全部相同。
在一些实施例中,初级扩增核酸群体可以使用4种天然存在的核苷酸碱基中的仅2种或仅3种来制备,诸如在核酸群体中省略所有“G”或省略所有“C”。在某些实施例中,缺少“G”或“C”的序列可以形成非常少的二级结构,并且可以有助于更均匀、更快的杂交。因此,在一些情况下,初级扩增核酸可以仅包含A、T和G;仅A、T和C;仅A、C和G;或仅T、C和G。
在一些情况下,可以将多于一种类型的初级扩增核酸例如顺序地或同时应用于样品。例如,可以有至少2种、至少5种、至少10种、至少25种、至少50种、至少75种、至少100种、至少300种、至少1,000种、至少3,000种、至少10,000种或至少30,000种应用于样品的可区分的初级扩增核酸。在一些情况下,可以顺序地添加初级扩增核酸。但是,在一些情况下,可以同时添加一种以上的初级扩增核酸。
在一个实施例集合中,初级扩增核酸上的读取序列可以能够(例如,特异性地)结合二级扩增核酸上的对应识别序列。因此,当核酸探针识别生物样品内的靶标,例如DNA或RNA靶标时,二级扩增核酸也能够经由初级扩增核酸,利用初级扩增核酸的读取序列和二级扩增核酸上的对应识别序列之间的相互作用,例如互补结合,与靶标关联。例如,二级扩增核酸上的识别序列可以能够识别初级扩增核酸上的读取序列,但基本上不识别或结合其它非靶标读取序列。取决于应用,二级扩增核酸还可以包含能够与核酸杂交的多种实体中的任何一种,例如DNA、RNA、LNA和/或PNA等。例如,这样的实体可以形成识别序列的部分或全部。
在一些情况下,二级扩增核酸上的识别序列可以与初级扩增核酸上的读取序列基本互补。在一些情况下,序列可以是至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%互补。
在一些情况下,二级扩增核酸上的识别序列可以是至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个或至少450个核苷酸长度。在一些情况下,识别序列可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20或不超过10个核苷酸长度。任何这些的组合也是可能的,例如,识别序列可以具有10至30个核苷酸之间、20至40个核苷酸之间、5至50个核苷酸之间、10至200个核苷酸之间,或25至35个核苷酸之间、10至300个核苷酸之间等的长度。
在一些实施例中,二级扩增核酸还可以包含能够结合信号传导实体的一个或多个读取序列,如本文所讨论的。例如,二级扩增核酸可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个、20或更多个、32或更多个、40或更多个、50或更多个、64或更多个、75或更多个、100或更多个、128或更多个能够结合信号传导实体的读取序列。读取序列可以定位在二级扩增核酸内的任何位置。如果存在多于一个读取序列,那么读取序列可以彼此相邻定位,和/或与其它序列散置。在一个实施例中,二级扩增核酸在第一端包含识别序列,并且在第二端包含多个读取序列。该结构也可以与初级扩增核酸的结构相同或不同。
在一些情况下,二级扩增核酸内的读取序列可以是至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少50个、至少60个、至少65个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个或至少450个核苷酸长度。在一些情况下,读取序列可以不超过500个、不超过450个、不超过400个、不超过350个、不超过300个、不超过250个、不超过200个、不超过175个、不超过150个、不超过125个、不超过100个、不超过75个、不超过60个、不超过65个、不超过60个、不超过55个、不超过50个、不超过45个、不超过40个、不超过35个、不超过30个、不超过20或不超过10个核苷酸长度。任何这些的组合也是可能的,例如,二级扩增核酸内的读取序列可以具有10至20个核苷酸之间、10至30个核苷酸之间、20至40个核苷酸至、5至50个核苷酸、10至200个核苷酸之间,或25至35个核苷酸之间、10至300个核苷酸之间等的长度。
在二级扩增核酸内可以有任意数量的读取序列。例如,可以有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个读取序列存在于二级扩增核酸内。如果二级扩增核酸内存在多于一个读取序列,那么读取序列可以相同或不同。在一些情况下,例如,读取序列可以全部相同。此外,初级和二级扩增核酸中可以独立地存在相同或不同数量的读取序列。
在某些实施例中,二级扩增核酸群体可以使用4种天然存在的核苷酸碱基中的仅2种或仅3种来制备,诸如在核酸群体中省略所有“G”或省略所有“C”。在某些实施例中,缺少“G”或“C”的序列可以形成非常少的二级结构,并且可以有助于更均匀、更快的杂交。因此,在一些情况下,二级扩增核酸可以仅包含A、T和G;仅A、T和C;仅A、C和G;或仅T、C和G。
在一些情况下,可以将多于一种类型的二级扩增核酸例如顺序地或同时应用于样品。例如,可以有至少2种、至少5种、至少10种、至少25种、至少50种、至少75种、至少100种、至少300种、至少1,000种、至少3,000种、至少10,000种或至少30,000种应用于样品的可区分的二级扩增核酸。在一些情况下,可以顺序地添加二级扩增核酸。但是,在一些情况下,可以同时添加一种以上的二级扩增核酸。
此外,在某些实施例中,该模式可以替代地在信号传导实体之前重复,例如,利用三级扩增核酸、四级核酸等,类似于以上讨论。因此,信号传导实体可以与末端扩增核酸结合。因此,作为非限制性示例,编码核酸探针可以与靶标结合,初级扩增核酸结合到该编码核酸探针,二级扩增核酸结合到初级扩增核酸,三级扩增核酸结合到二级扩增核酸,信号传导实体结合到三级扩增核酸,或者编码核酸探针可以与靶标结合,初级扩增核酸结合到该编码核酸探针,二级扩增核酸结合到初级扩增核酸,三级扩增核酸结合到二级扩增核酸、四级扩增核酸结合到三级扩增核酸、信号传导实体结合到四级扩增核酸,等等。因而,在所有实施例中,末端扩增核酸不必一定是二级扩增核酸。
其它组分也可以存在于核酸探针或扩增核酸内。例如,在一个实施例集合中,可以存在一个或多个引物(primer)序列,例如,以促进酶促扩增。本领域普通技术人员将意识到适用于诸如扩增之类应用的引物序列(例如,使用PCR或其它合适的技术)。许多这样的引物序列是可商购的。可以存在于初级核酸探针内的序列的其它示例包括但不限于启动(promoter)子序列、操纵子、识别序列、无义序列等。
通常,引物是用作核酸合成起始点的单链或部分双链核酸(例如,DNA),允许聚合酶(诸如核酸聚合酶)延伸引物并复制互补链。引物(例如,被设计为)与靶标核酸互补并杂交。在一些实施例中,引物是合成引物。在一些实施例中,引物是非天然存在的引物。引物通常具有10至50个核苷酸的长度。例如,引物可以具有10至40、10至30、10至20、25至50、15至40、15至30、20至50、20至40,或20至30个核苷酸的长度。在一些实施例中,引物具有18至24个核苷酸的长度。
在一些实施例中,一种或多种信号传导实体可以与二级扩增核酸(或其它末端扩增核酸)上的识别实体结合。信号传导实体的非限制性示例包括荧光实体(荧光团)或磷光实体,例如,如下所讨论的。然后可以确定信号传导实体,例如,以确定核酸探针或靶标。在一些情况下,确定可以是空间的,例如,在二维或三维中。此外,在一些情况下,确定可以是定量的,例如,可以确定信号传导实体和/或靶标的量或浓度。
在一个实施例集合中,信号传导实体可以附接到二级扩增核酸(或其它末端扩增核酸)。信号传导实体可以在二级扩增核酸与样品内的靶标结合之前或之后附接到二级扩增核酸(或其它末端扩增核酸)。例如,信号传导实体可以最初或在二级扩增核酸已应用于样品之后附接到二级扩增核酸。在一些情况下,添加信号传导实体,然后反应以将它们附接到扩增核酸。
在一个实施例集合中,信号传导实体可以经由可以被裂解以释放信号传导实体的键附接到核苷酸序列。例如,在确定样品内核酸探针的分布之后,信号传导实体可以在另一轮核酸探针和/或扩增核酸之前被释放或失活。因此,在一些实施例中,键可以是可裂解键,诸如二硫键或可光裂解键。本文详细讨论了可光裂解键的示例。在一些情况下,这种键可以例如在暴露于还原剂或光(例如,紫外光)时被裂解。关于附加详细信息,参见下文。本文更详细地讨论了用于失活和/或移除信号传导实体的系统和方法的其它示例。
在某些实施例中,初级和二级扩增核酸的使用表明存在最大数量的可以与给定核酸探针结合的信号传导实体。例如,可能存在最大数量的初级扩增核酸能够结合核酸探针,例如,由于能够结合有限数量的初级扩增核酸的最大数量的二级扩增核酸,和/或由于能够结合核酸探针上有限数量的读取序列的最大数量的初级扩增核酸。虽然每个潜在地点实际上不需要用信号传导实体填充,但该结构表明存在信号传导实体的饱和极限,超出该极限可能碰巧存在的任何附加信号传导实体都无法与核酸探针或其靶标关联。
因而,本公开的某些实施例一般而言涉及扩增指示可饱和的核酸探针或其靶标的信号的系统和方法,即使得有多少信号传导实体可以与核酸探针或其靶标关联存在饱和上限。通常,该数字大于1。例如,信号传导实体的上限可以是至少2、至少3、至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、至少400、至少500等。在一些情况下,上限可以小于500、小于400、小于300、小于250、小于200、小于175、小于150、小于125、小于100、小于75、小于50、小于40、小于30、小于25、小于20、小于15、小于10、小于5等。在一些情况下,上限可以被确定为可以结合到二级扩增核酸的信号传导实体的最大数量,乘以可以结合到初级扩增核酸的二级扩增核酸的最大数量,乘以可以结合到与靶标结合的核酸探针的初级扩增核酸的最大数量。作为对照,诸如滚环扩增或发夹(hairpin)展开等之类的技术允许以不受控制的方式扩增信号,即,当存在足够的试剂时,扩增可以在没有预定终点或饱和限制的情况下继续。因此,此类技术对于可以与核酸探针或其靶标关联的信号传导实体的数量没有理论上限。
但是,应该理解的是,实际结合至核酸探针或其靶标的信号传导实体的平均数量实际上不必与其上限相同,即,信号传导实体可能实际上并不处于完全饱和状态(但是他们可以)。例如,饱和量(或结合的信号传导实体的数量,相对于可以结合的最大数量)可以小于97%、小于95%、小于90%、小于85%、小于80%、小于75%等,和/或至少50%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%等。在一些情况下,允许更多时间发生结合和/或增加试剂浓度可以增加饱和量。
由于实际结合到核酸探针或其靶标的信号传导实体的数量的潜在上限,因此,与诸如上面讨论的那些不受控制的扩增相比,样品内分布的结合事件例如在空间上可以呈现基本均匀的尺寸和/或亮度。例如,由于可以与初级扩增核酸结合的二级扩增核酸的特定数量,不能发现二级扩增核酸大于与核酸探针或其靶标的固定距离,这可能会限制“斑点尺寸”或来自信号传导实体的荧光直径,从而指示结合。
在某些实施例中,至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的结合事件可以表现出基本相同的亮度、尺寸(例如,表观直径)、颜色等,这可以使得更容易将结合事件与诸如非特异性结合、噪音等其它事件区分开来。
此外,如前面所讨论的,本公开的某些方面使用编码各种结合事件的码空间,并且可选地可以使用误差检测和/或纠正来确定核酸探针与其靶标的结合。在一些情况下,核酸探针群体可以包含某些“读取序列”,这些“读取序列”可以结合某些扩增核酸,如上面所讨论的,并且核酸探针或靶标在样品内的地点可以使用与例如在某个码空间内的扩增核酸相关联的信号传导实体来确定,例如,如本文所讨论的。还参见国际专利申请公开号WO 2016/018960号和WO2016/018963,其各自通过引用整体并入本文。如所提到的,在一些情况下,核酸探针内的读取序列群体可以以各种组合进行组合,例如,使得相对少量的读取序列可以用于确定相对大量的不同核酸探针,如本文所讨论的。
因此,在一些情况下,核酸探针群体可以各自包含一定数量的读取序列,其中一些在不同核酸探针之间共享,使得核酸探针的总群体可以包含一定数量的读取序列。核酸探针群体可以具有任何合适数量的读取序列。例如,核酸探针群体可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20等个读取序列。在一些实施例中,超过20个也是可能的。此外,在一些情况下,核酸探针群体可以总共具有1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、12个或更多个、13个或更多个、14个或更多个、15个或更多个、16个或更多个、20个或更多个、24个或更多个、32个或更多个、40个或更多个、50个或更多个、60个或更多个、64个或更多个、100个或更多个、128个或更多个等可能的读取序列存在,但是探针中的一些或全部可以各自包含多于一个读取序列,如本文所讨论的。此外,在一些实施例中,核酸探针群体可以具有不超过100个、不超过80个、不超过64个、不超过60个、不超过50个、不超过40个、不超过32个、不超过24个、不超过20个、不超过16个、不超过15个、不超过14个、不超过13个、不超过12个、不超过11个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个或不超过两个读取序列。任何这些的组合也是可能的,例如,核酸探针群体可以包含总共10至15个读取序列。
作为在6种不同类型的核酸探针群体(每个包含一个或多个读取序列)中从包含在核酸探针内的相对少量的读取序列中组合识别相对大量的核酸探针的方法的非限制性示例,群体内的读取序列的总数可以不大于4。应该理解的是,虽然为了便于说明,在本示例中使用了4个读取序列,但在其它实施例中,取决于应用,可以实现更大量的核酸探针,例如,使用5、8、10、16、32等或更多个读取序列,或者本文描述的任何其它合适数量的读取序列。例如,如果每个核酸探针包含两个不同的读取序列,那么通过使用4个这样的读取序列(A、B、C和D),可以单独识别多达6个探针。应该注意的是,在这个示例中,核酸探针上的读取序列的排序不是必需的,即“AB”和“BA”可以被视为同义词(但是在其它实施例中,读取序列的排序可能是必不可少的,并且“AB”和“BA”不一定是同义词)。类似地,如果在核酸探针群体中使用5个读取序列(A、B、C、D和E),那么可以单独识别多达10个探针(例如,AB、AC、AD、AE、BC、BD、BE、CD、CE、DE)。例如,本领域普通技术人员会理解,对于在每个探针上具有n个读取序列的群体中的k个读取序列,可以产生多达
Figure BDA0003650898000000331
个不同的探针,假设读取序列的排序不是必需的;因为不是所有的探针都需要具有相同数量的读取序列并且不是所有的读取序列的组合都需要在每个实施例中使用,因此在某些实施例中也可以使用多于或少于该数量的不同探针。此外,还应该理解的是,在一些实施例中,每个探针上的读取序列的数量不必相同。例如,一些探针可以包含2个读取序列,而其它探针可以包含3个读取序列。
在一些方面,样品内核酸探针的读取序列和/或结合模式可以用于定义误差检测和/或误差纠正码,例如,以减少或防止错误识别或核酸误差。如本领域普通技术人员已知的,“误差检测码”是允许在传输期间检测由噪声或其它损伤引起的误差的码,而“误差纠正码”类似于误差检测码,但该码还允许重建原始数据。因此,例如,如果指示了结合(例如,如使用信号传导实体确定的),那么可以用“1”识别地点;相反,如果未指示结合,那么可以用“0”识别地点(或者在一些情况下,反之亦然)。例如使用不同核酸探针的多轮结合确定然后可以用于创建“码字”,例如,用于该空间地点。“码字”是数字的数值串,其中每个数字表示地点,该地点表示结合确定。例如,如本文所讨论的,可以使用3轮结合确定来创建3个数字长的码字,每个数字表示一轮结合。在其它实施例中,具有其它长度的码字也是可能的。码字的所有可能值的空间可以定义码空间。
在一些实施例中,可以对码字进行误差检测和/或纠正。例如,可以组织码字,使得如果对于给定的读取序列集合或核酸探针的结合模式没有发现匹配,那么可以将匹配识别为误差,并且可选地,可以对序列应用误差纠正以确定核酸探针的正确靶标。在一些情况下,码字可以具有比由码字编码的核酸总数更少的“字母”或位置,例如,其中每个码字编码不同的核酸。
这样的误差检测和/或误差纠正码可以采取多种形式。之前已经在诸如电信行业之类的其它环境中开发了多种这样的码,诸如格雷码或汉明码。在一个实施例集合中,分配核酸探针的读取序列或结合模式,使得并非分配每个可能的组合。
例如,如果可以有4个读取序列并且核酸探针包含2个读取序列,那么可以识别多达6个核酸探针;但使用的核酸探针数量可能少于6。类似地,对于在每个核酸探针上具有n个读取序列的群体中的k个读取序列,可以产生
Figure BDA0003650898000000341
个不同的探针,但是使用的核酸探针的数量可以是大于或小于
Figure BDA0003650898000000342
的任何数量。此外,这些可以被随机分配,或以特定方式分配以增加检测和/或纠正误差的能力。
作为另一个示例,如果使用多轮核酸探针,那么可以任意选择轮数。如果在每一轮中,每个靶标都可以给出两种可能的结果,诸如被检测到或未被检测,那么对于n轮探针可以有多达2n个不同的靶标,但实际使用的靶标数量可能是少于2n的任何数量。例如,如果在每一轮中,每个靶标可以给出两个以上的可能结果,诸如在不同颜色通道中被检测到,那么对于n轮探针可以有超过2n(例如,3n、4n、...)个不同的靶标。在一些情况下,实际使用的靶标数量可能是小于此数量的任何数量。此外,这些可以被随机分配,或以特定方式分配以增加检测和/或纠正误差的能力。
码字可以用于定义各种码空间。例如,在一个实施例集合中,可以在码空间内分配码字或核酸探针,使得分配被分开汉明距离,汉明距离测量给定模式中导致核酸探针被误解为不同有效核酸探针的不正确“读取”的数量。在一些情况下,汉明距离可以是至少2、至少3、至少4、至少5、至少6等。此外,在一个实施例集合中,分配可以形成为汉明码,例如,汉明(7,4)码、汉明(15,11)码、汉明(31,26)码、汉明(63,57)码、汉明(127,120)码等。在另一个实施例集合中,分配可以形成SECDED代码,例如,SECDED(8,4)码、SECDED(16,4)码、SCEDED(16,11)码、SCEDED(22、16)码、SCEDED(39、32)码、SCEDED(72、64)码等。在又一个实施例集合中,分配可以形成扩展二进制格雷码、完美二进制格雷码,或三进制格雷码。在另一个实施例集合中,分配可以表示取自上述任何码的可能值的子集。
例如,可以通过仅使用包含固定或恒定数量的“1”位(或“0”位)对靶标进行编码的二进制字来形成误差纠正码。例如,码空间可以仅包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16等个“1”位(或“0”位),例如,所有代码都具有相同数量的“1”位或“0”位等。在另一个实施例集合中,分配可以表示取自上述码的用于解决非对称读出误差目的的可能值的子集。例如,在一些情况下,其中对于所有使用的二进制字,“1”位的数量可以固定的码可以消除具有不同“1”的数量的字在“0”位被测量为“1”或“1”位被测量为“0”的速率不同时的偏差测量。
因而,在一些实施例中,一旦确定了码字(例如,如本文所讨论的),就可以将码字与已知的核酸码字进行比较。如果发现匹配,那么可以识别或确定核酸靶标。如果未找到匹配,那么可以识别码字读取中的误差。在一些情况下,还可以应用误差纠正来确定正确的码字,从而产生核酸靶标的正确身份。在一些情况下,可以选择码字,使得假设仅存在一个误差,那么只有一个可能的正确码字可用,因此,核酸靶标的唯一正确身份是可能的。在一些情况下,这也可以被泛化到更大的码字间距或汉明距离;例如,可以选择码字,使得如果存在两个、三个或四个(或者在一些情况下更多)误差,那么只有一个可能的正确码字可用,因此,核酸靶标的唯一正确身份是可能的。
误差纠正码可以是二进制误差纠正码,或者它可以基于其它编号系统,例如,三进制或四进制误差纠正码。例如,在一个实施例集合中,可以使用多于一种类型的信号传导实体并将其分配给误差纠正码内的不同编号。因此,作为非限制性示例,可以将第一信号传导实体(或在一些情况下多于一个信号传导实体)分配为“1”,并且可以将第二信号传导实体(或在一些情况下多于一个信号传导实体)分配为“2”(“0”指示不存在信号传导实体),并且分配码字以定义三进制误差纠正码。类似地,第三信号传导实体可以附加地被分配为“3”以产生四进制误差纠正码等。
如本文所讨论的,在某些方面,信号传导实体例如通过成像被确定,以确定核酸探针和/或产生码字。信号传导实体的示例包括本文讨论的那些。在一些情况下,可以使用多种技术例如在空间上确定样品内的信号传导实体。在一些实施例中,信号传导实体可以是荧光的,并且用于确定样品内荧光的技术,诸如荧光显微镜或共焦显微镜,可以用于在空间上识别信号传导实体在细胞内的位置。在一些情况下,样品内实体的位置可以在两个甚至三个维度上确定。此外,在一些实施例中,可以一次和/或顺序地确定一个以上的信号传导实体(例如,具有不同颜色或发射的信号传导实体)。
此外,在一些实施例中,可以确定识别出的靶标(例如,核酸靶标)的置信水平。例如,可以使用精确匹配的数量与具有一个或多个一位误差的匹配的数量的比率来确定置信水平。在一些情况下,仅可以使用具有大于某个值的置信度的匹配。例如,在某些实施例中,仅当匹配的置信比大于约0.01、大于约0.03、大于约0.05、大于约0.1、大于约0.3、大于约0.5、大于约1、大于约3、大于约5、大于约10、大于约30、大于约50、大于约100、大于约300、大于约500、大于约1000或任何其它合适的值时,才可以接受匹配。此外,在一些实施例中,仅当识别出的靶标的置信度大于内标或假阳性对照大约0.01、约0.03、约0.05、约0.1、约0.3、约0.5、约1、约3、约5、约10、约30、约50、约100、约300、约500、约1000或任何其它合适的值时,才可以接受匹配。
在一些实施例中,可以以相对高的分辨率确定实体(以及因此实体可以与之相关联的核酸探针)的空间位置。例如,可以以优于约100微米、优于约30微米、优于约10微米、优于约3微米、优于约1微米、优于约800nm、优于约600nm、优于约500nm、优于约400nm、优于约300nm、优于约200nm、优于约100nm、优于约90nm、优于约80nm、优于约70nm、优于约60nm、优于约50nm、优于约40nm、优于约30nm、优于约20nm、或优于约10nm等的空间分辨率确定位置。
有多种技术能够例如使用荧光显微镜光学地确定或成像实体的空间位置。在一些实施例中可以使用多于一种颜色。在一些情况下,可以以超分辨率或比光波长或衍射极限更好的分辨率确定空间位置。非限制性示例包括STORM(随机光学重建显微镜)、STED(受激发射耗尽显微镜)、NSOM(近场扫描光学显微镜)、4Pi显微镜、SIM(结构化照明显微镜)、SMI(空间调制照明)显微镜、RESOLFT(可逆饱和光学线性荧光跃迁显微镜)、GSD(基态耗尽显微镜)、SSIM(饱和结构化照明显微镜)、SPDM(光谱精密距离显微镜)、光激活定位显微镜(PALM)、荧光光激活定位显微镜(FPALM)、LIMON(3D光学显微镜纳米尺寸显微镜)、超分辨率光学波动成像(SOFI)等。参见例如2010年11月23日发布的Zhuang等人的标题为“Sub-Diffraction Limit Image Resolution and Other Imaging Techniques”的美国专利No.7,838,302;2013年10月22日发布的Zhuang等人的标题为“Sub-diffraction LimitImage Resolution in Three Dimensions”的美国专利No.8,564,792;或2013年6月20日公开的Zhuang等人的标题为“High Resolution Dual-Objective Microscopy”的国际专利申请公开No.WO 2013/090360,其各自通过引用整体并入本文。
作为说明性非限制性示例,在一个实施例集合中,可以使用具有100X扩增率的高数值孔径油浸物镜和在电子倍增CCD相机上收集到的光对样品进行成像。在另一个示例中,可以使用具有40X扩增率的高数值孔径油浸透镜和用广角科学CMOS相机收集到的光对样品进行成像。在各种非限制性实施例中,通过物镜和相机的不同组合,单个视场可以对应不少于40x40微米、80x80微米、120x120微米、240x240微米、340x340微米或500x500微米等。类似地,在一些实施例中,单个相机像素可以对应于不小于80x80nm、120x120nm、160x160nm、240x240nm或300x300nm等的样品区域。在另一个示例中,可以用低数值孔径、10X扩增倍率的空气透镜和sCMOS相机收集到的光对样品进行成像。在附加的实施例中,样品可以通过经由由扫描镜或旋转圆盘产生并且通过单个或多个针孔收集到的单个或多个扫描衍射限制位点照射它来进行光学切片。在另一个实施例中,样品也可以经由经由本领域技术人员已知的多种方法中的任何一种产生的薄光片来照射。
在一个实施例中,样品可以由单高斯模式激光线照射。在一些实施例中,可以通过使这些激光线穿过经由压电或其它机械手段振动的多模光纤来使照射轮廓变平。在一些实施例中,可以通过使单模高斯光束通过各种折射光束整形器(诸如,piShaper)或一系列堆叠的鲍威尔透镜来使照射轮廓变平。在又一个实施例集合中,高斯光束可以通过各种不同的漫射元件,诸如毛玻璃或工程漫射器,它们在一些情况下可以高速旋转以去除残留的激光散斑。在又一个实施例中,激光照射可以通过一系列小透镜阵列以产生接近平坦照射场的照射的重叠图像。
在一些实施例中,可以确定实体的空间位置的质心。例如,可以使用本领域普通技术人员已知的图像分析算法在图像或图像系列内确定信号传导实体的质心。在一些情况下,可以选择算法以确定样品中的非重叠单个发射器和/或部分重叠的单个发射器。合适技术的非限制性示例包括最大似然算法、最小二乘算法、贝叶斯算法、压缩感测算法等。在一些情况下也可以使用这些技术的组合。
此外,在一些情况下,信号传导实体可能失活。例如,在一些实施例中,可以将可以与信号传导实体(例如,使用扩增核酸)关联的第一二级核酸探针应用于可以识别第一读取序列(例如,在核酸探针上)的样品,然后可以在将第二二级核酸探针应用于例如可以与信号传导实体关联的样品(例如,使用扩增核酸)之前使信号传导实体失活。如果使用多个信号传导实体,那么可以使用相同或不同的技术来失活信号传导实体,并且可以例如顺序地或同时地失活多个信号传导实体中的一些或全部。
失活可以通过(例如,从样品或核酸探针等中)去除信号传导实体和/或通过以某种方式(例如,通过光漂白信号传导实体、漂白或化学改变信号传导实体的结构,例如,通过还原等)化学改变信号传导实体引起。例如,在一个实施例集合中,荧光信号传导实体可以通过化学或光学技术,诸如氧化、光漂白、化学漂白、严格洗涤或酶消化或通过暴露于酶的反应、将信号传导实体与其它组分(例如,探针)解离、信号传导实体(例如,与能够改变信号传导实体结构的反应物)的化学反应等进行灭活。例如,漂白可以通过暴露于氧气、还原剂发生,或者信号传导实体可以从核酸探针上化学裂解并经由流体流动冲走。
在一些实施例中,各种核酸探针可以例如使用如本文所讨论的扩增核酸与一种或多种信号传导实体相关联。如果使用多于一种核酸探针,那么信号传导实体可以各自相同或不同。在某些实施例中,信号传导实体是能够发光的任何实体。例如,在一个实施例中,信号传导实体是荧光的。在其它实施例中,信号传导实体可以是磷光的、放射性的、吸收性的,等等。在一些情况下,信号传导实体是可以在样品内以相对高的分辨率,例如,以比衍射极限或可见光的波长更好的分辨率确定的任何实体。信号传导实体可以是例如染料、小分子、肽或蛋白质等。信号传导实体在一些情况下可以是单个分子。如果使用多个二级核酸探针,那么核酸探针可以与相同或不同的信号传导实体关联。
信号传导实体的非限制性示例包括荧光实体(荧光团)或磷光实体,例如,花青染料(例如,Cy2、Cy3、Cy3B、Cy5、Cy5.5、Cy7等)、Alexa Fluor染料,Atto染料、光可切换染料、光活化染料、荧光染料、金属纳米粒子、半导体纳米粒子或“量子点”、荧光蛋白,诸如GFP(绿色荧光蛋白),或可光激活荧光蛋白,诸如PAGFP、PSCFP、PSCFP2、Dendra、Dendra2、EosFP、tdEos、mEos2、mEos3、PAmCherry、PAtagRFP、mMaple、mMaple2和mMaple3。其它合适的信号传导实体对于本领域普通技术人员来说是已知的。参见例如美国专利No.7,838,302或国际专利申请公开No.WO 2015/160690,以上每个专利都通过引用整体并入本文。
在一个实施例集合中,信号传导实体可以经由可以被裂解以释放信号传导实体的键附接到寡核苷酸序列。在一个实施例集合中,荧光团可以经由可裂解键(诸如可光裂解键)与寡核苷酸缀合。可光裂解键的非限制性示例包括但不限于1-(2-硝基苯基)乙基、2-硝基苄基、生物素亚磷酰胺、丙烯酸亚磷酰胺、二乙基氨基香豆素、1-(4,5-二甲氧基-2-硝基苯基)乙基、环十二烷基(二甲氧基-2-硝基苯基)乙基、4-氨基甲基-3-硝基苄基、(4-硝基-3-(1-氯羰氧基乙基)苯基)甲基-S-乙酰硫代酸酯、(4-硝基-3-(1-三氯羰基氧乙基)苯基)甲基-3-(2-吡啶基二硫代丙酸)酯、3-(4,4'-二甲氧基三苯甲基)-1-(2-硝基苯基)-丙烷-1,3-二醇-[2-氰乙基-(N,N-二异丙基)]-亚磷酰胺、1-[2-硝基-5-(6-三氟乙酰基己酰胺甲基)苯基]-乙基-[2-氰基-乙基-(N,N-二异丙基)]-亚磷酰胺、1-[2-硝基-5-(6-(4,4'-二甲氧基三苯甲基氧基)丁酰胺甲基)苯基]-乙基-[2-氰乙基-(N,N-二异丙基)]-亚磷酰胺、1-[2-硝基-5-(6-(N-(4,4'-二甲氧基三苯甲基))-生物素氨基己酰氨基-甲基)苯基]-乙基-[2-氰乙基-(N,N-二异丙基)]-亚磷酰胺,或类似的连接肽(linker)。寡核苷酸序列可以是例如初级或二级(或其它)扩增核酸,诸如本文所讨论的那些。
在另一个实施例集合中,荧光团可以经由二硫键与寡核苷酸缀合。二硫键可以被多种还原剂裂解,诸如但不限于二硫苏糖醇、二硫赤藓糖醇、β-巯基乙醇、硼氢化钠、硫氧还蛋白、谷氧还蛋白、胰蛋白酶原、肼、二异丁基氢化铝、草酸、甲酸、抗坏血酸、亚磷酸、氯化锡、谷胱甘肽、巯基乙酸盐、2,3-二巯基丙醇、2-巯基乙胺、2-氨基乙醇、三(2-羧乙基)膦、双(2-巯基乙基)砜、N,N'-二甲基-N、N'-双(巯基乙酰基)肼、3-巯基丙酸酯、二甲基甲酰胺、硫丙基-琼脂糖、三正丁基膦、半胱氨酸、硫酸铁、亚硫酸钠、亚磷酸盐、次磷酸盐、硫代磷酸盐等,和/或任何这些的组合。寡核苷酸序列可以是例如初级或二级(或其它)扩增核酸,诸如本文所讨论的那些。
在另一个实施例中,荧光团可以经由一个或多个硫代磷酸酯修饰的核苷酸与寡核苷酸缀合,其中硫修饰取代桥接和/或非桥接氧。在某些实施例中,可以经由添加诸如但不限于碘乙醇、在乙醇中混合的碘、硝酸银或氯化汞的化合物从寡核苷酸中裂解荧光团。在又一个实施例集合中,信号传导实体可以通过还原或氧化而被化学灭活。例如,在一个实施例中,可以使用硼氢化钠将诸如Cy5或Cy7的发色团还原到稳定的非荧光状态。在又一个实施例集合中,荧光团可以经由偶氮键与寡核苷酸缀合,并且偶氮键可以用2-[(2-N-芳基氨基)苯基偶氮]吡啶裂解。在另一个实施例集合中,荧光团可以经由合适的核酸区段与寡核苷酸缀合,该核酸区段可以在适当暴露于DNA酶(例如,外脱氧核糖核酸酶或内脱氧核糖核酸酶)时被裂解。示例包括但不限于脱氧核糖核酸酶I或脱氧核糖核酸酶II。在一个实施例集合中,裂解可以经由限制性核酸内切酶发生。潜在合适的限制性核酸内切酶的非限制性示例包括BamHI、BsrI、NotI、XmaI、PspAI、DpnI、MboI、MnlI、Eco57I、Ksp632I、DraIII、AhaII、SmaI、MluI、HpaI、ApaI、BclI、BstEII、TaqI、EcoRI、SacI、HindII、HaeII、DraII、Tsp509I、Sau3AI、PacI等。已详细研究了3000多种限制酶,其中600多种可商购。在又一个实施例集合中,荧光团可以与生物素缀合,并且寡核苷酸可以与抗生物素蛋白或链霉抗生物素蛋白缀合。生物素与抗生物素蛋白或链霉抗生物素蛋白之间的相互作用使荧光团与寡核苷酸缀合,而在充分暴露于过量添加的情况下,游离生物素可能会“竞争”链结(linkage),从而导致发生裂解。此外,在另一个实施例集合中,可以使用对应的“立足点探针(toe-hold-probes)”去除探针,该“立足点探针”包含与探针相同的序列,以及额外数量的与编码探针同源的碱基(例如,1-20个额外的碱基,例如,5个额外的碱基)。这些探针可以通过链置换相互作用去除标记的读出探针。寡核苷酸序列可以是例如初级或二级(或其它)扩增核酸,诸如本文所讨论的那些。
如本文所使用的,术语“光”通常是指具有任何合适波长(或等效地,频率)的电磁辐射。例如,在一些实施例中,光可以包括光学或视觉范围内的波长(例如,具有在约400nm和约700nm之间的波长,即“可见光”)、红外波长(例如,具有在约300微米和700nm之间的波长)、紫外波长(例如,具有在约400nm和约10nm之间的波长)等。在某些情况下,如下文详细讨论的,可以使用多于一个实体,即,在化学上例如在结构上不同或有差异的实体。但是,在其它情况下,实体可以在化学上相同或至少在化学上基本相同。
在一个实施例集合中,信号传导实体是“可切换的”,即,实体可以在两种或更多种状态之间切换,其中至少一种状态发射具有期望波长的光。在(一个或多个)其它状态下,实体可以不发射光,或发射不同波长的光。例如,实体可以被“激活”到能够产生具有期望波长的光的第一状态,并且“失活”到不能发射相同波长的光的第二状态。如果实体可以被合适波长的入射光激活,那么它是“可光激活的”。作为非限制性示例,Cy5可以通过不同波长的光以受控和可逆的方式在荧光和暗状态之间切换,即,633nm(或642nm、647nm、656nm)红光可以使Cy5切换或失活到稳定的暗态,而405nm的绿光可以使Cy5切换或激活回到荧光状态。在一些情况下,实体可以在两种或更多种状态之间可逆地切换,例如,在暴露于适当的刺激时。例如,第一刺激(例如,第一波长的光)可以用于激活可切换实体,而第二刺激(例如,第二波长的光)可以用于使可切换实体失活,例如,到非发射状态。可以使用任何合适的方法来激活实体。例如,在一个实施例中,可以使用合适波长的入射光来激活实体以发射光,即,实体是“光可切换的”。因此,光可切换实体可以通过例如不同波长的入射光在不同的发光或不发光状态之间切换。光可以是单色的(例如,使用激光产生的)或多色的。在另一个实施例中,实体可以在受到电场和/或磁场刺激时被激活。在其它实施例中,实体可以在暴露于合适的化学环境时例如通过调节pH或诱导涉及实体的可逆化学反应等被激活。类似地,任何合适的方法可以用于使实体失活,并且激活和失活实体的方法不必相同。例如,实体可以在暴露于合适波长的入射光时被失活,或者实体可以通过等待足够的时间被失活。
通常,本领域普通技术人员可以通过确定处于第一状态的实体在暴露于激发波长时可以发射光,从而例如在暴露于切换波长的光时将实体从第一状态切换到第二状态,然后显示该实体在处于第二状态时在暴露于激发波长时不再能够发射光(或以大大降低的强度发射光)的条件来识别“可切换”实体。
在一个实施例集合中,如所讨论的,可切换实体可以在暴露于光时进行切换。在一些情况下,用于激活可切换实体的光可以来自外部源,例如,诸如激光光源的光源、靠近可切换实体的另一个发光实体等。在一些情况下,第二发光实体可以是荧光实体,并且在某些实施例中,第二发光实体本身也可以是可切换实体。
在一些实施例中,可切换实体包括第一发光部分(例如,荧光团)和激活或“切换”第一部分的第二部分。例如,在暴露于光时,可切换实体的第二部分可以激活第一部分,从而导致第一部分发射光。激活剂部分的示例包括但不限于Alexa Fluor 405(Invitrogen)、Alexa Fluor 488(Invitrogen)、Cy2(GE Healthcare)、Cy3(GE Healthcare)、Cy3B(GEHealthcare)、Cy3.5(GE Healthcare),或其它合适的染料。发光部分的示例包括但不限于Cy5、Cy5.5(GE Healthcare)、Cy7(GE Healthcare)、Alexa Fluor 647(Invitrogen)、AlexaFluor 680(Invitrogen)、Alexa Fluor 700(Invitrogen)、Alexa Fluor 750(Invitrogen)、Alexa Fluor 790(Invitrogen)、DiD、DiR、YOYO-3(Invitrogen)、YO-PRO-3(Invitrogen)、TOT-3(Invitrogen)、TO-PRO-3(Invitrogen)或其它合适的染料。这些可以例如共价,例如直接或通过连接肽链接在一起,例如从而形成化合物,诸如但不限于Cy5-Alexa Fluor 405、Cy5-Alexa Fluor 488、Cy5-Cy2、Cy5-Cy3、Cy5-Cy3.5、Cy5.5-AlexaFluor 405、Cy5.5-Alexa Fluor 488、Cy5.5-Cy2、Cy5.5-Cy3、Cy5.5-Cy3.5、Cy7-AlexaFluor 405、Cy7-Alexa Fluor 488、Cy7-Cy2、Cy7-Cy3、Cy7-Cy3.5、Alexa Fluor 647-AlexaFluor 405、Alexa Fluor 647-Alexa Fluor 488、Alexa Fluor 647-Cy2、Alexa Fluor647-Cy3、Alexa Fluor 647-Cy3.5、Alexa Fluor 750-Alexa Fluor 405、Alexa Fluor750-Alexa Fluor 488、Alexa Fluor 750-Cy2、Alexa Fluor 750-Cy3或Alexa Fluor 750-Cy3.5。本领域普通技术人员将意识到这些和其它化合物的结构,其中许多可商购。这些部分可以经由共价键或通过连接肽链接,诸如下文详细描述的那些。其它发光或活化剂部分可以包括具有通过聚甲炔链链接的两个季铵化氮原子的部分,其中每个氮独立地是杂芳族组成部分的一部分,诸如吡咯、咪唑、噻唑、吡啶、喹啉、吲哚、苯并噻唑等,或非芳香胺的一部分。在一些情况下,两个氮原子之间可以有5、6、7、8、9或更多个碳原子。
在一些情况下,发光部分和活化剂部分,当彼此隔离时,可以各自是荧光团,即,当暴露于刺激(例如,激发波长)时可以发射特定发射波长的光的实体。但是,当形成包含第一荧光团和第二荧光团的可切换实体时,第一荧光团形成第一发光部分,并且第二荧光团形成激活剂部分,该激活剂部分进行切换,响应于刺激激活或“切换”第一部分。例如,可切换实体可以包括直接结合到第二荧光团的第一荧光团,或者第一和第二实体可以经由连接肽或共同实体连接。可以通过本领域普通技术人员已知的方法测试一对发光部分和激活剂部分是否产生合适的可切换实体。例如,可以使用各种波长的光来刺激该对,并且可以测量来自发光部分的发射光以确定该对是否进行了合适的切换。
作为非限制性示例,Cy3和Cy5可以链接在一起以形成这样的实体。在这个示例中,Cy3是能够激活Cy5发光部分的激活剂部分。因此,实体的激活或第二部分的吸收最大值处或附近的光(例如,Cy3的近532nm光)可能导致该部分激活第一发光部分,从而导致第一部分发射光(例如,对于Cy5接近647nm)。参见例如美国专利No.7,838,302,该专利通过引用整体并入本文。在一些情况下,第一发光部分随后可以通过任何合适的技术(例如,通过将647nm红光引导到分子的Cy5部分)来灭活。
潜在合适的活化剂部分的其它非限制性示例包括1,5IAEDANS、1,8-ANS、4-甲基伞形酮、5-羧基-2,7-二氯荧光素、5-羧基荧光素(5-FAM)、5-羧基荧光素、5-羧基四甲基罗丹明(5-TAMRA)、5-FAM(5-羧基荧光素)、5-HAT(羟基色胺)、5-羟基色胺(HAT)、5-ROX(羧基-X-罗丹明)、5-TAMRA(5-羧基四甲基罗丹明),6-羧罗丹明6G、6-CR 6G、6-JOE、7-氨基-4-甲基香豆素、7-氨基放线菌素D(7-AAD)、7-羟基-4-甲基香豆素、9-氨基-6-氯-2-甲氧基吖啶、ABQ、酸性品红、ACMA(9-氨基-6-氯-2-甲氧基吖啶)、吖啶橙、吖啶红、吖啶黄、吖啶黄素、吖啶黄素Feulgen SITSA、Alexa Fluor 350、Alexa Fluor 405、Alexa Fluor 430、AlexaFluor 488、Alexa Fluor 500、Alexa Fluor 514、Alexa Fluor 532、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 568、Alexa Fluor 594、Alexa Fluor 610、Alexa Fluor633、Alexa Fluor 635、茜素络合剂、茜素红色、AMC、AMCA-S、AMCA(氨基甲基香豆素)、AMCA-X、氨基放线菌素D、氨基香豆素、氨基甲基香豆素(AMCA)、苯胺蓝、硬脂酸蒽环酯、APTRA-BTC、APTS、Astrazon亮红4G、Astrazon橙R、Astrazon红6B、Astrazon黄7GLL、阿塔布林、ATTO390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 520、ATTO 532、ATTO 550、ATTO 565、ATTO 590、ATTO 594、ATTO 610、ATTO 611X、ATTO 620、ATTO 633、ATTO 635、ATTO 647、ATTO647N、ATTO 655、ATTO 680、ATTO 700、ATTO 725、ATTO 740、ATTO-TAG CBQCA、ATTO-TAG FQ、金胺、金膦G、金膦、BAO 9(双氨基苯恶二唑)、BCECF(高pH)、BCECF(低pH)、硫酸小檗碱、比曼、双苯甲酰胺、双苯并亚胺(Hoechst)、bis-BTC、Blancophor FFG、Blancophor SV、BOBO-1、BOBO-3、Bodipy 492/515、Bodipy 493/503、Bodipy 500/510、Bodipy 505/515、Bodipy530/550、Bodipy 542/563、Bodipy 558/568、Bodipy 564/570、Bodipy 576/589、Bodipy581/591、Bodipy 630/650-X、Bodipy 650/665-X、Bodipy 665/676、Bodipy Fl、Bodipy FLATP、Bodipy Fl-Ceramide、Bodipy R6G、Bodipy TMR、Bodipy TMR-X偶联物、Bodipy TMR-X、SE、Bodipy TR、Bodipy TR ATP、Bodipy TR-X SE、BO-PRO-1、BO-PRO-3、亮硫黄素FF、BTC、BTC-5N、钙黄绿素、钙黄绿素蓝、深红钙、钙绿、钙绿-1Ca2+染料、钙绿-2Ca2+、钙绿-5N Ca2+、钙绿-C18 Ca2+、钙橙、荧光白、羧基-X-罗丹明(5-ROX)、Cascade蓝、Cascade黄、儿茶酚胺、CCF2(GeneBlazer)、CFDA、色霉素A、色霉素A、CL-NERF、CMFDA、香豆素鬼笔环肽、CPM甲基香豆素、CTC、CTC甲臜、Cy2、Cy3.1 8、Cy3.5、Cy3、Cy5.1 8、环状AMP荧光传感器(FiCRhR)、Dabcyl、Dansyl、丹磺胺、丹磺酰尸胺、丹磺酰氯、Dansyl DHPE、丹磺酰氟、DAPI、Dapoxyl、Dapoxyl 2、Dapoxyl 3'DCFDA、DCFH(二氯二氢荧光素二乙酸酯)、DDAO、DHR(二氢罗丹明123)、Di-4-ANEPPS、Di-8-ANEPPS(非比例)、DiA(4-Di-16-ASP)、二氯二氢荧光素二乙酸酯(DCFH)、DiD-亲脂示踪剂、DiD(DiIC18(5))、DIDS、二氢罗丹明123(DHR)、DiI(DiIC18(3))、二硝基苯酚、DiO(DiOC18(3))、DiR、DiR(DiIC18(7))、DM-NERF(high pH)、DNP、多巴胺、DTAF、DY-630-NHS、DY-635-NHS、DyLight 405、DyLight 488、DyLight 549、DyLight 633、DyLight 649、DyLight 680、DyLight 800、ELF 97、曙红、赤藓红、赤藓红ITC、溴化乙锭、乙锭同型二聚体-1(EthD-1)、紫丁香素、EukoLight、氯化铕(III)、Fast Blue、FDA、福尔根(副玫瑰苯胺)、FIF(甲醛诱导荧光)、FITC、Flazo橙、Fluo-3、Fluo-4、荧光素(FITC)、荧光素二乙酸盐、氟祖母绿、氟金(羟芪胺)、氟红宝石、FluorX、FM 1-43、FM 4-46、芙拉红(高pH)、芙拉红/Fluo-3、Fura-2、Fura-2/BCECF、Genacryl亮红B、Genacryl亮黄10GF、Genacryl粉3G、Genacryl黄5GF、GeneBlazer(CCF2)、邻苯二甲酸、颗粒蓝、血卟啉、Hoechst 33258、Hoechst33342、Hoechst 34580、HPTS、羟基香豆素、羟芪胺(氟金)、羟色胺、Indo-1、高钙、Indo-1、低钙、吲哚羰花青(DiD)、吲哚三羰花青(DiR)、白内Cf、JC-1、JO-JO-1、JO-PRO-1、LaserPro、劳罗丹、LDS 751(DNA)、LDS 751(RNA)、Leucophor PAF、Leucophor SF、Leucophor WS、丽丝敏罗丹明、丽丝敏罗丹明B、钙黄绿素/乙锭同二聚体、LOLO-1、LO-PRO-1、路西法黄、LysoTracker蓝、Lyso Tracker蓝-白、Lyso Tracker绿、Lyso Tracker红、Lyso Tracker黄、LysoSensor蓝、LysoSensor绿、LysoSensor黄/蓝、Mag绿、Magdala红(Phloxin B)、Mag-Fura红、Mag-Fura-2、Mag-Fura-5、Mag-Indo-1、镁绿、镁橙、孔雀石绿、滨海蓝、MaxilonBrilliant Flavin 10GFF、Maxilon Brilliant Flavin 8GFF、部花青素、甲氧基香豆素、Mitotracker绿FM、Mitotracker橙、Mitotracker红、米曲霉素、溴二甲双胍、溴二甲双胍(mBBr-GSH)、一氯二甲双胍、MPS(甲基绿Pyronine Stilbene)、NBD、NBD胺、尼罗红、硝基苯并恶唑、去甲肾上腺素、核固红、核黄、Nylosan Brilliant Iavin E8G、俄勒冈绿、俄勒冈绿488-X、俄勒冈绿、俄勒冈绿488、俄勒冈绿500、俄勒冈绿514、太平洋蓝、副玫瑰苯胺(福尔根)、PBFI、福禄考B(马格达拉红)、Phorwite AR、Phorwite BKL、Phorwite Rev、PhorwiteRPA、磷化氢3R、PKH26(Sigma)、PKH67、PMIA、Pontochrome蓝黑、POPO-1、POPO-3、PO-PRO-1、PO-PRO-3、Primuline、Procion黄、碘化丙啶(PI)、PyMPO、芘、吡罗宁、吡罗宁B、PyrozalBrilliant Flavin 7GF、QSY 7、奎纳克林芥末、试卤灵、RH 414、Rhod-2、罗丹明、罗丹明110、罗丹明123、罗丹明5GLD、罗丹明6G、罗丹明B、罗丹明B 200、罗丹明B extra、罗丹明BB、罗丹明BG、罗丹明绿、罗丹明法利克定、罗丹明鬼笔环肽、罗丹明红、罗丹明WT、玫瑰红、S65A、S65C、S65L、S65T、SBFI、血清素、Sevron亮红2B、Sevron亮红4G、Sevron亮红B、Sevron橙、Sevron黄L、SITS、SITS(Primuline)、SITS(芪异硫磺酸)、SNAFL钙黄绿素、SNAFL-1、SNAFL-2、SNARF钙黄绿素、SNARF1、钠绿、SpectrumAqua、SpectrumGreen、SpectrumOrange、Spectrum Red、SPQ(6-甲氧基-N-(3-磺丙基)喹啉)、二苯乙烯、Sulphorhodamine B can C、Sulphorhodamine Extra、SYTO 11、SYTO 12、SYTO 13、SYTO 14、SYTO 15、SYTO 16、SYTO17、SYTO 18、SYTO 20、SYTO 21、SYTO 22、SYTO 23、SYTO 24、SYTO 25、SYTO 40、SYTO 41、SYTO 42、SYTO 43、SYTO 44、SYTO 45、SYTO 59、SYTO 60、SYTO 61、SYTO 62、SYTO 63、SYTO64、SYTO 80、SYTO 81、SYTO 82、SYTO 83、SYTO 84、SYTO 85、SYTOX蓝、SYTOX绿、SYTOX橙、四环素、四甲基罗丹明(TAMRA)、Texas红、Texas Red-X conjugate、硫二碳花青(DiSC3)、噻嗪红R、噻唑橙、硫黄素5、硫黄素S、硫黄素TCN、硫代电解质、噻唑橙、蒂诺波尔CBS(荧光白)、TMR、TO-PRO-1、TO-PRO-3、TO-PRO-5、TOTO-1、TOTO-3、TRITC(异硫氰酸四甲基罗丹明)、TrueBlue、TruRed、Ultralite、Uranine B、Uvitex SFC、WW 781、X-罗丹明、XRITC、二甲苯橙、Y66F、Y66H、Y66W、YO-PRO-1、YO-PRO-3、YOYO-1、YOYO-3、SYBR绿色、噻唑橙(螯合染料),或它们的组合。
一方面,本公开一般而言涉及用于扩增生物样品内(潜在地数十、数百、数千或更多个)靶标的信号的系统和方法,例如,用于使用MERFISH或其它技术进行成像。例如,在一些实施例中,这些技术提供了一种快速、简单和/或高效的方式例如在生物样品的天然环境中同时扩增数百或数千个RNA靶标的信号。在某些实施例中,如本文所讨论的,通过使用可饱和系统可以很好地控制这种扩增。因为此,在扩增过程中,点与点之间的亮度变化可以最小化,这在使用MERFISH或其它技术进行解码时是有用的。在一些实施例中,扩增斑点的尺寸也没有增加。这可以提高识别例如相对靠近彼此定位的靶标的能力。例如,如果斑点尺寸增加太多,那么来自一个靶标的信号可能与来自另一个靶标的信号重叠。此外,如下文所讨论的,在一些实施例中,扩增核酸不包含例如可能涉及扩增处理的发夹结构,这可以有助于创建可饱和系统,和/或将多个扩增系统的设计应用到大量的靶标。此外,同样如下所讨论的,扩增核酸可以仅使用三个核苷酸来构造。三字母核苷酸的二级结构可以比四字母核苷酸少得多,并且结合速率更快。此外,在一些情况下,任何给定扩增序列将可靠工作的可能性会增加,例如,通过减少意外二级结构的可能性。
这种系统的非限制性示例现在在图3中示出。在图3A中,图示了靶标10(在本示例中为RNA)。可以有数百或数千个靶标分布在生物样品(例如,细胞或组织)内,并且核酸探针与靶标的结合可以用于确定它们的分布,例如,通过使用荧光探针和对样品进行成像。但是注意的是,为了清楚起见,这里仅图示了单个靶标。
在一些实施例中,使用具有不同序列的多个核酸探针,并且基于每个核酸探针的结合模式,顺序地分析每个核酸探针的分布并将其用于为每个地点创建“码字”。通过选择定义合适码空间的核酸探针,可以识别和/或丢弃和/或校正观察到的结合模式中的明显误差以识别正确的码字,从而识别样品内核酸探针的正确靶标。这种抗误差和误差校正系统首先被引入用于多路复用的抗误差荧光原位杂交(MERFISH),随后也被用于各种相关技术。例如参见国际专利申请公开号WO 2016/018960和WO 2016/018963,其各自通过引用整体并入本文。
图3A中示出了编码核酸探针的示例,其中编码核酸探针15(在虚线框中示出)已结合到靶标10,例如,靶标RNA。其它核酸探针16、17也可以与靶标RNA和/或样品内的其它靶标结合。探针15可以包含能够与靶标RNA结合(例如,经由特异性结合)的靶标序列11,以及读取序列12(或“读出”序列),即可以被“读取”以确定是否发生结合的序列。探针上可以存在一个、两个、三个或更多个读取序列。例如,在这个示例中,在探针15中(识别为读取序列12和读取序列19)存在两个这样的读取序列。读取序列可以各自独立地相同或不同。此外,诸如16和17的探针可以具有与核酸探针15相同或不同数量的读取序列,和/或相同或不同的结构。
如果不应用扩增,那么核酸探针15可以暴露于含有信号传导实体40的合适的二级核酸探针32,如图3E中所示。在这个示例中,信号传导实体经由二硫键链结链接到二级核酸探针,但是在其它实施例中可以使用其它技术。但是,在这种情况下,只能将一个信号传导实体链接到靶标。因此,检测单个信号传导实体并使用它来确定核酸探针15与靶标10的结合可能相对困难,因为在这种结合事件之后产生的信号强度低。
因而,根据某些实施例,在图3B中,可以使用初级扩增核酸20。初级扩增核酸可以包含能够(例如,特异性)结合到核酸探针15的读取序列的第一初级识别序列22,以及能够(例如,特异性)结合到一个或多个二级扩增核酸的一个或多个初级读取序列23,如下面所讨论的。在这个示例中,“N”个这样的读取序列在初级扩增核酸中示意性地示出(N可以是例如5、7、9或如本文讨论的其它数量)。初级读取序列可以各自具有相同或不同的序列,并且可以具有相同或不同的长度。在这个示例中,每个读取序列的长度为20个核苷酸,但是这仅作为示例。此外,如前所述,虽然这里示出了两个这样的初级扩增核酸,但这仅是示例,在其它实施例中其它数量的初级扩增核酸可以与核酸探针结合。
接下来,如图3C中所示,二级扩增核酸30可以与初级扩增核酸结合。如下面所讨论的,二级扩增核酸可以包含能够(例如,特异性)结合到初级扩增核酸20的读取序列23的第一识别序列33,以及能够结合到信号传导实体的一个或多个二级读取序列34。
与初级扩增核酸一样,二级扩增核酸中可以存在任意数量的二级读取序列,如该图中所示。二级读取序列可以各自具有相同或不同的序列,并且可以具有相对于彼此相同或不同的长度。二级读取序列也可以与初级扩增核酸的读取序列相同或不同。在这个示例中,每个二级扩增核酸可以具有“M”个读取序列。M例如可以是5、7、9或如本文讨论的其它数量,并且M可以与N相同或不同。
在图3D中,多个信号传导实体40已与二级扩增核酸的读取序列结合。在这个示例中,信号传导实体各自经由二硫键链结结合,但是如本文所讨论的,在其它实施例中可以使用其它技术。
此外,在这种情况下,预计存在已结合到靶标序列的每个读取序列的信号传导实体的最大值或饱和极限。在这个特定的示例中,对于核酸探针的每个读取序列(这里是2个这样的读取序列)有NxM个这样的位置可用,假设两者具有基本相同的结构(但是它们不一定必须具有相同的结构,即,相同数量的NxM位置可用,例如,如果它们具有不同结构的扩增核酸)。因此,可以与给定靶标相关联的信号传导实体的数量是有限的、可预测的数量,并且不能无限地或无界限地增长。
在这个实施例中,讨论了两个读取序列12和19,其中的每一个都可以具有初级和二级扩增核酸和相关联的信号传导实体。这些可能具有或可能不具有相同或不同的结构,例如,与读取序列12相关联的信号传导实体和/或扩增核酸可能不与读取序列19相关联,反之亦然。(但是,如上所述,这里仅作为示例提供了2个读取序列,在其它实施例中,可以有1、2、3、4个等不同的读取序列,其可以例如使用类似的方法,包括利用不同的扩增核酸等并行扩增)。可以通过确定与每个读取序列(其可以相同或不同)相关联的信号传导实体例如顺序地或同时地独立确定读取序列。例如,如图3D中所示,信号传导实体40能够与初级扩增核酸20和二级扩增核酸30,最终与读取序列12关联,但不能与读取序列19或分别与其相关联的初级和二级扩增核酸29和39关联。
此外,在一些实施例中,扩增可以涉及仅一轮扩增核酸(产生N倍扩增)、两轮(产生NxM倍扩增)、三轮(产生NxMxO扩增,其中第三轮分子包含O个读取序列),或在一些情况下更多轮的结合。在一些情况下,可以应用任意数量轮次的扩增。
此外,样品可以包含具有许多不同读出序列的核酸探针,例如,可以使用不同的扩增核酸或信号传导实体识别这些读出序列。例如,可以使用8、10、12、14、16、24、32、48、64、128或其它数量的读出序列,包括超过128轮。在一些情况下,独特的扩增核酸可以用于扩增读出序列,例如,诸如使用合适的扩增核酸可以将存在的原始读出序列扩增成例如NxM个副本。在某些情况下,可以高效地设计扩增核酸。例如,通过仅利用扩增核酸序列中四个核苷酸中的三个,可以降低扩增核酸内未预料到的二级结构的可能性。不希望受任何理论的束缚,据信由于这种结合扩增核酸本身或随后的扩增核酸的二级结构的效果可能难以预测,因此减少或消除二级结构可以增加给定扩增核酸将正确组装的可能性,这可以促进大量正交扩增核酸的设计和使用。此外,通过减少也可以抑制这些扩增核酸结合速率的二级结构,这种设计考虑可以减少组装这些结构所需的时间,或减少每个样品所需的扩增核酸的量等。
这种方法提供的受控扩增与诸如发夹展开或滚环扩增之类的技术形成对比,其中信号的扩增可以以不受控制的方式或无限期地有效增长,即,当存在足够的试剂时。这种不受控制的扩增可能难以准确确定,因为存在的信号量可能与靶标的数量或靶标的地点没有很好的相关性(例如,由于不受控制的扩增产生大量信号,显微图像中出现的“斑点尺寸”可能增长较大,并且不一定以靶标为中心,从而阻碍图像的分辨率,或干扰来自其它附近靶标的信号)。作为对照,如本文所讨论的,使用可饱和扩增技术可以产生最大数量的可以与靶标相关联的信号传导实体,这可以限制斑点尺寸、产生斑点亮度或强度的均匀性、改进检测等。
如所提到的,在某些实施例中,这些技术可以与例如在MERFISH或其它类似技术中使用的误差校正组合。例如,码字可以基于多个核酸探针的结合(或非结合),并且在一些情况下,码字可以定义误差纠正码以帮助减少或防止核酸探针的错误识别。在一些情况下,可以使用相对少量的标签,例如,通过使用各种组合方法来识别相对大量的不同靶标。诸如STORM之类的图像采集技术也可以用于对此类样品进行成像并促进核酸探针的确定。参见例如美国专利号9,712,805或10,073,035,或国际专利申请公开号WO 2008/091296或WO2009/085218,其中每一个都通过引用整体并入本文,以获取关于诸如MERFISH的技术的更多细节。
本公开的另一方面涉及一种计算机实现的方法。例如,可以提供能够自动和/或重复执行本文描述的任何方法的计算机和/或自动化系统。如本文所使用的,“自动化”设备是指能够在没有人指导的情况下操作的设备,即,自动化设备可以在任何人完成任何动作以促进功能,例如,通过在计算机中输入指令来启动处理之后的一段时间内执行功能。通常,自动化设备可以在此时间点之后执行重复功能。在一些情况下,处理步骤也可以记录在机器可读介质上。
例如,在一些情况下,计算机可以用于例如使用荧光显微镜、STORM或其它超分辨率技术(诸如本文描述的那些)来控制样品的成像。在一些情况下,计算机还可以控制操作,诸如漂移纠正、物理配准、图像分析中的杂交和簇对准、簇解码(例如,荧光簇解码)、误差检测或纠正(例如,如本文所讨论的)、降噪、从背景特征(诸如,图像中的噪声或碎片)中识别前景特征等。作为示例,计算机可以用于控制样品内信号传导实体的激活和/或激发,和/或采集信号传导实体的图像。在一个实施例集合中,可以使用具有各种波长和/或强度的光来激发样品,并且可以使用计算机将用于激发样品的光的波长序列与采集的包含信号传导实体的样品的图像相关。例如,计算机可以将具有各种波长和/或强度的光应用于样品,以在每个关注区域中产生不同平均数量的信号传导实体(例如,每个地点一个激活的实体,每个地点两个激活的实体等)。在一些情况下,该信息可以用于构造图像和/或确定信号传导实体的地点,在一些情况下以高分辨率,如上所述。
在一些方面,将样品定位在显微镜上。在一些情况下,显微镜可以包含一个或多个通道,诸如微流体通道,以引导或控制流体流入或流出样品。例如,在一个实施例中,可以通过使流体流过一个或多个通道流入或流出样品来将诸如本文所讨论的那些核酸探针引入样品和/或从样品中去除。在一些情况下,还可以有一个或多个腔室或储存器用于保持流体,例如,与通道和/或样品流体连通。本领域普通技术人员将熟悉用于将流体移入或移出样品的通道,包括微流体通道。
以下文件通过引用并入本文:国际专利申请公开号WO 2018/218150,标题为“Systems and Methods for High-Throughput Image-Based Screening”;WO 2016/018960,标题为“Systems and Methods for Determining Nucleic Acids”;WO 2016/018963,标题为“Probe Library Construction”;WO 2018/089445,标题为“MatrixImprinting and Clearing”;WO 2018/089438,标题为“Multiplexed Imaging UsingMERFISH and Expansion Microscopy”;以及美国专利申请序列号62/836,578,标题为“Imaging-Based Pooled CRISPR Screening”和62/779,333,标题为“AmplificationMethods and Systems for MERFISH and Other Applications”。以下文件也通过引用整体并入本文:美国专利号2017/0220733和2017/0212986。此外,Moffitt等人于2019年11月20日提交的标题为“Systems and Methods for Multi-Focal Imaging for MolecularProfiling”的美国专利申请序列No.62/938,194通过引用整体并入本文。
以下示例旨在图示本公开的某些实施例,但不是例示本公开的全部范围。
示例1
为了进一步图示由同时多平面成像与MERFISH测量组合提供的MERFISH成像时间的潜在减少,该示例提供以下两种场景。
在第一个场景中,使用由1.5微米分隔的焦平面组成的8图像z栈来表征组织切片中多个视场(FOV)处的大量mRNA分子的分布。假设每图像的曝光时间为0.5秒,并且重新聚焦时间为100毫秒,那么收集每个z栈需要4.7秒。如果在1000FOV下进行此类测量并进行16轮成像以测量16位条形码,那么在所有轮次中对该样品进行成像所需的总时间约为21小时。
在第二个场景中,执行相同的MERFISH测量并在相同数量的FOV中对相同的8图像z栈进行成像;但是,使用由8个相机组成的相机组,其中相机组中的每个相机对与前一个相机分开1.5微米的焦平面进行成像,使得成像的z栈与第一个场景中成像的相同。
此外,一些实施例使用分支DNA扩增(bDNA)将每轮中的荧光信号扩增约8倍,使得相机组中每个相机上的总荧光与第一个场景中相机上的信号相同。在这个场景中,相机组中每个相机同时曝光,总曝光时间为0.5秒。在这个场景中,物镜不进行重新聚焦。因此,在单个FOV下对全部z栈进行成像所需的时间为0.5秒,并且在此特定示例中,在1000FOV中跨16轮执行所有成像所需的时间为2.2小时。
示例2
该示例图示了第三个场景,其中四个相机组用于对与示例1中所述相同组织体积中的四种不同颜色进行成像。与上述第二个场景一样,收集全部z栈每个FOV只需要0.5秒;但是,通过使用四个不同的颜色通道,可以在每轮染色和成像中测量四个读出探针,而不是需要16轮成像来测量16位,将只需要四轮。因此,在这个特定示例中,跨1000FOV测量16位条形码将只需要约33分钟。
示例3
该示例图示了其中16个相机组被布置为同时对两个颜色通道中的8个光学平面进行成像的场景(图4)。从显微镜或一些其它成像设备收集到的发射光由非二向色分束器在两条相同的路径之间平均分割。在第一条路径中,光通过第一成像透镜聚焦、在一系列两个附加的非二向色分束器(部分反射镜)中分割,以创建四条光路,每条光路理想情况下包含大致相等部分的从显微镜收集到的发射光。然后在这些路径中的每一条中,光通过第二个成像透镜,以在8个检测器中的每一个上形成图像。但是,在光到达检测器之前,它使用二向色分束器经由颜色进行分割,从而在两个单独的相机上的每个颜色通道中创建图像。由二向色分束器分开的每对这样的相机的位置相对于它们共享路径中的最终成像透镜进行设置,使得它们在与该系统附接的显微镜成像的样品中成像相同的轴向平面。但是,从与每对相机相关联的最终成像透镜到该对相机的距离对于每对相机来说是唯一的,使得每对相机相对于其它相机对在样品中成像不同的轴向平面。由第一非二向色分束器产生的第二光路包含等效路径。
虽然本文已经描述和说明了本公开的几个实施例,但是本领域普通技术人员将容易想到用于执行功能和/或获得结果和/或本文描述的一个或多个优点的各种其它手段和/或结构,并且这些变化和/或修改中的每一个被认为是在本公开的范围内。更一般而言,本领域技术人员将容易认识到的是,本文描述的所有参数、维度、材料和配置意在是示例性的,并且实际的参数、维度、材料和/或配置将取决于使用本公开教导的一个或多个具体应用。本领域技术人员将认识到,或仅仅使用常规实验就能够确定,本文描述的本公开的具体实施例的许多等同物。因此,应当理解的是,前述实施例仅作为示例给出,并且在所附权利要求及其等同物的范围内,本公开可以以与具体描述和要求保护的方式不同的方式实践。本公开针对本文描述的每个单独特征、系统、制品、材料、套件和/或方法。此外,如果两个或更多个特征、系统、制品、材料、套件和/或方法不相互不一致,那么这些特征、系统、制品、材料、套件和/或方法的任意组合都包括在本公开的范围内。
在本说明书和通过引用并入的文档包含矛盾和/或不一致的公开内容的情况下,以本说明书为准。如果通过引用并入的两个或更多个文档包含相互冲突和/或不一致的公开内容,那么以生效日期较晚的文档为准。
如本文所定义和使用的,所有定义都应当被理解为以字典定义、通过引用并入的文献中的定义和/或所定义术语的普通含义为准。
除非有明确的相反指示,否则如本文在说明书和权利要求书中使用的不定冠词“一”应当理解为意指“至少一个”。
如本文在说明书和权利要求书中使用的短语“和/或”应当理解为意指如此结合的元素的“任一个或两者”,即,在一些情况下联合存在并且在其它情况下分离地存在的元素。用“和/或”列出的多个元素应当以相同的方式解释,即,如此连接的元素中的“一个或多个”。除了由“和/或”子句具体识别出的元素之外,其它元素可以可选地存在,不管与具体识别出的那些元素相关还是不相关。因此,作为非限制性示例,当与开放式语言(诸如“包括”)结合使用时,对“A和/或B”的引用在一个实施例中可以仅指A(可选地包括除B以外的元素),在另一个实施例中仅指B(可选地包括除A以外的元素),在又一个实施例中指A和B两者(可选地包括其它元素)等等。
如本文在说明书和权利要求中所使用的,“或”应当被理解为具有与以上定义的“和/或”相同的含义。例如,当分离列表中的项时,“或”或“和/或”应当被解释为包含性的,即,包括多个元素或元素列表的至少一个元素,但也包括多于一个元素,以及可选的其它未列出的项。只有清楚地指示相反的术语(诸如“仅一个”或“恰好一个”,或者当在权利要求中使用时,“由......组成”)将指包括多个元素或元素列表中的恰好一个元素。一般而言,如本文所使用的术语“或”仅当前面有排他性术语(诸如“任一个”、“之一”、“仅一个”或“恰好一个”)时才被解释为指示排他性替代(即,“一个或另一个,但不是两者”)。
如本文在说明书和权利要求书中所使用的,关于一个或多个元素的列表的短语“至少一个”应当被理解为意指选自元素列表中的任何一个或多个元素的至少一个元素,但不一定包括在元素列表内具体列出的每个元素中的至少一个,并且不排除元素列表中元素的任意组合。这个定义还允许,除在短语“至少一个”所指的元素列表内具体识别出的元素之外,元素可以可选地存在,不管与具体识别出的那些元素相关还是不相关。因此,作为非限制性示例,“A和B中的至少一个”(或者等同地,“A或B中的至少一个”,或者等同地,“A和/或B中的至少一个”)可以在一个实施例中指至少一个(可选地包括多于一个)A,而不存在B(并且可选地包括除B以外的元素);在另一个实施例中指至少一个(可选地包括多于一个)B,而不存在A(并且可选地包括除A以外的元素);在又一个实施例中指至少一个(可选地包括多于一个)A,以及至少一个(可选地包括多于一个)B(并且可选地包括其它元素)等等。
当本文参考数字使用词“约”时,应当理解的是,本公开的又一个实施例包括没有通过存在词“约”来修改的数字。
本文中的所有数字都是近似值,并且旨在说明正常测量误差以及四舍五入到最接近的有效位。
还应当理解的是,除非清楚地指示为相反,否则在本文要求保护的包括多于一个步骤或动作的任何方法中,方法的步骤或动作的次序都不一定限于方法的步骤或动作被叙述的次序。
在权利要求书以及以上说明书中,所有过渡性短语(诸如“包括”、“携带”、“具有”、“包含”、“涉及”、“保持”、“由......构成(composed of)”等)都应当被理解为是开放式的,即,意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节所述,只有过渡性短语“由......组成”和“基本上由......组成”才分别是封闭式或半封闭式过渡性短语。

Claims (39)

1.一种方法,包括:
将样品暴露于多个核酸探针;
对于所述核酸探针中的每个核酸探针,使用聚焦在所述样品内不同焦平面上的至少2个检测器来捕获所述样品的图像;
使用所述图像确定所述样品内核酸探针的结合;以及
确定所述样品内与所述多个核酸探针的结合对应的核酸的丰度和/或空间分布。
2.如权利要求1所述的方法,包括使用聚焦在所述样品内的不同焦平面上的至少4个检测器来捕获所述样品的图像。
3.如权利要求1或2中的任一项所述的方法,包括使用聚焦在所述样品内的不同焦平面上的至少8个检测器来捕获所述样品的图像。
4.如权利要求1-3中的任一项所述的方法,包括使用聚焦在所述样品内的不同焦平面上的至少16个检测器来捕获所述样品的图像。
5.如权利要求1-4中的任一项所述的方法,包括使用聚焦在所述样品内的不同焦平面上的至少32个检测器来捕获所述样品的图像。
6.如权利要求1-5中的任一项所述的方法,其中所述不同焦平面中的每个焦平面被聚焦在距相邻焦平面不超过1000nm处。
7.如权利要求1-6中的任一项所述的方法,包括使来自所述样品的光通过多个分束器到达所述至少4个检测器。
8.如权利要求1-7中的任一项所述的方法,其中所述检测器中的至少一些检测器是相机。
9.如权利要求1-8中的任一项所述的方法,其中所述检测器中的至少一些检测器是点检测器。
10.如权利要求1-9中的任一项所述的方法,其中所述检测器中的至少一些检测器是光电检测器。
11.如权利要求1-10中的任一项所述的方法,其中所述检测器中的至少一些检测器是雪崩光电二极管。
12.如权利要求1-11中的任一项所述的方法,其中所述检测器中的至少一些检测器是一维阵列。
13.如权利要求1-12中的任一项所述的方法,其中所述检测器中的至少一些检测器是行检测器。
14.如权利要求1-13中的任一项所述的方法,包括以优于300nm的分辨率确定所述核酸探针中的至少一些核酸探针在所述样品中的z位置。
15.如权利要求1-14中的任一项所述的方法,包括将所述核酸探针暴露于能够结合到所述核酸探针的初级扩增核酸,其中最大数量的初级扩增核酸能够结合到核酸探针;以及
将初级扩增核酸暴露于能够结合到初级扩增核酸的二级扩增核酸,其中最大数量的二级扩增核酸能够结合到初级扩增核酸。
16.如权利要求15所述的方法,包括将初级扩增核酸暴露于能够结合到初级扩增核酸的二级扩增核酸,其中初级扩增核酸和二级扩增核酸与靶标的结合是可饱和的。
17.如权利要求15或16中的任一项所述的方法,包括将初级扩增核酸暴露于能够结合到初级扩增核酸的二级扩增核酸,其中二级扩增核酸在固定距离内结合到初级扩增核酸。
18.如权利要求15-17中的任一项所述的方法,其中不超过20个初级扩增核酸能够结合到所述核酸探针。
19.如权利要求15-18中的任一项所述的方法,其中初级扩增核酸具有小于300个核苷酸的平均长度。
20.如权利要求15-19中的任一项所述的方法,还包括将初级扩增核酸暴露于能够结合到初级扩增核酸的二级扩增核酸,其中最大数量的二级扩增核酸能够结合到初级扩增核酸。
21.如权利要求20所述的方法,其中二级扩增核酸包括荧光信号传导实体。
22.如权利要求1-21中的任一项所述的方法,还包括:
在所述样品内产生结合所述核酸探针的码字;以及
对于所述码字中的至少一些码字,可选地将码字与有效码字进行匹配,其中如果未找到匹配,那么对码字应用误差校正以形成有效码字。
23.如权利要求1-22中的任一项所述的方法,包括将所述样品暴露于至少5个不同的核酸探针。
24.如权利要求1-23中的任一项所述的方法,包括将所述样品顺序地暴露于多个核酸探针。
25.如权利要求1-24中的任一项所述的方法,其中所述多个核酸探针包括具有不同序列的核酸探针的组合性组合。
26.如权利要求1-25中的任一项所述的方法,其中所述多个核酸探针具有10至300个核苷酸的平均长度。
27.如权利要求1-26中的任一项所述的方法,其中所述多个核酸探针中的至少一些核酸探针包含靶标序列和一个或多个读取序列。
28.如权利要求27所述的方法,其中所述多个核酸探针的靶标序列具有10至200个核苷酸的平均长度。
29.如权利要求27或28中的任一项所述的方法,其中所述靶标序列经由特异性结合与靶标结合。
30.如权利要求27-29中的任一项所述的方法,其中所述多个读取序列分布在所述多个核酸探针上以便定义误差纠正码。
31.如权利要求1-30中的任一项所述的方法,其中所述多个核酸探针定义了具有至少2的汉明距离的码空间。
32.如权利要求1-31中的任一项所述的方法,包括使用荧光成像来确定所述核酸探针的结合。
33.如权利要求1-32中的任一项所述的方法,包括使用多色荧光成像来确定所述核酸探针的结合。
34.如权利要求1-33中的任一项所述的方法,包括使用超分辨率荧光成像技术来确定所述核酸探针的结合。
35.如权利要求34所述的方法,包括使用随机光学重建显微镜(STORM)来确定所述核酸探针的结合。
36.如权利要求1-35中的任一项所述的方法,其中所述样品包括细胞。
37.如权利要求36所述的方法,其中所述细胞是人类细胞。
38.如权利要求36或37中的任一项所述的方法,其中所述细胞是固定的。
39.一种方法,包括:
将样品暴露于多个核酸探针;
对于所述核酸探针中的每个核酸探针,将核酸探针暴露于能够与其结合的扩增核酸,其中最大有限数量的扩增核酸能够直接或间接结合到核酸探针;以及
对于所述核酸探针中的每个核酸探针,使用聚焦在所述样品内不同焦平面上的至少4个相机捕获所述样品的图像。
CN202080080598.3A 2019-11-20 2020-11-19 用于分子谱分析的多焦点成像的方法 Pending CN114729892A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962938194P 2019-11-20 2019-11-20
US62/938,194 2019-11-20
PCT/US2020/061254 WO2021102122A1 (en) 2019-11-20 2020-11-19 Methods for multi-focal imaging for molecular profiling

Publications (1)

Publication Number Publication Date
CN114729892A true CN114729892A (zh) 2022-07-08

Family

ID=73643372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080080598.3A Pending CN114729892A (zh) 2019-11-20 2020-11-19 用于分子谱分析的多焦点成像的方法

Country Status (7)

Country Link
US (1) US20240060121A1 (zh)
EP (1) EP4062154A1 (zh)
JP (1) JP2023502664A (zh)
CN (1) CN114729892A (zh)
AU (1) AU2020388390A1 (zh)
CA (1) CA3161149A1 (zh)
WO (1) WO2021102122A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107075545A (zh) 2014-07-30 2017-08-18 哈佛学院院长及董事 探针文库构建

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7342717B1 (en) * 1997-07-10 2008-03-11 Ruprecht Karts Universitaet Heidelberg Wave field microscope with detection point spread function
US6934408B2 (en) * 2000-08-25 2005-08-23 Amnis Corporation Method and apparatus for reading reporter labeled beads
US7776613B2 (en) 2006-08-07 2010-08-17 President And Fellows Of Harvard College Sub-diffraction image resolution and other imaging techniques
US7838302B2 (en) 2006-08-07 2010-11-23 President And Fellows Of Harvard College Sub-diffraction limit image resolution and other imaging techniques
WO2009085218A1 (en) 2007-12-21 2009-07-09 President And Fellows Of Harvard College Sub-diffraction limit image resolution in three dimensions
WO2013090360A2 (en) 2011-12-15 2013-06-20 President And Fellows Of Harvard College High resolution dual-objective microscopy
WO2015160690A1 (en) 2014-04-14 2015-10-22 President And Fellows Of Harvard College Photoconvertible fluorescent proteins
CN107075545A (zh) 2014-07-30 2017-08-18 哈佛学院院长及董事 探针文库构建
CN116242687A (zh) 2016-11-08 2023-06-09 哈佛学院院长及董事 使用merfish、扩展显微术和相关技术进行多重成像
EP4386761A3 (en) 2016-11-08 2024-09-04 President and Fellows of Harvard College Matrix imprinting and clearing
WO2018218150A1 (en) 2017-05-26 2018-11-29 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening

Also Published As

Publication number Publication date
US20240060121A1 (en) 2024-02-22
AU2020388390A1 (en) 2022-04-28
CA3161149A1 (en) 2021-05-27
JP2023502664A (ja) 2023-01-25
WO2021102122A1 (en) 2021-05-27
EP4062154A1 (en) 2022-09-28

Similar Documents

Publication Publication Date Title
CN106715768B (zh) 用于测定核酸的系统和方法
US20220064697A1 (en) Amplification methods and systems for merfish and other applications
Wang et al. Rapid sequential in situ multiplexing with DNA exchange imaging in neuronal cells and tissues
Sengupta et al. Superresolution imaging of biological systems using photoactivated localization microscopy
Yang et al. Versatile application of fluorescent quantum dot labels in super-resolution fluorescence microscopy
US20230029257A1 (en) Compositions and methods for light-directed biomolecular barcoding
US10830643B2 (en) Spectral microscope
JP6291842B2 (ja) 検出方法、マイクロアレイの解析方法および蛍光読取装置
CN108351349A (zh) 用于多路定量核酸扩增的方法和系统
CN112099214A (zh) 用于原位遗传分析的光学扫描系统
CN114729892A (zh) 用于分子谱分析的多焦点成像的方法
KR100483706B1 (ko) 레이저 유발 표면형광 검출 장치
Su et al. Lanthanide Complex for Single-Molecule Fluorescent in Situ Hybridization and Background-Free Imaging
WO2024020122A1 (en) Method for highly multiplexed, thermal controllable dna extension and its applications
CN113874712B (zh) 芯片上定位显微镜法
KR102709228B1 (ko) 스펙트럼 에지 검출
CN201313902Y (zh) 单一波长的dna测序装置
CN115398306A (zh) 用于成像系统的成像链和光谱边缘检测
Schneider et al. Single-molecule localisation microscopy (SMLM)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination