CN116848397A - 通过单分子动力学进行分子条形码分析 - Google Patents

通过单分子动力学进行分子条形码分析 Download PDF

Info

Publication number
CN116848397A
CN116848397A CN202180093796.8A CN202180093796A CN116848397A CN 116848397 A CN116848397 A CN 116848397A CN 202180093796 A CN202180093796 A CN 202180093796A CN 116848397 A CN116848397 A CN 116848397A
Authority
CN
China
Prior art keywords
barcode
molecular
recognition molecule
nucleic acid
analyte
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180093796.8A
Other languages
English (en)
Inventor
奥马尔·阿德
罗伯特·E·博埃尔
埃文·麦科马克
布丽安娜·利·海宁
托马斯·雷蒙德·瑟斯顿
布莱恩·瑞德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quantum Si Inc
Original Assignee
Quantum Si Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantum Si Inc filed Critical Quantum Si Inc
Publication of CN116848397A publication Critical patent/CN116848397A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54353Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals with ligand attached to the carrier via a chemical coupling agent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/10Oligonucleotides as tagging agents for labelling antibodies

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
  • Peptides Or Proteins (AREA)
  • Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本公开的各个方面提供了根据条形码识别分子与分子条形码之间的结合相互作用来确定分子条形码内容的方法。在一些方面,本公开涉及包括使分子条形码与与分子条形码上的一个或多个位点结合的条形码识别分子接触,检测一系列信号脉冲,以及根据一系列信号脉冲中的条形码特异性模式确定条形码内容的方法。

Description

通过单分子动力学进行分子条形码分析
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求于2020年12月15日提交的美国临时专利申请号63/125,904的优先权,其全部内容通过引用的方式并入本文。
背景技术
微阵列技术的进步使得以高通量格式对单分子进行大规模并行分析成为可能。确定这些分子的身份和来源及其在阵列中的位置对于临床应用、诊断和生物医学研究非常重要。
发明内容
在一些方面,本公开提供了包括使分子条形码与条形码识别分子接触的方法,所述条形码识别分子与分子条形码上的一个或多个位点结合。在一些实施方案中,所述方法进一步包括检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲。在一些实施方案中,所述方法进一步包括根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份。
在一些方面,本公开提供了一种方法,其包括:使分子条形码与条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合,其中分子条形码连接至包含多肽的分析物;检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲;以及根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份。
在一些实施方案中,多肽是蛋白质或蛋白质片段。在一些实施方案中,所述方法进一步包括对多肽进行测序。在一些实施方案中,对多肽进行测序包括:使多肽与一个或多个末端氨基酸识别分子接触;以及在多肽降解的同时,检测指示一个或多个末端氨基酸识别分子与暴露在多肽末端的连续氨基酸的关联的一系列信号脉冲,从而对多肽进行测序。在一些实施方案中,所述方法在单个反应容器中进行。
在一些方面,本公开提供了一种方法,其包括:使分子条形码与条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合,其中分子条形码连接至分析物,并且其中酶与分析物结合;检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲;以及根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份。
在一些实施方案中,分析物是核酸。在一些实施方案中,酶是聚合化酶。在一些实施方案中,分析物是脱氧核糖核酸,其中酶是DNA聚合酶。在一些实施方案中,所述方法进一步包括对核酸进行测序。在一些实施方案中,对核酸进行测序包括进行合成测序反应,其中酶以核酸为模板合成互补核酸链。在一些实施方案中,所述方法在单个反应容器中进行。
在一些方面,本公开提供了一种方法,其包括:使分子条形码与条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合,其中分子条形码连接至包含生物分子(例如多肽、核酸)的分析物;检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲;根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份;以及通过将生物分子置于测序反应条件下对生物分子进行测序。
在一些实施方案中,生物分子是多肽。在一些实施方案中,对生物分子进行测序包括:使多肽与一个或多个末端氨基酸识别分子接触;以及在多肽降解的同时,检测指示一个或多个末端氨基酸识别分子与暴露在多肽末端的连续氨基酸的关联的一系列信号脉冲,从而对多肽进行测序。在一些实施方案中,生物分子是核酸。在一些实施方案中,聚合化酶与核酸结合。在一些实施方案中,核酸是脱氧核糖核酸,聚合化酶是DNA聚合酶。在一些实施方案中,对生物分子进行测序包括:进行合成测序反应,其中聚合化酶以核酸为模板合成互补核酸链。在一些实施方案中,所述方法在单个反应容器中进行。
如本文所述,在一些实施方案中,分子条形码连接至分析物。在一些实施方案中,所述方法进一步包括根据分子条形码与分析物之间的已知关联来鉴定分析物。在一些实施方案中,鉴定分析物包括确定分析物来源的样品(例如血清样品、血液样品、组织样品、单细胞)的身份。在一些实施方案中,分析物包括生物分子(例如多肽、核酸)或其片段,鉴定分析物包括确定生物分子的身份。
在一些实施方案中,分子条形码连接至分析物,并且分析物通过分子条形码固定到表面。在一些实施方案中,分子条形码通过包含至少一个生物分子的连接基团固定到表面。在一些实施方案中,连接基团包括双链核酸。在一些实施方案中,连接基团包括蛋白质-配体复合物,所述复合物包含与至少一个双生物素部分结合的亲和素蛋白。在一些实施方案中,连接基团包括双链核酸和蛋白质-配体复合物,所述复合物包含与至少一个双生物素部分结合的亲和素蛋白。在一些实施方案中,连接基团包括:包含双生物素部分的双链核酸,其中双链核酸连接至分子条形码;以及与双生物素部分结合的亲和素蛋白,其中亲和素蛋白连接至表面。
在一些实施方案中,本公开的分子条形码是核酸条形码或多肽条形码。在一些实施方案中,本公开的条形码识别分子是寡核苷酸。在一些实施方案中,分子条形码是核酸条形码,条形码识别分子是寡核苷酸。在一些实施方案中,寡核苷酸的长度为至少4个核苷酸(例如,长度为至少5个、至少6个、至少7个、至少8个、至少9个或至少10个核苷酸)。在一些实施方案中,寡核苷酸的长度少于30个核苷酸(例如,长度少于25个、少于20个或少于15个核苷酸)。在一些实施方案中,寡核苷酸的长度在约5至约50个核苷酸之间(例如,长度在约5至约25个核苷酸之间)。在一些实施方案中,本公开的条形码识别分子是蛋白质或核酸适体。
在一些实施方案中,本公开的条形码识别分子包括至少一个可检测标签。在一些实施方案中,本公开的分子条形码包括至少一个可检测标签。在一些实施方案中,可检测标签是发光标签或电导标签。在一些实施方案中,可检测标签是在条形码识别分子与分子条形码结合过程中未被淬灭的淬灭标签。在一些实施方案中,可检测标签是在条形码识别分子与分子条形码结合过程中被淬灭的未淬灭标签。
在一些实施方案中,本公开的条形码识别分子连接至标记的生物分子,所述标记的生物分子包括至少一个可检测标签。在一些实施方案中,标记的生物分子是标记的核酸。在一些实施方案中,条形码识别分子通过含至少一个生物分子的连接基团连接至标记的生物分子。在一些实施方案中,连接基团包括蛋白质-配体复合物。在一些实施方案中,蛋白质-配体复合物包括包含至少两个配体结合位点的多价蛋白,其中条形码识别分子包括与多价蛋白上的第一配体结合位点结合的第一配体部分,并且其中标记的生物分子包括与多价蛋白上的第二配体结合位点结合的第二配体部分。在一些实施方案中,多价蛋白是包含四个生物素结合位点的亲和素蛋白,其中配体部分是生物素部分。在一些实施方案中,至少一个生物素部分是双生物素部分,并且双生物素部分与亲和素蛋白上的两个生物素结合位点结合。
在一些实施方案中,条形码特异性模式的信号脉冲包括脉冲持续时间,所述脉冲持续时间表征条形码识别分子与分子条形码上的位点之间的结合的解离速率。在一些实施方案中,条形码特异性模式的每个信号脉冲与另一个信号脉冲间隔脉冲间持续时间,所述脉冲间持续时间表征条形码识别分子结合的关联速率。在一些实施方案中,一系列信号脉冲是一系列实时信号脉冲。
在一些实施方案中,所述方法包括使分子条形码与两个或更多个条形码识别分子接触,所述条形码识别分子与分子条形码上的不同或重叠位点结合。在一些实施方案中,两个或更多个条形码识别分子在相同混合物中同时与分子条形码接触。在一些实施方案中,两个或更多个条形码识别分子在不同混合物中分别与分子条形码接触。
在一些实施方案中,所述方法进一步包括提供包含分子条形码和条形码识别分子的混合物。在一些实施方案中,混合物包括多个分子条形码,所述多个分子条形码中的每一个具有连接至其上的不同分析物。在一些实施方案中,条形码识别分子结合多个分子条形码中的两个或更多个分子条形码。在一些实施方案中,条形码识别分子与两个或更多个分子条形码中的每一个之间的结合相互作用产生不同的条形码特异性模式。在一些实施方案中,条形码识别分子与两个或更多个分子条形码中的每一个之间的结合相互作用产生相同的条形码特异性模式。在一些实施方案中,混合物包括多个条形码识别分子,所述条形码识别分子与多个分子条形码中的两个或更多个分子条形码结合。
在一些实施方案中,分子条形码包括一系列索引序列。在一些实施方案中,每个索引序列与所述系列中的任何其他索引序列不同。在一些实施方案中,所述系列中的至少两个索引序列是相同的。在一些实施方案中,所述一系列索引序列对应于一系列条形码识别分子结合位点。在一些实施方案中,条形码识别分子与包含所述系列中的两个索引序列的分子条形码上的位点结合。
在一些实施方案中,本公开的分析物包括来自生物或合成来源的生物分子。在一些实施方案中,生物分子来自混合或纯化样品。在一些实施方案中,生物分子来自生物样品(例如血清、血液、组织、唾液、尿液或其他生物来源)。在一些实施方案中,生物分子来自合成库。在一些实施方案中,生物分子从患者样品(例如人类样品)获得。在一些实施方案中,生物分子是核酸或多肽。在一些实施方案中,生物分子是核酸适体、蛋白质或蛋白质片段。
在一些实施方案中,本公开的分子条形码通过接头(例如共价或非共价连接基团)连接至分析物。在一些实施方案中,分子条形码通过包含裂解位点的接头连接至分析物。在一些实施方案中,所述方法进一步包括在使分子条形码与条形码识别分子接触之前,从分子条形码(例如在裂解位点)上裂解分析物。
在一些实施方案中,本公开的分子条形码被固定(例如连接)到表面。在一些实施方案中,分子条形码通过接头(例如共价或非共价连接基团)连接至表面。在一些实施方案中,表面由阵列组成。在一些实施方案中,阵列表面包括连接至其上的多个分子条形码。
在一些实施方案中,根据本公开的多个条形码识别过程在阵列上并行执行。在一些实施方案中,阵列包括样品孔阵列。在一些实施方案中,阵列包括约10,000至约1,000,000个样品孔。在一些实施方案中,样品孔的体积在约10-21升至约10-15升之间。
在一些方面,本公开提供了包含至少一个硬件处理器和至少一个存储处理器可执行指令的非暂时性计算机可读存储介质的系统,所述处理器可执行指令在被至少一个硬件处理器执行时使至少一个硬件处理器执行根据本公开的方法。在一些方面,本公开提供了至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被至少一个硬件处理器执行时使至少一个硬件处理器执行根据本公开的方法。
本发明某些实施方案的细节在具体实施方式中阐述,如下所述。本发明的其他特征、目的和优点将从实施例、附图和权利要求书中显而易见。
附图说明
构成本说明书一部分的附图说明了本发明的几个实施方案,并与描述一起用于解释本发明的原理。
图1显示了通过检测单分子结合相互作用进行分子条形码识别的示例。
图2显示了通过检测单分子结合相互作用进行动态肽测序反应的示例。
图3显示了信号脉冲检测和分析的示例。
图4显示了根据本公开的实施方案使用的分子条形码构建体的示例。
图5A-5B显示了与单细胞多肽测序结合使用的条形码识别的示例。图5A显示了用细胞特异性条形码标记单细胞多肽的一般过程。图5B一般性地描述了条形码化多肽,其可在单个阵列基底上通过动态测序和条形码识别进行分析。
图6显示了集成装置像素的示例示意图。
图7A-7D显示了通过寡核苷酸杂交进行条形码识别的示例。图7A显示了通过使DNA条形码复合物与与DNA条形码杂交的寡核苷酸探针接触来进行条形码识别的过程示意图。图7B显示了单分子强度轨迹,说明了在单个反应室中寡核苷酸探针与两个不同条形码的杂交。图7C显示了单分子强度轨迹,说明了在单个反应室中寡核苷酸探针与三个不同条形码的杂交。图7D是显示可根据强度和寿命数据区分三种不同条形码的曲线图。
图8显示了条形码识别和肽测序的过程的示例示意图。
图9A-9C显示了在单个反应室中在涉及条形码识别和氨基酸识别的单分子实验中获得的数据。图9A显示了在条形码识别测定(左图)和氨基酸识别测定(右图)期间确定的寿命测量值。图9B显示了在条形码识别和氨基酸识别联合测定期间确定的寿命测量值。图9C是显示在图9A-9B的单个和组合测定中确定的寿命测量值(bin比值)的分布的图。
图10A-10G显示了在单个反应室中在涉及条形码识别和肽测序的单分子实验中获得的数据。图10A-10D显示了在使用单个条形码化多肽进行条形码和氨基酸识别测定中确定的寿命测量值。图10E-10F显示了在使用两种不同条形码化多肽进行条形码和氨基酸识别测定期间确定的寿命测量值。图10G显示了加入移除N-末端氨基酸的裂解试剂可消除氨基酸识别。
图11显示了在涉及两种不同条形码的条形码识别的单分子实验中获得的数据,说明了不同的动力学脉冲特性可用于区分一种条形码和另一种条形码。
图12A-12E显示了通过杂交进行条形码识别的示例。图12A一般性地描述了组合的条形码,其可以通过连接索引序列产生。图12B显示了使用不同长度的寡核苷酸探针进行条形码识别的示例示意图。图12C显示了条形码识别测定的示例工作流程。图12D显示了并行进行的识别测定的芯片上成像(上图中突出显示的区域在下图中放大显示)。图12E显示了评估结合频率(上图)和τon(下图)的图。
图13A-13C显示了与单分子筛选测定结合使用的条形码识别的示例。图13A显示了编码构建体和体外转录/翻译产生的产物的示例。图13B显示了条形码识别(上)和抗体/抗原筛选(下)的信号轨迹。图13C显示了定向进化筛选方法的示例工作流程。
具体实施方式
本公开的各个方面涉及通过检测单分子结合相互作用来识别分子条形码的方法,以及用于执行此类方法的组合物。在一些方面,本公开的方法提供了一种根据与分子条形码上一个或多个位点的单分子结合相互作用相对应的动力学信息,从多重样品中去卷积分子条形码内容的方法。
在一些方面,本公开涉及分子条形码技术的发现,该技术利用传统的条形码原理,结合单分子分析的进步,允许实时监测离散的结合事件。本发明人已经认识到并了解到,分子条形码内容可以使用探针进行询问,以评估内容特异性结合动力学,这为传统的条形码分析提供了一个替代或另外的维度。
在一些方面,本公开的方法涉及通过实时监测单分子结合相互作用来进行条形码识别。图1显示了根据本文所述的实施方案进行条形码识别的示例。在一些实施方案中,分子条形码100与至少一个条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合并解离。在一些实施方案中,可根据不同的结合相互作用获得不同的条形码内容信息。例如,在一些实施方案中,不同条形码识别分子与相同或不同条形码位点结合时,可观察到不同的结合相互作用。在一些实施方案中,在相同条形码识别分子与不同条形码位点结合时,可观察到不同的结合相互作用。
如顶部图所示,在一些实施方案中,分子条形码100与第一条形码识别分子101接触,所述第一条形码识别分子与分子条形码100上的第一位点结合,在信号脉冲数据中产生第一模式。如底部图所示,在一些实施方案中,分子条形码100与第二条形码识别分子102接触,所述第二条形码识别分子与分子条形码100上的第二位点结合,在信号脉冲数据中产生第二模式。在一些实施方案中,每种不同的结合相互作用都会在信号脉冲数据中产生不同的模式。如本文其他地方所述,信号脉冲数据中的这些不同模式可用于确定关于分子条形码100的不同内容信息。在一些实施方案中,分子条形码100连接至分析物103,分子条形码的内容与关于分析物103的信息相关联。
应当理解的是,在一些实施方案中,结合相互作用是条形码识别分子的化学成分和条形码上与其结合的位点两者的因素。例如,在一些实施方案中,分子条形码是核酸条形码,条形码识别分子是寡核苷酸探针。当寡核苷酸探针与核酸条形码上的位点结合时,寡核苷酸探针的单碱基修饰不一定会消除其与该位点结合的能力—相反,这种修饰很可能会改变寡核苷酸探针与位点之间观察到的结合动力学(例如,产生不同的结合曲线,如图1的信号轨迹所示)。同样,当特定的寡核苷酸探针与两个或更多个在化学上不同的核酸条形码位点结合(例如,相差单个碱基)时,在每个不同的条形码位点上观察到的寡核苷酸之间的结合动力学不同。因此,在一些方面,本公开的方法灵敏度高,所需试剂少,并且能够通过设计达到预期结果。
在一些方面,本文所述的方法遵循与动态肽测序反应类似的原理。因此,在一些方面,本公开涉及发现可同时(例如在相同的反应混合物中)或在单个表面(例如在单个反应容器中)进行多肽测序和分子条形码识别的技术。由于这些技术自始至终遵循相似的原理,这就简化了数据分析,为测序和条形码分析提供了更高效、更廉价的整体流程。
作为背景,动态肽测序反应是通过评估氨基酸识别分子与多肽末端之间的结合互作用实时进行的,因为氨基酸会从末端逐渐裂解。图2显示了动态肽测序反应的示例,其中离散的结合事件会产生信号输出的信号脉冲。图2的插图(左)说明了动态肽测序的一般方案。如图所示,测序反应混合物中存在氨基酸识别分子200和裂解试剂201,其中含有目的多肽。氨基酸识别分子200与末端氨基酸关联(例如,与之结合)并从其解离,在每个关联事件的时段内产生可检测的信号。由于这种开关式结合的速度通常快于氨基酸被裂解试剂201裂解的速度,因此结合事件在信号输出中产生一系列脉冲,可用于鉴定特定的末端氨基酸。
图1显示了插图(左)中所示的示例多肽的信号输出强度随时间的进展(右图)。正如一般描述的那样,涉及一种类型的末端氨基酸的结合事件将在一系列脉冲中产生特征模式,这种特征模式可与其他类型的末端氨基酸中观察到的特征模式区分开来。通过实时监测这些事件,可对信号脉冲数据进行分析,以确定与多肽的氨基酸序列信息相对应的一系列特征模式。用于执行动态测序和分析由此获得的数据的方法和组合物在2019年11月15日提交的题为“METHODS AND COMPOSITIONS FOR PROTEIN SEQUENCING”的PCT国际公开号WO2020102741A1和2021年5月20日提交的题为“METHODS AND COMPOSITIONS FOR PROTEINSEQUENCING”的PCT国际公开号WO2021236983A2中有更全面的描述,上述专利中的每一个均通过引用的方式整体并入本文。
单分子动力学
本公开的各个方面涉及鉴定分子条形码的内容。如本文所用,在涉及分子条形码时,“鉴定”、“识别”和类似术语包括确定分子条形码的部分身份(例如部分序列信息)以及完整身份(例如完整序列信息)。在一些实施方案中,该术语包括确定或推断分子条形码的至少一部分的核苷酸序列(例如,根据与寡核苷酸探针的互补性)。在另一些实施方案中,该术语包括确定或推断分子条形码的某些特征,例如在分子条形码的一个或多个位点上存在或不存在特定的索引序列。因此,在一些实施方案中,本文使用的术语“条形码内容”、“条形码身份”和类似术语可以指与分子条形码有关的定性信息,而不限于对分子条形码进行生化表征的特定序列信息(例如索引的核苷酸序列)。
在一些实施方案中,条形码识别是通过观察条形码识别分子与分子条形码之间的不同关联事件来进行的,其中每个关联事件产生持续一个时段的信号幅度变化。在一些实施方案中,这些幅度变化被检测为一系列信号脉冲或信号轨迹输出中的一系列脉冲。
图3显示了信号轨迹输出和分析的非限制性示例。示例信号轨迹(I)描绘了两个信号脉冲,每个脉冲表现为信号强度的峰值,峰值持续的时段与关联事件相对应。因此,具有近似基线信号的两个信号脉冲之间的时段可以对应于分子条形码未与条形码识别分子发生可检测关联的时段。在一些实施方案中,信号脉冲数据可以如图(II)和(III)所示进行分析。
在一些实施方案中,可通过对信号数据的一个或多个参数应用阈值水平来分析信号数据,以提取信号脉冲信息。例如,图(II)描述了应用于示例信号轨迹(I)的信号数据的阈值幅度水平(“ML”)。在一些实施方案中,ML是在某一时间点检测到的信号与为给定数据集确定的基线之间的最小差值。在一些实施方案中,信号脉冲(“sp”)被分配给数据的每个部分,所述部分表示幅度变化超过ML并持续一个时段。在一些实施方案中,可将阈值时段应用于满足ML的数据部分,以确定是否为该部分分配信号脉冲。例如,实验假象可能会导致幅度变化超过ML,而这种变化不会持续足够长的时段,从而无法以所需的置信度分配信号脉冲(例如,非特异性检测事件,如扩散到观察区域或观察区域内的试剂粘附)。因此,在一些实施方案中,根据阈值幅度水平和阈值时段从信号数据中提取信号脉冲。
提取的信号脉冲信息显示在图(II)中,为说明起见,叠加了示例信号轨迹(I)。在一些实施方案中,信号脉冲的幅度峰值是通过对超过ML的时段内检测到的幅度进行平均来确定的。应当理解的是,在一些实施方案中,本文使用的“信号脉冲”可以指信号数据中持续时段高于基线的变化(例如,原始信号数据,如通过示例信号轨迹(I)所示),也可以指从中提取的信号脉冲信息(例如,处理后的信号数据,如图(III)所示)。
图(III)显示了从示例信号轨迹(I)中提取的信号脉冲信息。如图所示,每个信号脉冲包括与条形码识别分子和分子条形码之间的关联事件相对应的脉冲持续时间(“pd”)。在一些实施方案中,脉冲持续时间表征结合的解离速率。同样如图所示,每个信号脉冲与另一个信号脉冲间隔脉冲间持续时间(“ipd”)。在一些实施方案中,脉冲间持续时间表征结合的关联速率。在一些实施方案中,可根据基线与信号脉冲峰值之间的差值确定信号脉冲的幅度变化(“ΔM”)。
在一些实施方案中,可以根据一系列信号脉冲中的条形码特异性模式分析信号脉冲信息,以鉴定条形码内容。例如,如图(III)所示,在一些实施方案中,根据脉冲持续时间和脉冲间持续时间确定条形码特异性模式(阴影区域)。在一些实施方案中,根据脉冲持续时间或本文其他地方所述的脉冲持续时间的概括统计确定条形码特异性模式。在一些实施方案中,根据脉冲持续时间、脉冲间持续时间和幅度变化中的任意一个或多个确定条形码特异性模式。在一些实施方案中,根据参考数据确定条形码特异模式与分子条形码的特定特征和/或序列(例如,条形码内容)相关联。
因此,如图3所示,在一些实施方案中,本公开的方法通过检测指示条形码识别分子与分子条形码的关联(例如结合)的一系列信号脉冲来执行。可以对一系列信号脉冲进行分析,以确定一系列信号脉冲中的条形码特异性模式,并且条形码特异性模式可用于破译条形码内容。
在一些实施方案中,一系列信号脉冲包括光信号幅度随时间的一系列变化。在一些实施方案中,光信号的一系列变化包括关联事件期间产生的发光的一系列变化。在一些实施方案中,发光是由与一个或多个条形码识别试剂相关联的可检测标签产生的。例如,在一些实施方案中,条形码识别分子包括发光标签。发光标签的示例及其根据本公开的用途在本文其他地方提供。
在一些实施方案中,一系列信号脉冲包括电信号幅度随时间的一系列变化。在一些实施方案中,电信号的一系列变化包括在关联事件期间产生的一系列电导率变化。在一些实施方案中,电导率是由与一个或多个条形码识别试剂相关联的可检测标签产生的。例如,在一些实施方案中,条形码识别分子包括电导标签。已经描述了使用电导标签鉴定单分子的方法(参见,例如,美国专利公开号2017/0037462)。
如本文所述,信号脉冲信息可用于根据一系列信号脉冲中的条形码特异性模式鉴定条形码内容。在一些实施方案中,条形码特异性模式包括多个信号脉冲,每个信号脉冲包括脉冲持续时间。在一些实施方案中,多个信号脉冲可由条形码特异性模式中的脉冲持续时间分布的概括统计(例如平均值、中位数、时间衰减常数)来表征。在一些实施方案中,条形码特异性模式的平均脉冲持续时间在约1毫秒至约10秒之间(例如,约1ms至约1s之间、约1ms至约100ms之间、约1ms至约10ms之间、约10ms至约10s之间、约100ms至约10s之间、约1秒至约10s之间、约10ms至约100ms之间或约100ms至约500ms之间)。在一些实施方案中,平均脉冲持续时间在约50毫秒至约2秒之间、约50毫秒至约500毫秒之间或约500毫秒至约2秒之间。
在一些实施方案中,对应于不同条形码内容的不同条形码特异性模式可根据概括统计的统计学显著差异彼此区分开来。例如,在一些实施方案中,一种条形码特异性模式可根据至少10毫秒(例如,约10ms至约10s之间、约10ms至约1s之间、约10ms至约100ms之间、约100ms至约10s之间、约1s至约10s之间或约100ms至约1s之间)的平均脉冲持续时间差值与另一种条形码特异性模式区分开来。在一些实施方案中,平均脉冲持续时间的差值为至少50ms、至少100ms、至少250ms、至少500ms或更多。在一些实施方案中,平均脉冲持续时间的差值在约50ms至约1s之间、约50ms至约500ms之间、约50ms至约250ms之间、约100ms至约500ms之间、约250ms至约500ms之间或约500ms至约1s之间。在一些实施方案中,一种条形码特异性模式的平均脉冲持续时间与另一种条形码特异性模式的平均脉冲持续时间相差约10-25%、25-50%、50-75%、75-100%或100%以上,例如相差约2倍、3倍、4倍、5倍或更多。应当理解的是,在一些实施方案中,不同条形码特异性模式之间的平均脉冲持续时间的较小差异可能需要每个条形码特异性模式内更多的脉冲持续时间,从而以统计置信度彼此区分开来。
在一些实施方案中,条形码特异性模式通常是指条形码识别分子与分子条形码之间的多个关联(例如结合)事件。在一些实施方案中,条形码特异性模式包括至少10个关联事件(例如,至少25个、至少50个、至少75个、至少100个、至少250个、至少500个、至少1000个或更多关联事件)。在一些实施方案中,条形码特异性模式包括约10至约1,000个关联事件(例如,约10至约500个关联事件,约10至约250个关联事件,约10至约100个关联事件,或约50至约500个关联事件)。在一些实施方案中,多个关联事件被检测为多个信号脉冲。
在一些实施方案中,条形码特异性模式是指多个信号脉冲,其可通过本文所述的概括统计进行表征。在一些实施方案中,条形码特异性模式包括至少10个信号脉冲(例如,至少25个、至少50个、至少75个、至少100个、至少250个、至少500个、至少1000个或更多信号脉冲)。在一些实施方案中,条形码特异性模式包括约10至约1,000个信号脉冲(例如,约10至约500个信号脉冲,约10至约250个信号脉冲,约10至约100个信号脉冲,或约50至约500个信号脉冲)。
在一些实施方案中,条形码特异性模式是指条形码识别分子与分子条形码之间在一个时间间隔内发生的多个关联(例如结合)事件。在一些实施方案中,条形码识别可以通过迭代清洗循环来进行,在迭代清洗循环中,分子条形码在不同的时段内暴露于不同的条形码识别分子组。在一些实施方案中,条形码特异性模式的时间间隔在约1分钟至约30分钟之间(例如,约1分钟至约20分钟之间、约1分钟至10分钟之间、约5分钟至约20分钟之间、约5分钟至约15分钟之间或约5分钟至约10分钟之间)。
在一些实施方案中,可以对实验条件进行设置,以实现允许足够的关联事件的时间间隔,这些关联事件提供了条形码特异性模式的所需置信度水平(例如,在给定的一组条形码识别分子在清洗周期中被移除之前)。这可以例如通过基于以下各种特征设置反应条件来实现,包括:试剂浓度、一种试剂与另一种试剂的摩尔比(例如,条形码识别分子与分子条形码的比率、一种条形码识别分子与另一种条形码识别分子的比率)、不同试剂类型的数量(例如,不同类型的条形码识别分子的数量)、结合特性(例如,条形码识别分子结合的动力学和/或热力学结合参数)、试剂修饰(例如,多元醇修饰和可改变相互作用动力学的其他蛋白质修饰)、反应混合物组分(例如一种或多种组分,如pH、缓冲剂、盐、二价阳离子、表面活性剂和本文所述的其他反应混合物组分)、反应温度以及本领域技术人员显而易见的各种其他参数及其组合。反应条件可根据本文所述的一个或多个方面进行设置,包括例如信号脉冲信息(例如脉冲持续时间、脉冲间持续时间、幅度变化)、标记策略(例如荧光团、连接基团的数量和/或类型)、表面修饰(例如样品孔表面修饰,包括分子条形码固定)、样品制备(例如分析物大小、用于固定的分子条形码修饰)以及本文所述的其他方面。
分子条形码
在一些实施方案中,本文提供的方法包括使分子条形码与结合分子条形码上一个或多个位点的条形码识别分子接触。在一些实施方案中,条形码识别分子结合多个分子条形码上的一个或多个位点。因此,在一些实施方案中,条形码识别分子可用于破译混合物中多个不同单分子(例如,包含相同或不同分子条形码的不同分析物)的条形码内容。作为一个说明性和非限制性的示例,多重混合物可以包括连接至分子条形码的多个分析物。这些分子条形码中的一些可以包括指示连接至其上的分析物的样品来源的样品索引,并且结合样品索引的条形码识别分子可用于确定哪些分析物来源于相应的样品。
在一些实施方案中,用于本公开的方法的单分子构建体可以是如图4所示的一般形式。在一些实施方案中,单分子构建体包括分子条形码(例如动力学条形码)。在一些实施方案中,本公开的分子条形码是核酸条形码(例如单链核酸)。在一些实施方案中,核酸条形码包括DNA、RNA、PNA和/或LNA。在一些实施方案中,分子条形码是多肽条形码。
在一些实施方案中,分子条形码包括一系列索引序列。例如,在一些实施方案中,分子条形码是包含一系列索引序列的核酸条形码。在一些实施方案中,每个索引序列与所述系列中的任何其他索引序列不同。在一些实施方案中,所述系列中的至少两个索引序列是相同的。在一些实施方案中,所述一系列索引序列对应于一系列条形码识别分子结合位点。在一些实施方案中,条形码识别分子与包含所述系列中的两个索引序列的分子条形码上的位点结合。在一些实施方案中,每个索引序列提供与条形码内容有关的不同信息。
如图4进一步所示,在一些实施方案中,分子条形码连接至分析物(例如有效载荷分子、检测器分子)。在一些实施方案中,分析物来自生物或合成来源。在一些实施方案中,分析物来自血清样品、血液样品、组织样品或单细胞。在一些实施方案中,分析物是生物分子。在一些实施方案中,分析物是核酸或多肽。在一些实施方案中,分析物是核酸适体、蛋白质或蛋白质片段。在一些实施方案中,分析物是小分子、代谢物或抗体。在一些实施方案中,分子条形码通过接头连接至分析物。在一些实施方案中,接头包括裂解位点(例如光可裂解位点)。因此,在一些实施方案中,包含裂解序列的单分子构建体可移除分析物,以简化基底表面(例如芯片)上的装载和/或分析。
同样如图4所示,在一些实施方案中,分子条形码包括连接分子。在一些实施方案中,连接分子是适于分子条形码的表面固定的任何部分或连接基团。在一些实施方案中,连接分子包括共价或非共价连接基团。在一些实施方案中,连接分子包括生物素部分。在一些实施方案中,连接分子包括双生物素部分。连接基团和其他用于表面固定的组合物和方法在本文其他地方有进一步详细描述,并且是本领域已知的。
应当理解的是,图4仅提供了一个示例构造,对于本公开的单分子构建体并无限制。例如,在一些实施方案中,裂解位点是可选的元件,其可以根据所需的实施方案而不并入单分子构建体中。在一些实施方案中,再次参考图4,连接分子可以与分析物相邻,使得分子条形码可以通过分析物连接至表面。本文其他地方提供了单分子构建体和连接策略的其他构造的示例。
在一些方面,本公开的方法涉及条形码解卷积方法,所述方法涉及破译分子身份、样品来源和/或单分子在阵列上的位置。在一些实施方案中,本文提供的方法被有利地用于解卷积多重样品中的分子条形码信息。例如,本公开的方法可应用于单细胞多肽测序技术。图5A显示了用细胞特异性条形码标记单细胞的多肽分子的一般过程。在一些实施方案中,可根据本公开通过多肽测序(例如动态肽测序)和条形码识别来分析所得到的单分子构建体(图5B)。
条形码识别分子
在一些方面,本公开提供了条形码识别分子及其使用方法。在一些实施方案中,可根据与条形码位点的期望结合动力学选择或设计条形码识别分子。例如,在一些方面,本文所述的方法可以以多重格式执行,其中多个位点必须根据每个位点的结合相互作用彼此区分开来。因此,一个位点上的结合相互作用应与另一个位点上的结合相互作用有足够大的差异,使得可以根据信号脉冲信息以更高的置信度区分不同的位点。
不希望囿于理论的,条形码识别分子根据由关联速率或结合的“开启”速率(kon)和解离速率或结合的“关闭”速率(koff)定义的结合亲和力(KD)与条形码位点结合。速率常数koff和kon分别是脉冲持续时间(例如,对应于可检测关联事件的时间)和脉冲间持续时间(例如,可检测关联事件之间的时间)的关键决定因素。在一些实施方案中,可以设计这些动力学速率常数,以实现给出最佳准确性的脉冲持续时间和脉冲频率(例如,信号脉冲的频率)。
在一些实施方案中,条形码识别分子可以由本领域技术人员使用常规已知技术进行设计。在一些实施方案中,理想的特性可以包括以较低至中等亲和力(例如,KD为约50nM或更高,例如,约50nM至约50μM、约100nM至约10μM、约500nM至约50μM)与分子条形码上的一个或多个位点结合的能力。例如,在一些方面,本公开提供了通过检测可逆结合相互作用来进行条形码识别的方法,并且与高亲和力结合相互作用相比,以较低至中等亲和力可逆结合分子条形码的条形码识别分子有利地提供了更多信息的结合数据,并且确定性更高。
在一些实施方案中,条形码识别分子以小于约10-6M(例如,小于约10-7M、小于约10-8M、小于约10-9M、小于约10-10M、小于约10-11M、小于约10-12M、至低至10-16M)的解离常数(KD)结合分子条形码上的一个或多个位点,而不与其他非靶标(例如,非互补)位点显著结合。在一些实施方案中,条形码识别分子以小于约100nM、小于约50nM、小于约25nM、小于约10nM或小于约1nM的KD结合分子条形码上的一个或多个位点。在一些实施方案中,条形码识别分子以约50nM至约50μM之间(例如,约50nM至约500nM之间、约50nM至约5μM之间、约500nM至约50μM之间、约5μM至约50μM之间或约10μM至约50μM之间)的KD结合分子条形码上的一个或多个位点。在一些实施方案中,条形码识别分子以约50nM的KD结合分子条形码上的一个或多个位点。
在一些实施方案中,条形码识别分子以至少0.1s-1的解离速率(koff)结合分子条形码上的一个或多个位点。在一些实施方案中,解离速率在约0.1s-1至约1,000s-1之间(例如,约0.5s-1至约500s-1之间、约0.1s-1至约100s-1之间、约1s-1至约100s-1之间或约0.5s-1至约50s-1之间)。在一些实施方案中,解离速率在约0.5s-1至约20s-1之间。在一些实施方案中,解离速率在约2s-1至约20s-1之间。在一些实施方案中,解离速率在约0.5s-1至约2s-1之间。
在一些实施方案中,KD或koff的值可以是已知的文献值,或者该值可以凭经验确定。例如,KD或koff的值可以在单分子测定或集合测定中测量。在一些实施方案中,koff的值可以根据本文其他地方所述的单分子测定中获得的信号脉冲信息凭经验确定。例如,koff的值可以用平均脉冲持续时间的倒数来近似确定。在一些实施方案中,条形码识别分子结合两个或更多个化学上不同的条形码位点,这两个或更多个位点中的每一个的KD或koff均不同。在一些实施方案中,第一位点的第一KD或koff与第二位点的第二KD或koff相差至少10%(例如至少25%、至少50%、至少100%或更多)。在一些实施方案中,KD或koff的第一和第二值相差约10-25%、25-50%、50-75%、75-100%或100%以上,例如相差约2倍、3倍、4倍、5倍或更多。
如本文所述,条形码识别分子可以是能够结合分子条形码上的一个或多个位点而非其他条形码位点的任何生物分子。识别分子包括例如寡核苷酸、核酸和蛋白质,其中任何一种可以是合成的或重组的。
在一些实施方案中,条形码识别分子是寡核苷酸(例如寡核苷酸探针)。在一些实施方案中,本文提供的方法可通过使核酸条形码与结合核酸条形码上的一个或多个位点的寡核苷酸探针接触来执行。在一些实施方案中,寡核苷酸探针与核酸条形码之间的结合是通过杂交或退火进行的。在一些实验条件(例如浓度、温度)之外,结合特性在很大程度上受寡核苷酸探针的长度和含量及其与核酸条形码上与之结合(例如杂交或退火)的位点的互补程度的影响。因此,在一些实施方案中,寡核苷酸探针提供了多种用于调节信号脉冲特性的可调节特征,包括但不限于长度、核苷酸含量(例如G/C含量、具有不同结合特性的核苷酸类似物,如LNA或PNA类似物)、互补程度以及实验因素,如浓度、温度、缓冲条件(例如pH、盐、镁)和DNA变性或稳定溶剂。
在一些实施方案中,寡核苷酸探针的长度为至少4个核苷酸。在一些实施方案中,寡核苷酸探针的长度为至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少12个、至少15个、至少20个、至少25个或至少30个核苷酸。在一些实施方案中,寡核苷酸探针的长度少于30个核苷酸(例如,长度少于25个、少于20个、少于15个、少于12个、少于10个核苷酸)。在一些实施方案中,寡核苷酸探针的长度在约3至约30个核苷酸之间(例如,长度在约3至约10个核苷酸之间、约3至约8个核苷酸之间、约5至约25个核苷酸之间、约5至约15个核苷酸之间或约5至10个核苷酸之间)。在一些实施方案中,寡核苷酸探针的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。
在一些实施方案中,寡核苷酸探针可与一个或多个与寡核苷酸探针不完全互补的条形码位点结合,并为其提供条形码内容信息。例如,在一些实施方案中,寡核苷酸探针与一个或多个条形码位点结合,所述条形码位点的序列与寡核苷酸的互补性小于100%(例如,小于99%、小于98%、小于95%、小于90%、小于85%、小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%、小于1%或更少)。
除寡核苷酸外,根据本公开内容,核酸适体也可用作条形码识别分子。核酸适体是经过设计以所需的亲和力和选择性结合靶标的核酸分子。因此,可以使用本领域已知的选择和/或富集技术将核酸适体设计为与所需的条形码位点结合。在一些实施方案中,条形码识别分子包括核酸适体,如DNA适体或RNA适体。
在一些实施方案中,条形码识别分子是蛋白质或多肽。在一些实施方案中,识别分子是抗体或抗体的抗原结合部分、含SH2结构域的蛋白质或其片段或失活的酶促生物分子,例如肽酶、氨基转移酶、核酶、适体酶(aptazyme)或tRNA合成酶,包括2016年9月2日提交的题为“MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING”的美国专利申请号15/255,433中所述的氨酰tRNA合成酶。
在一些实施方案中,条形码识别分子是氨基酸识别分子。例如,在一些实施方案中,分子条形码包括多肽条形码,并且氨基酸识别分子可用于从多肽中破译条形码内容。在一些实施方案中,氨基酸识别分子结合一种或多种类型的具有不同动力学结合特性的末端氨基酸。在一些实施方案中,氨基酸识别分子结合具有不同动力学结合特性的多肽的不同区段。例如,在一些实施方案中,氨基酸识别分子与在N-末端或C-末端包含相同类型的氨基酸但在倒数第二个位置(例如n+1)和/或随后的位置相对于末端氨基酸的氨基酸内容不同(例如在第二、三、四、五或更高位置中的一个或多个位置处的氨基酸类型不同)的多肽区段结合。这些概念(例如,基于仅在倒数第二个位置或更高位置处的氨基酸内容差异的不同结合动力学)和氨基酸识别分子的其他示例在2019年11月15日提交的题为“METHODS ANDCOMPOSITIONS FOR PROTEIN SEQUENCING”的PCT国际公开号WO2020102741A1号中有更全面的描述,其全部内容通过引用的方式并入本文。
在一些实施方案中,本文提供的方法包括使分子条形码与一个或多个条形码识别分子接触。出于本讨论的目的,本文所述方法的上下文中的一个或多个条形码识别分子可以被替代地称为一组条形码识别分子。在一些实施方案中,一组条形码识别分子包括至少两个至多二十个(例如,2至15个之间、2至10个之间、5至10个之间、10至20个之间)条形码识别分子。在一些实施方案中,一组条形码识别分子包括二十个以上(例如20至25个、20至30个)条形码识别分子。然而,应当理解的是,根据本公开的方法,可以使用任意数量的条形码识别分子以适应所需的用途。
根据本公开,在一些实施方案中,分子条形码的内容可以通过检测连接至条形码识别分子的标签的发光来鉴定。在一些实施方案中,标记的条形码识别分子包括结合至少一个分子条形码的条形码识别分子和具有与条形码识别分子相关联的发光的发光标签。这样,发光(例如,发光寿命、发光强度和本文其他地方所述的其他发光特性,包括基于发光的动力学结合数据)可与条形码识别分子的结合相关联,以鉴定至少一个分子条形码。在一些实施方案中,在根据本公开的方法中可以使用多种类型的标记的条形码识别分子,其中每种类型包含发光标签,所述发光标签的发光在多种类型中是可独特地鉴定的。合适的发光标签可以包括发光分子,如荧光团染料,以及在本文其他地方有描述。
在一些实施方案中,条形码识别分子包括具有受结合诱导的发光的标签。例如,在一些实施方案中,标记的适体可以包括供体标签和受体标签。作为游离和未结合的分子,标记的适体采用一种构象,其中供体标签和受体标签之间的距离限制了标签之间的可检测的FRET(例如,约10nm或更多)。在与条形码位点结合后,标记的适体采用一种构象,其中供体标签和受体标签之间的距离可促进标签之间的可检测的FRET(例如,约10nm或更小)。在另一些实施方案中,标记的适体可以包括淬灭部分,其功能类似于分子信标,其中作为游离分子在内部淬灭发光,并在与条形码位点结合后恢复发光(参见Hamaguchi,et al.(2001)Analytical Biochemistry 294,126-131)。对于本领域技术人员来说,类似的和替代的标记策略是显而易见的,例如在标记的适体和标记的分子条形码之间使用FRET。不希望囿于理论的,据信这些和其他类型的受结合诱导的发光机制可以有利地减少或消除背景发光,从而提高本文所述方法的整体灵敏度和准确性。
在一些实施方案中,分子条形码内容可以通过检测标记的条形码识别分子的一个或多个电特性来鉴定。在一些实施方案中,标记的条形码识别分子包括结合至少一个分子条形码的条形码识别分子和与条形码识别分子相关联的电导标签。这样,所述一个或多个电特性(例如电荷、电流振荡颜色和其他电特性,包括基于电导率的动力学结合数据)可与条形码识别分子的结合相关联,以鉴定至少一个分子条形码。在一些实施方案中,多种类型的标记的条形码识别分子可用于根据本公开的方法中,其中每种类型包括电导标签,所述电导标签产生在多种类型中可独特地鉴定的电信号变化(例如电导率的变化,如电导率振幅的变化和条形码特异模式的电导率转换)。在一些实施方案中,多种类型的标记的条形码识别分子各自包括具有不同数量的带电基团(例如不同数量的带负电和/或带正电基团)的电导标签。因此,在一些实施方案中,电导标签是电荷标签。电荷标签的示例包括树枝状聚合物、纳米颗粒、核酸和其他具有多个带电基团的聚合物。在一些实施方案中,电导标签可通过其净电荷(例如净正电荷或净负电荷)、其电荷密度和/或其带电基团的数量进行独特地鉴定。
测序
如本文所述,在一些方面,本公开涉及允许同时(例如在相同的反应混合物中)、依次和/或在单个表面(例如在单个反应容器中)执行测序和分子条形码识别的技术的发现。因此,在一些方面,本公开提供了通过以下方式分析条形码化生物分子的方法:确定连接至生物分子的分子条形码的身份(例如,通过本文所述的条形码识别);以及对生物分子进行测序。
在一些实施方案中,所述方法包括:(a)将条形码化生物分子固定到表面;(b)确定连接至生物分子的分子条形码的身份;以及(c)对生物分子进行测序,其中(b)和(c)在表面上进行。在一些实施方案中,此类条形码化和测序方法包括对固定到单个表面和/或包含在单个反应容器(例如样品孔)内的多个条形码化生物分子进行条形码化和测序。在一些实施方案中,所述方法包括对固定到单个表面和/或包含在单个反应容器(例如样品孔)内的两个或更多个(例如,3个或更多个、5个或更多个、10个或更多个、20个或更多个、2-100个、5-50个、5-20个、5-10个、50-100个)条形码化生物分子进行条形码化和测序。
多肽测序。在一些实施方案中,条形码化生物分子是包含分子条形码的多肽。在一些实施方案中,分子条形码的身份根据本文所述的条形码识别方法确定。在一些实施方案中,所述方法进一步包括对多肽进行测序。在一些实施方案中,多肽测序通过检测多肽降解过程中的单分子结合相互作用来进行(如图2所示和本文所述)。
如本文所用,多肽测序是指确定多肽的序列信息。在一些实施方案中,这可能涉及确定多肽的一部分(或全部)的每个序列氨基酸的身份。然而,在一些实施方案中,这可能涉及评估多肽内氨基酸子集的身份(例如,确定一个或多个氨基酸类型的相对位置,而不确定多肽中每个氨基酸的身份)。在一些实施方案中,可以从多肽中获得氨基酸含量信息,而无需直接确定多肽中不同类型氨基酸的相对位置。仅氨基酸含量就可用于推断存在的多肽的身份(例如,通过将氨基酸含量与多肽信息数据库进行比较,确定哪些多肽具有相同的氨基酸含量)。
在一些方面,条形码化多肽的多肽测序可以通过鉴定多肽的一种或多种类型的氨基酸来进行。在一些实施方案中,对多肽的一个或多个氨基酸(例如末端氨基酸和/或内部氨基酸)进行标记(例如直接或间接,例如使用结合剂,如氨基酸结合蛋白),并确定多肽中标记的氨基酸的相对位置。在一些实施方案中,多肽中氨基酸的相对位置是使用一系列氨基酸标记和裂解步骤确定的。
在一些实施方案中,评估末端氨基酸(例如,N-末端或C-末端氨基酸)的身份,然后移除末端氨基酸并评估末端的下一个氨基酸的身份,重复该过程直到评估多肽中的多个连续氨基酸。在一些实施方案中,评估氨基酸的身份包括确定存在的氨基酸的类型。在一些实施方案中,确定氨基酸的类型包括确定实际氨基酸的身份,例如,通过确定天然存在的20个氨基酸中哪个是末端氨基酸(例如,使用对单个末端氨基酸特异的结合剂)。在一些实施方案中,氨基酸的类型选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、硒代半胱氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸。然而,在一些实施方案中,评估末端氨基酸类型的身份可以包括确定可能存在于多肽末端的潜在氨基酸子集。在一些实施方案中,评估末端氨基酸类型的身份包括确定氨基酸包含翻译后修饰。
在一些实施方案中,蛋白质或多肽可被消化成多个较小的多肽,并可从这些较小的多肽中的一个或多个获得序列信息(例如,使用涉及依次评估多肽的末端氨基酸并移除该氨基酸以暴露末端的下一个氨基酸的方法)。在一些实施方案中,多肽测序方法可能涉及使多肽末端经受末端氨基酸检测和末端氨基酸裂解的重复循环。
在一些实施方案中,多肽测序包括提供通过连接基团固定到固体支持物表面(例如,连接至样品孔的底部或侧壁表面)的多肽。在一些实施方案中,连接基团由多肽的官能化末端与连接至表面的互补官能部分之间的共价或非共价连接形成。例如,在一些实施方案中,连接基团由多肽(例如条形码化多肽)的生物素部分与表面的亲和素蛋白之间的非共价连接形成。在一些实施方案中,连接基团包括核酸。
在一些实施方案中,多肽通过一个末端的官能化部分固定到表面,使得另一个末端是游离的,用于检测和裂解测序反应中的末端氨基酸。因此,在一些实施方案中,在某些多肽测序反应中使用的试剂优先与多肽的非固定(例如游离)末端的末端氨基酸相互作用。这样,多肽在检测和裂解的重复循环中保持固定,例如,如在动态多肽测序反应中。
在一些实施方案中,动态多肽测序是通过评估末端氨基酸与标记的氨基酸识别分子和裂解试剂(例如外肽酶)的结合相互作用来实时进行的。图2显示了测序方法的示例,其中离散的结合事件会产生信号输出的信号脉冲。图2的插图(左)说明了通过这种方法进行实时测序的一般方案。如图所示,标记的氨基酸识别分子200与末端氨基酸(此处显示为苯丙氨酸)关联(例如,与之结合)并从其解离,从而产生一系列信号输出脉冲,可用于鉴定末端氨基酸。在一些实施方案中,所述一系列脉冲提供了一种脉冲模式(例如特征模式),可用于诊断相应末端氨基酸的身份。
如图2的插图(左)进一步所示,在一些实施方案中,测序反应混合物进一步包括外肽酶201(例如裂解试剂)。在一些实施方案中,外肽酶在混合物中存在的浓度低于标记的氨基酸识别分子的浓度。在一些实施方案中,外肽酶具有广泛的特异性,使得它可以裂解大多数或所有类型的末端氨基酸。因此,动态测序方法可以包括在外肽酶裂解活性催化的降解反应过程中监测多肽末端的识别分子结合。
图2进一步显示了信号输出强度随时间的进展(右侧图)。在一些实施方案中,外肽酶的末端氨基酸裂解发生的频率低于标记的氨基酸识别分子的结合脉冲的频率。这样,在实时测序过程中可以对多肽的氨基酸进行计数和/或鉴定。在一些实施方案中,一种类型的氨基酸识别分子可与一种以上类型的氨基酸关联,其中不同的特征模式对应于一种类型的标记的氨基酸识别分子与不同类型的末端氨基酸的关联。例如,在一些实施方案中,不同的特征模式(如苯丙氨酸(F,Phe)、色氨酸(W,Trp)和酪氨酸(Y,Tyr)中的每一种所示)对应于一种类型的标记的氨基酸识别分子(例如ClpS蛋白)在降解过程中与不同类型的末端氨基酸的关联。在一些实施方案中,可以使用多个标记的氨基酸识别分子,每一个都能与不同的氨基酸子集关联。
在一些实施方案中,动态肽测序是通过观察不同的关联事件来进行的,例如氨基酸识别分子与肽末端氨基酸之间的关联事件,其中每个关联事件都会产生持续一个时段的信号(例如发光信号)幅度的变化。在一些实施方案中,可以在肽降解过程中观察不同的关联事件,例如氨基酸识别分子与肽末端氨基酸之间的关联事件。在一些实施方案中,从一种特征信号模式到另一种特征信号模式的转变指示氨基酸裂解(例如,肽降解导致的氨基酸裂解)。在一些实施方案中,氨基酸裂解是指从多肽末端移除至少一个氨基酸(例如,从多肽中移除至少一个末端氨基酸)。在一些实施方案中,氨基酸裂解是根据特征信号模式之间的时段推断确定的。在一些实施方案中,氨基酸裂解是通过由检测标记的裂解试剂与多肽末端氨基酸的关联产生的信号变化来确定的。当氨基酸在降解过程中依次从多肽末端裂解时,可检测到一系列幅度变化或一系列信号脉冲。
在一些实施方案中,信号脉冲信息可用于根据一系列信号脉冲中的特征模式鉴定氨基酸。在一些实施方案中,特征模式包括多个信号脉冲,每个信号脉冲包括脉冲持续时间。在一些实施方案中,多个信号脉冲可通过特征模式中脉冲持续时间分布的概括统计(例如平均值、中位数、时间衰减常数)来表征。在一些实施方案中,特征模式的平均脉冲持续时间在约1毫秒至约10秒之间(例如,约1ms至约1s之间、约1ms至约100ms之间、约1ms至约10ms之间、约10ms至约10s之间、约100ms至约10s之间、约1s至约10s之间、约10ms至约100ms之间或约100ms至约500ms之间)。在一些实施方案中,可根据概括统计的统计学显著差异,将对应于单个多肽中不同类型氨基酸的不同特征模式彼此区分开来。例如,在一些实施方案中,可根据至少10毫秒(例如,约10ms至约10s之间、约10ms至约1s之间、约10ms至约100ms之间、约100ms至约10s之间、约1s至约10s之间或约100ms至约1s之间)的平均脉冲持续时间差值将一种特征模式与另一种特征模式区分开来。应当理解的是,在一些实施方案中,不同特征模式之间的平均脉冲持续时间的较小差异可能需要每个特征模式内更多的脉冲持续时间,从而以统计置信度彼此区分开来。
2019年11月15日提交的PCT国际公开号WO2020102741A1和2021年5月20日提交的PCT国际公开号WO2021236983A2中更全面地描述了用于执行动态测序的方法和组合物,每个专利的全部内容通过引用的方式并入本文。
核酸测序。在一些实施方案中,条形码化生物分子是包含分子条形码的核酸。在一些实施方案中,酶与核酸结合。例如,在一些实施方案中,核酸分子包括至少一个杂交的引物/聚合化酶复合物。在一些实施方案中,核酸分子与测序引物接触,所述测序引物与核酸分子的一部分互补,从而使测序引物退火至核酸分子。该引发位置产生一个位点,聚合化酶(例如DNA聚合酶)可在该位点与核酸分子偶联,以形成杂交的引物/聚合化酶复合物。在一些实施方案中,分子条形码的身份是根据本文所述的条形码识别方法确定的。在一些实施方案中,所述方法进一步包括对核酸进行测序。
在一些实施方案中,核酸测序是通过鉴定掺入与条形码化生物分子的核酸互补的新生核酸链的一系列核苷酸单体(例如,通过检测掺入一系列标记的核苷酸单体的时间进程)来进行的。在一些实施方案中,核酸测序是通过鉴定掺入由聚合化酶(例如DNA聚合酶)合成的模板依赖性核酸测序反应产物的一系列核苷酸来进行的。
在一些实施方案中,核酸测序方法包括以下步骤:(i)将目标体积中的复合物暴露于包含一个或多个标记的核苷酸的核酸测序反应组合物,所述复合物包括条形码化核酸、引物和聚合化酶;(ii)将一个或多个激发能量的一系列脉冲引导向目标体积附近;(iii)在标记的核苷酸依次掺入包含引物的核酸链的过程中,检测标记的核苷酸的多个发射光子;以及(iv)通过确定发射光子的时序和任选地发光强度,鉴定掺入的核苷酸的序列。
靶核酸(例如条形码化核酸)的核碱基与互补核苷多磷酸(例如dNTP)碱基配对后,聚合化酶(例如聚合酶)通过在新合成链的3’羟基端和dNTP的α磷酸之间形成磷酸二酯键,将dNTP掺入到新合成的核酸链中。在与dNTP缀合的标签包括荧光团的示例中,荧光团的存在通过激发发出信号,并在掺入步骤期间和/或之后检测到发射脉冲。对于与dNTP的末端(γ)磷酸酯缀合的标签,将dNTP掺入到新合成链中会导致β和γ磷酸酯及标签的释放,标签可在样品孔中自由扩散,从而导致从荧光团检测到的发射降低。
在一些实施方案中,模板依赖性核酸测序产物由天然存在的核酸聚合酶完成。在一些实施方案中,聚合酶是天然存在的聚合酶的突变体或修饰变体。在一些实施方案中,模板依赖性核酸序列产物将包括一个或多个与模板核酸链互补的核苷酸区段。在一些实施方案中,确定模板核酸的序列包括确定其互补核酸链的序列。
如本文所用,术语“聚合化酶”或“聚合酶”通常是指能够催化聚合反应的任何酶。聚合酶的示例包括但不限于核酸聚合酶、转录酶或连接酶。针对单分子核酸延伸(例如用于核酸测序)的实施方案可使用任何能够合成与靶核酸分子互补的核酸的聚合酶。在一些实施方案中,聚合酶可以是DNA聚合酶、RNA聚合酶、逆转录酶和/或其中一种或多种的突变体或改变形式。
聚合酶的示例包括但不限于DNA聚合酶、RNA聚合酶、热稳定聚合酶、野生型聚合酶、修饰的聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶、噬菌体T4聚合酶(psi29)DNA聚合酶、Taq聚合酶、Tth聚合酶、Tli聚合酶、Pfu聚合酶、Pwo聚合酶、VENT聚合酶、DEEPVENT聚合酶、EX-Taq聚合酶、LA-Taq聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、ES4聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tca聚合酶、Tih聚合酶、Tfi聚合酶、铂Taq聚合酶、Tbr聚合酶、Tfl聚合酶、Tth聚合酶、Pfutubo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Bst聚合酶、Sac聚合酶、Klenow片段、具有3’至5’外切酶活性的聚合酶及其变体、修饰产物和衍生物。在一些实施方案中,聚合酶是单亚基聚合酶。
在测序过程中,聚合化酶可与靶核酸分子(例如条形码化核酸)的引发位置偶联(例如连接)。引发位置可以是与靶核酸分子的一部分互补的引物。在一些实施方案中,引发位置是靶核酸分子的双链区段内的一个间隙或缺口。间隙或缺口的长度可以从0到至少1、2、3、4、5、6、7、8、9、10、20、30或40个核苷酸。缺口可提供双链序列中一条链的断裂,其为聚合化酶(例如链置换聚合酶)提供引发位置。
在一些情况下,测序引物可以退火至靶核酸分子(例如条形码化核酸)上,所述靶核酸分子可以固定或不固定到固体支持物。例如,固体支持物可以包括用于核酸测序的芯片上的样品孔(例如纳米孔、反应室)。在一些实施方案中,测序引物可固定到固体支持物,靶核酸分子的杂交也可将靶核酸分子固定到固体支持物。在一些实施方案中,聚合酶固定到固体支持物,并且可溶性引物和靶核酸与聚合酶接触。然而,在一些实施方案中,包含聚合酶、靶核酸和引物的复合物在溶液中形成,所述复合物固定到固体支持物(例如,通过固定聚合酶、引物和/或靶核酸)。在一些实施方案中,样品孔(例如纳米孔、反应室)中的所有成分都没有固定到固体支持物。例如,在一些实施方案中,包含聚合酶、靶核酸和引物的复合物在溶液中形成,所述复合物不固定到固体支持物。
在适当条件下,与退火的引物/靶核酸接触的聚合酶可将一种或多种核苷酸添加或结合到引物上,核苷酸可以以5’至3’、模板依赖性方式添加到引物上。核苷酸与引物的这种结合(例如,通过聚合酶的作用)一般可称为引物延伸反应。每个核苷酸都可与可检测标签结合,所述可检测标签可在核酸延伸反应期间被检测和鉴定(例如,基于其发光寿命和/或其他特性),并用于确定掺入延伸引物的每个核苷酸,从而确定新合成核酸分子的序列。通过新合成核酸分子的序列互补性,还可确定靶核酸分子(例如条形码化核酸)的序列。在一些情况下,测序引物与靶核酸分子的退火以及核苷酸与测序引物的结合可以在相似的反应条件(例如相同或相似的反应温度)或不同的反应条件(例如不同的反应温度)下发生。在一些实施方案中,合成测序方法可以包括靶核酸分子群(例如靶核酸的拷贝)的存在和/或靶核酸的扩增步骤,以获得靶核酸群。然而,在一些实施方案中,合成测序用于确定每个被评估的反应中单分子的序列(并且不需要核酸扩增来制备用于测序的靶标模板)。在一些实施方案中,根据本申请的各个方面,多个单分子测序反应并行(例如,在单个芯片上)进行。例如,在一些实施方案中,多个单分子测序反应分别在单个芯片上的独立反应室(例如纳米孔、样品孔)中进行。
在一些实施方案中,单分子测序中使用的靶核酸分子(例如条形码化核酸)是单链靶核酸(例如脱氧核糖核酸(DNA)、DNA衍生物、核糖核酸(RNA)、RNA衍生物)模板,所述模板被添加或固定到样品孔(例如反应室或反应容器),所述样品孔含有至少一种测序反应的另外的成分(例如聚合酶(如DNA聚合酶)、测序引物),其固定或连接至固体支持物,例如样品孔的底部或侧壁。靶核酸分子或聚合酶可直接或通过接头连接至样品壁,例如样品孔的底部或侧壁。样品孔还可以包含通过引物延伸反应合成核酸所需的任何其他试剂,例如合适的缓冲液、辅因子、酶(例如聚合酶)和包含发光标签的多磷酸脱氧核苷,如三磷酸脱氧核苷,包括三磷酸脱氧腺苷(dATP)、三磷酸脱氧胞苷(dCTP)、三磷酸脱氧鸟苷(dGTP)、三磷酸脱氧尿苷(dUTP)和三磷酸脱氧胸苷(dTTP)dNTP。
在一些实施方案中,每一类dNTP(例如含腺嘌呤的dNTP(例如dATP)、含胞嘧啶的dNTP(例如dCTP)、含鸟嘌呤的dNTP(例如dGTP)、含尿嘧啶的dNTP(例如dUTP)和含胸腺嘧啶的dNTP(例如dTTP))与发光分子缀合,所述发光分子具有独特的发光特性,使得检测发光分子发射的光可显示出掺入新合成核酸的dNTP的身份。发光分子发射的光(例如,包含至少一个发光标签的标记的生物分子发射的光)可通过任何合适的装置和/或方法进行检测并归属于其相应的发光分子(以及相关的dNTP)。发光分子可在任何位置与dNTP缀合,从而使发光分子(例如本申请的标记的生物分子)的存在不会抑制dNTP掺入新合成的核酸链或聚合酶的活性。在一些实施方案中,发光分子与dNTP的末端磷酸(例如γ磷酸)缀合。
在一些实施方案中,单链靶核酸模板(例如条形码化核酸)可与测序引物、dNTP、聚合酶和核酸合成所需的其他试剂接触。在一些实施方案中,所有适当的dNTP可同时(例如,所有dNTP同时存在)与单链靶核酸模板接触,这样dNTP的掺入可连续发生。在其他实施方案中,dNTP可以依次与单链靶核酸模板接触,其中单链靶核酸模板分别与每个适当的dNTP接触,在单链靶核酸模板与不同dNTP接触之间有清洗步骤。单链靶核酸模板与每种dNTP分别接触,然后进行清洗,这样的循环可以针对要鉴定的单链靶核酸模板的每个连续碱基位置重复进行。
在一些实施方案中,测序引物退火至单链靶核酸模板,聚合酶根据单链靶核酸模板连续地将dNTP(或其他多磷酸核苷)掺入引物。在dNTP掺入引物的过程中或之后,可使用适当的激发光激发与每个掺入的dNTP相关的独特发光分子,随后可使用任何合适的装置和/或方法检测其发射。特定发射光(例如,具有特定发射寿命、强度、光谱和/或其组合)的检测可归因于掺入的特定dNTP。从检测到的发光分子集合中获得的序列然后可用于通过序列互补性确定单链靶核酸模板的序列。
在一些实施方案中,本公开提供了可以在以下美国专利申请号中描述的技术中有利地利用的方法和组合物:14/543,865、14/543,867、14/543,888、14/821,656、14/821,686、14/821,688、15/161,067、15/161,088、15/161,125、15/255,245、15/255,303、15/255,624、15/261,697、15/261,724、15/600,979、15/846,967和15/847,001,其中每项专利的内容通过引用的方式并入本文。
发光标签
如本文所用,发光标签是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。在一些实施方案中,该术语可与“标签”、“可检测标签”或“发光分子”互换使用,这取决于上下文。根据本文所述的某些实施方案的发光标签可以指条形码识别分子的发光标签、分子条形码的发光标签或本文所述的另一种标记的组合物的发光标签。
在一些实施方案中,发光标签包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(FRET)。这样的FRET对可用于提供具有使标签更容易从混合物中的多个发光标签中区分的性质的发光标签,或用于提供限制背景荧光的受结合诱导的荧光,如本文其他地方所述。在其他实施方案中,FRET对包含第一发光标签的第一生色团和第二发光标签的第二生色团,例如,FRET发生在条形码识别分子上的第一标签和分子条形码上的第二标签之间。在某些实施方案中,FRET对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。
在一些实施方案中,发光标签是指荧光团或染料。通常,发光标签包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。
在一些实施方案中,发光标签包括选自以下中的一种或多种的染料:5/6-羧基罗丹明6G、5-羧基罗丹明6G、6-羧基罗丹明6G、6-TAMRA、STAR 440SXP、STAR 470SXP、/>STAR 488、/>STAR 512、/>STAR520SXP、/>STAR 580、/>STAR 600、/>STAR 635、/>STAR 635P、/>STAR RED、Alexa/>350、Alexa/>405、Alexa/>430、Alexa/>480、Alexa/>488、Alexa/>514、Alexa/>532、Alexa546、Alexa/>555、Alexa/>568、Alexa/>594、Alexa/>610-X、Alexa/>633、Alexa/>647、Alexa/>660、Alexa/>680、Alexa700、Alexa/>750、Alexa/>790、AMCA、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO 542、ATTO 550、ATTO 565、ATTO590、ATTO 610、ATTO 620、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740、ATTO Oxa12、ATTO Rho101、ATTO Rho11、ATTO Rho12、ATTORho13、ATTO Rho14、ATTO Rho3B、ATTO Rho6G、ATTO Thio12、BD HorizonTMV450、493/501、/>530/550、/>558/568、/>564/570、576/589、/>581/591、/>630/650、/>650/665、FL、/>FL-X、/>R6G、/>TMR、/>TR、CALGold 540、CAL/>Green 510、CAL/>Orange 560、CAL/>Red 590、CAL/>Red 610、CAL/>Red 615、CAL/>Red 635、/>Blue、CFTM350、CFTM405M、CFTM405S、CFTM488A、CFTM514、CFTM532、CFTM543、CFTM546、CFTM555、CFTM568、CFTM594、CFTM620R、CFTM633、CFTM633-V1、CFTM640R、CFTM640R-V1、CFTM640R-V2、CFTM660C、CFTM660R、CFTM680、CFTM680R、CFTM680R-V1、CFTM750、CFTM770、CFTM790、ChromeoTM642、Chromis425N、Chromis 500N、Chromis 515N、Chromis 530N、Chromis 550A、Chromis 550C、Chromis550Z、Chromis 560N、Chromis 570N、Chromis 577N、Chromis 600N、Chromis 630N、Chromis645A、Chromis 645C、Chromis 645Z、Chromis 678A、Chromis 678C、Chromis 678Z、Chromis770A、Chromis 770C、Chromis 800A、Chromis 800C、Chromis 830A、Chromis 830C、 350、/>405、415-Co1、/>425Q、/>485-LS、/>488、/>504Q、/>510-LS、/>515-LS、/>521-LS、/>530-R2、543Q、/>550、/>554-R0、/>554-R1、/>590-R2、/>594、/>610-B1、/>615-B2、/>633、633-B1、/>633-B2、/>650、/>655-B1、/>655-B2、/>655-B3、/>655-B4、/>662Q、/>675-B1、675-B2、/>675-B3、/>675-B4、/>679-C5、680、/>683Q、/>690-B1、/>690-B2、/>696Q、/>700-B1、/>700-B1、/>730-B1、/>730-B2、730-B3、/>730-B4、/>747、/>747-B1、/>747-B2、/>747-B3、/>747-B4、/>755、/>766Q、775-B2、/>775-B3、/>775-B4、/>780-B1、780-B2、/>780-B3、/>800、/>830-B2、Dyomics-350、Dyomics-350XL、Dyomics-360XL、Dyomics-370XL、Dyomics-375XL、Dyomics-380XL、Dyomics-390XL、Dyomics-405、Dyomics-415、Dyomics-430、Dyomics-431、Dyomics-478、Dyomics-480XL、Dyomics-481XL、Dyomics-485XL、Dyomics-490、Dyomics-495、Dyomics-505、Dyomics-510XL、Dyomics-511XL、Dyomics-520XL、Dyomics-521XL、Dyomics-530、Dyomics-547、Dyomics-547P1、Dyomics-548、Dyomics-549、Dyomics-549P1、Dyomics-550、Dyomics-554、Dyomics-555、Dyomics-556、Dyomics-560、Dyomics-590、Dyomics-591、Dyomics-594、Dyomics-601XL、Dyomics-605、Dyomics-610、Dyomics-615、Dyomics-630、Dyomics-631、Dyomics-632、Dyomics-633、Dyomics-634、Dyomics-635、Dyomics-636、Dyomics-647、Dyomics-647P1、Dyomics-648、Dyomics-648P1、Dyomics-649、Dyomics-649P1、Dyomics-650、Dyomics-651、Dyomics-652、Dyomics-654、Dyomics-675、Dyomics-676、Dyomics-677、Dyomics-678、Dyomics-679P1、Dyomics-680、Dyomics-681、Dyomics-682、Dyomics-700、Dyomics-701、Dyomics-703、Dyomics-704、Dyomics-730、Dyomics-731、Dyomics-732、Dyomics-734、Dyomics-749、Dyomics-749P1、Dyomics-750、Dyomics-751、Dyomics-752、Dyomics-754、Dyomics-776、Dyomics-777、Dyomics-778、Dyomics-780、Dyomics-781、Dyomics-782、Dyomics-800、Dyomics-831、/>450、伊红、FITC、荧光素、HiLyteTMFluor 405、HiLyteTMFluor 488、HiLyteTMFluor 532、HiLyteTMFluor 555、HiLyteTMFluor 594、HiLyteTMFluor 647、HiLyteTMFluor 680、HiLyteTMFluor 750、680LT、/>750、/>800CW、JOE、/>640R、/>Red 610、/>Red 640、/>Red 670、Red 705、丽丝胺罗丹明B、Napthofluorescein、Oregon/>488、Oregon/>514、Pacific BlueTM、Pacific GreenTM、Pacific OrangeTM、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、570、/>670、/>705、罗丹明123、罗丹明6G、罗丹明B、罗丹明绿、罗丹明绿-X、罗丹明红、ROX、SetaTM375、SetaTM470、SetaTM555、SetaTM632、SetaTM633、SetaTM650、SetaTM660、SetaTM670、SetaTM680、SetaTM700、SetaTM750、SetaTM780、SetaTMAPC-780、SetaTMPerCP-680、SetaTMR-PE-670、SetaTM646、SeTau 380、SeTau 425、SeTau 647、SeTau 405、Square 635、Square 650、Square 660、Square 672、Square 680、磺酰罗丹明101、TAMRA、TET、Texas/>TMR、TRITC、Yakima YellowTM、/>Zy3、Zy5、Zy5.5和Zy7。
发光
在一些方面,本公开涉及基于发光标签的一种或多种发光特性进行条形码识别。在一些实施方案中,基于发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来鉴定发光标签。在一些实施方案中,多种类型的发光标签可以基于不同的发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其中两种或更多种的组合而彼此区分开来。
在一些实施方案中,通过将发光标签暴露于一系列单独的光脉冲并评估从所述标签发射的每个光子的时序或其他特性来检测发光。在一些实施方案中,从标签依次发射的多个光子的信息被聚集和评估以鉴定所述标签并由此鉴定相关的条形码位点。在一些实施方案中,标签的发光寿命由从所述标签依次发射的多个光子确定,并且发光寿命可用于鉴定所述标签。在一些实施方案中,标签的发光强度由从所述标签依次发射的多个光子确定,并且发光强度可用于鉴定所述标签。在一些实施方案中,标签的发光寿命和发光强度由从所述标签依次发射的多个光子确定,并且发光寿命和发光强度可用于鉴定所述标签。
在本公开的一些方面,将单分子暴露于多个单独的光脉冲,并检测和分析一系列发射光子。在一些实施方案中,所述一系列发射光子提供了关于存在的并且在实验过程中在混合物中不发生改变的单分子的信息。然而,在一些实施方案中,所述一系列发射光子提供了关于在混合物中在不同时间(例如,随着反应或过程进行)存在的一系列不同分子的信息。
在某些实施方案中,发光标签吸收一个光子并在一个时段后发射一个光子。在一些实施方案中,可以通过测量所述时段来确定或估计标签的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段来确定或估计标签的发光寿命。在一些实施方案中,可以通过测量时段在多种类型的标签的发光寿命中区分标签的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段在多种类型的标签的发光寿命中区分标签的发光寿命。在某些实施方案中,通过确定或估计标签的发光寿命在多种类型的标签中鉴定或区分标签。在某些实施方案中,通过在多种类型的标签的多种发光寿命中区分标签的发光寿命,在多种类型的标签中鉴定或区分标签。
可以使用任何合适的方法(例如,通过使用合适的技术测量寿命或通过确定发射的时间相关特性)来确定发光标签的发光寿命。在一些实施方案中,确定一个标签的发光寿命包括确定相对于另一标签的寿命。在一些实施方案中,确定标签的发光寿命包括确定相对于参照的寿命。在一些实施方案中,确定标签的发光寿命包括测量寿命(例如荧光寿命)。在一些实施方案中,确定标签的发光寿命包括确定一种或多种指示寿命的时间特性。在一些实施方案中,可以基于多个发射事件(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100或更多个发射事件)发生在相对于激发脉冲的一个或多个时间门控窗口的分布来确定标签的发光寿命。例如,可以基于关于激发脉冲测量的光子到达时间的分布将标签的发光寿命与具有不同发光寿命的多个标签区分开来。
应当理解的是,发光标签的发光寿命指示在标签达到激发态之后发射的光子的时序,并且可以通过指示光子的时序的信息来区分标签。一些实施方案可以包括基于标签的发光寿命通过测量与所述标签发射的光子相关联的时间来区分所述标签与多个标签。时间分布可以提供发光寿命的指示,该指示可以从分布中确定。在一些实施方案中,可以基于时间分布区分所述标签与多个标签,例如通过将时间分布与对应于已知标签的参照分布进行比较。在一些实施方案中,发光寿命的值由时间分布确定。
如本文所用,在一些实施方案中,发光强度是指每单位时间由发光标签发射的发射光子的数量,所述发光标签通过递送脉冲激发能量而被激发。在一些实施方案中,发光强度是指每单位时间检测到的发射光子的数量,这些光子由通过脉冲激发能量的递送而被激发的标签发射并且由特定传感器或传感器组检测。
如本文所用,在一些实施方案中,亮度是指报告每个发光标签的平均发射强度的参数。因此,在一些实施方案中,“发射强度”可用于一般指包含一种或多种标签的组合物的亮度。在一些实施方案中,标签的亮度等于其量子产率和消光系数的乘积。
如本文所用,在一些实施方案中,发光量子产率是指在给定波长或在给定光谱范围内导致发射事件的激发事件的分数,并且通常小于1。在一些实施方案中,本文所述的发光标签的发光量子产率在0和约0.001之间、在约0.001和约0.01之间、在约0.01和约0.1之间、在约0.1和约0.5之间、在约0.5和0.9之间或在约0.9和1之间。在一些实施方案中,通过确定或估计发光量子产率来鉴定标签。
如本文所用,在一些实施方案中,激发能量是来自光源的光脉冲。在一些实施方案中,激发能量在可见光谱中。在一些实施方案中,激发能量在紫外光谱中。在一些实施方案中,激发能量在红外光谱中。在一些实施方案中,激发能量处于或接近发光标签的吸收最大值,从所述发光标签中检测多个发射光子。在某些实施方案中,激发能量在约500nm至约700nm之间(例如,约500nm至约600nm之间、约600nm至约700nm之间、约500nm至约550nm之间、约550nm至约600nm之间、约600nm至约650nm之间或约650nm至约700nm之间)。在某些实施方案中,激发能量可以是单色的或限制在光谱范围内。在一些实施方案中,光谱范围具有约0.1nm至约1nm、约1nm至约2nm或约2nm至约5nm的范围。在一些实施方案中,光谱范围具有约5nm至约10nm、约10nm至约50nm或约50nm至约100nm的范围。
装置和系统
在一些方面,根据本公开的方法可涉及将分子条形码固定到基底表面。在一些实施方案中,基底是固体支持物,例如生物传感器、微阵列、芯片或本文所述的集成装置。在一些实施方案中,多个分子条形码连接至阵列上的多个位点(例如,每个位点上连接有多个分子条形码中的一个分子条形码)。在一些实施方案中,分子条形码可固定到包含样品孔阵列的基底上的样品孔表面(例如,样品孔的底部表面)。在一些实施方案中,分子条形码被直接或间接(例如通过接头或通过连接至表面的分析物)固定(例如连接至表面)。固定的分子条形码可以使用任何合适的共价或非共价接头或连接基团连接,例如,如本公开所述。
在一些实施方案中,分子条形码通过共价连接基团连接至表面,所述共价连接基团可使用本领域已知的技术(例如点击化学)形成。在一些实施方案中,分子条形码通过非共价连接基团连接至表面。在一些实施方案中,非共价连接基团包括亲和素蛋白。亲和素蛋白是生物素结合蛋白,通常在亲和素蛋白的四个亚基中的每个亚基上都有生物素结合位点。例如,亲和素蛋白包括亲和素、链霉亲和素、traptavidin、tamavidin、bradavidin、xenavidin及其同源物和变体。在一些情况下,可以使用单体、二聚体或四聚体形式的亲和素蛋白。在一些实施方案中,亲和素蛋白复合物中的亲和素蛋白是四聚体形式的链霉亲和素(例如同源四聚体)。在一些实施方案中,亲和素蛋白的生物素结合位点为生物素化表面、生物素化分子条形码和/或生物素化分析物提供连接点。
亲和素蛋白的多价性可以允许各种连接构造。例如,在一些实施方案中,生物素连接部分可用于提供与亲和素蛋白的单个连接点。在一些实施方案中,双生物素连接部分可用于提供与亲和素蛋白的两个连接点。在一些实施方案中,本公开的条形码构建体通过由两个双生物素连接部分形成的亲和素蛋白复合物固定到表面。在一些实施方案中,条形码构建体包括两个双生物素连接部分中的一个,而表面包括两个双生物素连接部分中的另一个。2020年10月9日提交的题为“SURFACE MODIFICATION IN THE VAPOR PHASE”的美国专利申请号17/067,184以及2018年5月4日提交的题为“SUBSTRATES HAVING MODIFIED SURFACEREACTIVITY AND ANTIFOULING PROPERTIES IN BIOLOGICAL REACTIONS”的美国专利申请号15/971,493中描述了用于单分子表面固定的合适组合物和方法的更多示例,这两份申请的全部内容通过引用的方式并入本文。
在一些方面,本公开提供了一种设备,其包括具有单分子约束位点阵列的基底。在一些实施方案中,多个单分子约束位点各自包括包含本文所述的分子条形码的单分子。在一些实施方案中,分子条形码固定到单分子约束位点的表面。在一些实施方案中,所述设备包括用于保持试剂(例如,一个或多个条形码识别分子,或本文所述的任何一种或多种组合物)与基底接触的容器或其他装置。因此,在一些实施方案中,基底包括与本公开的一个或多个条形码识别分子接触的多个不同分子条形码。在一些实施方案中,所述多个不同分子条形码和所述一个或多个条形码识别分子按照本文其他地方所述的结合参数(例如KD、koff、kon、脉冲持续时间、脉冲间持续时间和其他信号特征)相互作用。在一些实施方案中,基底是集成装置。在一些实施方案中,所述多个单分子约束位点包括多个样品孔。
在一些方面,根据本公开的方法可以使用允许单分子分析的系统来执行。所述系统可以包括集成装置和设置为与集成装置接口的仪器。集成装置可以包括像素阵列,其中各个像素包括样品孔和至少一个光检测器。集成装置的样品孔可以形成在集成装置的表面上或穿过集成装置的表面,并且被设置为接收放置在集成装置表面上的样品。总的来说,样品孔可以被认为是样品孔的阵列。多个样品孔可以具有合适的尺寸和形状,使得样品孔的至少一部分接收单个样品(例如单分子,如多肽)。在一些实施方案中,样品孔内的样品数量可以分布在集成装置的样品孔中,使得一些样品孔包含一个样品,而其他样品孔包含零个、两个或更多个样品。
从集成装置外部的一个或多个光源向集成装置提供激发光。集成装置的光学部件可以接收来自光源的激发光并将光引导到集成装置的样品孔阵列并照亮样品孔内的照明区域。在一些实施方案中,样品孔可以具有允许样品保持在样品孔表面附近的构造,这可以容易地将激发光递送到样品和检测来自样品的发射光。位于照明区域内的样品可以响应于被激发光照亮而发射光。例如,可以用荧光标签标记样品,所述荧光标签响应于通过激发光的照射实现激发态而发射光。由样品发射的发射光然后可以由对应于样品孔的像素内的一个或多个光检测器检测,其中样品被分析。根据一些实施方案,当在数量范围可以在大约10,000像素到1,000,000像素之间的样品孔阵列上执行时,可以并行分析多个样品。
集成装置可以包括用于接收激发光并将激发光引导到样品孔阵列之间的光学系统。光学系统可以包括一个或多个被设置为将激发光耦合到集成装置的其他光学部件并将激发光引导到其他光学部件的光栅耦合器。例如,光学系统可以包括将来自光栅耦合器的激发光引导到样品孔阵列的光学部件。这样的光学部件可以包括分光器、光学组合器和波导。在一些实施方案中,一个或多个分光器可以耦合来自光栅耦合器的激发光并将激发光递送到至少一个波导。根据一些实施方案,分光器可以具有允许激发光在所有波导上基本均匀地传递的构造,使得每个波导接收基本相似量的激发光。这样的实施方案可以通过提高集成装置的样品孔接收的激发光的均匀性来提高集成装置的性能。例如,用于将激发光耦合到样品孔和/或将发射光引导到光检测器以包括在集成装置中的合适部件的示例在2015年8月7日提交的题为“INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZINGMOLECULES”的美国专利申请号14/821,688以及2014年11月17日提交的题为“INTEGRATEDDEVICE WITH EXTERNAL LIGHT SOURCE FOR PROBING,DETECTING,AND ANALYZINGMOLECULES”的美国专利申请号14/543,865中进行了描述,两者的全部内容均通过引用的方式并入本文。可以在集成装置中实施的合适的光栅耦合器和波导的示例在2017年12月15日提交的题为“OPTICAL COUPLER AND WAVEGUIDE SYSTEM”的美国专利申请号15/844,403中进行了描述,其全部内容通过引用的方式并入本文。
另外的光激性结构可以定位在样品孔和光检测器之间,并且被设置为减少或防止激发光到达光检测器,否则这可能会导致检测发射光时的信号噪声。在一些实施方案中,可以充当集成装置的电路的金属层也可以充当空间滤光器。合适的光激性结构的示例可以包括光谱滤光器、偏振滤光器和空间滤光器,并且在2018年7月23日提交的题为“OPTICALREJECTION PHOTONIC STRUCTURES”的美国专利申请号16/042,968以及2020年12月11日提交的题为“INTEGRATED CIRCUIT WITH IMPROVED CHARGE TRANSFER EFFICIENCY ANDASSOCIATED TECHNIQUES”的美国临时专利申请号63/124,655中进行了描述,其全部内容通过引用的方式并入本文。
位于集成装置之外的部件可用于将激发源定位和对准到集成装置。这样的部件可以包括光学部件,包括透镜、镜子、棱镜、窗口、孔径、衰减器和/或光纤。所述仪器中可以包括另外的机械部件,以允许控制一个或多个对准部件。这样的机械部件可以包括致动器、步进电机和/或旋钮。合适的激发源和对准机构的示例在2016年5月20日提交的题为“PULSEDLASER AND SYSTEM”的美国专利申请号15/161,088中进行了描述,其全部内容通过引用的方式并入本文。光束控制模块的另一个示例在2017年12月14日提交的题为“COMPACT BEAMSHAPING AND STEERING ASSEMBLY”的美国专利申请号15/842,720中进行了描述,其通过引用的方式并入本文。合适的激发源的另外的示例在2015年8月7日提交的题为“INTEGRATEDDEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES”的美国专利申请号14/821,688中进行了描述,其全部内容通过引用的方式并入本文。
与集成装置的单个像素一起定位的光检测器可以被设置和定位以检测来自像素的相应样品孔的发射光。合适的光检测器的示例在2015年8月7日提交的题为“INTEGRATEDDEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS”的美国专利申请号14/821,656中进行了描述,其全部内容通过引用的方式并入本文。在一些实施方案中,样品孔及其相应的光检测器可以沿着公共轴线对齐。以这种方式,光检测器可以与像素内的样品孔重叠。
检测到的发射光的特征可以提供用于鉴定与发射光相关的标签的指示。这样的特征可以包括任何合适类型的特征,包括由光检测器检测到的光子的到达时间、由光检测器随时间累积的光子量和/或跨两个或更多个光检测器的光子分布。在一些实施方案中,这样的特征可以是发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率、波长(例如峰值波长)和信号特征(例如脉冲持续时间、脉冲间持续时间、信号幅度变化)中的任意一种,或两种或更多种的组合。
在一些实施方案中,光检测器可以具有允许检测与样品的发射光(例如,发光寿命)相关的一个或多个时序特性的构造。在激发光脉冲传播通过集成装置之后,光检测器可以检测光子到达时间的分布,并且到达时间的分布可以提供样品发射光的时序特性的指示(例如,发光寿命的代表)。在一些实施方案中,一个或多个光检测器提供由标签发射的发射光的概率(例如,发光强度)的指示。在一些实施方案中,多个光检测器的尺寸和布置可被设置为捕获发射光的空间分布。来自一个或多个光检测器的输出信号然后可用于将标签与多个标签区分开来,其中所述多个标签可用于鉴定样品内的样品。在一些实施方案中,样品可以被多种激发能量激发,并且样品响应多种激发能量而发射的发射光和/或发射光的时序特性可以将标签与多个标签区分开来。
在操作中,样品孔内的样品的并行分析是通过使用激发光激发孔内的一些或所有样品并用光检测器检测来自样品发射的信号来进行的。来自样品的发射光可以由相应的光检测器检测并转换为至少一个电信号。电信号可以沿着集成装置的电路中的导线传输,所述导线可以连接到与集成装置接口的仪器。随后可以处理和/或分析电信号。电信号的处理或分析可以在位于仪器上或仪器外的合适的计算设备上进行。
所述仪器可以包括用于控制仪器和/或集成装置的操作的用户界面。用户界面可以被设置为允许用户将信息输入到仪器中,例如用于控制仪器功能的命令和/或设置。在一些实施方案中,用户界面可以包括用于语音命令的按钮、开关、拨号盘和麦克风。用户界面可以允许用户接收关于仪器和/或集成装置的性能的反馈,例如同轴度(properalignment)和/或通过来自集成装置上的光检测器读出信号获得的信息。在一些实施方案中,用户界面可以使用扬声器提供听觉反馈来提供反馈。在一些实施方案中,用户界面可以包括用于向用户提供视觉反馈的指示灯和/或显示屏。
在一些实施方案中,所述仪器可以包括被设置为与计算设备连接的计算机接口。计算机接口可以是USB接口、火线接口或任何其他合适的计算机接口。计算设备可以是任何通用计算机,例如膝上型计算机或台式计算机。在一些实施方案中,计算设备可以是经由合适的计算机接口在无线网络上可访问的服务器(例如,基于云的服务器)。计算机接口可以促进仪器和计算设备之间的信息通信。用于控制和/或设置仪器的输入信息可以被提供给计算设备并通过计算机接口传输给仪器。由仪器生成的输出信息可以通过计算机接口由计算设备接收。输出信息可以包括关于仪器性能、集成装置性能和/或从光检测器的读出信号产生的数据的反馈。
在一些实施方案中,所述仪器可以包括被设置为分析从集成装置的一个或多个光检测器接收的数据和/或将控制信号传输到激发源的处理装置。在一些实施方案中,处理装置可以包括通用处理器、专门适配的处理器(例如,中央处理单元(CPU),例如一个或多个微处理器或微控制器内核、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、定制集成电路、数字信号处理器(DSP)或其组合)。在一些实施方案中,来自一个或多个光检测器的数据的处理可以由仪器的处理装置和外部计算设备两者来执行。在其他实施方案中,可以省略外部计算设备,并且可以仅由集成装置的处理装置执行来自一个或多个光检测器的数据处理。
根据一些实施方案,被设置为基于发光发射特性来分析样品的仪器可以检测不同发光分子之间的发光寿命和/或强度的差异,和/或相同发光分子在不同环境中的寿命和/或强度之间的差异。发明人已经认识到并理解,发光发射寿命的差异可用于辨别不同发光分子的存在与否和/或辨别发光分子所经受的不同环境或条件。在一些情况下,根据寿命(例如,而不是发射波长)辨别发光分子可以简化系统的方面。作为实例,当基于寿命辨别发光分子时,波长区分光学器件(例如波长过滤器、每个波长的专用检测器、不同波长的专用脉冲光源和/或衍射光学器件)可以在数量上减少或被消除。在一些情况下,以单一特征波长操作的单一脉冲光源可用于激发在光谱的相同波长区域内发射但具有可测量的不同寿命的不同发光分子。使用单个脉冲光源而不是在不同波长下工作的多个光源来激发和辨别在相同波长范围内发射的不同发光分子的分析系统操作和维护的复杂度更低,更紧凑,并且可以以更低的成本制造。
尽管基于发光寿命分析的分析系统可能具有某些好处,但通过允许另外的检测技术可以增加由分析系统获得的信息量和/或检测准确性。例如,所述系统的一些实施方案可以另外被设置成基于发光波长和/或发光强度来辨别样品的一种或多种特性。在一些实施方式中,发光强度可以另外地或替代地用于区分不同的发光标签。例如,一些发光标签可以以显著不同的强度发射或在它们的激发概率上有显著差异(例如,至少约35%的差异),即使它们的衰减率可能相似。通过将分箱信号参考测量的激发光,可以根据强度水平区分不同的发光标签。
根据一些实施方案,不同的发光寿命可以用被设置为在发光标签激发之后对发光发射事件进行时间分箱(time-bin)的光检测器来区分。时间分箱可以发生在光检测器的单个电荷累积周期期间。电荷累积周期是读出事件之间的间隔,在该期间光生载流子累积在时间分箱的光检测器的仓中。时间分箱的光检测器的示例在2015年8月7日提交的题为“INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS”的美国专利申请号14/821,656中进行了描述,其通过引用的方式并入本文。在一些实施方案中,时间分箱的光检测器可以在光子吸收/载流子产生区域中产生电荷载流子并且将电荷载流子直接转移到电荷载流子存储仓中的电荷载流子存储仓。在这样的实施方案中,时间分箱的光检测器可以不包括载流子行进/捕获区域。这样的时间分箱的光检测器可以被称为“直接分箱像素”。包括直接分箱像素的时间分箱的光检测器的示例在2017年12月22日提交的题为“INTEGRATED PHOTODETECTOR WITH DIRECT BINNING PIXEL”的美国专利申请号15/852,571中进行了描述,其通过引用的方式并入本文。
在一些实施方案中,相同类型的不同数量的荧光团可以与样品中的不同试剂连接,从而可以基于发光强度来鉴定每种试剂。例如,两个荧光团可以与第一标记的识别分子连接,四个或更多个荧光团可以与第二标记的识别分子连接。由于不同数量的荧光团,可能存在与不同识别分子相关的不同激发和荧光团发射概率。例如,在信号累积间隔期间,第二标记的识别分子可能有更多的发射事件,因此仓的表观强度明显高于第一标记的识别分子。
发明人已经认识到并理解,基于荧光团衰减率和/或荧光团强度区分生物或化学样品可以简化光激发和检测系统。例如,可以用单波长源(例如,产生一个特征波长而不是多个源的源或以多个不同特征波长操作的源)来执行光激发。此外,检测系统中可能不需要波长识别光学器件和滤光器。此外,每个样品孔可以使用单个光检测器来检测来自不同荧光团的发射。短语“特征波长”或“波长”用于指代有限辐射带宽内的中心或主要波长(例如,脉冲光源输出的20nm带宽内的中心或峰值波长)。在一些情况下,“特征波长”或“波长”可用于指代源辐射输出的总带宽内的峰值波长。
示例性集成装置
根据本公开的一个方面,示例性集成装置可被设置为与上述仪器结合来进行单分子分析。应当理解的是,本文所述的示例性集成装置旨在进行说明,其他集成装置构造可被设置为执行本文所述的任何或所有技术。
图6示出了集成装置1-102的像素1-112的截面图。像素1-112包括光检测区域(其可以是pinned型光电二极管(PPD))和电荷存储区域(其可以是存储二极管(SD0))。在一些实施方案中,光检测区域和电荷存储区域可以通过掺杂半导体材料的区域形成在像素的半导体材料中。例如,可以使用相同的电导类型(例如n型掺杂或p型掺杂)来形成光检测区域和电荷存储区域。
在像素1-112操作期间,激发光可以照亮样品孔1-108,导致入射光子(包括来自样品的荧光发射)沿光轴流向光检测区域PPD。如图6所示,像素1-112可以包括波导1-220,该波导被设置为将来自集成装置的光栅耦合器(未显示)的激发光光学地(例如,短暂地)耦合到样品孔1-108。作为响应,样品孔1-108中的样品可向光检测区域PPD发射荧光。在一些实施方案中,像素1-112还可以包括一个或多个光激性结构1-230,其可以包括一个或多个光排除结构(optical rejection structure),例如光谱滤光器、偏振滤光器和空间滤光器。例如,光激性结构1-230可被设置为减少到达光检测区域PPD的激发光量和/或增加到达光检测区域PPD的荧光发射量。像素1-112中还显示,像素1-112可以包括一个或多个金属层1-240,其可被设置为滤光器和/或可携带来自被设置为控制转移栅极(transfer gate)的控制电路的控制信号,如本文进一步所述。
在一些实施方案中,像素1-112可以包括一个或多个转移栅极,其被设置为响应一个或多个控制信号,通过向像素1-112的一个或多个半导体区域施加电偏压来控制像素1-112的操作。例如,当转移栅极ST0在光检测区域PPD和存储区域SD0之间的半导体区域引起第一电偏压时,可在半导体区域中形成转移路径(例如电荷转移通道)。入射光子在光检测区域PPD中产生的电荷载流子(例如光电子)可沿着转移路径流向存储区域SD0。在一些实施方案中,第一电偏压可在收集期施加,在此期间,来自样品的电荷载流子被选择性地引导向存储区域SD0。替代地,当转移栅极ST0在光检测区域PPD和存储区域SD0之间的半导体区域提供第二电偏压时,来自光检测区域PPD的电荷载流子可被阻止沿着转移路径到达存储区域SD0。在一些实施方案中,漏极栅极(drain gate)REJ可为漏极D提供通道,以便将激发光在光检测区域PPD中产生的噪声电荷载流子从光检测区域PPD和存储区域SD0吸走,例如在样品的荧光发射光子到达光检测区域PPD之前的排除期(rejection period)。在一些实施方案中,在读出期(readout period),转移栅极ST0可以提供第二电偏压,转移栅极TX0可以提供电偏压,以使存储在存储区域SD0中的电荷载流子流向读出区域(其可以是浮动扩散(FD)区域)进行处理。
应当理解的是,根据各种实施方案,本文所述的转移栅极可以包括半导体材料和/或金属,并且可以包括场效应晶体管(FET)的栅极、双极结型晶体管(BJT)的基极和/或类似物。
在一些实施方案中,像素1-112的操作可以包括一个或多个收集序列,每个收集序列包括一个或多个排除(例如漏极)期和一个或多个收集期。在一个示例中,根据激发光源的一个或多个脉冲执行的收集序列可以从排除期开始,例如,丢弃响应于来自光源的激发光子而在像素1-112中(例如,在光检测区域PD中)产生的电荷载流子。例如,激发光子可以在样品孔的荧光发射光子到达之前到达像素1-112。电荷存储区域的转移栅极可偏置为在耦合电荷存储区域与光检测区域的电荷转移通道中具有低电导率,以阻止电荷载流子在电荷存储区域的转移和积聚。用于漏极区域的漏极栅极可偏置为在光检测区域和漏极区域之间的漏极通道中具有高电导率,以促进电荷载流子从光检测区域排向漏极区域。耦合到光检测区域的任何电荷存储区域的转移栅极可偏置为在光检测区域和电荷存储区域之间具有低电导率,从而在排除期电荷载流子不会转移到电荷存储区域或在电荷存储区域中积聚。
在排除期之后,可能会出现收集期,在收集期内,响应入射光子而产生的电荷载流子被转移到一个或多个电荷存储区域。在收集期,入射光子可能包括荧光发射光子,从而导致荧光发射电荷载流子在电荷存储区域中积聚。例如,电荷存储区域中的一个的转移栅极可偏置为在光检测区域和电荷存储区域之间具有高电导率,以促进电荷载流子在电荷存储区域的积聚。耦合到光检测区域的任何漏极栅极可偏置为在光检测区域和漏极区域之间具有低电导率,以便在收集期不丢弃电荷载流子。
一些实施方案可以在收集序列中包括多个排除期和/或收集期,例如在第一排除期和收集期之后的第二排除期和第二收集期,其中每对排除期和收集期响应激发光脉冲而进行。在一个示例中,在收集序列的每个收集期(例如,响应多个激发光脉冲)在光检测区域中产生的电荷载流子可聚集在单个电荷存储区域中。在一些实施方案中,聚集在电荷存储区域的电荷载流子可在下一个收集序列之前读出进行处理。替代地或另外地,在一些实施方案中,在第一收集序列期间聚集在第一电荷存储区域的电荷载流子可转移到依次耦合到第一电荷存储区域的第二电荷存储区域,并与下一个收集序列同时读出。在一些实施方案中,设置为从一个或多个像素读出电荷载流子的处理电路可被设置为确定与执行本文所述技术相关的发光强度信息、发光寿命信息、发光光谱信息和/或任何其他模式的发光信息中的一个或多个。
在一些实施方案中,第一收集序列可以包括在每个激发脉冲之后的第一时间将响应激发脉冲在光检测反应中产生的电荷载流子转移到电荷存储区域,第二收集序列可以包括在每个激发脉冲之后的第二时间将响应激发脉冲在光检测反应中产生的电荷载流子转移到电荷存储区域。例如,在第一和第二时间之后聚集的电荷载流子数量可指示接收光的亮度寿命信息。
如本文进一步描述的,可以使用来自集成电路的控制电路的一个或多个控制信号,例如通过向集成电路像素的漏极和/或转移栅极提供控制信号来控制集成装置的像素,以执行一个或多个收集序列。在一些实施方案中,电荷载流子可在与每个像素和/或一行或一列像素相关联的读出像素期间从每个像素的FD区域读出,以进行处理。在一些实施方案中,可使用相关双采样(CDS)技术读出像素的FD区域。
实施例
实施例1.作为多重化手段的条形码识别
进行了单分子条形码识别实验,以研究在单个反应室中区分多个不同条形码的潜力。图7A展示了进行实验的一般过程。如图所示,DNA条形码复合物通过链霉亲和素连接基团固定到反应室表面。条形码化分子包括单链DNA条形码区、由杂交链形成的双链区和双生物素部分。条形码化分子的双生物素部分被链霉亲和素结合,链霉亲和素再与表面的生物素部分结合。引入含有与条形码互补的序列的标记的寡核苷酸探针,并检测探针与固定的DNA条形码的杂交。
图7A中还显示了这些实验中使用的一种标记的寡核苷酸探针的一般描述。标记的寡核苷酸探针(Tris-ATRho6G DNA)包括与DNA条形码互补的单链区,该单链区通过链霉亲和素连接基团连接至具有三个拷贝的荧光染料(ATTO Rho6G)的双链DNA。
在第一组实验中,将两种不同标记的寡核苷酸探针引入具有固定到反应室表面的两种不同条形码的单个反应室,并在24小时内监测条形码与探针之间的杂交事件。图7B显示了在这些实验过程中获得的示例单分子强度轨迹。如图所示,一系列杂交事件产生了在强度轨迹中检测到的一系列信号脉冲。每个强度轨迹的右侧显示的是由相应信号脉冲数据生成的强度与寿命的关系图。
在第二组实验中,将三种不同标记的寡核苷酸探针引入具有固定到反应室表面的三种不同条形码的单个反应室,并监测条形码与探针之间的杂交事件。图7C显示了在这些实验过程中获得的示例单分子强度轨迹。每个强度轨迹的右侧显示的是由相应信号脉冲数据生成的强度与寿命的关系图。图7D是使用三个条形码进行的代表性实验生成的强度与寿命的关系图。
图7B和7C中所示的强度轨迹和图表明,可以根据信号脉冲模式和/或发光特性(寿命、强度)的差异来区分不同的条形码。例如,如图7D所示,在强度与寿命的关系图中,三个不同条形码中的每个条形码都对应不同的簇,从而可以单独区分这三个条形码。因此,这些实验结果证实,条形码通过DNA杂交产生芯片上脉冲,并且条形码显示的寿命和动力学脉冲特性类似于动态肽测序反应中的氨基酸识别,因此可以对条形码识别和肽测序进行类似的分析。
实施例2.条形码识别和多肽测序
进行了单分子识别实验,以研究在单个反应室中进行条形码识别和多肽测序的潜力。图8展示了在通过氨基酸识别进行多肽测序之前进行条形码识别的一般过程。如图所示,条形码化多肽通过链霉亲和素连接基团固定到反应室表面,并使用标记的寡核苷酸探针进行条形码识别。一旦条形码识别完成,加入与条形码互补的未标记寡核苷酸,可抑制任何进一步的条形码识别。在此步骤之后,通过本文所述的氨基酸识别进行多肽测序。
在这些研究中,条形码化多肽被固定到单分子反应室的表面。在第一组实验中,将与条形码互补的标记的寡核苷酸探针引入反应室,并获得条形码识别数据(图9A,左图)。寡核苷酸探针用三个拷贝的ATTO Rho6G染料标记。在第二组实验中,将标记的末端氨基酸结合蛋白引入反应室,并获得氨基酸识别数据(图9A,右图)。末端氨基酸结合蛋白用四个拷贝的Cy3染料标记。在第三组实验中,将标记的寡核苷酸探针和标记的氨基酸结合蛋白两者引入反应室,并获得识别数据(图9B)。利用三组实验的数据生成了显示寿命测量值分布(bin比值)的图(图9C)。
这些实验结果证实,可以观察到条形码化多肽同时识别条形码和氨基酸(图9B),且寿命和强度数据与单个参数相匹配(图9A-9C)。结果进一步表明,条形码和氨基酸识别可以按照图8所示的工作流程依次进行,或者可以同时进行条形码和氨基酸识别。在本实施例中,寡核苷酸探针和氨基酸结合蛋白用不同的染料组标记,从而可以进行寿命区分。
进行了另外的实验,以研究在多肽测序反应中使用的多肽降解条件下进行条形码和氨基酸识别的潜力。
与之前的研究一样,条形码化多肽被固定到单分子反应室的表面。按照图8所示的顺序工作流程,将标记的寡核苷酸探针(100nM)引入反应室,并获得条形码识别数据(图10A)。接着,引入与条形码互补的未标记寡核苷酸(100nM),结果导致条形码与标记的探针之间的可检测杂交事件减少(图10B)。然后引入标记的末端氨基酸结合蛋白(50nM),并获得氨基酸识别数据(图10C)。最后引入裂解试剂(40μM PfuTET,3μM hTET),结果导致标记的末端氨基酸结合蛋白与多肽之间的可检测结合事件减少(图10D)。
使用固定到单个反应室表面的两种不同条形码化多肽进行类似实验,其中将不同标记的寡核苷酸探针和不同标记的末端氨基酸结合蛋白引入反应室。图10E-10F显示的数据证实,两种条形码化多肽的不同条形码(图10E)和末端氨基酸(图10F)可通过识别区分开来。图10G显示,加入可移除N-末端氨基酸的裂解试剂可消除氨基酸识别。
这些实验结果表明了使用寿命不同的寡核苷酸探针和氨基酸结合蛋白同时识别多种不同的条形码和多肽的能力。通过添加切除剂(cutter)后信号的损失,结果进一步证明了通过移除N-末端氨基酸对条形码化多肽进行动态测序的能力。
图11显示了单分子实验中获得的数据,涉及对两种不同条形码的条形码识别,说明不同的动力学脉冲特性可用于区分一种条形码和另一种条形码。在本实施例中,两个具有独特序列的条形码显示出不同的脉冲持续时间、脉冲间持续时间和脉冲SNR的曲线,可用于区分一种条形码和另一种条形码,而无需使用具有不同寿命(bin比值)特性的染料组。
实施例3.通过杂交进行条形码读出
如图12A所示,通过连接索引序列产生组合条形码,从而产生具有杂交序列的变异条形码。将变异条形码化分子添加到链霉亲和素涂覆的载玻片上,其中条形码化分子通过杂交序列固定到载玻片表面,杂交序列与连接至链霉亲和素的捕获寡核苷酸结合(图12B)。固定的条形码化分子与标记的寡核苷酸探针接触,标记的寡核苷酸探针与索引序列结合,这些结合事件被检测为一系列信号脉冲。同样如图12B所示,观察到的信号脉冲的模式将随寡核苷酸探针长度的不同而变化。
图12C显示了条形码识别测定的示例工作流程,其涉及在测定过程中的不同点清洗不同寡核苷酸探针的迭代步骤。这种方法根据颜色和动力学来区分探针,因此每个索引可以有16个序列,或65,536个变体。图12D显示了并行进行识别测定的芯片上成像(上图中突出显示的区域在下图中放大显示)。图12E显示了评估结合频率(上图)和τon(下图)的图。
实施例4.单分子筛选
单分子筛选技术填补了超高通量筛选和低通量二级筛选之间的空白,提供了高通量(105个纳米光子芯片)和精确表型表征的中间地带。变异条形码包含在抗体筛选测定中使用的编码构建体中,其中体外转录/翻译产生的产物包含用于分析的变异条形码(图13A)。如图13B所示,荧光探针用于利用结合动力学(上图)检测变异条形码,抗体/抗原筛选同样基于单分子动力学(下图)。图13C显示了定向进化筛选方法的示例工作流程。
等同和范围
在权利要求书中,除非有相反的指示或从上下文中明显看出,否则诸如“一个/一种(a)”、“一个/一种(an)”和“该/所述(the)”之类的冠词可以表示一个或多于一个。除非有相反的指示或从上下文中明显看出,否则如果一个、多于一个或所有组成员存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关,则认为在组的一个或多个成员之间包含“或”的权利要求或描述是令人满意的。本发明包括其中该组的一个成员恰好存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关的实施方案。本发明包括其中多于一个或所有组成员存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关的实施方案。
此外,本发明涵盖所有变化、组合和排列,其中将来自一个或多个所列权利要求的一个或多个限制、要素、条款和描述性术语引入另一权利要求。例如,可以修改从属于另一权利要求的任何权利要求,以包括在从属于相同基本权利要求的任何其他权利要求中发现的一个或多个限制。在要素作为列表,例如以马库什组格式呈现的情况下,要素的每个子组也被公开,并且可以从所述组中删除任何要素。应当理解的是,一般而言,在本发明或本发明的方面被称为包括特定要素和/或特征的情况下,本发明的某些实施方案或本发明的方面由或基本上由这样的要素和/或特征组成。为简单起见,这些实施方案并未在本文中具体阐述。
如本文在说明书和权利要求书中使用的短语“和/或”应理解为表示如此结合的要素中的“一个或两个”,即,在一些情况下要素结合存在而在其他情况下要素分离存在。用“和/或”列出的多个要素应该以相同的方式解释,即“一个或多个”这样结合的元素。除了由“和/或”子句具体标识的要素之外,可以任选地存在其他要素,无论与那些具体标识的要素相关或不相关。因此,作为非限制性示例,当与诸如“包含”之类的开放式语言结合使用时,对“A和/或B”的引用在一个实施方案中可以仅指A(任选地包括除B之外的要素);在另一个实施方案中,仅指B(任选地包括除A之外的要素);在又一个实施方案中,指A和B两者(任选地包括其他元素);等等。
如本文在说明书和权利要求书中使用的,“或”应理解为与如上定义的“和/或”具有相同的含义。例如,当分开列表中的项目时,“或”或“和/或”应被解释为是包含的,即包含至少一个,但也包含要素的数量或列表以及任选地其他未列出的项目中的多于一个。只有明确指出相反的术语,例如“仅一个”或“恰好一个”,或在权利要求中使用时,“由……组成”将指包含要素的数量或列表中的恰好一个要素。一般而言,当前面带有排他性术语,例如“任一”、“其中一个”、“只有一个”或“恰好一个”时,本文使用的术语“或”仅应解释为表示排他性的替代方案(即“一个或另一个但不是两者”)。当在权利要求中使用时,“基本上由……组成”应具有专利法领域所使用的一般含义。
如本文在说明书和权利要求书中使用的,短语“至少一个”在提及一个或多个要素的列表时,应理解为表示选自要素列表中的任何一个或多个要素的至少一个元素,但不一定包括要素列表中具体列出的每个要素中的至少一个,并且不排除要素列表中的任何要素组合。该定义还允许除了在短语“至少一个”所指的要素列表中具体标识的要素之外的元素可以任选地存在,无论是否与那些具体标识的要素相关或不相关。因此,作为非限制性示例,“A和B中的至少一个”(或等效地,“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)可以,在一个实施方案中,指至少一个,任选地包括多于一个的A,不存在B(并且任选地包括除B之外的要素);在另一个实施方案中,指至少一个,任选地包括多于一个的B,不存在A(并且任选地包括除A之外的要素);在又一个实施方案中,指至少一个,任选地包括多于一个的A,和至少一个,任选地包括多于一个的B(并且任选地包括其他要素);等等。
还应当理解的是,除非有明确的相反指示,否则在本文要求保护的任何包括一个以上步骤或动作的方法中,该方法的步骤或动作的顺序不一定限于所记载的方法的步骤或动作的顺序。
在权利要求以及上述说明书中,所有过渡短语,例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由……组成”,等应被理解为是开放式的,即意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节所述,只有过渡短语“由……组成”和“基本上由……组成”应分别为封闭或半封闭式过渡短语。应当理解的是,在本文档中使用开放式过渡短语(例如,“包含”)描述的实施方案在替代实施方案中还被考虑为“由”开放式过渡短语描述的特征“组成”和“基本上由”开放式过渡短语描述的特征“组成”。例如,如果本申请描述了“包含A和B的组合物”,则该申请还考虑了替代实施方案“由A和B组成的组合物”和“基本上由A和B组成的组合物”。
在给出范围的地方,端点包括在内。此外,除非另有说明或从上下文和本领域普通技术人员的理解中以其他方式显而易见,否则表示为范围的值可以假定在本发明的不同实施方案中的所述范围内的任何特定值或子范围,以范围下限单位的十分之一,除非上下文另有明确规定。
本申请涉及各种已发布的专利、公开的专利申请、期刊文章和其他出版物,所有这些都通过引用的方式并入本文。如果任何并入的参考文献与本说明书之间存在冲突,则以本说明书为准。此外,落入现有技术的本发明的任何特定实施方案可以明确地排除在任何一项或多项权利要求之外。因为这样的实施方案被认为是本领域普通技术人员已知的,所以即使本文没有明确阐述排除,它们也可以被排除。出于任何原因,无论是否与现有技术的存在相关,本发明的任何特定实施方案都可以从任何权利要求中排除。
本领域技术人员将认识到或能够仅使用常规实验来确定本文描述的特定实施方案的许多等同物。本文描述的本实施方案的范围不旨在限于以上描述,而是如所附权利要求书中所述。本领域普通技术人员将理解,在不背离本发明的精神或范围的情况下,可以对本说明书进行各种改变和修改,如所附权利要求书所定义的。
本文对变量的任何定义中记载的化学基团列表包括将该变量定义为任何单个基团或所列基团的组合。本文对变量的实施方案的记载包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。本文对实施方案的记载包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。

Claims (170)

1.一种方法,其包括:
使分子条形码与条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合,其中所述分子条形码连接至包含多肽的分析物;
检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲;和
根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份。
2.根据权利要求1所述的方法,其中所述分析物通过分子条形码固定到表面。
3.根据权利要求2所述的方法,其中所述分子条形码通过包含至少一个生物分子的连接基团固定到表面。
4.根据权利要求3所述的方法,其中所述连接基团包括双链核酸。
5.根据权利要求3或4所述的方法,其中所述连接基团包括蛋白质-配体复合物,所述复合物包括与至少一个双生物素部分结合的亲和素蛋白。
6.根据权利要求3-5中任一项所述的方法,其中所述连接基团包括:
包含双生物素部分的双链核酸,其中所述双链核酸连接至分子条形码;和
与双生物素部分结合的亲和素蛋白,其中所述亲和素蛋白连接至表面。
7.根据权利要求1-6中任一项所述的方法,其中所述分子条形码是核酸条形码或多肽条形码。
8.根据权利要求1-7中任一项所述的方法,其中所述条形码识别分子是寡核苷酸。
9.根据权利要求1-8中任一项所述的方法,其中所述分子条形码是核酸条形码,并且其中所述条形码识别分子是寡核苷酸。
10.根据权利要求8或9所述的方法,其中所述寡核苷酸的长度为至少4个核苷酸。
11.根据权利要求8-10中任一项所述的方法,其中所述寡核苷酸的长度少于30个核苷酸。
12.根据权利要求8-11中任一项所述的方法,其中所述寡核苷酸的长度在约5至约25个核苷酸之间。
13.根据权利要求1-7中任一项所述的方法,其中所述条形码识别分子是蛋白质或核酸适体。
14.根据权利要求1-13中任一项所述的方法,其中所述条形码识别分子包括至少一个可检测标签。
15.根据权利要求14所述的方法,其中所述条形码识别分子连接至标记的生物分子,所述标记的生物分子包括所述至少一个可检测标签。
16.根据权利要求15所述的方法,其中所述标记的生物分子是标记的核酸。
17.根据权利要求15或16所述的方法,其中所述条形码识别分子通过包含至少一个生物分子的连接基团连接至所述标记的生物分子。
18.根据权利要求17所述的方法,其中所述连接基团包括蛋白质-配体复合物。
19.根据权利要求18所述的方法,其中所述蛋白质-配体复合物包括包含至少两个配体结合位点的多价蛋白,
其中所述条形码识别分子包括与多价蛋白上的第一配体结合位点结合的第一配体部分,和
其中所述标记的生物分子包括与多价蛋白上的第二配体结合位点结合的第二配体部分。
20.根据权利要求19所述的方法,其中所述多价蛋白是包含四个生物素结合位点的亲和素蛋白,并且其中所述配体部分是生物素部分。
21.根据权利要求20所述的方法,其中至少一个生物素部分是双生物素部分,并且其中所述双生物素部分与亲和素蛋白上的两个生物素结合位点结合。
22.根据权利要求1-21中任一项所述的方法,其中所述分子条形码包括至少一个可检测标签。
23.根据权利要求14-22中任一项所述的方法,其中所述至少一个可检测标签是发光标签或电导标签。
24.根据权利要求14-23中任一项所述的方法,其中所述至少一个可检测标签是在条形码识别分子与分子条形码结合过程中未被淬灭的淬灭标签。
25.根据权利要求14-23中任一项所述的方法,其中所述至少一个可检测标签是在条形码识别分子与分子条形码结合过程中被淬灭的未淬灭标签。
26.根据权利要求1-25中任一项所述的方法,进一步包括根据分子条形码与分析物之间的已知关联来鉴定分析物。
27.根据权利要求26所述的方法,其中鉴定分析物包括确定分析物来源的样品的身份。
28.根据权利要求27所述的方法,其中所述样品是血清样品、血液样品、组织样品或单细胞。
29.根据权利要求26-28中任一项所述的方法,其中所述分析物包括蛋白质或其片段,并且其中鉴定分析物包括确定所述蛋白质的身份。
30.根据权利要求1-29中任一项所述的方法,其中所述条形码特异性模式的信号脉冲包括脉冲持续时间,所述脉冲持续时间表征条形码识别分子与分子条形码上的位点之间的结合的解离速率。
31.根据权利要求30所述的方法,其中所述条形码特异性模式的每个信号脉冲与另一个信号脉冲间隔脉冲间持续时间,所述脉冲间持续时间表征条形码识别分子结合的关联速率。
32.根据权利要求1-31中任一项所述的方法,其中所述接触包括使分子条形码与两个或更多个条形码识别分子接触,所述条形码识别分子与分子条形码上的不同或重叠位点结合。
33.根据权利要求32所述的方法,其中所述两个或更多个条形码识别分子在相同混合物中同时与分子条形码接触。
34.根据权利要求32所述的方法,其中所述两个或更多个条形码识别分子在不同混合物中分别与分子条形码接触。
35.根据权利要求1-34中任一项所述的方法,进一步包括提供包含分子条形码和条形码识别分子的混合物。
36.根据权利要求35所述的方法,其中所述混合物包括多个分子条形码,所述多个分子条形码中的每一个具有连接至其上的不同分析物。
37.根据权利要求36所述的方法,其中所述条形码识别分子结合所述多个分子条形码中的两个或更多个分子条形码。
38.根据权利要求37所述的方法,其中所述条形码识别分子与所述两个或更多个分子条形码中的每一个之间的结合相互作用产生不同的条形码特异性模式。
39.根据权利要求37所述的方法,其中所述条形码识别分子与所述两个或更多个分子条形码中的每一个之间的结合相互作用产生相同的条形码特异性模式。
40.根据权利要求36-39中任一项所述的方法,其中所述混合物包括与所述多个分子条形码中的两个或更多个分子条形码结合的多个条形码识别分子。
41.根据权利要求1-40中任一项所述的方法,其中所述分子条形码包括一系列索引序列。
42.根据权利要求41所述的方法,其中每个索引序列与所述系列中的任何其他索引序列不同。
43.根据权利要求41所述的方法,其中所述系列中的至少两个索引序列是相同的。
44.根据权利要求41-43中任一项所述的方法,其中所述一系列索引序列对应于一系列条形码识别分子结合位点。
45.根据权利要求41-44中任一项所述的方法,其中所述条形码识别分子与包含所述系列中的两个索引序列的分子条形码上的位点结合。
46.根据权利要求1-45中任一项所述的方法,其中所述分析物来自生物或合成来源。
47.根据权利要求1-46中任一项所述的方法,其中所述多肽是蛋白质或蛋白质片段。
48.根据权利要求1-47任一项所述的方法,其中所述分子条形码通过包含裂解位点的接头连接至分析物。
49.根据权利要求48所述的方法,进一步包括在接触之前从所述分子条形码上裂解分析物。
50.根据权利要求1-49中任一项所述的方法,其中所述一系列信号脉冲是一系列实时信号脉冲。
51.根据权利要求1-50中任一项所述的方法,进一步包括对多肽进行测序。
52.根据权利要求51所述的方法,其中对多肽进行测序包括:
使多肽与一个或多个末端氨基酸识别分子接触;和
在多肽降解的同时,检测指示所述一个或多个末端氨基酸识别分子与暴露在多肽末端的连续氨基酸的关联的一系列信号脉冲,从而对多肽进行测序。
53.根据权利要求1-52中任一项所述的方法,其中所述方法在单个反应容器中进行。
54.一种系统,其包括:
至少一个硬件处理器;和
至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被所述至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求1-53中任一项所述的方法。
55.至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求1-53中任一项所述的方法。
56.一种方法,其包括:
使分子条形码与条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合,其中所述分子条形码连接至分析物,其中酶与所述分析物结合;
检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲;和
根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份。
57.根据权利要求56所述的方法,其中所述分析物通过分子条形码固定到表面。
58.根据权利要求57所述的方法,其中所述分子条形码通过包含至少一个生物分子的连接基团固定到表面。
59.根据权利要求58所述的方法,其中所述连接基团包括双链核酸。
60.根据权利要求58或59所述的方法,其中所述连接基团包括蛋白质-配体复合物,所述复合物包括与至少一个双生物素部分结合的亲和素蛋白。
61.根据权利要求58-60中任一项所述的方法,其中所述连接基团包括:
包含双生物素部分的双链核酸,其中所述双链核酸连接至分子条形码;和
与所述双生物素部分结合的亲和素蛋白,其中所述亲和素蛋白连接至表面。
62.根据权利要求56-61中任一项所述的方法,其中所述分子条形码是核酸条形码或多肽条形码。
63.根据权利要求56-62中任一项所述的方法,其中所述条形码识别分子是寡核苷酸。
64.根据权利要求56-63中任一项所述的方法,其中所述分子条形码是核酸条形码,并且其中所述条形码识别分子是寡核苷酸。
65.根据权利要求63或64所述的方法,其中所述寡核苷酸的长度为至少4个核苷酸。
66.根据权利要求63-65中任一项所述的方法,其中所述寡核苷酸的长度少于30个核苷酸。
67.根据权利要求63-66中任一项所述的方法,其中所述寡核苷酸的长度在约5至约25个核苷酸之间。
68.根据权利要求56-62中任一项所述的方法,其中所述条形码识别分子是蛋白质或核酸适体。
69.根据权利要求56-68中任一项所述的方法,其中所述条形码识别分子包括至少一个可检测标签。
70.根据权利要求69所述的方法,其中所述条形码识别分子连接至标记的生物分子,所述标记的生物分子包括所述至少一个可检测标签。
71.根据权利要求70所述的方法,其中所述标记的生物分子是标记的核酸。
72.根据权利要求70或71所述的方法,其中所述条形码识别分子通过包含至少一个生物分子的连接基团连接至所述标记的生物分子。
73.根据权利要求72所述的方法,其中所述连接基团包括蛋白质-配体复合物。
74.根据权利要求73所述的方法,其中所述蛋白质-配体复合物包括包含至少两个配体结合位点的多价蛋白,
其中所述条形码识别分子包括与多价蛋白上的第一配体结合位点结合的第一配体部分,和
其中所述标记的生物分子包括与多价蛋白上的第二配体结合位点结合的第二配体部分。
75.根据权利要求74所述的方法,其中所述多价蛋白是包含四个生物素结合位点的亲和素蛋白,并且其中所述配体部分是生物素部分。
76.根据权利要求75所述的方法,其中至少一个生物素部分是双生物素部分,并且其中所述双生物素部分与亲和素蛋白上的两个生物素结合位点结合。
77.根据权利要求56-76中任一项所述的方法,其中所述分子条形码包括至少一个可检测标签。
78.根据权利要求69-77中任一项所述的方法,其中所述至少一个可检测标签是发光标签或电导标签。
79.根据权利要求69-78中任一项所述的方法,其中所述至少一个可检测标签是在条形码识别分子与分子条形码结合过程中未被淬灭的淬灭标签。
80.根据权利要求69-78中任一项所述的方法,其中所述至少一个可检测标签是在条形码识别分子与分子条形码结合过程中被淬灭的未淬灭标签。
81.根据权利要求56-80中任一项所述的方法,进一步包括根据分子条形码与分析物之间的已知关联来鉴定分析物。
82.根据权利要求81所述的方法,其中鉴定分析物包括确定分析物来源的样品的身份。
83.根据权利要求82所述的方法,其中所述样品是血清样品、血液样品、组织样品或单细胞。
84.根据权利要求81-83中任一项所述的方法,其中所述分析物包括生物分子或其片段,并且其中鉴定分析物包括确定生物分子的身份。
85.根据权利要求56-84中任一项所述的方法,其中所述条形码特异性模式的信号脉冲包括脉冲持续时间,所述脉冲持续时间表征条形码识别分子与分子条形码上的位点之间的结合的解离速率。
86.根据权利要求85所述的方法,其中所述条形码特异性模式的每个信号脉冲与另一个信号脉冲间隔脉冲间持续时间,所述脉冲间持续时间表征条形码识别分子结合的关联速率。
87.根据权利要求56-86中任一项所述的方法,其中所述接触包括使分子条形码与两个或更多个条形码识别分子接触,所述条形码识别分子与分子条形码上的不同或重叠位点结合。
88.根据权利要求87所述的方法,其中所述两个或更多个条形码识别分子在相同混合物中同时与分子条形码接触。
89.根据权利要求87所述的方法,其中所述两个或更多个条形码识别分子在不同混合物中分别与分子条形码接触。
90.根据权利要求56-89中任一项所述的方法,进一步包括提供包含分子条形码和条形码识别分子的混合物。
91.根据权利要求90所述的方法,其中所述混合物包括多个分子条形码,所述多个分子条形码中的每一个具有连接至其上的不同分析物。
92.根据权利要求91所述的方法,其中所述条形码识别分子结合所述多个分子条形码中的两个或更多个分子条形码。
93.根据权利要求92所述的方法,其中所述条形码识别分子与所述两个或更多个分子条形码中的每一个之间的结合相互作用产生不同的条形码特异性模式。
94.根据权利要求92所述的方法,其中所述条形码识别分子与所述两个或更多个分子条形码中的每一个之间的结合相互作用产生相同的条形码特异性模式。
95.根据权利要求91-94中任一项所述的方法,其中所述混合物包括与所述多个分子条形码中的两个或更多个分子条形码结合的多个条形码识别分子。
96.根据权利要求56-95中任一项所述的方法,其中所述分子条形码包括一系列索引序列。
97.根据权利要求96所述的方法,其中每个索引序列与所述系列中的任何其他索引序列不同。
98.根据权利要求96所述的方法,其中所述系列中的至少两个索引序列是相同的。
99.根据权利要求96-98中任一项所述的方法,其中所述一系列索引序列对应于一系列条形码识别分子结合位点。
100.根据权利要求96-99中任一项所述的方法,其中所述条形码识别分子与包含所述系列中的两个索引序列的分子条形码上的位点结合。
101.根据权利要求56-100中任一项所述的方法,其中所述分子条形码通过包含裂解位点的接头连接至分析物。
102.根据权利要求101所述的方法,进一步包括在接触之前从所述分子条形码上裂解分析物。
103.根据权利要求56-102中任一项所述的方法,其中所述一系列信号脉冲是一系列实时信号脉冲。
104.根据权利要求56-103中任一项所述的方法,其中所述分析物包括来自生物或合成来源的生物分子。
105.根据权利要求56-104中任一项所述的方法,其中所述分析物是核酸。
106.根据权利要求56-105中任一项所述的方法,其中所述酶是聚合化酶。
107.根据权利要求56-106中任一项所述的方法,其中所述分析物是脱氧核糖核酸,并且其中所述酶是DNA聚合酶。
108.根据权利要求105-107中任一项所述的方法,进一步包括对核酸进行测序。
109.根据权利要求108所述的方法,其中对核酸进行测序包括进行合成测序反应,其中所述酶以核酸为模板合成互补核酸链。
110.根据权利要求56-109中任一项所述的方法,其中所述方法在单个反应容器中进行。
111.一种系统,其包括:
至少一个硬件处理器;和
至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被所述至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求56-110中任一项所述的方法。
112.至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求56-110中任一项所述的方法。
113.一种方法,其包括:
使分子条形码与条形码识别分子接触,所述条形码识别分子与分子条形码上的一个或多个位点结合,其中所述分子条形码连接至包含生物分子的分析物;
检测指示条形码识别分子与分子条形码之间的结合相互作用的一系列信号脉冲;
根据一系列信号脉冲中的条形码特异性模式确定分子条形码的身份;和
通过将生物分子置于测序反应条件下对生物分子进行测序。
114.根据权利要求113所述的方法,其中所述分析物通过分子条形码固定到表面。
115.根据权利要求114所述的方法,其中所述分子条形码通过包含至少一个生物分子的连接基团固定到表面。
116.根据权利要求115所述的方法,其中所述连接基团包括双链核酸。
117.根据权利要求115或116所述的方法,其中所述连接基团包括蛋白质-配体复合物,所述复合物包括与至少一个双生物素部分结合的亲和素蛋白。
118.根据权利要求115-117中任一项所述的方法,其中所述连接基团包括:
包含双生物素部分的双链核酸,其中所述双链核酸连接至分子条形码;和
与所述双生物素部分结合的亲和素蛋白,其中所述亲和素蛋白连接至表面。
119.根据权利要求113-118中任一项所述的方法,其中所述分子条形码是核酸条形码或多肽条形码。
120.根据权利要求113-119中任一项所述的方法,其中所述条形码识别分子是寡核苷酸。
121.根据权利要求113-120中任一项所述的方法,其中所述分子条形码是核酸条形码,并且其中所述条形码识别分子是寡核苷酸。
122.根据权利要求120或121所述的方法,其中所述寡核苷酸的长度为至少4个核苷酸。
123.根据权利要求120-122中任一项所述的方法,其中所述寡核苷酸的长度少于30个核苷酸。
124.根据权利要求120-123中任一项所述的方法,其中所述寡核苷酸的长度在约5至约25个核苷酸之间。
125.根据权利要求113-124中任一项所述的方法,其中所述条形码识别分子是蛋白质或核酸适体。
126.根据权利要求113-125中任一项所述的方法,其中所述条形码识别分子包括至少一个可检测标签。
127.根据权利要求126所述的方法,其中所述条形码识别分子连接至标记的生物分子,所述标记的生物分子包括所述至少一个可检测标签。
128.根据权利要求127所述的方法,其中所述标记的生物分子是标记的核酸。
129.根据权利要求127或128所述的方法,其中所述条形码识别分子通过包含至少一个生物分子的连接基团连接至所述标记的生物分子。
130.根据权利要求129所述的方法,其中所述连接基团包括蛋白质-配体复合物。
131.根据权利要求130所述的方法,其中所述蛋白质-配体复合物包括包含至少两个配体结合位点的多价蛋白,
其中所述条形码识别分子包括与多价蛋白上的第一配体结合位点结合的第一配体部分,和
其中所述标记的生物分子包括与多价蛋白上的第二配体结合位点结合的第二配体部分。
132.根据权利要求131所述的方法,其中所述多价蛋白是包含四个生物素结合位点的亲和素蛋白,并且其中所述配体部分是生物素部分。
133.根据权利要求132所述的方法,其中至少一个生物素部分是双生物素部分,并且其中所述双生物素部分与亲和素蛋白上的两个生物素结合位点结合。
134.根据权利要求113-133中任一项所述的方法,其中所述分子条形码包括至少一个可检测标签。
135.根据权利要求126-134中任一项所述的方法,其中所述至少一个可检测标签是发光标签或电导标签。
136.根据权利要求126-135中任一项所述的方法,其中所述至少一个可检测标签是在条形码识别分子与分子条形码结合过程中未被淬灭的淬灭标签。
137.根据权利要求126-135中任一项所述的方法,其中所述至少一个可检测标签是在条形码识别分子与分子条形码之间的结合过程中被淬灭的未淬灭标签。
138.根据权利要求113-137中任一项所述的方法,进一步包括根据分子条形码与分析物之间的已知关联来鉴定分析物。
139.根据权利要求138所述的方法,其中鉴定分析物包括确定来自分析物的样品的身份。
140.根据权利要求139所述的方法,其中所述样品是血清样品、血液样品、组织样品或单细胞。
141.根据权利要求138-140中任一项所述的方法,其中鉴定分析物包括确定生物分子的身份。
142.根据权利要求113-141中任一项所述的方法,其中所述条形码特异性模式的信号脉冲包括脉冲持续时间,所述脉冲持续时间表征条形码识别分子与分子条形码上的位点之间的结合的解离速率。
143.根据权利要求142所述的方法,其中所述条形码特异性模式的每个信号脉冲与另一个信号脉冲间隔脉冲间持续时间,所述脉冲间持续时间表征条形码识别分子结合的关联速率。
144.根据权利要求113-143中任一项所述的方法,其中所述接触包括使分子条形码与两个或更多个条形码识别分子接触,所述条形码识别分子与分子条形码上的不同或重叠位点结合。
145.根据权利要求144所述的方法,其中所述两个或更多个条形码识别分子在相同混合物中同时与分子条形码接触。
146.根据权利要求144所述的方法,其中所述两个或更多个条形码识别分子在不同混合物中分别与分子条形码接触。
147.根据权利要求113-146中任一项所述的方法,进一步包括提供包含分子条形码和条形码识别分子的混合物。
148.根据权利要求147所述的方法,其中所述混合物包括多个分子条形码,所述多个分子条形码中的每一个具有连接至其上的不同分析物。
149.根据权利要求148所述的方法,其中所述条形码识别分子结合所述多个分子条形码中的两个或更多个分子条形码。
150.根据权利要求149所述的方法,其中所述条形码识别分子与所述两个或更多个分子条形码中的每一个之间的结合相互作用产生不同的条形码特异性模式。
151.根据权利要求149所述的方法,其中所述条形码识别分子与所述两个或更多个分子条形码中的每一个之间的结合相互作用产生相同的条形码特异性模式。
152.根据权利要求148-151中任一项所述的方法,其中所述混合物包括与所述多个分子条形码中的两个或更多个分子条形码结合的多个条形码识别分子。
153.根据权利要求113-152中任一项所述的方法,其中所述分子条形码包括一系列索引序列。
154.根据权利要求153所述的方法,其中每个索引序列与所述系列中的任何其他索引序列不同。
155.根据权利要求153所述的方法,其中所述系列中的至少两个索引序列是相同的。
156.根据权利要求153-155中任一项所述的方法,其中所述一系列索引序列对应于一系列条形码识别分子结合位点。
157.根据权利要求153-156中任一项所述的方法,其中所述条形码识别分子与包含所述系列中的两个索引序列的分子条形码上的位点结合。
158.根据权利要求113-157中任一项所述的方法,其中所述分子条形码通过包含裂解位点的接头连接至分析物。
159.根据权利要求158所述的方法,进一步包括在接触之前从所述分子条形码上裂解分析物。
160.根据权利要求113-159中任一项所述的方法,其中所述一系列信号脉冲是一系列实时信号脉冲。
161.根据权利要求113-160中任一项所述的方法,其中所述分析物来自生物或合成来源。
162.根据权利要求113-161中任一项所述的方法,其中所述生物分子是多肽。
163.根据权利要求162所述的方法,其中对生物分子进行测序包括:
使多肽与一个或多个末端氨基酸识别分子接触;和
在多肽降解的同时,检测指示所述一个或多个末端氨基酸识别分子与暴露在多肽末端的连续氨基酸的关联的一系列信号脉冲,从而对多肽进行测序。
164.根据权利要求113-161中任一项所述的方法,其中所述生物分子是核酸。
165.根据权利要求164所述的方法,其中聚合化酶与所述核酸结合。
166.根据权利要求165所述的方法,其中所述核酸是脱氧核糖核酸,并且其中所述聚合化酶是DNA聚合酶。
167.根据权利要求164-166中任一项所述的方法,其中对生物分子进行测序包括:
进行合成测序反应,其中聚合化酶以核酸为模板合成互补核酸链。
168.根据权利要求113-167中任一项所述的方法,其中所述方法在单个反应容器中进行。
169.一种系统,其包括:
至少一个硬件处理器;和
至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被所述至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求113-168中任一项所述的方法。
170.至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求113-168中任一项所述的方法。
CN202180093796.8A 2020-12-15 2021-12-15 通过单分子动力学进行分子条形码分析 Pending CN116848397A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063125904P 2020-12-15 2020-12-15
US63/125,904 2020-12-15
PCT/US2021/010050 WO2022132188A1 (en) 2020-12-15 2021-12-15 Molecular barcode analysis by single-molecule kinetics

Publications (1)

Publication Number Publication Date
CN116848397A true CN116848397A (zh) 2023-10-03

Family

ID=81941298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180093796.8A Pending CN116848397A (zh) 2020-12-15 2021-12-15 通过单分子动力学进行分子条形码分析

Country Status (7)

Country Link
US (1) US20220186295A1 (zh)
EP (1) EP4251975A1 (zh)
JP (1) JP2023554368A (zh)
CN (1) CN116848397A (zh)
AU (1) AU2021401791A1 (zh)
CA (1) CA3177753A1 (zh)
WO (1) WO2022132188A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240003886A1 (en) * 2022-06-15 2024-01-04 Quantum-Si Incorporated Directed protein evolution

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2036989T3 (pl) * 2007-09-12 2012-12-31 Pasteur Institut Polinukleotyd odpowiedni do testu reporterowego dla pojedynczych komórek do monitorowania schematów ekspresji genów z dużą rozdzielczością przestrzenną i czasową
US10266876B2 (en) * 2010-03-08 2019-04-23 California Institute Of Technology Multiplex detection of molecular species in cells by super-resolution imaging and combinatorial labeling
EP4180535A1 (en) * 2015-03-30 2023-05-17 Becton, Dickinson and Company Methods and compositions for combinatorial barcoding
US10174363B2 (en) * 2015-05-20 2019-01-08 Quantum-Si Incorporated Methods for nucleic acid sequencing
WO2020123319A2 (en) * 2018-12-10 2020-06-18 10X Genomics, Inc. Methods of using master / copy arrays for spatial detection

Also Published As

Publication number Publication date
WO2022132188A1 (en) 2022-06-23
AU2021401791A1 (en) 2023-07-06
CA3177753A1 (en) 2022-06-23
WO2022132188A8 (en) 2023-02-16
JP2023554368A (ja) 2023-12-27
US20220186295A1 (en) 2022-06-16
EP4251975A1 (en) 2023-10-04

Similar Documents

Publication Publication Date Title
US11970729B2 (en) Methods for nucleic acid sequencing
TWI704229B (zh) 核酸定序方法
JP5934817B2 (ja) 分子オブジェクトを検出及び識別する装置と方法
US20240035081A1 (en) Labeled nucleotide compositions and methods for nucleic acid sequencing
CN116848397A (zh) 通过单分子动力学进行分子条形码分析
US20230221253A1 (en) Techniques for sequencing
US20220098658A1 (en) Methods to minimize photodamage during nucleic acid and peptide sequencing
JP2023554620A (ja) チップを再生するためのシステムおよび方法
US20240151729A1 (en) Luminescently labeled oligonucleotide structures and associated systems and methods
US20240003886A1 (en) Directed protein evolution
KR20230125053A (ko) 분광분석기반 샘플 내 타겟 분석물질 검출 방법 및장치
JPH11164700A (ja) Dna検出方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination