CN114761538A - 样品处理条形码化珠组合物、方法、制备和系统 - Google Patents

样品处理条形码化珠组合物、方法、制备和系统 Download PDF

Info

Publication number
CN114761538A
CN114761538A CN202080084667.8A CN202080084667A CN114761538A CN 114761538 A CN114761538 A CN 114761538A CN 202080084667 A CN202080084667 A CN 202080084667A CN 114761538 A CN114761538 A CN 114761538A
Authority
CN
China
Prior art keywords
barcode
composition
molecules
region
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080084667.8A
Other languages
English (en)
Inventor
亚当·麦考伊
卡利安·翰迪克
乔纳森·贝尔
维沙·沙玛
王思达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bio Rad Laboratories Inc
Original Assignee
Bio Rad Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bio Rad Laboratories Inc filed Critical Bio Rad Laboratories Inc
Publication of CN114761538A publication Critical patent/CN114761538A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/149Particles, e.g. beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals

Abstract

一种用于靶材料分离的组合物的实施方案,该组合物包含:主体和一个或更多个偶联到主体并构造成用于组合物功能化的分子。在实施方案中,一个或更多个分子中的每一个可以包含以下一个或更多个:接头区;聚合酶链式反应(PCR)区段或寡聚结合区;一个或更多个条形码区;独特分子标识符;制备辅助区段;活性区段;和分子剪刀或裂解区,其中各种区可以偶联在一起以便向组合物提供功能性。本发明还包含组合物的制备和在靶材料捕获(例如,来自单细胞或其他生物材料)的背景下各种用途的应用。

Description

样品处理条形码化珠组合物、方法、制备和系统
相关申请的交叉引用
本申请要求2019年12月06日提交的美国临时申请第62/945,006号的权益,该申请通过此引用以其整体并入本文。
技术领域
本发明总体涉及细胞捕获和细胞处理领域,并且更具体地,涉及用于靶材料反应的样品处理条形码化珠的新的和有用的系统、方法和组合物。
背景
随着对细胞特异性药物测试、诊断和其他测定的兴趣增加,允许单个细胞分离、鉴定和回收的系统和方法变得非常可取。单细胞捕获系统和方法已显示对这些应用特别有利。然而,用于单细胞捕获和随后分析的相关过程和方案通常必须以特定的方式和高精度进行,以便合适地维护细胞。此外,从高密度平台有效地回收靶材料面临着许多挑战。此外,材料的组成可以被显著地改进,以用于涉及以允许单细胞分析的方式捕获和回收靶材料的应用。因此,这些过程对用户来说可能是耗时的,可能需要广泛和迭代的手动文库制备和选择过程,可能不适合自动化,并且可能因此导致对细胞的损害(例如,在不期望的存活力损失方面)、高背景噪声率、升高的假阳性率或在其他方面不可靠的实验结果。
因此,在细胞捕获和细胞处理领域中需要创建用于样品处理和靶材料回收的新的和有用的系统和方法,并使靶生物材料的文库制备中所需的步骤最少化,其中一些实施方案利用分子条形码化(例如,通过在工作流程中使用条形码化寡核苷酸,典型地递送到包括功能性颗粒的反应环境中)。还需要创建用于简化(streamline)制备大量所描述的条形码化珠实施方案的方法。
附图简述
图1描绘了用于靶材料反应的组合物的实施方案的示意图。
图2描绘了用于靶材料反应的组合物的替代实施方案的示意图。
图3描绘了包含在用于靶材料反应的组合物中的接头分子的实施方案的示意图。
图4A-4C描绘了可用于将mRNA捕获到cDNA合成反应或蛋白加标签(proteintagging)相互作用的组合物的变化形式。
图5描绘了包含用于简化文库制备操作的部分的组合物的变化形式。
图6A描绘了可用于将mRNA捕获到cDNA合成反应的组合物的变化形式。
图6B描绘了可用于蛋白加标签反应的组合物的变化形式。
图6C-6E描绘了包含热不稳定接头元件的组合物的变化形式。
图7描绘了掺入了分子剪刀区的组合物的变化形式。
图8A-8M描绘了功能化分子与底物偶联的变化形式。
图9A和图9B描绘了可用于ATAC-seq操作的组合物的变化形式。
图9C-9E描绘了含有限制性位点的组合物的变化形式。
图10描绘了用于ATAC-seq的方法的实施方案的流程图。
图11描绘了用于制备组合物的方法的流程图。
图12A描绘了用于制备组合物颗粒的方法的变化形式的流程图。
图12B和图12C描绘了用于制备组合物的步骤的变化形式。
图13描绘了寡核苷酸分子的合成的变化形式。
图14描绘了寡核苷酸分子的一部分的合成的变化形式。
图15描绘了寡核苷酸分子的一部分的合成的变化形式的详细步骤。
图16A-16E描绘了具有与颗粒偶联的独特条形码的一组寡核苷酸分子的合成的变化形式。
图17A-17B描绘了具有与颗粒偶联的独特条形码的一组寡核苷酸分子的合成的替代变化形式。
优选实施方案的描述
本发明的优选实施方案的下列描述并不意在将本发明限制到这些优选实施方案,而是使本领域中的任何技术人员能够制备和使用本发明。
1.益处
所描述的发明可以赋予比起传统系统、方法和组合物来的若干益处。
本发明赋予了以下益处:提供用于促进从样品中捕获、提取和/或回收靶生物材料的非天然存在的组合物,同时为从样品分区中回收的每个生物标志物分子提供条形码,所述样品分区可以是样品中离散的单细胞。这样的组合物可以包含已经从其天然状态修饰过的材料(例如,在提供与天然组合物的结构差异方面)。此外,本发明涉及材料的组合,其中材料的组合是非天然发生的(例如,所描述和要求保护的组合物没有天然存在的对应物)。
本发明还包括基材的新组合物及组分化学,以产生文库制备过程的简化。
本发明还包括具有允许靶材料分离的可裂解位点的新组合物,具有监测裂解和/或量化从生物样品中处理的组分的能力。
本发明还赋予了提供从高密度捕获平台的高长径比孔有效回收靶材料(例如,珠、细胞、释放的核酸材料等)的机制的益处。由于捕获平台的孔紧密排列,在这种情况下,回收通常是困难和无效率的。所描述的回收机制也会使靶材料承受可接受量的剪切和其他潜在应力,否则这些剪切和应力将阻碍下游处理步骤。
本发明还赋予了以下益处:提供制备用于捕获靶分子和/或偶联到基底(例如,室壁)的分子的珠的方法,其中该分子包含一组用于样品处理的可被检测的独特条形码。
本发明还赋予了减少与从孔中回收靶材料过程有关的系统操作者负担的益处,其中标准过程可能是低效/劳动密集型的。
本发明还赋予了提高回收靶材料的效率(而不回收非靶材料)的益处。因此,选择性回收效率可以减少与处理试剂和其他材料成本相关的下游成本(由于所需体积减少)、处理负担和改进的信噪比。例如,本发明可以使系统操作者能够购买更小体积的试剂,减少成功扩增靶分子所需的分开次数,并且避免对靶寡核苷酸产物进行基于SPRI的清洗和尺寸选择以与不包含产物但从一个处理步骤遗留到下一个处理步骤的其他寡核苷酸标签分开的需要。这样改进的靶产物回收和减少非靶产物的遗留还可以减少数据分析的复杂性,并且还提供与所需的生物标志物分析有关的更可用的数据。这可以起到节省成本,减少试剂浪费,或获得任何其他合适的结果的作用。
由于所描述的组合物、方法和系统提供了更大数目的靶读段,因此本发明还赋予了针对所需靶提供更大的测序深度的益处。
本发明还赋予了使涉及单细胞捕获、靶材料回收和后续处理的方案能够至少部分自动化的益处。例如,人工操作者用户可以从部分或全部方法中去除。此外,该系统和/或方法与传统的系统和方法相比,可以在方案性能方面实现更好的准确度。这些发明中的一些也更适合于液体处理机器人的完全自动化。
另外或可选地,本发明可以赋予任何其他合适的益处。
2.功能性珠组合物
如图1所示,用于靶材料分离的组合物100的实施方案包含:主体110和一个或更多个偶联到主体110并构造成用于组合物100功能化的分子120。在实施方案中,一个或更多个分子120中的每一个可包含以下中的一个或更多个:接头区130;聚合酶链式反应(PCR)区段或寡核苷酸结合区140;一个或更多个条形码区150;独特分子标识符160;制备辅助区段(preparation-facilitating segment)170;活性区段180;和分子剪刀或裂解区190,其中各种区可以偶联在一起(例如,按顺序)以便向组合物提供功能性。在应用中,组合物100可以被提供为一组功能化颗粒,每个功能化颗粒具有一组用于各种测定的偶联的寡核苷酸分子,所述寡核苷酸分子被配置为辅助提取操作、扩增过程、基于尺寸的纯化过程、结合过程、释放和回收过程以及用于单细胞分析的其他反应(例如,分子反应)。
组合物100可以被配置为与配置为以手动、半自动和/或自动操作模式进行单细胞分析的系统一起操作。这样的系统的实施方案、变化形式和实例在以下一项或更多项中描述:标题为“Cell Capture System and Method of Use”并于2012年7月25日提交的美国申请第13/557,510号;标题为“System and Method for Isolating and Analyzing Cells”并于2014年5月28日提交的美国申请第14/289,155号;标题为“System and Method forIsolating and Analyzing Cells”并于2017年2月24日提交的美国申请第15/422,222号;标题为“System and Method for Retrieving and Analyzing Particles”并于2017年11月16日提交的美国申请第15/815,532号;以及标题为“System and Method for Isolatingand Analyzing Cells”并于2018年8月28日提交的美国申请第16/115,059号;所述申请各自通过此引用以其整体并入。
组合物100可以被配置为用于与以下一种或多种相关的过程和反应:逆转录反应(RT-反应)、免疫化学、DNA反应、mRNA FISH反应、邻近连接反应、桥式扩增反应、催化酶促反应、杂交反应、限制性消化反应、扩增反应(例如mRNA和/或DNA PCR)和其他合适的反应。这样的反应可以在芯片上和/或芯片外进行,其中用于单细胞分析的微流体芯片的实施方案、变化形式和实例描述于以下中:标题为“Cell Capture System and Method of Use”并于2012年7月25日提交的美国申请第13/557,510号;标题为“System and Method forIsolating and Analyzing Cells”并于2014年5月28日提交的美国申请第14/289,155号;标题为“System and Method for Isolating and Analyzing Cells”并于2017年2月24日提交的美国申请第15/422,222号;以及标题为“System and Method for Retrieving andAnalyzing Particles”并于2017年11月16日提交的美国申请第15/815,532号;所述申请各自通过此引用以其整体并入。
2.1功能性珠核心
主体110的作用是提供基底,一个或更多个分子120可以偶联到基底,以便在实施相应的测定和反应方面为组合物提供功能化。
关于形态,主体110可以具有微球的形式。可选地,主体110可以具有非球形(例如,椭球、棱柱、多面体、非定形等)主体的形式,其中穿过主体110所取的横截面是非圆形的。然而,主体110可以可选地具有其他合适的形式。关于尺寸,主体110可以具有5-50微米的直径(或特征宽度),公差为±0.05微米到5微米。此外,主体110在整个颗粒群体上的均匀性可以使得在完成预期的单细胞过程的各个步骤后实现所需的回收效率性能。在特定实例中,主体110具有20微米±1微米的直径;然而,示例性主体110的变化形式可以具有其他形态。
在实施方案中,主体110具有以下特征尺寸,该特征尺寸被配置为使得只有组合物100的单个主体110可以与单个靶细胞一起进入上述芯片的孔,以便在单个孔内共定位和共捕获单细胞-颗粒对。然而,组合物100的主体110可以具有配置为用于其他微流体或非微流体测定应用的其他合适的特征尺寸。
关于密度,主体110被配置为具有大于旨在与组合物100一起使用(例如,与特定反应或测定有关)的处理液体的密度的密度,使得组合物100在操作期间因重力沉降在处理液体中。在实施方案中,主体110的密度大于1.02g/cm3,然而,在变化形式中主体110可以具有其他适当的密度。例如,在一些实施方案中,主体110可以被配置为与预期的处理液体具有相同的密度(例如,为了便于其中需要处理液体流携带主体110的步骤)。在又其他实施方案中,主体110可以被配置为相对于处理液体是漂浮的,使得主体110是漂浮的并且可用于分离样品中的靶或非靶材料。
关于密度和形态,主体110可以是连续的主体(例如,在微米尺度、在纳米尺度、在亚纳米尺度)。可选地,其变化形式如图2所示,主体110可以包含较小主体115(例如,具有从主体110的宏观形态按比例缩小的形态,具有其他形态)的团簇。由于较小主体115的表面集合(aggregation),这样的配置可以提供更大的总表面积,可以产生用于寡核苷酸合成的单个主体的宏观性能(例如,在近似刚性/其他机械特性方面),和/或可以在测定中使用后(例如,在捕获后)溶解,以提供所需的表面化学性能。较小主体115的团簇可以被团簇材料116包围(例如,包裹在其中),团簇材料116可以暂时地或“永久地”维持团簇的团簇形态。在实例中,团簇材料116可以包含水凝胶,其中水凝胶具有适合组合物预期用途的特性(例如,在交联方面,在溶解性方面,在孔隙率方面,在密度方面,在热特性方面,在光学特性方面,在电荷方面,在组成方面,在机械特性方面,在其他物理特性方面,等等)。在相关的使用应用中,团簇材料116可以在测定中在使用阶段期间保持较小主体115的团簇形态,并且然后可以溶解或以其他方式去除,以便将较小主体115转变为非团簇状态(例如,为每个较小主体的表面化学提供改进的接近)。
在实例中,由多个小微球(例如,具有0.5微米直径)与较大微球(例如,具有19微米直径)的表面反应制成复合微球,使得复合微球具有20微米的总直径,但是复合颗粒表面的表面积由于较小微球的存在或以特定预先设计的阵列排列的某些反应基团的存在而显著增强。
在实施方案中,基材和表面特性可以不同,以提供显著的性能灵活性。例如,较大的微球可能是硬质材料,而小微球可以是水凝胶。在另一实例中,较大的微球可以是非磁性的,而较小的微球可以是磁性的。在另一实例中,较大的微球是磁性的,并且较小的微球是磁性或顺磁性的。在另一实例中,较大的微球可以由透明材料制成,而较小的微球可以是光学(例如,明场或荧光)编码的。在另一实例中,较大的微球可以制备为可溶解的,而较小的微球不可溶解。复合微球的另一实施方案可以包含涂覆有提供增加反应表面积的薄(例如,1-3微米层)水凝胶或其他材料的一组基础硬质微球。这样的创新的微球还将提供额外的优势,即允许某些尺寸的生物标志物渗透到微球中,以部分参与(part-take)特定的反应。复合微球的又另一实例可以包含固体颗粒(例如直径为20微米),其具有从复合微球的表面贯穿到微球中心的微隧道(例如直径为0.1-2微米)。在一些情况下,这些微隧道可以穿过整个颗粒的直径。在又其他实施方案中,微隧道是增加复合材料总表面积的孔。在又另一实施方案中,大微球可以在表面上具有薄涂层,该涂层与内部的组合物相比具有不同的功能性组成。顶部表面可以是交联的,但内部材料可以是软的或可溶解的。
在变化形式中,每个较小主体115在特性和组成上可以是相同的;然而,在其他变化形式中,一个或更多个较小主体115可以被配置为具有不同的特性、组成和在团簇内的分布(例如,从核心到表面),以便为测定或反应的不同部分提供不同的功能。例如,团簇的第一区(例如,表面)可以具有第一组特性、组成和/或表面化学,以进行测定或反应的第一部分,可以被溶解或以其他方式去除,并且然后团簇的第二区(例如,核心)可以具有第二组特性、组成和/或表面化学,以进行测定或反应的第二部分。
在特定实例中,一组约750个较小主体115被聚集在可溶解的水凝胶中,以提供20微米的总直径,具有单个连续20微米颗粒表面积的~7.5倍的总表面积,每个较小主体115包含具有二乙烯基苯交联的聚苯乙烯(PS-DVB),具有1微米的直径(具有适当的公差)。在另一实例中,主体110可以包含水凝胶,其中较小主体由聚丙烯酰胺基质组成,并且团簇材料包含二硫化物交联剂(例如,BAC)。然而,实例的变化形式可以以其他合适的方式配置。
关于热特性,主体110被配置为在温度下限(例如,与低温反应和过程相关,与储存相关等)和温度上限(例如,与高温反应和过程相关)之间操作。在特定实例中,温度下限为-20℃至4℃(例如,用于冷藏),并且温度上限为90℃至120℃(例如,用于变性反应)。然而,主体110可以被配置为用于其他操作温度。
关于物理特性,主体110被配置为在溶液中保持结构(例如,在储存期间的缓冲溶液中,在进行测定期间的溶液中)。因此,主体110被配置为非溶胀性和非浸出性的。然而,在替代实施方案中,主体110可以被配置为溶胀所需的量(例如,关于达到在应用中的处理或使用所需的尺寸或形态),被配置为浸出某些化合物(例如,处理试剂)以用于进行测定,和/或在进行测定或其他过程期间以所需方式溶解。在又另一实施方案中,颗粒可以具有明确定制的溶胀性,使得其在特定缓冲液和/或物理条件中的使用允许颗粒容易地进入微孔,但在特定缓冲条件下可以被捕获在微孔中。此外,关于物理特性,主体110可以被配置为具有与测定或其他过程的进行有关的所需程度的亲水性(例如,在从亲水性到疏水性的范围内)。关于与流体接触相关的表面特性,主体110可以被配置为具有所需的润湿性(例如,在接触角等方面)。因此,主体110的变化形式可以具有合适的交联类型(例如,化学交联、物理交联等)和交联百分比(例如,丙烯酰胺的1%-10%交联,其他材料的30%-99%交联,其他合适的交联范围),以便在使用条件中提供所需水平的稳定性。
关于其他表面特性,主体110可以被配置为具有所需的孔隙率(例如,200-2000A等)。主体110可以另外地或可选地被配置为具有所需的装载密度(LD),以便能够实现适当的接头密度(例如,通过在主体110上提供附接点以在使用期间提供更稳健的可检测信号),其中对主体110的添加在下文第2.2节中更详细地描述。此外,主体110可以包含用于偶联下文第2.2节中描述的接头分子的表面基团(例如,羟基基团、胺基团、羧基基团、硫化物基团、硅醇基团等)。在实例中,所需的装载密度(LD)可以低至1umol/g或高至几百umol/g的官能团密度。
关于磁特性,主体110可以被配置为对磁场响应(例如,关于涉及分离和/或回收靶或非靶材料的测定)。在主体110的变化形式中,主体110的某些区(例如,核心区)可以是磁性的(例如,磁性的、顺磁性的等),并且主体110的某些区(例如,壳区)可以是非磁性的。关于表面特性,主体110可以被配置为带电荷或不带电荷,以辅助与靶材料的结合,或者辅助涉及具有功能性的分子的制备。
关于光学特性,主体110可以被配置为非荧光的(例如,以便不干扰基于光学的检测测定)。然而,在变化形式中,主体110可以被配置为可光学检测的(例如,通过非荧光形式、通过荧光形式、通过红外检测形式、通过热检测形式等),例如用于跟踪目的。
关于机械特性,主体110可以被配置为具有所需的硬度(例如,根据莫氏量表测量,根据其他硬度量表测量),以便在使用应用期间保持所需的硬度水平。另外地或可选地,主体110可以被配置为具有与以下一个或更多个相关的所需机械特性:刚性、弹性性能(例如,在模量方面,在塑性和弹性变形方面等)、粘弹性性能、抗疲劳性、抗断裂性、剪切强度、抗压强度、抗张强度、流变性能(例如,在磨损条件下)和其他机械特性。
关于组成,主体110可以包含以下一种或多种:聚苯乙烯、聚苯乙烯-二乙烯基苯、聚甲基丙烯酸甲酯(PMMA)、二氧化硅、硅胶、无孔玻璃、多孔玻璃、镀膜玻璃、琼脂糖、丙烯酰胺、聚丙烯酰胺、铁、钢或陶瓷材料和/或一种或更多种合适材料的组合。如上文和下文所述,主体110的不同区可以包含不同的材料(例如,核心区可以包含第一材料,并且壳区可以包含第二材料)。在一些实施方案中,可以有作为多于一个壳区或者处于其他配置诸如无定形或有序空间排列的多于一个区。
主体110的特定实例包含聚丙烯酰胺(例如,如下文更详细的描述)、二氧化硅(例如,硅胶)、聚苯乙烯或PMMA,直径为15-25微米(例如,其中较小的直径允许以仍适合用于微流体结构中的方式轻微溶胀),具有80-1500A的表面孔隙率,聚合物珠的交联率在20%和80%之间(例如,由二乙烯基苯交联60%的聚苯乙烯或由二乙烯基苯交联80%的聚苯乙烯),具有表面基团(例如,胺基团、羟基基团、硅醇基团)用于偶联化学接头(如C18标签接头),以及聚乙二醇(PEG)功能化以用于反应效率。特定实例的变化形式可以具有磁性(例如,磁性、顺磁性)核心或壳,以允许磁性功能性(例如,用于分离和回收)。
2.2功能性分子
如图1所示,组合物100还包含一个或更多个分子120,分子120偶联到主体110并被构造成用于组合物100的功能化。在实施方案中,一个或更多个分子120中的每一个可包含以下中的一个或更多个:接头区130;聚合酶链式反应(PCR)区段140;条形码区150;独特分子标识符160;制备辅助区段170;活性区段180;和分子剪刀区190,其中各种区可以偶联在一起(例如,按顺序)以便向组合物提供功能性。一个或更多个分子120可以起到为不同的反应或过程提供所需的化学(例如,结合化学)的作用,并且在变化形式中,在一个或更多个分子中包含特定的寡核苷酸可使一个或更多个分子适于mRNA结合、CITE测序探针的结合、寡核苷酸标记的抗体、寡核苷酸标记的肽、寡核苷酸标记的脂质、寡核苷酸标记的代谢物、修饰的基因组DNA、未修饰的基因组DNA、DNA ATAC测序、Hi-C测序、切割-n-标签测序、桥式扩增、邻近连接、其他分子反应、其他蛋白加标签操作和/或其他反应。此外,一个或更多个分子可以通过包含用于各种测序平台(例如,下一代测序平台,IlluminaTM测序平台等)的区(例如,特异性衔接子、引物)而适于辅助文库制备操作。因此,一个或更多个分子120可以通过掺入特定的寡核苷酸区段来简化与测序或其他反应相关的手动或自动步骤。
在实施方案中,一个或更多个分子120可以包含遍及主体110分布的单个分子、一组相同分子或一组不同分子(例如,第一和第二分子、多于一个不同分子)。例如,在涉及mRNA捕获和cDNA合成的反应中,一个或更多个分子120可以包含具有第一序列和第二序列的寡核苷酸分子,第一序列用于mRNA结合,并且第二序列与互补cDNA链的产生相关。类似地,在涉及蛋白标签结合的反应中,一个或更多个分子可以包含具有第一序列的分子以及具有第二序列的分子,第一序列用于通过检测抗体被寡核苷酸标签的加标签来检测抗体结合,第二序列用于合成。在另一实施方案中,用于提供正向以及反向引物的不同分子组可以存在于一个或更多个分子120中,以允许桥式扩增以扩增来自最初结合到微球的单细胞的某些核酸片段。可以调整各种正向或反向引物的相对比例,使得在桥式扩增期间仅某些尺寸的cDNA被最大化(如,例如小于600个碱基对或大于300个碱基对的产物)。然而,一个或更多个分子120的序列可以适用于其他反应和过程,其变化形式在下文结合一个或更多个分子120的不同结构特征进行描述。结合基团也可以在120中以某些比例存在,以便酶在酶促反应期间被束缚在微球上,从而这些酶可以处理和产生mRNA的反应产物,使产物仅达到某些尺寸或防止产物超过某些碱基尺寸。可选地,结构特征可以排除某些酶(例如,核酸酶或限制性内切酶)或其他功能部分紧密靠近主体110,以便将保留分子的尺寸调整到所需的尺寸(例如,任何长于300bp的分子被消化到较小的尺寸)。
2.2.1分子—接头
如图1所示,主体110可以包含一组包含接头130的接头,其中接头130起到以为反应的发生提供足够数量的分子/位点的方式控制偶联到主体110的一个或更多个分子120的密度和间距的作用。该组接头还起到以防止主体表面处的分子折叠或以其他方式形成不希望的结构(例如,二级结构、三级结构等)的方式控制一个或更多个分子120的密度和间距的作用,或在其他实施方案中以促进这种结构的方式控制密度。
在实施方案中,该组接头中接头的数量被配置为大于每个被靶向用于结合反应的单细胞的靶分子的数量。在一种实例中,每个细胞的靶分子数目在50万至100万个分子或分子片段的数量级上;因此,在该实例中,该组接头可以包含107-1010个接头,用于在每个主体110定位107-1010个全长寡核苷酸,其中过量的全长寡核苷酸导致在反应期间捕获更多的mRNA(或其他分子)。然而,在其他实施方案中,该组接头可以包含其他数量的接头。
在实施方案中,接头130包含分支接头,分支接头被配置为在主体110的表面提供寡核苷酸分子的合适密度,并提供相邻寡核苷酸分子之间的合适的间距。在变化形式中,分支接头是树枝状大分子(例如,对称树枝状大分子、不对称树枝状大分子、双体(doubler)、三体(trebler)、标记的、非标记的等),其提供具有附接节点的分支。在一种变化形式中,树枝状大分子可以是Y形树枝状大分子,其包含源节点(例如,用于附接在主体110的区或主体110的近端)和两个末端节点(例如,用于附接到一个或更多个分子120的功能性寡核苷酸分子或用于附接到主体110远端的后续树枝状大分子)。在特定实例中,分支接头是对称的双体亚磷酰胺树枝状大分子;然而,特定实例的变化形式可以使用其他核心化学(例如,碳硅烷、硫醇化等)和结构。因此,在其他变化形式中,树枝状大分子可以具有任何其他合适数目的附接点、化学和/或结构,以提供寡核苷酸分子与主体110的间距和偶联位点。
此外,分支接头可以被配置为用于选择性附接(例如,具有对特定化学物质特异性的官能团)和/或选择性裂解(例如,用于在处理过程中释放寡核苷酸区段,诸如分子剪刀)。
如图3所示,可用作接头的树枝状大分子可以通过以下方式形成:从初始分支中心开始,将一组基础试剂(base reagent)偶联到初始分支中心,并且依次添加几代基础试剂,直到达到所需的树枝状大分子尺寸和末端分支的数量(例如,代数的指数)。基础试剂官能团的类型、代数和分子量可以产生与对应于寡核苷酸螺旋宽度(例如~2nm)的所需直径相对应的流体动力学直径,以便通过接头设计的方式来达到偶联到主体110的寡核苷酸分子的所需密度。然而,树枝状接头的最终直径(或其他特征尺寸)可以配置为匹配其他设计限制或以其他适当方式配置。
2.2.2分子—PCR区段
如图1所示,一个或更多个分子中的每一个还可以包含一个或更多个聚合酶链式反应(PCR)区段140,聚合酶链式反应(PCR)区段140被配置为用于进行PCR相关的反应(例如,扩增)。PCR区段可以包含用于进行PCR反应的PCR引物。如以上关于不同类型的核酸相关反应和蛋白相关反应所示(并在图4A至图4C中所示),用于一个或更多个分子120的不同序列的PCR引物可以彼此相同或不同。例如,在第一变化形式中,一个或更多个分子120的第一部分可以包含与反应的第一阶段(例如,mRNA结合、抗体结合、其他蛋白标签的结合等)相关的第一PCR引物区段141,并且一个或更多个分子120的第二部分可以包含与反应的第二阶段(例如,cDNA合成、其他合成、其他加标签、其他结合等)相关的第二PCR引物区段142。
在其他变化形式中,PCR区段140可以另外地或可选地包含PCR手柄区段143,该PCR手柄区段143是可检测的并被配置为用于组合物的质量控制。然而,一个或更多个分子120的变化形式可以另外地或可选地省略PCR手柄区段143。
在实施方案中,PCR区段140直接偶联到一组接头130中的一个接头的末端部分(或其他部分)。然而,在其他变化形式中,PCR区段可以以其他方式相对地与寡核苷酸分子的其他部分偶联。
在实施方案中,PCR区段140可以具有5-30个碱基,并且可以包含定制或非定制的引物;然而,在可选的变化形式中,PCR区段140可以具有其他合适数目的碱基。
2.2.3分子—条形码区和独特分子标识符(UMI)
如图1所示,一个或更多个分子120中的每一个都可以包含条形码区150,其功能是能够独特识别使用组合物100的一个或更多个分子120处理或衍生(例如合成)的生物材料(例如细胞材料)。条形码区150可以被配置为减少与检测信号和可用读段有关的噪声(例如,与将测序读段分配至正确条形码和减少浪费读段有关)。关于下文更详细描述的制备方法400,遍及偶联到特定主体110的所有分子的条形码区150的准确度(涉及使无意的缺失、取代或添加最小化)可以因此得到低的与假阳性有关的错误率(例如,信号与不正确条形码分子的匹配)。
如图1所示,条形码区150可以偶联到PCR区段140(例如,相对于主体110在PCR区段140的远端),或者可以可选地偶联到一个或更多个分子120的分子的其他部分。
条形码区150可以包含一个或更多个条形码区段,其中条形码区段的制备和组装将在下文第4节中更详细地描述。在一些变化形式中,条形码区段可包含用于组装的部分(例如手柄,诸如连接手柄或PCR延伸手柄),其可以可选地用作条形码的部分或独立于条形码区段使用。在变化形式中,每个条形码区段长度可以为2-20个核苷酸;然而,在替代的变化形式中,每个条形码区段可以具有其他合适的长度。优选地,每个条形码区段具有大于2的汉明距离(Hamming distance)(例如,使两串核酸相同所需的取代数);然而,在替代的变化形式中,条形码区段可以具有其他合适的汉明距离。此外,每个条形码区段可以被配置为不以GG(或不太适合于特定测序平台的其他序列)结束;然而,条形码区段可以以其他合适的方式配置。条形码区150可以由一个或更多个区段构建,以创建1百万-1亿个合适长度的独特条形码;然而,变化形式可以产生其他合适数量的独特条形码。在特定实例中,条形码区段选自一组875个(或更多)的7-mer,其具有2的汉明距离,不以GG碱基终止,其中序列是非天然存在的。在特定实例中,条形码区包含多于一个区段,当这些区段组装在一起时,创建5000万个独特条形码。然而,特定实例的变化形式可以以其他合适的方式配置。
如图1所示,一个或更多个分子120中的每一个可以包含独特分子标识符(UMI)160,其用作分子标签以允许测序平台(例如,下一代测序平台)鉴定被处理的输入分子。一个或更多个分子120中的每个分子可以具有单个UMI或多于一个UMI。此外,UMI 160可以偶联到条形码区150(例如,在条形码区150的远端),如图1所示,或者在沿着一个或更多个分子120的分子的其他位置。
2.2.4分子—制备辅助区段
如图1所示,一个或更多个分子120中的每一个可以任选地包含一个或更多个制备辅助区段170,其用于简化或以其他方式减少与某些操作相关的处理步骤。
在一种变化形式中,如图5所示,制备辅助区段170可以被配置为通过通常必须在单独步骤中(例如,原本以手动方式)实施的分子序列掺入来简化文库制备步骤。更详细地,一个或更多个分子120的分子可包含与P5衔接子(例如,用于IlluminaTM流动池)缔合的第一制备辅助区段170a,其中,在一些变化形式中,第一制备辅助区段170a包含部分P5衔接子和相关索引的序列。在变化形式中,第一制备辅助区段170a可以偶联到条形码区150(例如,靠近主体110,其他合适的区)。一个或更多个分子120的分子还可以包含与P7衔接子(例如,用于IlluminaTM平台和配置为用于cDNA合成)缔合的第二制备辅助区段170b,其可以在同一步骤期间或在逆转录过程中或其他单独步骤中添加,其中,在一些变化形式中,第二制备辅助区段170b包含随机引物的序列,该随机引物配置为随机结合到更靠近mRNA分子3’端的靶mRNA分子,并防止mRNA分子5’端的延伸。因此,在逆转录期间,cDNA链将终止于随机引物区段附近。然后连接酶将使随机引物与附接的辅助区段170b连接到cDNA链。随后用P7引物和P5引物进行扩增,将得到可测序的片段,而不需要在索引过程中进行片段化。这样的配置还将产生信号的指数放大,但仅产生噪声的线性放大,从而显著提高信噪比(SNR)。因此,制备辅助区段170a、170b的掺入可以将多于一个步骤缩减为单个步骤,并简化其他情况下必须进行的清洁过程(例如,在使用组合物100后所需产物将偶联到组合物的情况下)。
然而,在其他变化形式中,制备辅助区段170可以另外地或可选地包含配置成减少与操作(例如,用于特定平台、用于特定过程等)相关的步骤(例如,手动步骤)的其他序列。
2.2.5分子—活性区段
如图1所示,一个或更多个分子120中的每一个可以任选地包含活性区段180,其功能是使得能够进行所需过程(例如,结合相互作用以实现与核酸分子、蛋白相关的加标签或合成等)。
在变化形式中,如图6A所示,一个或更多个分子120的分子的活性区段180可以适用于mRNA结合,并且cDNA合成可以包括以下中的一种或更多种:用于mRNA结合的第一序列180a,诸如PolyT序列(例如,dTVN或TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN序列),其使得能够通过与PolyA相互作用来捕获mRNA种类;和用于与从捕获的mRNA合成的cDNA相互作用的第二序列180b(例如,用于与由逆转录酶添加到合成的cDNA的CCC区相互作用的rGrGrG基团,用于与由逆转录酶添加到合成的cDNA的其他区相互作用的其他基团,等)。在操作过程中,RT酶在cDNA合成过程中可以通过添加CCC序列(或其他序列)来终止,然后变性后去除模板mRNA,该cDNA序列可以与第二序列180b中含有GGG的基团(或其他互补基团)相互作用,其中第二序列在3’端被磷酸酯或其他合适的封闭基团(例如,C3间隔区,双脱氧核苷酸等)阻断延伸。除了CCC或GGG之外的特定序列可以掺入到附接到珠的寡核苷酸标签中以提供特定的分子相互作用功能,并且可以包含DNA碱基、RNA碱基或其他基团。如图6A所示,一个或更多个分子可以包含第一子集和第二子集,第一子集包含用于mRNA结合的第一序列(例如,具有序列180a)和,第二子集包含用于与cDNA相互作用的第二序列(例如,具有序列180b),使得合成的cDNA产物可以在组合物100的颗粒上捕获和纯化,而无需随后的纯化步骤;然而,在其他变化形式中,第一序列180a和第二序列180b可以替代地偶联到不同的颗粒。在其他变化形式中,第二序列可以不是3’封闭的,并且可以延伸到cDNA序列上,并与第一链序列形成互补序列。
在如图6A所示的另外的变化形式中,一个或更多个分子120的分子的活性区段180可以适用于将特定靶序列结合在mRNA、DNA或其他核酸靶上,并且合成可以包括以下中的一个或更多个:用于靶结合的第一序列180c,诸如TotalSeqC捕获序列(例如,TTTCTTATATGGG),其使得能够捕获附接到抗体的寡核苷酸标签或诸如靶向一个或几个mRNA种类、gDNA序列或其他序列的特定部分的其他靶结合寡核苷酸(例如,靶向引物);以及用于与从捕获的核酸合成的DNA(或cDNA)相互作用的第二序列180b。在操作过程中,RT酶在模板化cDNA合成后可以通过添加CCC序列(或其他序列)来终止,然后变性后去除模板mRNA,cDNA序列可以与第二序列180b中含有GGG的基团(或其他互补基团)相互作用,其中第二序列在3’端被磷酸酯或其他合适的封闭基团(例如,C3间隔区,双脱氧核苷酸等)阻断延伸。除了CCC或GGG之外的特定序列可以掺入到附接到珠的寡核苷酸标签中以提供特定的分子相互作用功能,并且可以包含DNA碱基、RNA碱基或其他基团。如图6A所示,一个或更多个分子可以包含第一子集和第二子集,第一子集包含用于靶向核酸结合的第一序列(例如,具有序列180c),第二子集包含用于核酸杂交的第二序列(例如,具有序列180b),第二序列具有通用(例如,rGrGrG)结合基序或其他特定靶向寡核苷酸序列,使得所得到的合成产物可以被捕获(例如在180c和180b的已知序列元件之间)并在组合物100的颗粒上纯化,而无需随后的纯化步骤;然而,在其他变化形式中,第一序列180c和第二序列180b可以替代地偶联到不同的颗粒。在其他变化形式中,第二序列不是3’封闭的,并且可以直接延伸到新合成的序列上,并与第一链序列形成互补序列。
在实施方案中,存在于如图6A中同一颗粒中的两种不同的寡核苷酸标签可以被配置为提供额外的优点。图6A中创建的链包含寡核苷酸加cDNA,然后继续作为第二链的互补序列,最终捕获CBC两次,其中第二链是反向互补序列。在这样的情况下,源自同一珠的多于一个条形码区是物理上连接的,提供了改进数据分析的手段(即,条形码区应该“匹配”)。但是,不匹配的条形码区指示错误(例如,如果条形码差异很大,则指示体外重组;如果差异仅为1-2个碱基,则指示其他错误)。因此,这允许人们鉴定和潜在地校正小错误,并从而具有将cDNA序列映射到正确的珠进而正确的细胞的改进的能力。更详细地,这样的配置提供第二点以提供一定程度的错误校正。此外,当条形码不充分匹配时,人们可以从分析中排除这些序列(或初步将它们分配到一个或其他条形码区)。另一个优点是,人们可以测量数据中这种类型的嵌合的比例,并且然后使用这些数据来校正可能无法直接测量的数据。例如,如果人们在相同的工作流中使用仅具有一个条形码区的珠作为具有多个条形码区的珠,则人们可以从用每个序列赋予两个条形码区的珠生成的数据推断一个条形码区情况的嵌合率。不需要两个条形码都相同才能匹配。如果条形码被构造成不同的,但关联是已知的,那么“匹配”的优点仍然是可能的。
在其他变化形式中,如图6B所示,一个或更多个分子120的分子的活性区段180可以适用于加蛋白标签和其他过程,可以包含以下中的一个或更多个:用于结合靶蛋白的抗体(或其他蛋白组分)的第三序列180c,诸如寡核苷酸-抗体结合区(例如,TotalSeqTM区),其能够结合来自裂解细胞的抗体(例如,表面抗体);以及用于与源自捕获蛋白的生成产物相互作用的第四序列180d(例如,用于与合成期间添加的CCC区相互作用的rGrGrG基团,用于与合成期间添加的其他区相互作用的其他基团,等等)。在操作过程中,RT酶可以通过在合成过程中添加CCC序列(或其他序列)来终止,然后合成的蛋白产物可以与第四序列180d的GGG基团(或其他互补基团)相互作用。如图6B所示,一个或更多个分子可以包含第一子集和第二子集,第一子集包含用于抗体结合的第一序列(例如,具有序列180c),第二子集包含用于与合成产物相互作用的第二序列(例如,具有序列180d),使得合成产物可以在组合物100的颗粒上被捕获和扩增,而无需随后的纯化步骤;然而,在其他变化形式中,第三序列180c和第四序列180d可以替代地偶联到不同的颗粒。注意,一些特定产物的纯化或增强是通过扩增特定寡核苷酸序列超过其他序列而实现的。
组合物可以另外地或可选地包含一个或更多个分子120中的其他活性区段,用于进行包括结合/其他相互作用的其他过程。
2.2.5.1可裂解接头
例如,如图6C-6E所示,活性区段180’中可以掺入一个或更多个可裂解的荧光团猝灭剂区,其可以起到实现根据发射的荧光信号确认寡核苷酸从主体的裂解的作用。如图6C(右上图)所示,组合物的一个或更多个分子可以包含偶联分子与主体110’的接头130’(如上所述);包含具有荧光团180a’和猝灭剂180b’的可裂解元件(例如,可裂解碱基或接头)的活性区180’;PCR手柄140’;条形码区150’;和具有捕获序列的独特分子标识符(UMI)160’。
在使用过程中,如图6C-6D所示,生物素化核苷酸可以在逆转录过程中掺入,其中在一些分子上生成互补的RNA/DNA杂交链,而一些分子可以不捕获任何靶寡核苷酸。然后,裂解信号(例如,反应环境温度变化到94℃,反应环境温度变化到用于热不稳定接头的其他适合温度)导致活性区180’的热不稳定接头的裂解,以及具有RNA/DNA杂交链的分子的互补RNA/DNA杂交链的释放。如图6D所示,在热不稳定碱基/接头分离后,释放猝灭剂180b,允许荧光团180a在激发时发出荧光。因此,由荧光团180a发射的荧光信号可以实现对寡核苷酸分子从主体110裂解的确认。
更详细地如图6D所示,加热导致反应环境中存在多个分子:1)具有生物素化核苷酸的包含条形码区150’和独特分子标识符160’的逆转录的寡核苷酸;2)裸露的/空的/未捕获的寡核苷酸序列;和3)RNA-DNA杂交互补链。然后,通过从反应环境中除去液相,组合液相与分离颗粒(例如,链霉亲和素磁珠,如通过引用并入的申请中所述)并随后分离(例如,通过磁力)允许分离逆转录寡核苷酸用于下游处理和第二链合成,以及文库制备,如2020年5月5日提交的美国申请第16/867,235号和2020年6月19日提交的美国申请第16/906,337号所述,其中每一项通过该此引用以其整体并入本文。
尽管描述了热不稳定机制,但活性区180’可以另外地或可选地包含其他可裂解机制,由此可以检测产物以确认裂解。例如,活性区180’可以另外地或可选地包含光可裂解区、化学可裂解区、酶可裂解区或通过其他适当机制可裂解的区。
此外,如上所述,可以实施荧光团180a’和猝灭剂180b’的反向定向,以便通过发射的荧光信号来监测裂解和/或捕获。
在相关的变化形式中,活性区180’可以替代地包含荧光团,其中荧光团既充当荧光团又充当猝灭剂。特别是,当珠上的荧光团的密度高到足以自我猝灭时,即使在不包含特定的猝灭剂分子时,珠上一些荧光团的去除也会导致总荧光的增加。因此,即使被监测的珠的数量和荧光团的数量保持不变,也可以通过荧光的增加(例如,来自珠的荧光或来自含有珠的孔的荧光和/或上清液中释放的荧光团)来监测裂解。
又可选地,在活性区180’的另一变化形式中,猝灭剂180b可以不是暗猝灭剂,而是在操作期间影响从反应中检测信号的其他荧光团(例如,FRET伴侣)。例如,活性区180可以掺入第一荧光团(例如,荧光素)和第二荧光团(例如,TAMRA),第一荧光团在配置成裂解后保留在主体110上的部分上,而第二荧光团(例如,TAMRA)配置成通过裂解释放,这将导致当距离很近时来自第一荧光团的荧光素信号猝灭,但当带有第二荧光团的寡核苷酸释放时信号增加。此外,来自第二荧光团的信号可以在裂解和未裂解两种配置中进行监测。
在图6E所示的一种替代配置中,组合物可以配置为用于珠的直接定量(例如,通过全长和裂解的分子二者定量)。更详细地,组合物的一个或更多个分子可以包含将分子偶联到主体110”的接头130”(如上所述);包含带有第一荧光团180a”(例如荧光素、Cy3等)和第二荧光团180b”(例如TAMRA、Cy5、Cy7)的可裂解元件的活性区180”,以及根据特定用途所需配置的另外的元件,例如PCR手柄140”、条形码区150”和具有捕获序列的独特分子标识符(UMI)160”。这样的配置可用于直接定量组合物裂解后的裂解部分,其中组合物组分可以使用不同的波长方案可视化(例如,通过荧光显微术,通过荧光读取设备),以交替地检测未裂解的元件(其中FRET伴侣保持紧密接近)和裂解的元件(其中FRET伴侣分开并且不再相互作用),或者优选地仅检测两种中的一种。相同或类似的组合物可用于定量而无需可视化(例如,对于保存期限测试)。此外,这样的组合物可以与包含水凝胶的主体110一起使用,其中用于主体110的水凝胶材料是半透明的并且不自发荧光。
然而,可以设想其他配置或所描述的配置的组合。
2.2.6分子—分子剪刀
如图1和图7所示,一个或更多个分子的分子变化形式可以另外地或可选地包含一个或更多个任选的分子剪刀区190,其作用是使得能够将产物或其他靶分子从一个或更多个分子120受控地裂解(例如,在生物材料处理期间的某一点上,合成后、反应后、产物生成后等)。关于所描述的实施方案、变化形式和实例,分子剪刀广泛地不仅包括来自NEB的特定USER酶掺合物,还包含限制性内切酶、锌指核酸酶、TALEN、适配体、转座酶、RNA酶H、CRISPR酶和其他具有识别特定寡核苷酸(例如,天然或非天然)序列并在序列的特定位置切割的能力的分子。在变化形式中,分子剪刀可以是单链或双链的。在变化形式中,分子剪刀区190优选地沿着寡核苷酸分子定位在裂解不会损坏所需产物或使所需产物不可用的区(例如,紧邻接头的远端)。然而,分子剪刀区190可以可选地以其他合适的方式定位。图7(上图)描绘了一种实例,其中组合物的单元包含沿着用于mRNA捕获的第一寡核苷酸分子紧邻第一接头130a的远端定位的第一分子剪刀区190a,以及沿着用于捕获合成的cDNA产物的第二寡核苷酸分子紧邻第二接头130b的远端定位的第二分子剪刀区190b。该实例允许mRNA捕获寡核苷酸从cDNA靶向寡核苷酸的单独受控裂解。图7(中图)描绘了一种实例,其中组合物的单元包含沿着用于mRNA捕获的第一寡核苷酸分子紧邻第一接头130a的远端定位的第一分子剪刀区190a,和用于捕获合成的cDNA产物的第二寡核苷酸分子。该实例允许mRNA捕获寡核苷酸的受控裂解。图7(下图)描绘了一种实例,其中组合物的单元包含沿着用于mRNA捕获的第一寡核苷酸分子紧邻第一接头130a的远端定位的第一分子剪刀区190a,以及沿着用于捕获合成的cDNA产物的第二寡核苷酸分子紧邻第二接头130b的远端定位的第一分子剪刀区190a的另一实例。该实例允许mRNA捕获寡核苷酸和cDNA靶向寡核苷酸的同时裂解。
关于mRNA结合-cDNA合成反应,分子剪刀可以被配置为用于在变性前或变性后裂解产物以去除mRNA。因此,分子剪刀区190可用于去除mRNA-cDNA产物、靶mRNA和/或合成的cDNA产物(不含mRNA)两者。
在一种示例性实施方案中,可以实施双链特异性分子剪刀,使得只有在聚合酶延伸或逆转录或类似过程完成第二链后,链才会被释放。以此方式,未反应的产物可以被洗去,并且然后完成的产物可以选择性地释放和回收,而不会从一个或更多个分子120或组合物100的其他部分产生背景污染。在图7所示组合物的替代变化形式中,提供上述功能的底部分子可以省略。在另一变化形式中,具有作为活性部分的引物的分子可以提供所需的功能。
此外,在替代实施方案中,一个或更多个分子120和/或组合物100的其他部分可以包含设计成用于使用其他机制(例如,光裂解、热裂解、化学裂解等)对寡核苷酸序列和/或其他产物进行受控裂解的区。
2.2.7组合物变化形式—偶联到基底的功能分子
如图8A-8C所示,组合物的变化形式可以被配置为将一个或更多个分子120附接到用于捕获和/或处理靶材料(例如,来自单细胞)的基底110b(例如,作为室壁、覆盖室的盖子、突出到室中的突起等)。组合物和方法的变化形式还可以适用于2019年8月27日授权的美国专利第10,3891,492号中描述的方法和组合物,该专利通过此引用以其整体并入本文。
更详细地,如图8A和图8B所示,颗粒组合物可以被配置为将功能化的寡核苷酸分子递送到基底110b(例如,反应室的壁),其中偶联到颗粒主体的分子包含被配置为将寡核苷酸附接到基底的表面涂层191上的反应基团6(例如,在末端)。在非限制性实例中,表面涂层可以包含丙烯酰胺或类似化合物,并且附接到寡核苷酸的功能性接头可以包含acrydite修饰。因此,将寡核苷酸附接到孔表面可包括使多于一个丙烯酰胺和acrydite分子聚合。在一些实施方案中,丙烯酰胺聚合物可以包含交联剂(例如,双丙烯酰胺)或可逆交联剂(例如,[双(丙烯酰基)胱胺],BAC)。在一些实施方案中,聚合物基质可以以使得寡核苷酸通过共价键直接附接到孔壁上的方式聚合。在其他实施方案中,附接可以是间接的。例如,在一种实施方案中,寡核苷酸可以通过掺入到基质中来附接而不是直接附接到壁表面。在这种配置中,由于与BAC的聚合而产生的交联是完整的,并且寡核苷酸保持功能性地附接到壁上,但是当BAC减少时,交联是不稳定的,并且多于一个寡核苷酸随后从表面释放到溶液中。对于图8A所示的配置,以及在图8B-8M所示的后续配置中,可以实施其他示例性表面涂层化学和/或功能性接头化学。
如图8B所示,链的反应基团6可以通过与主体110共价附接的杂交寡核苷酸与互补链7配对,并且从主体110释放带有反应基团6的链可以为其附接到基底110b做好准备。关于使用附接到颗粒的寡核苷酸的互补序列将全长寡核苷酸从图8A和图8B所示的主体110(例如,颗粒110)转移到孔表面,该互补序列可以使用在5’端具有反应部分的引物构建(例如,在孔外,在孔内)(例如,可以在多于一个主体/珠上批量进行),其中将珠添加到孔中,随后变性以释放互补寡核苷酸并将这些寡核苷酸结合到孔。生物素/链霉亲和素的应用可以通过多轮变性(例如从1轮到5轮)提供所需的结合结果,使得在第一轮中重新退火的寡核苷酸可以在随后的轮中脱落并与基底110b表面的可用链霉亲和素结合。
如图8C所示,可以将用于附接的全长寡核苷酸以液滴8的形式递送到孔9中,并将寡核苷酸从液滴中释放以用于附接到基底110b(即,孔表面)。液滴可以是空气中的液体(例如,由液体处理子系统递送),或者由各种材料结合(例如,诸如在乳液中,诸如由油结合的含有或不含表面活性剂或其他材料的水性溶液等)。液滴可以是完全液体,或者可以可选地包含水凝胶。对于油包水液滴,可以通过添加去污剂或破坏乳液的化学物质来释放寡核苷酸。一种非限制性实例是由油结合的水性液滴,其在较低温度形成固体(例如,蜡)结构,但在正常生物温度恢复为流体。
可选地,图8D-8M描绘了用于在基底110b的表面偶联和/或构建全长寡核苷酸的附接过程的变化形式。
在第一变化形式中,如图8D所示,共同残端(stub)寡核苷酸可以在溶液中提供并附接到基底110b(例如,壁表面),并且然后使用合适的方法(例如,使用颗粒、珠、液滴等)从基底110b构建出来以产生全长寡核苷酸。
图8E描绘了从基底110b的表面顺序构建的一种这样的变化形式,其中初始残端寡核苷酸如前面所述附接到孔内的表面,在孔内递送另外的寡核苷酸区段或模板(例如,在颗粒上)以将附接的寡核苷酸延伸到全长功能性寡核苷酸。
图8F描绘了附接的寡核苷酸可以藉以延伸的机制。更详细地,附接到孔内表面的初始残端寡核苷酸可以通过颗粒上另外的寡核苷酸区段的递送来延伸,其中从颗粒上裂解(例如,通过化学手段、热手段、光裂解手段等)这些另外的寡核苷酸区段,并随后将裂解的寡核苷酸区段连接到孔表面的残端寡核苷酸的功能性接头。
图8G描绘了图8F所示机制的第一变化形式,其中最初偶联到颗粒的另外的寡核苷酸区段包含反应基团,该反应基团被配置为在通过变性从颗粒裂解时附接到相应的功能性接头。在实例中,反应基团可以包含用于连接的5’磷酸,但可以可替代地包含用于点击化学的炔烃或叠氮化物,或还可以替代地包含其他反应基团(例如氨基甲酸酯等)。根据图8G,可以根据反应基团/功能性接头化学的类型,将反应基团/功能性接头定位在5’或3’取向(例如,配置成与功能性接头上的5’磷酸反应的3’OH)。此外,寡核苷酸可以是单链或双链的,其中带有反应基团的双链寡核苷酸的实例如图8H所示。
图8I描绘了图8G和图8H所示机制的替代变化形式,由此将寡核苷酸偶联到颗粒的可裂解部分的裂解产生反应基团,该反应基团随后附接到孔表面的功能性接头。同样,如图8I所示,5’和3’取向没有被特别地调用。在一种非限制性实例中,反应基团可以是裂解后生成的5’磷酸,其中5’磷酸与附接到孔表面的寡核苷酸3’端的功能性接头反应。在一种这样的实例中,颗粒上的寡核苷酸可以构建为其5’端附接到颗粒,并包含dU残基或无碱基位点,dU残基或无碱基位点通过用尿嘧啶DNA糖苷酶处理来裂解,随后通过裂解酶(例如,内切核酸酶III、内切核酸酶VIII)处理裂解主链,产生5’磷酸。然后将裂解产物准备连接到可用的3’OH(例如,附接到壁表面的寡核苷酸3’端的3’OH)。在操作中,与功能性接头的附接可以实施夹板(implement a splint)以辅助连接。在变化形式中,功能性接头可以被配置为部分双链构建体以用作夹板,颗粒上的寡核苷酸可以是在两条链上切割的双链产物(例如,通过两个dU碱基偏移)以产生所需的单链突出端,或者可以单独添加另外的寡核苷酸以用作夹板。
图8J描绘了图8G-8I所示机制的替代变化形式,其中将寡核苷酸偶联到颗粒的可裂解部分的裂解将寡核苷酸从颗粒释放,用于与功能性接头的3’端退火,然后使用聚合酶进行延伸。在图8J(右下图)所示的变化形式中,当颗粒的几何形状、变形性或功能性接头的密度良好,使得不必从颗粒释放寡核苷酸时,寡核苷酸可以保持附接到颗粒。
图8K描绘了图8G-8J所示机制的替代变化形式,其中单链寡核苷酸从颗粒释放,随后与孔表面的功能性接头的3’端退火,以使用聚合酶进行延伸。在图8K(右下图)所示的变化形式中,当颗粒的几何形状、变形性或功能性接头的密度良好,使得不必从颗粒释放寡核苷酸时,寡核苷酸可以保持附接到颗粒。
图8L描绘了图8G-8K所示机制的替代变化形式,其中构建了颗粒上的寡核苷酸的互补序列,并且互补序列用作模板,以在孔表面延伸功能性接头。更详细地,互补序列可以通过在颗粒寡核苷酸处使引物退火并延伸以形成互补序列来构建,然后变性以从颗粒释放互补序列。然后,可以延伸功能性接头以在孔表面生成全长寡核苷酸。
图8M描绘了另外的寡核苷酸区段可以藉以添加到偶联到孔表面的功能性接头的一种示例性机制。更详细地,可以通过从颗粒顺序地裂解寡核苷酸区段并将其附接到寡核苷酸的运行构建体(running build),从而将1至n个另外的区段附接到孔表面的该运行构建体。关于图8M的方法,前面的任何一种附接方法都可以连续使用、单独使用或组合使用。例如,每个寡核苷酸区段可以通过点击化学连接或附接,每个寡核苷酸区段可以通过与模板杂交后进行延伸来添加,或者一些寡核苷酸区段可以通过延伸来添加,而其他寡核苷酸区段可以通过连接来添加。
然而,图8A-8M中所示的方法和配置可以包含其他步骤或元件,其中一些步骤或元件将在下面的部分中更详细地描述。
3.组合物的特定实例—ATAC测序,分子剪刀,限制性位点
如图9A和图9B所示,一个或更多个分子120的分子的变化形式可以被配置为用于使用测序进行的转座酶可及性染色质测定(ATAC-seq),以便评估与基因组相关的染色质可及性(例如,用于表观基因组分析)。如图9A所示,组合物200的实例可以包含主体210、偶联到主体的接头230、偶联到接头的第一分子剪刀区290、偶联到第一分子剪刀区290的PCR引物240、偶联到PCR引物240的条形码区250、偶联到PCR引物240的UMI 260、以及偶联到UMI260的活性区段280,活性区段280包含与用于ATAC-seq的转座酶衔接子(例如,Tn5转座酶1、Tn5转座酶2)互补的序列。该配置被配置为用于完成初始延伸反应,其中另一转座酶衔接子用于与第一转座酶衔接子相关的插入事件的下游PCR富集。
如图9B所示,这样的组合物200可以被配置为关于染色质区段切割DNA序列,通过在每个片段的每一端添加衔接子(和连接到转座酶衔接子的条形码)进行延伸,然后进行扩增和测序。
图9A所示实例的变化形式可以以其他合适的方式配置。例如,在第二配置中,一个或更多个分子可以包括包含以下的一个或更多个分子:偶联到主体的接头230、偶联到接头的第一分子剪刀区290、偶联到第一分子剪刀区290的PCR引物240、偶联到PCR引物240的条形码区250、偶联到PCR引物240的UMI 260、以及偶联到UMI 260的包含第一转座酶衔接子(例如,Tn5转座酶1)的活性区段280;以及包含以下的第二一个或更多个分子:偶联到主体的接头230、偶联到接头的第一分子剪刀区290、偶联到第一分子剪刀区290的PCR引物240、偶联到PCR引物240的条形码区250、偶联到PCR引物240的UMI 260、以及偶联到UMI 260的包含第二转座酶衔接子(例如,Tn5转座酶2)的活性区段280。该配置被配置为在组合物200的同一颗粒上进行延伸和PCR富集。
在图9C所示的替代变化形式中,组合物200’可以被配置为包含可裂解元件235’和290’,其可用于受控地从主体释放寡核苷酸。更详细地,限制性内切酶可以用来特异性地裂解DNA,但需要双链区段才能切割;然而,本文描述的方法通常利用单链核酸。因此,为了使用限制性内切酶,通常需要向单链分子添加第二核酸以形成用于靶向裂解的双链元件。该过程可能会产生困难,并可能导致不完全裂解。组合物200’可以被配置为编码至少一个裂解位点,其中一个或更多个分子可以包含偶联到主体的接头230’(例如,长的柔性接头,诸如为弯曲提供长度和柔性的间隔区18(HEG)序列)、编码限制性位点290’的单链序列(例如,II型限制性内切核酸酶、I型限制性内切核酸酶、IIG型限制性内切核酸酶、IIP型限制性内切核酸酶、IIS型限制性内切核酸酶、III型限制性内切核酸酶;IV型限制性内切核酸酶),和任选地修饰编码区235’(例如,内部脱氧尿苷修饰编码),正向引物240a’,反向引物结合位点240b’和任选的荧光探针靶295’(例如(FAM)标记的5’核酸酶探针,其他探针)。在图9C所示的变化形式中,寡核苷酸分子被描绘为指向远离主体表面的线性链,并且其中限制性内切核酸酶需要反向平行取向的dsDNA。此外,寡核苷酸分子可以采用各种构象,这些构象允许彼此接近的寡核苷酸(例如,组合物200’的第一分子和组合物200’的第二分子)在限制性内切酶识别序列的区内至少瞬时地形成反向平行的双链结构,从而形成完整的限制性位点,尽管除了回文限制性位点序列之外缺乏明显的同源性。因此,在使用限制性位点290’裂解后,可以使用各种测定(例如,通过qPCR)对溶液中的寡核苷酸进行检测、取样和定量。在特定实例中,限制性位点290’包含来自解淀粉芽孢杆菌(Bacillus amyloliquefaciens)的BamHI II型限制性内切核酸酶,其中该内切核酸酶具有识别短序列(例如,6bp)的核酸并在靶位点裂解它们的能力。然而,其他限制性内切核酸酶可如上所述使用。
在根据实例的实验期间,表面上(ostensibly)带有单链寡核苷酸的未经处理的珠显示出通过BamHI裂解释放的分子数量最多(例如,与其中通过反向引物杂交和聚合酶延伸产生的双链产物的处理相比,约两倍的数量),而带有ssDNA并在限制性消化前不久用氢氧化钠变性的珠显示出较低的裂解,表明裂解依赖于双链状态,并且需要时间来重新退火。
在这些变化形式中,分子通过不同寡核苷酸链之间的瞬时杂交形成正确的双链基序(即它们在单链中不形成发夹或其他二级结构)。此外,在相应分子链的其余部分中没有能完成限制性位点的序列,表明需要分子间相互作用。此外,BamHI限制性位点的使用不仅是回文性的,而且富含GC以促进裂解;然而,可以使用其他限制位点,尽管裂解效率可能不同。更详细地,ssDNA可以仅用少数碱基形成环结构,并且通常可以呈“随机卷曲”构型,但接头区230’的接头长度和柔性在使寡核苷酸对匹配以实现靶向裂解方面发挥作用。此外,在这些实施方案中,不要求两条链在每次裂解之前都附接。例如,由于限制性内切核酸酶BamHI藉以切割的方式,Bam HI的两条链将被裂解成相同的产物,但缺少碱基不会完全抑制裂解;因此,一条裂解的寡核苷酸可以与未裂解的寡核苷酸杂交,并在先前未裂解的链中诱导第二次切割(例如,切口(nick)),而不需要添加外源互补链。因此,与主体偶联的寡核苷酸的密度对反应速率起作用,但对于实现裂解不是严格需要的。
图9D中示出了可裂解接头的另一特定实例,其中可裂解接头区230”可以用于受控地从主体释放寡核苷酸。图9D所示的组合物将序列特征231”构建到寡核苷酸中,其中序列特征形成发夹结构,该发夹结构将至少瞬时地生成包含限制性内切酶识别/切割位点的双链元件(例如,Pac I限制性位点)。因此,形成临时双链元件用于分子内方式的靶裂解,从而使得能够释放相应的寡核苷酸链。
然而,分子的区段可以另外地或可选地包含如所述的其他合适区段,和/或以其他合适的方式偶联到主体210。作为非限制性实例,图9C和图9E的限制位点290’和图9D的可裂解接头元件可用于为本文描述的其他组合物提供受控裂解元件(例如,作为图1中描绘的组合物100的分子剪刀部分190、构建体200的分子剪刀部分290、图6C所示的或在其中可裂解元件被指示或有益的其他组合物中的可裂解接头元件)。
在一种实例中,组合物200的实施方案可以以用于单细胞ATAC测序的方法300实施,其中,如图10所示,方法300包括:在微流体基底的捕获区以单细胞形式捕获一组靶细胞S310;在捕获区裂解该组靶细胞以去除细胞质,同时保留该组靶细胞的细胞核S320;将组合物200的单元与单细胞核共捕获S330;使单细胞核和组合物发生转座反应,从而产生片段化的DNA S340;使用第一转座酶衔接子进行延伸操作S350;通过分子剪刀区从组合物的主体裂解包含条形码区和UMI的组合物的部分S360;通过延伸操作将第二转座酶衔接子添加到片段化的DNA S370;以及对片段化和经处理的DNA进行扩增反应S380。
方法300的变化形式还可以包括文库清洁和下一代测序加载步骤。
然而,方法300的变化形式可以以其他合适方式来实现(例如,使用其他捕获和处理平台等)。
4.制备
如图11所示,用于生成组合物的方法400包括:提供主体作为基础基底S410;将一组接头偶联到主体S420;以及通过分阶段/顺序附接操作将一个或更多个分子偶联到该组接头S430。在实施方案中,可以利用各种分子生物学反应(例如,连接或聚合酶延伸)或化学合成方法(例如,点击化学)来制备长的(长度>50bp)寡核苷酸分子,以得到最小错误率(例如,具有小于5%的错误,具有小于1%的错误,具有小于0.5%的错误)的非常符合定义的序列(very well defined sequences)。在一些实例中,这些可以包括模板化反应,其中用于定义序列的模板未直接掺入到最终产物中。在其他实例中,反应可以未模板化或以模板确实被掺入的方式进行。寡核苷酸可以由组分单体单元或通过添加部分或完整序列来构建。在一些实例中,所添加的单元可以是部分单链或完整单链的。在其他实施方案中,所添加的单元是部分双链或完整双链的。在一些实施方案中,所添加的单元主要是双链的,但两条中只有一条链共价连接到主体和/或接头。在一些实施方案中,所添加的模板链和/或单元在用于附接之前经历纯化或质量控制检查,从而通过减少个体单元中存在的错误,使最终产物具有减少的错误率。在一些情况下,个体单元的制备方法可以固有地确保减少的错误率(例如,通过使用短的寡核苷酸单元)。在图10的一些实施方案和变化形式中,从第二步到最后一步(例如,将一组接头偶联到主体S420)可以是任选的。例如,在步骤S430中,可以潜在地将接头附接到该组中的每个分子。
根据上文第1节中描述的一个或更多个益处,方法400用于有效地创建允许从样品处理、分离和回收靶材料的组合物。方法400可以以阶段附接的方式生产具有复杂寡核苷酸结构的组合物,这减少了与逐碱基的寡核苷酸附接方法(例如,基于亚磷酰胺的寡核苷酸合成)相关的复合错误。方法400还可以通过包含专用于测序平台的分子衔接子(例如,IlluminaTM衔接子等)来生产提供文库制备过程简化的组合物。因此,方法400可以用于以可缩放的方式制备功能化的颗粒,并且以提供质量控制和提高可回收产物的量的方式制备功能化的颗粒。
在实施方案中,方法400可以生产上述组合物100和200的实施方案、变化形式和实例。然而,方法300的部分可以适用于生产其他相关组合物。
框S410叙述:提供作为基础基底的主体,其功能是提供用于附接专用于各种过程的功能性分子的基础基底。如上所述,基底可以被提供为连续的主体,或者可以可选地被提供为较小主体的团簇。以连续或团簇的形式,框S410可以包括官能团(例如,胺、羟基基团、硅醇基团等)与主体的偶联,以便辅助随后接头分子与主体表面的附接。
在替代变化形式中,如上所述,框S410可以包括聚集一组较小主体以形成主体。在第一变化形式中,如图12B所示,框S410可以包括使用微流体通道产生未聚合和/或未交联材料的液滴S414,由此材料以液滴状态进行聚合和/或交联以形成一组较小主体。根据框S414,材料可以以所需速率流动通过微流体通道并通过具有所需形态的开口进入介质(例如油等)中以产生所需尺寸的液滴。然后聚合可以通过化学或其他手段来实现。类似地,交联可以使用以下方法中的一种或多种来实现:光激活方法、化学方法、热诱导方法和/或任何其他合适的方法。
在另一替代变化形式中,如图12C所示,框S410可以包括将一组较小主体遍及基底的一组孔分布在预聚合的水性溶液中S415,在该组孔上有流体水性层。然后,框S410可以包括用分离层(例如,低密度油层,诸如硅油)替换流体水性层S416,以分离该组孔内的较小主体团簇。然后,框S410可以包括将基底倒置S417或以其他方式将较小主体的团簇从该组孔中取出(例如,利用离心力,利用其他施加的力),其中流体分离层内的表面张力促成分离流体内的该组团簇中的每一个的球形形态。框S310的变化形式还可以包括较小主体团簇的聚合和/或交联S318(例如,在流体分离层内、流体分离层外的其他区域)。在变化形式中,框S416可以包括该组较小主体的团簇中的每一个的光聚合(例如,用UV光、用其他波长的光等)或化学聚合。框S316可以另外地或可选地包括交联(例如,通过辐照交联、化学交联、基于热的交联、氧化交联等)。
然而,框S410的其他变化形式可以包括用于形成一组具有适当表面化学(和/或核心材料特征,诸如磁性)的较小主体团簇的另外或替代的步骤,以便提供用于寡核苷酸功能化的基底。
在第一变化形式中,框S410可以包括生成呈珠形式的基础基底,其中珠由在受控环境中溶解的聚合物组成。在特定实例中,珠可以由聚丙烯酰胺材料组成,聚丙烯酰胺材料由丙烯酰胺溶液(例如,40%v/v丙烯酰胺,其他百分比的丙烯酰胺),双(丙烯酰基)胱胺(例如0.8%w/v的BAC,其他百分比的BAC,去离子水,和缓冲液(例如,包含Tris-HCL、NaCl、KCl、EDTA、Triton X-100和水的缓冲液,其他合适的缓冲液等)处理获得,其中聚丙烯酰胺珠被配置为在低氧条件下(例如,在氩气下)与过硫酸铵(例如,10%APS,其他百分比的APS)和四甲基乙二胺(TEMED)聚合,并且以后在存在还原剂诸如二硫苏糖醇(DTT)的情况下溶解。
在该变化形式中,如图12A所示,根据框S410产生珠包括:将材料成分与引发剂传输到第一微流体路径中S411;在将S411所得材料泵送(例如,用加压气体泵)通过第二微流体路径(例如,终止于500ul收集体积的14um聚焦通道)时,在收集期间将TEMED提供至油相,用所得材料产生一组液滴S412;以及基于微流体通道特征、用于将材料成分泵送通过微流体路径的气体组成(例如氩气、其他气体)来控制该组液滴的液滴尺寸S413。在S410-S413的特定实例中,具有压力和流量控制的加压泵(例如,用加压氩气来加压并从泵室中去除空气,以便水凝胶聚合)偶联到包含第一流体路径的第一微流体芯片和包含第二流体路径的第二微流体芯片,其中形成的液滴的质量和尺寸使用安装到用流动控制中心控制的显微镜上的X-Y台和高速照相机来监测。在该实例中,用包含Tris-HCL、NaCl、KCl、EDTA、Triton X-100和水的缓冲液洗涤形成的聚丙烯酰胺液滴,并将其置于Tris Tween-20的储存溶液中,其中形成的液滴的具有22.75um的平均直径(例如,在水性溶液中溶胀),标准差为1.62um。在该实例中,液滴在0.1M DTT中以1:1的体积比在30秒内可溶解。
在与图12A相关的实例的变化形式中,通过减少丙烯酰胺的量并添加加丙烯酰胺标签的(例如,acrydite修饰的)寡核苷酸来调整聚丙烯酰胺珠的配方,以提供每个珠约109个寡核苷酸。在一些变化形式中,寡核苷酸被进一步修饰(例如,用荧光团或其他修饰)用于加荧光标签和检测应用。更详细地,珠可以包含聚丙烯酰胺材料,聚丙烯酰胺材料由丙烯酰胺溶液(例如,40%v/v丙烯酰胺,其他百分比的丙烯酰胺)、双(丙烯酰基)胱胺(例如0.8%w/v的BAC,其他百分比的BAC,去离子水,acrydite化寡核苷酸(例如,具有第一末端近端的acrydite化位点和第二末端近端的FAM位点的250uM的acrydite化荧光素酰亚胺(FAM)寡核苷酸)、过硫酸铵溶液(例如,10%w/v的APS、其他百分比的APS)和缓冲液(例如,包含Tris-HCL、NaCl、KCl、EDTA、Triton X-100和水的缓冲液,其他合适的缓冲液等)处理获得,其中加FAM标签的聚丙烯酰胺珠被配置为与四甲基乙二胺(TEMED)聚合并溶解于二硫苏糖醇(DTT)溶液中。在加荧光标签的珠的实例中,形成的液滴具有20.39um的平均直径(例如,在水性溶液中溶胀),标准差为1.25um。在实例中,液滴在0.1M DTT中以1:1体积比可溶解(例如,通过在0秒、30秒、90秒和5分钟成像),其中荧光信号指示溶解过程。在该非限制性实例中,DTT破坏由于BAC元件而存在的二硫键交联,从而从球形珠释放较小主体(例如,聚丙烯酰胺连接的寡核苷酸)。较小主体具有可以容易地通过溶液扩散的尺寸。然而,也可以实施该非限制性实例的变化形式。
框S420叙述:将一组接头偶联到主体,接头作用是控制偶联到主体的一组寡核苷酸分子的间距和密度,以产生组合物的功能化。在实施方案中,接头可以是上述接头130的实施方案、变化形式或实例;然而,接头可以是其他合适的接头。
在包括不对称接头的变化形式(例如,具有不同长度的分支的接头或长度相似但具有不同官能团或保护基团的接头)中,框S420可以包括在用第二保护基团保护第二分支的同时从不对称接头的第一分支构建第一寡核苷酸区段,以及在用第一保护基团保护第一分支的同时从不对称接头的第二分支单独构建第二寡核苷酸区段S425。然而,框S425的变化形式可以被配置为不使用接头或通过将已经合成的寡核苷酸偶联到组合物的附接位点而操作。
框S430叙述:通过阶段/顺序附接操作将一个或更多个分子偶联到该组接头,这起到减少与寡核苷酸链的典型化学合成相关的复合错误和批次间可变性的作用。更详细地,框S430的功能在于提供一种方法,该方法包括较少的添加事件以产生较少的复合错误,以便相对于可用全长产物的量(例如,超过97%可用产物)产生更高准确度的寡核苷酸分子、对分子设计的更多控制和更高的合成效率。在一些实施方案中,它还用于将不完整产物限制在大于单个基底的离散单元中,这提供了可以防止部分产物参与下游工作流程的优点,并且便于数据分析,该数据分析可以将制备错误与下游过程的人工伪迹(artefact)区分开来,这可以改进后续的数据分析。
如图13所示,在变化形式中,框S430可以包括产生配置为用于上述反应的所需寡核苷酸分子的一组子区段(例如,并行、串联)S431。然后,框S430可以包括以减少的错误将该组子区段组装成作为全长产物的所需寡核苷酸分子S432。在一些变化形式中,框S430可以包括该组子区段的纯化单元S433,以便进一步减少组装中的错误,其中纯化可以包括完全纯化过程和/或脱盐步骤。另外或可选地,一些变化形式可以包括在组装所需的寡核苷酸分子之后的纯化相关步骤;然而,方法S430的一些变化形式可以省略与框S433相关的纯化步骤。在变化形式中,框S430的阶段附接方法包括生成长度为5-30个碱基的子区段,然后将其组装;然而,在替代的变化形式中,框S430的阶段附接方法可以包括生成其他合适长度的子区段。
关于上文描述的条形码区段或其他区段,如图14所示,框S430的特定实例可以包括生成条形码区段(例如,长度约20个碱基的区段),其中,如图14所示,条形码区段选自具有96-384种形式的条形码序列的组。然而,可以用合适长度的非天然存在的序列来生成其他合适数量的条形码序列形式。
在特定实例中,可以生成具有独特突出端(例如,具有相关标识符)的条形码序列的3种区段,其中突出端可以用于辅助寡核苷酸分子以所需顺序正确组装。例如,如图15所示,第一条形码序列435可以包含用于与第二条形码序列436偶联的突出端,第二条形码序列436具有用于与第三条形码序列偶联的突出端,并且独特分子标识符437具有用于与活性基团438(例如,寡核苷酸TVN、TS GGG、TotalSeq C等)偶联的突出端。组装的条形码区段可以偶联到前体分子(例如,偶联到引物的接头),该前体分子偶联到框S410中提供的主体,或者以其他方式偶联到前体分子。
关于特定实例更详细地,组合物的前体可以用与接头(例如,C18接头)偶联的主体(例如,珠)来构建,该接头偶联到包含引物结合位点(例如,TSO引物)后接一组碱基(例如,8个胸腺嘧啶碱基)的寡核苷酸。然后,在第一条形码区段的每一侧具有突出端的第一条形码区段可以被预杂交,并且然后通过适当的连接酶偶联到组合物的前体。随后的具有突出端的条形码区段可以偶联到条形码区的运行构建体,直到达到所需的条形码区长度。对于条形码区段组装的每个步骤,包含检测部分(例如,荧光团区段)的互补区段可以作为标签被加到正在添加的当前区段上,其中对检测部分的检测(例如,通过光学检测方法)可以用于在阶段附接的每个步骤中的质量控制。然而,在阶段附接方法的每个阶段的质量控制可以以其他合适的方式进行或省略。
框S430的其他替代变化形式可以包括进行配置为核苷酸的单碱基添加以形成寡核苷酸产物的合成操作。在替代变化形式的特定实例中,化学合成包括将核苷酸碱基逐碱基添加到接头(例如,C18接头)以产生全长产物。此外,方法400的变化形式可以包括杂交方法,由此通过逐碱基合成形成寡核苷酸分子的一部分(例如,接头和引物区段),并且寡核苷酸分子的剩余部分通过包括组装寡核苷酸的较短的子区段的阶段附接方法形成。
方法400可以另外地或可选地包括其他合适的步骤。例如,方法400的变化形式可以包括与制备、规模放大和质量控制相关的步骤,以便提高生成可用产物的效率,包括以下中的一个或更多个:在受控环境中(例如,以按生成颗粒数所需的浓度)用连接酶(例如,NEB-M0202M)进行反应,以便偶联生成的寡核苷酸区段;按生成颗粒数提供所需浓度的寡核苷酸材料;提供所需的反应体积(例如,在允许用于洗涤步骤的足够净空的容器内);在制备过程中提供稳定试剂(例如,聚乙二醇)以提高反应效率;实施振荡程序(或其他程序,以彻底分散或以所需的反应条件产生均匀的产物);在组合物的制备过程中实施孵育程序(例如,16±5℃或16±1℃);并进行适当数目的洗涤步骤。另外,方法400的变化形式可以从制备过程中排除某些要素,诸如用无DTT连接酶制备和从该过程中的其他试剂中去除DTT,或者从制备过程中排除较小主体的其他潜在释放剂(温度、化学物质等)。然而,方法400可以另外地或可选地包括用于大量产生组合物100、200的单元的方法的其他合适步骤。
4.1.1第一制备实例—下一代条形码化珠
在一种实例中,方法400’可以适于使用以已知和独特组合组合的有限(例如,少数)条形码组,以其中单个珠具有条形码序列的不同组合的方式在每个主体上创建多于一个条形码组。单个珠上的条形码序列的所有组合可以是对珠独特的,或者可以以其他方式配置。因此,方法400’可以实施以已知的组合组合在一起的有限的条形码组,使得单个制备构建体以受控和可预测的方式产生每个珠多于一个条形码(CBC),使得所有这些不同的条形码可以映射回同一个珠。
更详细地,每个条形码单元可以包含具有一组碱基(例如,少于10个碱基,多于10个碱基)和一个或多于一个手柄(例如,一组不同连接手柄中的一个,或任一端上的一组连接手柄中的一个,或其他手柄,诸如聚合酶延伸手柄)的条形码单元子序列,其中条形码单元子序列可以被配置为主要由手柄限定的组。在变化形式中,手柄可以各自具有3个和15个之间的碱基,或其他合适数量的碱基。因此,组装组中的每个条形码单元子序列配置有相同的手柄(例如,一组不同的连接手柄中的一个),而不同组具有该组不同手柄中的其他手柄。因此,连接手柄的数量可以基于每个珠所需的条形码序列的数量和所需的总条形码多样性来确定。
在实例中,方法400’可以实施多个条形码单元子序列(例如,96个条形码单元、384个条形码单元、其他条形码单元数量),以及一组连接手柄(例如,4个连接手柄、少于4个连接手柄、多于4个连接手柄),以实现被处理的样品所需的多样性水平和每个珠所需的不同条形码数量。每个组可以具有独特条形码,但是可选地,相同的组(例如,96个条形码子序列,384个条形码子序列等)可以用于所有组。在一种实例中,具有7-mer条形码的96个条形码单元子序列可以用4个碱基的连接手柄来实施,其中条形码单元子序列选自96个条形码单元子序列的四个不同组;然而,可以使用其他数量的条形码单元子序列组,包括仅由手柄序列区分的情况的单个组。
扩展该实例,为了在一个珠上提供四种不同的独特条形码序列,方法400’可以实施具有带连接手柄ATCG的条形码子序列XXXXXXX的第一组,其中XXXXXXX是7-mer条形码序列(例如,96个条形码序列的组中的一个,384个条形码序列中的一个,其他数量的条形码序列中的一个);具有带连接手柄TCGA的条形码子序列XXXXXXX的第二组,其中XXXXXXX是7-mer条形码序列;具有带连接手柄CGAT的条形码子序列XXXXXXX的第三组,其中XXXXXXX是7-mer条形码序列;以及具有带连接手柄GATC的条形码子序列XXXXXXX的第四组404’,其中XXXXXXX是7-mer条形码序列。因此,连接手柄ATCG、TCGA、CGAT和GATC对于该组是专一性的,但子序列XXXXXXX对于该组可以不是专一性的。在该实例中,对于与单个珠缔合的第一(例如,ATCG、TCGA、CGAT和GATC)、第二(例如,TCAG、AATC、ATTA、TCCT)、第三和第4连接反应,专一性的4个碱基的连接手柄是不同,并且对于每组条形码单元子序列也是不同的。因此,该配置通过4个连接事件跨四组条形码单元子序列提供了16种不同的手柄(例如,手柄的数目是条形码单元子序列组的数目和所需连接事件数目的乘积)。
在方法400’的实施过程中,所有第一组条形码变化形式可以在第一孔中提供,所有第二组条形码变化形式可以在第二孔中提供,以此类推,以便生成具有偶联到每个珠的不同条形码的独特条形码化珠(例如,孔1包含条形码1ATCG、条形码1TCGA、条形码1CGAT和条形码1GATC;孔2具有条形码2ATCG、条形码2TCGA、条形码2CGAT和条形码2GATC等)。在可选的变化形式中,可以在每个孔中提供来自每个组的不同条形码变化形式,只要每个孔具有来自每个条形码组的一个独特可识别条形码(例如,孔1具有条形码1ATCG、条形码25TCGA、条形码49CGAT和条形码76GATC;孔2具有条形码2ATCG、条形码33TCGA、条形码82CGAT和条形码25GATC;或者可选地,如果每个条形码组源自不同的96个的组,例如,孔1具有条形码1ATCG、条形码97 TCGA、条形码193 CGAT和条形码290 GATC等)。
图16A-16D描绘了具有四种不同条形码的珠(即,主体110’)的创建的序列,其中每个单独的珠在一组连接事件之后最终具有一组四种独特可识别的条形码(CBC)。如图16A所示,示例性方法400’可以包括:在3’端添加具有不同连接手柄的第一组条形码单元子序列S410’,其中第一组条形码单元子序列中的不同条形码单元子序列411’、412’、413’、414’与具有相同重叠序列的夹板寡核苷酸415’杂交。关于步骤S410’,可以将第一组条形码单元子序列中的每一个一起添加,以实现不同单元之间的所需比例(例如,1:1:1:1,非1:1:1:1比例等)。在第一轮连接后得到的产物将是每个珠上4种不同的寡核苷酸链(或在其他变化形式中的其他合适的数量),每种寡核苷酸链具有不同的连接手柄。在一种变化形式中,一个孔内的条形码单元子序列可以是相同的,具有用于区分组的不同连接手柄。在另一变化形式中,条形码单元子序列可以不同,但由于来自同一孔而知道其关联性。
如图16B所示,示例性方法400’可以包括:将第二组条形码单元子序列添加到第一组条形码单元子序列的相应端S420’,其中第二条形码单元子序列在图16B中示为421’、422’、423’、424’。关于步骤S420’,可以将第二组条形码单元子序列中的每一个一起添加,以实现不同单元之间的所需比例(例如,1:1:1:1,非1:1:1:1比例等)。
如图16C所示,示例性方法400’可以包括:将第三组条形码单元子序列添加到第二组条形码单元子序列的相应端S430’,其中第三组条形码单元子序列在图16C中示为431’、432’、433’、434’。关于步骤S430’,可以将第三组条形码单元子序列中的每一个一起添加,以实现不同单元之间的所需比例(例如,1:1:1:1,非1:1:1:1比例等)。此外,如图15C所示,第三组条形码单元子序列可以任选地包含独特分子标识符序列,如上所述。
如图16D所示,示例性方法400’可以包括:将一组捕获寡核苷酸添加到第三组条形码单元子序列的相应端S440’,其中类似的捕获寡核苷酸在图16D中示为441’,并且实施不同的夹板寡核苷酸(即,445’、446’、447’、448’)。虽然描述了三组条形码单元子序列,但是方法400’可以包括添加任何其他合适数量的条形码单元子序列以实现所需的多样性。关于示例性方法400,在3(或无论多少)轮连接(在轮之间汇集和分开)后的结果是,珠具有我们对于单个条形码序列将具有的相同的条形码多样性,但每个珠上有4种不同的条形码序列。可以使用不同的末端在这些珠上放置4种不同的捕获序列,并且由于条形码单元子序列关联性是已知的,因此任何条形码组不仅应该在单个条形码位置上匹配,而且应跨越3种条形码单元子序列的组组成聚集条形码序列。
更详细地,如果相同的捕获序列应用于特定珠的所有寡核苷酸链,即使它们包含不同的复合条形码,来自任何细胞的序列汇集都将映射到与该特定珠相关的有限的白名单条形码子序列组之一,从而允许更好地鉴定测序错误或嵌合序列。所使用的连接手柄还对应于从个体条形码单元子序列聚集的聚集条形码序列的所有位置的特定组。因此,可以检测组的任何交叉,并标记这些序列。在临床应用中,由于存在全都映射到同一个珠(并因此映射到同一细胞)的多于一个不同的条形码而即使是相对稀有(例如,大于1)捕获的序列(例如,转录本)也被确认来源于同一细胞的能力将大大提高与条形码相关的任何判定的确定性,并从而提高任何潜在诊断的确定性。与聚集条形码序列但不同的UMI相关的特定转录本或一组转录本可能是来自单个靶细胞的不同转录本,但也可能是由嵌合序列引起的。因此,映射到4种不同的聚集条形码(所有这些条形码都与单个珠相关)提供了它们源自单个细胞的更大的置信度。
根据示例性方法400’使用条形码单元子序列的个体组的另外的益处是,“不变的”连接手柄现在将与每个单个珠共同相关,具有多样性,并从而避免测序标记,从而允许更节省成本地使用下游过程。
虽然描述了三组条形码单元子序列,但方法400’可以包括添加任何其他合适数量的条形码单元子序列。关于示例性方法400,在3(或无论多少)轮连接(在轮之间汇集和分开)后的结果是,珠具有我们对于单个条形码序列将具有的相同的条形码多样性,但每个珠上有4种不同的条形码序列。可以使用不同的末端在这些珠上放置4种不同的捕获序列,并且由于条形码单元子序列关联性是已知的,因此任何条形码组不仅应该在单个条形码位置上匹配,而且应跨越3种条形码单元子序列的组组成聚集条形码序列。
在方法400’的变化形式中,如图16E所示,该方法可以包括:将一组捕获寡核苷酸添加到第三组条形码单元子序列的相应端S440’,其中捕获寡核苷酸对应于图16E中示出的441’、442’、443’、444’。步骤S440”与上述步骤S440’的不同在于,在最后的连接步骤之后,所得组合物包含每个珠多于一个不同的聚集条形码序列(CBC),具有相同的PCR手柄,但在每个聚集条形码序列上具有不同的捕获序列。因此,该配置允许同时捕获不同的靶,具有即使聚集条形码序列不相同,也能够可靠地映射回每个细胞的能力。
在方法400’的又另一变化形式中,如图17A所示,该方法可以包括:在3’端添加具有不同连接手柄的第一组条形码单元子序列,并添加至不同的PCR手柄S410”,其中第一组条形码单元子序列中的不同条形码单元子序列411”、412”、413”、414”与具有互补重叠序列的夹板寡核苷酸415”杂交。关于步骤S410”,可以将第一组条形码单元子序列中的每一个一起添加,以实现不同单元之间的所需比例(例如,1:1:1:1,非1:1:1:1比例等)。然后,以类似于关于上述的步骤S420’到步骤S440’所描述的和图17B所示的方式,该方法可以产生其中每个珠具有可以被独立寻址(因为在步骤S410”中应用了不同的PCR手柄)的不同的条形码序列的珠组合物。特别地,取决于应用,最终捕获寡核苷酸可以是相同或不同的。此外,每一个最终捕获寡核苷酸都可以使用不同的PCR手柄单独寻址,但仍可以映射回同一个珠。因此,即使使用不同的下游工作流程处理样品(例如,在最初捕获和通过逆转录延伸或聚合酶延伸之后),也可以存在与特定的细胞/珠的联系和关联。
如上所述,方法400’和400”显示为将寡核苷酸序列附加到珠;然而,方法400’和400”可以另外地或可选地适于如上述各种变化形式中描述地掺入裂解位点(例如,分子剪刀区、限制性位点等)。此外,在一些应用中,寡核苷酸可以通过5’端附接到珠,并具有游离的3’-OH基团。在其他应用中,寡核苷酸可以通过3’端附接到珠。在其他应用中,不同的条形码组可以包含组装成在连接后潜在具有相同序列的寡核苷酸,但以其中一个条形码组通过沿5’至3’方向延伸寡核苷酸来添加,而另一寡核苷酸沿3’至5’方向延伸的方式配置。
关于上述方法400’和400”的步骤,在连接期间将珠保持悬浮有利于总体连接,并且可能有利于珠之间的连接均匀性。精确的速度将随容器的尺寸和形状以及反应中珠的数量而变化。在实例中,相关混合物在振荡装置中以1500RPM振荡;但是可以实施其他振荡参数。关于每个连接步骤的时间,连接时间小于1小时可能会降低总连接效率,或者需要额外的酶才能达到相同的效率。在实例中,实施每次连接4小时和24小时之间的连接时间段,在16℃孵育;但是可以实施其他连接时间和孵育温度。
用于珠制备的分开和汇集合成方法的固有特点是具有不完整寡核苷酸的珠将组合在一起。因此,来自一个孔的未连接的条形码有可能连接到原本位于不同孔中的珠上的寡核苷酸上。当“残端(stub)”(即附接到珠的不完整寡核苷酸)的数量没有被条形码完全饱和时,尤其如此。结果将是在同一个珠上具有多于一种条形码的珠,而这将导致在分析过程中序列数据的错误分配。这种类型的污染将是非常不期望的。如果将来自多于一个孔的珠(和连接反应组分)收集到较大的管中,则收集珠、随后沉淀以保留珠并去除上清液、随后洗涤珠显著减少交叉污染以减轻上述效应(例如,如果快速操作)。可选地,对于自动化系统或当任何珠留在处于中间状态的混合溶液中时,应该抑制连接(例如,通过停止溶液,通过热灭活酶,通过条形码寡核苷酸去磷酸化,通过添加封闭寡核苷酸,通过从连接溶液中耗尽ATP,以其他合适的方式)。示例性停止溶液可以包含与约2X摩尔当量的Mg++结合的EDTA。
每个珠的寡核苷酸的理想数量还根据珠的组成和最终用途而变化。例如,用次最大量条形码寡核苷酸进行连接可以实现改进的性能和降低的成本。示例性方法在连接反应中实施850纳摩尔的部分双链寡核苷酸与约350万个珠,或每个珠约0.25皮摩尔。通过将部分双链寡核苷酸的量减少到每350万个珠172纳摩尔,或每个珠约50飞摩尔,制备成本显著降低,性能得到改进。该实例实现了每个珠周围寡核苷酸的更优化分布,导致较少的空间位阻,因为空间位阻会成为问题的相邻寡核苷酸以较低的速率连接,从而产生一组更分散的全长寡核苷酸。连接酶的量也与珠的数量和每个珠的连接事件的数量成比例。在该实例中,实施每350万个珠33,333个黏性末端单元,或每个珠约0.0095个黏性末端单元。
其他可以改进连接的连接反应组分包括PEG 6000至10%w/v的终浓度,Mg++至10mM的浓度(或通过用其他二价阳离子或更大量的一价阳离子替换最多~50%的镁,其中一价=120*[二价]的平方根)。可以另外地或可选地实施其他连接反应组分以产生合适的反应环境。
此外,虽然在示例性方法400’、400”中描述了连接,但也可以实施其他组装或延伸方法(例如模板化聚合酶延伸或化学附接,诸如点击附接等)。
关于与上述方法相关的条形码单元子序列列表,各种实例列表可以包含96个(或更少)和932个(或更多)之间的条形码单元子序列。特别地,组可以被配置为更大的汉明距离、Levenshtein距离或其他距离,以便提供通过测序后分析易于校正的特性。可以另外地或可选地配置组以产生具有较低总条形码多样性的珠。
然而,可以实施其他合适的配置和/或每个列表的条形码单元的数量。
4.1.2第二制备实例
在实例中,制备方法可以在最佳的时间、温度和振荡以及组成(例如,酶浓度、寡核苷酸浓度、反应增强剂、提供拥挤的分子)条件下,从多于一个孔(例如,96个孔)开始,每个孔包含超过100万个微球和附接(例如,通过连接)到每个珠的一个独特寡核苷酸区段。在将独特寡核苷酸标签连接到每个管(例如,96个管)中存在的所有颗粒之后,可以洗涤珠,使得洗涤之后,当来自96个管的所有珠汇集在一起(例如,每管100万个珠x 96个管=汇集的9600万个珠)时,不会发生产物的残留。
再洗涤一段时间后,将珠重新分配到96个不同的含有独特条形码化寡核苷酸区段的管中,并且然后添加另外的试剂(例如,连接酶、ATP、PEG、反应增强剂)以继续第二阶段的附接。这个条形码区段反应、洗涤、汇集、重新分配的过程一直持续到所有不同的寡核苷酸区段被添加以完成整个过程。用于珠的分开-汇集-洗涤和反应的液体处理过程可以在96孔板中自动化,或者可以在其他板尺寸(诸如384孔板或1536孔板)中自动化。在每个孔中分配试剂可以通过液体移液器完成,也可以通过其他方法完成,诸如喷墨式喷嘴,或从倒置的孔板中声学喷射。珠的汇集可以通过移液器完成,或可以通过使用专门设计的接收盖板来完成,接收盖板可以放置在96孔板上,并且然后将板盖组件倒置并振荡,以将所有珠收集在接收盖板中。液体处理操作被设计成使得在整个操作过程中步骤的污染最小化,以防止任何错误在整个过程中传播。本文描述的本发明将允许制备这些条形码化珠的工作流程显著简化。可以制备的珠总数可以低至1000万到高至100亿,具有多于100,000(或100万或>1000万)不同的独特组合的珠多样性。
在一些实施方案中,存在于每个孔中的独特寡核苷酸可以包括不同孔中的不同尺寸的片段。为了清楚起见,特定实例可以是,32个孔可以各自包含部分双链构建体,该部分双链构建体包含提供与前一区段的重叠以辅助连接的6个碱基,定义条形码区段的7个独特碱基,以及提供与下一区段的重叠的4个碱基。另外32个孔包含部分双链构建体,该部分双链构建体包含相同的提供与前一区段的重叠的6个碱基、定义条形码区段的8个独特碱基,以及提供与下一区段的重叠的4个碱基。第三组32个孔各自包含部分双链构建体,该部分双链构建体包含相同的提供与前一区段的重叠的6个碱基、定义条形码区段的9个独特碱基,以及提供与下一区段的重叠的4个碱基。当用于上述制备方法时,这将由于包含不同长度的片段而产生长度不同的全长寡核苷酸。当随后生成读通条形码区的序列时,以这种方式制备的条形码将具有典型制备方法不存在的序列生成和分析的多个明显益处。特别地,当从多于一个珠生成多于一个序列时,通过上述方法生成的序列可以具有有益的属性,即一些或全部序列的重叠部分将相同。因此,它们可以用作比对标志物,并为分析提供其他益处,诸如鉴定嵌合分子、测序或制备错误以及其他益处。
通常,如果太大一部分序列在特定位置全部包含相同的碱基,则用于这些分析的测序仪将产生错误并终止运行,从而无法收集所需的实验数据。因此,当所有序列都是相同长度时,包含相同序列诸如所描述的相同重叠区,可能是有问题的。通过以本文描述的方式改变在恒定区之前的条形码单元的长度,得到的序列变得偏移(offset)。尽管重叠区或多于一个重叠区可以在多于一个序列中基本不变,但它们有效地不在同相(out of phase),从而可以实现相同或接近相同标志物的益处,而不会在测序过程本身中引起错误。这可以在所描述的制备过程中用不同数量的孔或管和不同配置的序列长度变化来实现,这些序列长度变化在这里用于说明,只要它们适合于提供处理测序仪器限制的局限性和提供改进的测序后分析的双重益处。
5.结论
附图说明了根据优选的实施方案、示例性配置及其变化形式的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。就这点而言,在流程图或框图中的每个框可以代表代码的模块、段或部分,代码包含用于实现一个或更多个指定的逻辑功能的一个或更多个可执行指令。还应当注意,在一些可选的实现方式中,在框中提到的功能可以不按在附图中提到的顺序出现。例如,连续地显示的两个框事实上可以实质上同时被进行,或者框有时可以以相反的顺序被进行,取决于所涉及的功能。还应当注意,框图和/或流程图图示的每个框以及在框图和/或流程图图示中的框的组合可以由执行指定的功能或行动的专用的基于硬件的系统或专用硬件和计算机指令的组合实现。
如本领域技术人员从前面的详细描述及从附图和权利要求书将认识到的,可以对本发明的优选实施方案做出修改和变化而不偏离在所附权利要求书中限定的本发明的范围。

Claims (33)

1.一种组合物,包含:
主体;和
偶联到所述主体的一组分子,其中该组分子中的一个或更多个包含一组区,该组区包含:
偶联到所述主体的接头区;
结合区;
条形码区;
独特分子标识符;
捕获序列;和
裂解区,其被配置为将该组区中的至少一个与所述主体分离。
2.根据权利要求1所述的组合物,其中所述主体包含含有可裂解元件的聚丙烯酰胺材料。
3.根据权利要求2所述的组合物,其中所述主体包含被配置为在含有还原剂的环境中溶解的聚丙烯酰胺材料。
4.根据权利要求2所述的组合物,其中所述主体是用荧光素酰亚胺(FAM)化合物加标签的,所述荧光素酰亚胺(FAM)化合物被配置为在所述组合物使用期间发射荧光信号。
5.根据权利要求1所述的组合物,其中所述条形码区包含两组或更多组条形码单元子序列,其中所述两组或更多组条形码单元子序列中的多于一组在组装期间包含遍及一组条形码单元子序列共有的共同手柄。
6.根据权利要求1所述的组合物,其中所述条形码区包含附接到单个主体的两个或更多个非随机序列。
7.根据权利要求6所述的组合物,其中该组分子包含具有第一条形码区的第一分子子集、具有第二条形码区的第二分子子集和具有第三条形码区的第三分子子集,所述第一条形码区具有第一序列,所述第二条形码区具有第二序列,所述第三条形码区具有第三序列。
8.根据权利要求6所述的组合物,其中所述两个或更多个条形码区以序列特异性的方式与两个或更多个聚合酶链式反应(PCR)手柄或寡核苷酸结合区连接。
9.根据权利要求1所述的组合物,其中所述结合区包含聚合酶链式反应(PCR)手柄和寡核苷酸结合区中的至少一个。
10.根据权利要求1所述的组合物,其中所述裂解区包含用于USER序列的dU。
11.根据权利要求1所述的组合物,其中所述裂解区包含限制性内切酶识别位点。
12.根据权利要求11所述的组合物,其中所述限制性内切酶裂解位点形成由相应限制性内切酶识别的瞬时发夹结构。
13.根据权利要求1所述的组合物,其中所述裂解区包含位于第一荧光团和荧光猝灭剂之间的可裂解元件,所述第一荧光团位于所述可裂解元件的第一端,所述荧光猝灭剂位于所述可裂解元件的第二端。
14.根据权利要求13所述的组合物,其中所述猝灭元件包含第二荧光团,所述第二荧光团被配置为在裂解之前猝灭从所述第一荧光团发射的荧光信号。
15.根据权利要求1所述的组合物,其中所述裂解区包含位于所述主体和荧光团之间的可裂解元件。
16.根据权利要求1所述的组合物,其中所述裂解区包含热不稳定位点。
17.根据权利要求1所述的组合物,其中所述裂解区包含一系列RNA碱基。
18.根据权利要求1所述的组合物,其中所述捕获序列被配置为用于通过PolyA相互作用结合mRNA和从捕获的mRNA合成cDNA中的一种。
19.根据权利要求1所述的组合物,其中所述接头区包含树枝状大分子。
20.一种用于生成组合物的方法,所述方法包括:
生成一组主体作为基底;
对于该组主体中的每一个:
将一组接头偶联到所述主体;和
用顺序附接操作将一组分子偶联到该组接头,其中该组分子中的一个或更多个包含一组区,该组区包含:
偶联到所述主体的接头区;
结合区;
条形码区;和
捕获序列。
21.根据权利要求20所述的方法,其中该组分子包含独特分子标识符和裂解区中的至少一个,所述裂解区被配置为将该组区中的至少一个与所述主体分离。
22.根据权利要求20所述的方法,其中生成所述主体包括将一定体积的包含酰胺溶液的材料成分与引发剂传输到第一微流体路径中,并且用加压气体泵将所述一定体积的材料成分传输到聚焦通道中以生成所述主体。
23.根据权利要求20所述的方法,其中所述条形码区包含两组或更多组条形码单元子序列,其中所述两组或更多组条形码单元子序列中的多于一组在组装期间包含遍及一组条形码单元子序列共有的共同手柄。
24.根据权利要求20所述的方法,其中所述条形码区包含附接到单个主体的两个或更多个非随机序列。
25.根据权利要求24所述的方法,其中该组分子包含具有第一条形码区的第一分子子集、具有第二条形码区的第二分子子集和具有第三条形码区的第三分子子集,所述第一条形码区具有第一序列,所述第二条形码区具有第二序列,所述第三条形码区具有第三序列。
26.根据权利要求20所述的方法,其中所述顺序附接操作包括将第一组条形码单元子序列添加到该组主体,其中所述第一组条形码单元子序列在所述第一组条形码单元子序列中包含多于一个手柄。
27.根据权利要求26所述的方法,所述方法还包括:
基于该组连接手柄,以靶向连接将第二组条形码单元子序列连接到所述第一组条形码单元子序列,
基于该组连接手柄,以靶向连接将第三组条形码单元子序列连接到所述第二组条形码单元子序列,并且
从而形成包含两个或更多个序列的所述条形码区。
28.根据权利要求20所述的方法,其中所述结合区包含两个或更多个不同的序列。
29.根据权利要求28所述的方法,其中所述顺序附接操作包括将第一组条形码单元子序列添加到该组主体,其中所述第一组条形码单元子序列在所述第一组条形码单元子序列中包含多于一个手柄。
30.根据权利要求29所述的方法,所述方法还包括将所述第一组条形码单元子序列靶向连接到所述两个或更多个结合区。
31.根据权利要求30所述的方法,所述方法还包括:
基于该组连接手柄,以靶向连接将第二组条形码单元子序列连接到所述第一组条形码单元子序列,
基于该组连接手柄,以靶向连接将第三组条形码单元子序列连接到所述第二组条形码单元子序列,并且
从而形成包含两个或更多个序列的所述条形码区。
32.根据权利要求1所述的组合物,其中所述主体是微孔的表面。
33.根据权利要求20所述的方法,其中所述主体是微孔的表面。
CN202080084667.8A 2019-12-06 2020-12-02 样品处理条形码化珠组合物、方法、制备和系统 Pending CN114761538A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962945006P 2019-12-06 2019-12-06
US62/945,006 2019-12-06
PCT/US2020/062846 WO2021113330A1 (en) 2019-12-06 2020-12-02 Sample processing barcoded bead composition, method, manufacturing, and system

Publications (1)

Publication Number Publication Date
CN114761538A true CN114761538A (zh) 2022-07-15

Family

ID=76209640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080084667.8A Pending CN114761538A (zh) 2019-12-06 2020-12-02 样品处理条形码化珠组合物、方法、制备和系统

Country Status (8)

Country Link
US (1) US20210171939A1 (zh)
EP (1) EP4073229A4 (zh)
JP (1) JP2023504836A (zh)
KR (1) KR20220121826A (zh)
CN (1) CN114761538A (zh)
AU (1) AU2020395133A1 (zh)
CA (1) CA3159051A1 (zh)
WO (1) WO2021113330A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023107539A1 (en) * 2021-12-10 2023-06-15 Bio-Rad Laboratories, Inc. Compositions, methods, and systems for sample processing with morphology-adjustable functionalized particles

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030069173A1 (en) * 1998-03-16 2003-04-10 Life Technologies, Inc. Peptide-enhanced transfections
EP2047910B1 (en) * 2006-05-11 2012-01-11 Raindance Technologies, Inc. Microfluidic device and method
WO2011085075A2 (en) * 2010-01-07 2011-07-14 Gen9, Inc. Assembly of high fidelity polynucleotides
CA2830443C (en) * 2011-03-18 2021-11-16 Bio-Rad Laboratories, Inc. Multiplexed digital assays with combinatorial use of signals
EP2986968B1 (en) * 2014-03-07 2019-05-08 Bio-rad Laboratories, Inc. Automated blotting using sliding devices
US10550429B2 (en) * 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11072816B2 (en) * 2017-05-03 2021-07-27 The Broad Institute, Inc. Single-cell proteomic assay using aptamers
CN111971124B (zh) * 2017-09-25 2022-08-23 普莱克斯姆公司 寡核苷酸编码的化学文库
US10829815B2 (en) * 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
WO2019152395A1 (en) * 2018-01-31 2019-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for deconvoluting partition barcodes
WO2019157529A1 (en) * 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
SG11202008080RA (en) * 2018-02-22 2020-09-29 10X Genomics Inc Ligation mediated analysis of nucleic acids
US11841371B2 (en) * 2018-03-13 2023-12-12 The Broad Institute, Inc. Proteomics and spatial patterning using antenna networks
CN113287014A (zh) * 2018-12-27 2021-08-20 生物辐射实验室股份有限公司 循序多重蛋白质印迹

Also Published As

Publication number Publication date
EP4073229A4 (en) 2024-01-24
WO2021113330A1 (en) 2021-06-10
CA3159051A1 (en) 2021-06-10
US20210171939A1 (en) 2021-06-10
KR20220121826A (ko) 2022-09-01
AU2020395133A1 (en) 2022-05-26
JP2023504836A (ja) 2023-02-07
EP4073229A1 (en) 2022-10-19

Similar Documents

Publication Publication Date Title
CN108350499B (zh) 可转化标记组合物、方法及结合其的过程
JP2022122964A (ja) サンプル中の標的核酸を検出する方法
US20210155985A1 (en) Surface concatemerization of templates
US20200370105A1 (en) Methods for performing spatial profiling of biological molecules
US8609341B2 (en) Uniform fragmentation of DNA using binding proteins
EP3103885B1 (en) Methods for sequencing nucleic acids
KR20210013668A (ko) 샘플 처리를 위한 조성물 및 방법
KR20230157538A (ko) 고체 지지체 상의 샘플 제조법
JP2014512176A (ja) マルチプレックス配列決定反応における核酸鋳型の同定
CN113166807A (zh) 通过分区中条码珠共定位生成核苷酸序列
JP2017514478A (ja) 集積した単一細胞の配列決定
WO2019126209A1 (en) Particles associated with oligonucleotides
CN116406428A (zh) 用于使用酶促核酸延伸进行原位单细胞分析的组合物和方法
CN110869515A (zh) 用于基因组重排检测的测序方法
US20220135966A1 (en) Systems and methods for making sequencing libraries
CN114761538A (zh) 样品处理条形码化珠组合物、方法、制备和系统
US20230313278A1 (en) Cell barcoding for single cell sequencing
DK2456892T3 (en) Procedure for sequencing of a polynukleotidskabelon
JP2023532905A (ja) トランスポソーム担体としてのビーズ
CN116261593A (zh) 用于表面扩增的组合物及其用途
CN117015603A (zh) 使用基于转座子的技术与用于误差校正的独特分子标识符制备定向标签化测序文库的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination