CN117916389A - 使用原位逆转录的空间多组学 - Google Patents

使用原位逆转录的空间多组学 Download PDF

Info

Publication number
CN117916389A
CN117916389A CN202280059380.9A CN202280059380A CN117916389A CN 117916389 A CN117916389 A CN 117916389A CN 202280059380 A CN202280059380 A CN 202280059380A CN 117916389 A CN117916389 A CN 117916389A
Authority
CN
China
Prior art keywords
oligonucleotide
sample
nucleic acid
sequence
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280059380.9A
Other languages
English (en)
Inventor
宋慧媛
乔迪·马丁
玛格丽特·纳卡莫托
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Publication of CN117916389A publication Critical patent/CN117916389A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation

Abstract

本文公开的内容包括用于确定样品中靶(例如,核酸靶、细胞组分靶)的空间位置和拷贝数的系统、方法、组合物和试剂盒。在一些实施方案中,提供了包含多于一个空间区域的基底。多于一种寡核苷酸条形码可以与空间区域中的每一个关联,并且可以包含预定空间标记。相同空间区域的寡核苷酸条形码可以包含相同的空间标记,并且不同空间区域的寡核苷酸条形码可以包含不同的空间标记。该方法可以包括使基底与样品接触,使得每个不同的空间区域接触样品的不同空间位置。该方法可以包括寡核苷酸条形码的原位延伸(例如,逆转录)。

Description

使用原位逆转录的空间多组学
相关申请
本申请根据35 U.S.C.§119(e)要求2021年9月1日提交的美国临时专利申请序号63/239,897的权益,该相关申请的内容出于所有目的通过引用以其整体并入本文。
背景
领域
本公开内容总体上涉及分子生物学领域,例如使用分子条形码化(molecularbarcoding)确定基因表达。
对相关技术的描述
诸如原位杂交和免疫组织化学的方法和技术允许样品中靶分子的位置的可视化。用于标记用于扩增和测序的靶分子的方法和技术,例如随机条形码化,对于确定靶分子的标识符是有用的。确定样品中靶分子的标识符和位置对于临床应用、诊断和生物医学研究非常重要。因此,需要能够将靶分子的标识符与靶分子在样品中的位置关联的方法和技术。
概述
本文公开的内容包括用于确定样品中核酸靶的空间位置和拷贝数的方法。在一些实施方案中,该方法包括:提供包含多于一个空间区域的基底,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、能够与核酸靶杂交的靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。该方法可以包括:使基底与包含核酸靶的拷贝的样品接触,其中接触包括使多于一个空间区域与样品接触,使得每个不同的空间区域接触样品的不同空间位置。该方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,多于一个条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列。该方法可以包括:获得测序数据,该测序数据包括多于一个条形码化核酸分子或其产物的多于一个测序读段,其中多于一个测序读段中的每一个包含空间标记序列、分子标记序列和核酸靶的子序列。该方法可以包括:对于每个独特的空间标记序列,其与基底的不同空间区域关联并且从而与样品的不同空间位置关联,计数具有与核酸靶关联的不同序列的分子标记的数量,以确定在样品的每个空间位置处核酸靶的拷贝数。
本文公开的内容包括用于确定样品中细胞组分靶的空间位置和拷贝数的方法。该方法可以包括:使多于一种细胞组分结合试剂与样品接触,其中多于一种细胞组分结合试剂中的每一种包含细胞组分结合试剂特异性寡核苷酸,细胞组分结合试剂特异性寡核苷酸包含针对细胞组分结合试剂的独特标识符序列,并且其中细胞组分结合试剂能够与多于一种细胞组分靶中的至少一种特异性地结合。该方法可以包括:使与细胞组分结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞组分结合试剂特异性寡核苷酸,多于一种条形码化细胞组分结合试剂特异性寡核苷酸各自包含与独特标识符序列的至少一部分互补的序列。该方法可以包括:获得测序数据,该测序数据包括多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的多于一个测序读段,其中多于一个测序读段中的每一个包含空间标记序列、分子标记序列和独特标识符序列的至少一部分。该方法可以包括:对于每个独特的空间标记序列,其与基底的不同空间区域关联并且从而与样品的不同空间位置关联,计数具有与独特标识符序列关联的不同序列的分子标记的数量,以确定在样品的每个空间位置处多于一种细胞组分靶中的至少一种细胞组分靶的拷贝数。
在一些实施方案中,接触步骤中的至少一部分在存在延伸试剂的情况下进行,任选地,整个接触步骤在存在延伸试剂的情况下进行,还任选地,接触和延伸步骤是同时的,任选地,样品和基底在延伸步骤期间接触,任选地,延伸在原位进行。在一些实施方案中,延伸试剂包括逆转录试剂,任选地逆转录试剂包括逆转录酶和dNTP。在一些实施方案中,该方法包括变性步骤,任选地变性将核酸靶与条形码化核酸分子分离和/或将细胞组分结合试剂特异性寡核苷酸与条形码化细胞组分结合试剂特异性寡核苷酸分离。在一些实施方案中,接触步骤包括在样品上覆盖基底。该方法可以包括:在接触步骤之后,将样品与基底分离。
在一些实施方案中,该方法(i)包括在接触步骤之前固定样品,或者(ii)不包括在接触步骤之前固定样品。在一些实施方案中,样品在接触步骤期间被物理分割或保持完整。在一些实施方案中,样品中核酸靶的空间位置在样品的表面上、样品内部、在样品中的亚细胞位置或其任何组合。在一些实施方案中,样品包含多于一个细胞,任选地,核酸靶与多于一个细胞关联。在一些实施方案中,多于一个细胞包括一种或更多种细胞类型,任选地,所述一种或更多种细胞类型选自由以下组成的组:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移细胞、良性细胞、原代细胞和循环细胞,或其任何组合。在一些实施方案中,样品包括组织、细胞单层、固定细胞、组织切片或其任何组合。在一些实施方案中,样品包括生物样品、临床样品、环境样品、生物流体、组织、来源于受试者的组织切片或其任何组合,任选地受试者是人类、小鼠、狗、大鼠或脊椎动物。
该方法可以包括:基于样品中核酸靶的空间位置确定受试者的基因型、表型或一个或更多个基因突变。该方法可以包括:预测受试者对一种或更多种疾病的易感性。在一些实施方案中,一种或更多种疾病中的至少一种是癌症或遗传性疾病。该方法可以包括:确定样品中多于一个细胞的细胞类型。在一些实施方案中,基于样品中多于一个细胞的细胞类型的预测反应性来选择药物。
该方法可以包括:对样品成像,任选地在接触步骤之后对样品成像,任选地,成像产生成像数据。在一些实施方案中,对样品成像包括用染色剂对样品染色,其中染色剂是荧光染色剂、负染色剂、抗体染色剂或其任何组合,任选地染色包括免疫细胞化学(ICC)、免疫组织化学(IHC)、免疫荧光(IF)或其任何组合。在一些实施方案中,成像包括显微术、共焦显微术、时差成像(time-lapse imaging)显微术、荧光显微术、多光子显微术、定量相位显微术、表面增强拉曼光谱、摄像、手动视觉分析、自动视觉分析或其任何组合。该方法可以包括:将样品的一个或更多个空间位置的成像数据和测序数据关联。该方法可以包括:空间位置的成像数据和测序数据的相关性分析,任选地,相关性分析识别以下中的一个或更多个:候选生物标志物、候选治疗剂、治疗剂的候选剂量和/或候选治疗剂的细胞靶。在一些实施方案中,所述成像产生用于构建所述样品的物理表示的图谱的图像,任选地,所述图谱是二维或三维的。该方法可以包括:将核酸靶和/或细胞组分靶映射到样品的图谱上。该方法可以包括:分离对应于感兴趣的空间位置的一个或更多个条形码化核酸分子,任选地,分离包括包含对应于感兴趣的空间位置的空间区域的独特空间标记的一个或更多个条形码化核酸分子的选择性杂交和下拉。
在一些实施方案中,寡核苷酸条形码包含含有捕获序列的靶结合区,任选地,靶结合区包含多(dT)区。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含与被配置为捕获细胞组分结合试剂特异性寡核苷酸的捕获序列互补的序列,任选地,与捕获序列互补的序列包含多(dA)区。在一些实施方案中,核酸靶包括核酸分子。在一些实施方案中,核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸、细胞组分结合试剂特异性寡核苷酸或其任何组合。在一些实施方案中,空间区域中的每一个包含被配置成与一组核酸靶杂交的多于一种寡核苷酸条形码。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含第二通用序列。在一些实施方案中,获得多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的序列信息包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞组分结合试剂特异性寡核苷酸;以及获得多于一种扩增的条形码化细胞组分结合试剂特异性寡核苷酸或其产物的测序数据。在一些实施方案中,获得测序数据包括将测序衔接子附接至(i)多于一个条形码化核酸分子或其产物,和/或(ii)多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物。
该方法可以包括:在使多于一种细胞组分结合试剂与样品接触之后,去除多于一种细胞组分结合试剂中未与样品接触的一种或更多种细胞组分结合试剂,任选地,去除未与样品接触的一种或更多种细胞组分结合试剂包括:去除未与多于一种细胞组分靶中的相应的至少一种接触的一种或更多种细胞组分结合试剂。在一些实施方案中,细胞组分靶包括细胞内蛋白、糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。
在一些实施方案中,使多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’外切核酸酶活性和3’至5’外切核酸酶活性中的至少一种的DNA聚合酶使多于一种寡核苷酸条形码延伸,任选地DNA聚合酶包括Klenow片段,还任选地逆转录酶包括病毒逆转录酶,任选地其中病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。在一些实施方案中,少于约5%的核酸靶由于所述核酸靶从起始空间位置扩散而被映射到不正确的空间位置。
在一些实施方案中,其中多于一种寡核苷酸条形码中的每一种包含基底接头官能团,多于一个基底中的每一个包含基底官能团,并且基底官能团和基底接头官能团相互关联。在一些实施方案中,基底接头官能团和基底官能团单独地选自由C6、生物素、链霉抗生物素蛋白、伯胺、醛、酮及其任何组合组成的组。在一些实施方案中,寡核苷酸条形码通过基底接头与基底关联。在一些实施方案中,基底接头包含碳链,任选地碳链包含2-30个碳,并且还任选地碳链包含12个碳。在一些实施方案中,基底接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。在一些实施方案中,空间标记的长度为6-60个核苷酸。在一些实施方案中,寡核苷酸条形码的长度为50-500个核苷酸。在一些实施方案中,寡核苷酸条形码被附接至基底。在一些实施方案中,寡核苷酸条形码被共价附接至基底。在一些实施方案中,寡核苷酸条形码被缀合至基底。在一些实施方案中,寡核苷酸条形码通过选自由以下组成的组的化学基团被缀合至基底:UV光可裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。在一些实施方案中,寡核苷酸条形码被非共价附接至基底。
在一些实施方案中,寡核苷酸条形码被配置为可从基底分离。该方法可以包括:使寡核苷酸条形码从基底解离,并且任选地,使寡核苷酸条形码从基底解离包括通过UV光裂解、化学处理、加热、酶处理或其任何组合使寡核苷酸条形码从基底分离。在一些实施方案中,解离发生在对寡核苷酸条形码进行条形码化之后。
在一些实施方案中,寡核苷酸条形码被配置为不可从基底分离。在一些实施方案中,寡核苷酸条形码被配置为通过1,3-偶极环加成反应、杂-第尔斯-阿尔德反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合被缀合至基底。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被固定在基底上、被部分地固定在基底上、被包封在基底中、被部分地包封在基底中或其组合。在一些实施方案中,基底包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮,及其任何组合。在一些实施方案中,靶结合区包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。在一些实施方案中,多于一种寡核苷酸条形码的每一种空间标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。
在一些实施方案中,基底包括固体支持物。在一些实施方案中,固体支持物包括平坦表面。在一些实施方案中,基底包含含有多于一个点的寡核苷酸阵列,并且其中寡核苷酸阵列的每个点包含多于一个空间区域中的不同空间区域。在一些实施方案中,基底包含微孔阵列,并且其中微孔阵列的每个微孔包含多于一个空间区域中的不同空间区域。
该方法可以包括:在使多于一种细胞组分结合试剂与样品接触和/或使基底与样品接触之前,使样品与阻断试剂、一个或更多个诱饵寡核苷酸和/或一个或更多个阻断寡核苷酸接触。在一些实施方案中,使多于一种细胞组分结合试剂与样品接触在存在阻断试剂的情况下进行。在一些实施方案中,阻断试剂包含与细胞组分结合试剂特异性寡核苷酸的至少一部分互补的多于一个寡核苷酸。在一些实施方案中,阻断试剂包含来源于第一物种的抗体或其片段,并且其中阻断试剂包含来源于第一物种的血清。在一些实施方案中,样品包含一种或更多种非靶核酸,其中阻断试剂包含能够与一种或更多种非靶核酸中的至少一种杂交的多于一个诱饵寡核苷酸。在一些实施方案中,多于一个诱饵寡核苷酸中的每一个能够与非靶核酸的至少一部分杂交。在一些实施方案中,诱饵寡核苷酸包含与非靶核酸的至少一部分互补的序列。在一些实施方案中,诱饵寡核苷酸包含与细胞组分结合试剂特异性寡核苷酸的序列相同或基本相似的序列。在一些实施方案中,序列的长度为3-40个核苷酸。在一些实施方案中,诱饵寡核苷酸与细胞组分结合试剂特异性寡核苷酸具有至多50%的序列同一性。在一些实施方案中,诱饵寡核苷酸不包含UMI。在一些实施方案中,诱饵寡核苷酸包含随机序列,并且任选地,随机序列的长度为约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸。在一些实施方案中,诱饵寡核苷酸不包含具有多于4个、5个、6个或7个连续T或A的任何序列。在一些实施方案中,诱饵寡核苷酸在每4个、5个、6个或7个连续的核苷酸中包含至少一个G或C。在一些实施方案中,诱饵寡核苷酸包含一个或更多个修饰的核苷酸。在一些实施方案中,诱饵寡核苷酸包含5’修饰,并且任选地,5’修饰包含5’氨基修饰物C12修饰(5AmMC12)。在一些实施方案中,诱饵寡核苷酸包含3’修饰,并且任选地,3’修饰包含3’双脱氧-C修饰(ddC)。在一些实施方案中,诱饵寡核苷酸的长度为30个至65个核苷酸。
在一些实施方案中,样品包含一种或更多种不合意的核酸物质,该方法包括:使阻断寡核苷酸与样品接触,其中阻断寡核苷酸特异性地结合一种或更多种不合意的核酸物质中的至少一种;由此,通过阻断寡核苷酸减少一种或更多种不合意的核酸物质中的至少一种的延伸。在一些实施方案中,在基底与样品接触之前,阻断寡核苷酸与样品接触。在一些实施方案中,在基底与样品接触之后,阻断寡核苷酸与样品接触。在一些实施方案中,当基底与样品接触时,阻断寡核苷酸与样品接触。在一些实施方案中,阻断寡核苷酸包含:(i)与一种或更多种不合意的核酸物质中的至少一种特异性地结合的序列,和(ii)靶结合区的序列或子序列。在一些实施方案中,阻断寡核苷酸包含(i)与一种或更多种不合意的核酸物质中的至少一种特异性地结合的序列,(ii)靶结合区的序列或子序列,和(iii)不与一种或更多种不合意的核酸物质中的至少一种杂交的序列。在一些实施方案中,阻断寡核苷酸包含3’非退火区,所述3’非退火区被配置为不与所述一种或更多种不合意的核酸物质退火;并且任选地,3’非退火区和与被阻断寡核苷酸特异性地结合的序列5’相邻的不合意的核酸物质的区域之间的非互补性为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或约100%。在一些实施方案中,3’非退火区为1nt至100nt长,为1nt至50nt长,为1nt至21nt长,为1nt至10nt长,或为约5nt长。在一些实施方案中,阻断寡核苷酸是锁核酸(LNA)、肽核酸(PNA)、DNA、LNA/PNA嵌合体、LNA/DNA嵌合体或PNA/DNA嵌合体。在一些实施方案中,阻断寡核苷酸不包含非天然核苷酸。
该方法可以包括:提供特异性地结合样品中两种或更多种不合意的核酸物质,任选地至少10种或至少100种不合意的核酸物质的阻断寡核苷酸。在一些实施方案中,阻断寡核苷酸具有至少50℃、至少60℃或至少70℃的Tm。在一些实施方案中,阻断寡核苷酸不能用作逆转录酶或聚合酶的引物。在一些实施方案中,阻断寡核苷酸为8nt至100nt长、为10nt至50nt长、为12nt至21nt长、为20nt至30nt长或为约25nt长。在一些实施方案中,一种或更多种不合意的核酸物质占样品的核酸含量的约50%、约60%、约70%或约80%。在一些实施方案中,不合意的核酸物质选自由核糖体RNA、线粒体RNA、基因组DNA、内含子序列、高丰度序列及其组合组成的组。在一些实施方案中,阻断寡核苷酸特异性地结合到一种或更多种不合意的核酸物质的3’末端的100nt内、50nt内或25nt内。在一些实施方案中,阻断寡核苷酸特异性地结合到一种或更多种不合意的核酸物质的5’末端的100nt内,或者阻断寡核苷酸特异性地结合到一种或更多种不合意的核酸物质的中点的100nt内。在一些实施方案中,一种或更多种不合意的核酸物质是mRNA分子,并且阻断寡核苷酸与一种或更多种不合意的核酸物质的3’多(A)尾的10nt内特异性地结合。
本文公开的内容包括组合物。在一些实施方案中,组合物包含:包含多于一个空间区域的微孔阵列,其中所述微孔阵列包含至少100个微孔,其中每个微孔具有从约10μm3至约786,000μm3的体积,其中每个微孔包含不同的空间区域,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
本文公开的内容包括组合物。在一些实施方案中,该组合物包含:包含多于一个空间区域的寡核苷酸阵列,其中寡核苷酸阵列包含至少100个点,其中寡核苷酸阵列的每个点包含多于一个空间区域中的不同空间区域,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
组合物可以包含:盒(cartridge),其中盒包括以下中的至少一个:入口端口、出口端口、泵、阀、通风口、储库(reservoir)、样品收集室、温度控制设备或其任何组合。组合物可以包含:缓冲液。组合物可以包含:一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂,或两者。在一些实施方案中,盒包括用于对至少100个微孔进行光学成像的透明窗。
附图简述
图1图示了非限制性示例性条形码。
图2示出了条形码化和数字计数的非限制性示例性工作流程。
图3是示出用于从多于一个靶产生在3’末端条形码化的靶的索引文库的非限制性示例性过程的示意图。
图4A-图4C描绘了非限制性示例性空间多组学工作流程。
图5描绘了非限制性示例性空间多组学平台。
详述
以下详述中参考了形成本文的一部分的附图。在附图中,除非上下文另外指示,否则相似的符号通常标识相似的组成部分。在详述、附图和权利要求书中描述的说明性实施方案不意味着是限制性的。在不脱离本文呈现的主题的精神或范围的情况下,可以利用其他实施方案,并且可以做出其他改变。将容易理解的是,如本文一般描述的以及附图中图示的本公开内容的方面能够以各种不同的配置来布置、替换、组合、分离和设计,所有这些都在本文中明确设想并且构成本公开内容的一部分。
本文提及的所有专利、公开的专利申请、其他出版物和来自GenBank以及其他数据库的序列关于相关技术通过引用以其整体并入。
对少量核酸(例如信使核糖核苷酸(mRNA)分子)进行定量对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因是临床上重要的。然而,确定核酸分子(例如,mRNA分子)的绝对数目也可以是非常具有挑战性的,尤其是当分子数目非常小时。确定样品中分子的绝对数目的一种方法是数字聚合酶链式反应(PCR)。理想地,PCR在每个循环中产生相同拷贝的分子。然而,PCR可具有缺点,使得每个分子以随机概率复制,且此概率根据PCR循环和基因序列而变化,这导致扩增偏倚和不准确的基因表达测量。具有独特分子标记(也称为分子索引(molecular indexes,MI))的随机条形码可以用于计数分子数目和校正扩增偏倚。诸如PreciseTM测定(Cellular Research,Inc.(Palo Alto,CA))和RhapsodyTM测定(Becton,Dickinson and Company(Franklin Lakes,NJ))的随机条形码化可以通过使用分子标记(ML)在逆转录(RT)期间标记mRNA来纠正由PCR和文库制备步骤引起的偏倚。
PreciseTM测定可以利用具有在多(T)寡核苷酸上的大量(例如6561种至65536种)独特分子标记序列的随机条形码的非耗尽性池(non-depleting pool),以在RT步骤期间与样品中的所有多(A)-mRNA杂交。随机条形码可以包含通用PCR引发位点。在RT期间,靶基因分子与随机条形码随机地反应。每一种靶分子可以与随机条形码杂交,导致产生随机条形码化的互补核糖核苷酸(cDNA)分子。在标记后,可以将来自微孔板微孔的随机条形码化cDNA分子汇集到单个管中用于PCR扩增和测序。可以分析原始测序数据以产生读段的数目、具有独特分子标记序列的随机条形码的数目以及mRNA分子的数目。
本文公开的内容包括用于确定样品中核酸靶的空间位置和拷贝数的方法。在一些实施方案中,该方法包括:提供包含多于一个空间区域的基底,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、能够与核酸靶杂交的靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。该方法可以包括:使基底与包含核酸靶的拷贝的样品接触,其中接触包括使多于一个空间区域与样品接触,使得每个不同的空间区域接触样品的不同空间位置。该方法包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,多于一个条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列。该方法可以包括:获得测序数据,该测序数据包括多于一个条形码化核酸分子或其产物的多于一个测序读段,其中多于一个测序读段中的每一个包含空间标记序列、分子标记序列和核酸靶的子序列。该方法可以包括:对于每个独特的空间标记序列,其与基底的不同空间区域关联并且从而与样品的不同空间位置关联,计数具有与核酸靶关联的不同序列的分子标记的数量,以确定在样品的每个空间位置处核酸靶的拷贝数。
本文公开的内容包括用于确定样品中细胞组分靶的空间位置和拷贝数的方法。该方法可以包括:使多于一种细胞组分结合试剂与样品接触,其中多于一种细胞组分结合试剂中的每一种包含细胞组分结合试剂特异性寡核苷酸,细胞组分结合试剂特异性寡核苷酸包含针对细胞组分结合试剂的独特标识符序列,并且其中细胞组分结合试剂能够与多于一种细胞组分靶中的至少一种特异性地结合。该方法可以包括:使与细胞组分结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞组分结合试剂特异性寡核苷酸,多于一种条形码化细胞组分结合试剂特异性寡核苷酸各自包含与独特标识符序列的至少一部分互补的序列。该方法可以包括:获得测序数据,该测序数据包括多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的多于一个测序读段,其中多于一个测序读段中的每一个包含空间标记序列、分子标记序列和独特标识符序列的至少一部分。该方法可以包括:对于每个独特的空间标记序列,其与基底的不同空间区域关联并且从而与样品的不同空间位置关联,计数具有与独特标识符序列关联的不同序列的分子标记的数量,以确定在样品的每个空间位置处多于一种细胞组分靶中的至少一种细胞组分靶的拷贝数。
本文公开的内容包括组合物。在一些实施方案中,组合物包含:包含多于一个空间区域的微孔阵列,其中所述微孔阵列包含至少100个微孔,其中每个微孔具有从约10μm3至约786,000μm3的体积,其中每个微孔包含不同的空间区域,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
本文公开的内容包括组合物。在一些实施方案中,该组合物包含:包含多于一个空间区域的寡核苷酸阵列,其中寡核苷酸阵列包含至少100个点,其中寡核苷酸阵列的每个点包含多于一个空间区域中的不同空间区域,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
定义
除非另外定义,否则本文使用的技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同意义。参见,例如,Singleton等人,Dictionary ofMicrobiology and Molecular Biology,第2版,J.Wiley&Sons(New York,NY 1994);Sambrook等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press(Cold Spring Harbor,NY 1989)。为了本公开内容的目的,下文定义了以下术语。
如本文使用的,术语“衔接子”可以意指促进关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包括空间标记、靶记、样品标记、索引标记或条形码序列(例如,分子标记)中的一种或更多种。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子(pre-adenylated adaptors)。衔接子可以是双链或单链的。一种或更多种衔接子可以位于核酸的5’末端或3’末端。当衔接子在5’末端和3’末端包含已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’末端和/或3’末端的衔接子可以能够与固定在表面上的一种或更多种寡核苷酸杂交。在一些实施方案中,衔接子可以包含通用序列。通用序列可以是两种或更多种核酸分子共有的核苷酸序列的区域。两种或更多种核酸分子也可以具有不同序列的区域。因此,例如,5’衔接子可以包含相同和/或通用核酸序列,并且3’衔接子可以包含相同和/或通用序列。可以存在于多于一种核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单种通用引物复制或扩增多于一种不同序列。类似地,可以存在于核酸分子的集合中的不同成员中的至少一种、两种(例如,一对)或更多种通用序列可以允许使用与通用序列互补的至少一种、两种(例如,一对)或更多种单一通用引物复制或扩增多于一种不同序列。因此,通用引物包含可与此类通用序列杂交的序列。可以修饰具有靶核酸序列的分子以将通用衔接子(例如,非靶核酸序列)附接至不同靶核酸序列的一个末端或两个末端。与靶核酸附接的一种或更多种通用引物可以提供通用引物杂交的位点。与靶核酸附接的一种或更多种通用引物可以彼此相同或不同。
如本文使用的,术语“关联”或“与...关联”可以意指两个或更多个物质可以被鉴定为在某个时间点共定位。关联可以意指,两个或更多个物质在或曾经在相似的容器内。关联可以是信息学关联。例如,关于两个或更多个物质的数字信息可以被存储并且可以用于确定一种或更多种物质在某个时间点共定位。关联也可以是物理关联。在一些实施方案中,两个或更多个关联的物质彼此“拴系”、“附接”或“固定”或与共同的固体或半固体表面“拴系”、“附接”或“固定”。关联可以指用于将标记与固体或半固体支持物(诸如珠)附接的共价或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(诸如靶分子和标记)之间的杂交。
如本文使用的,术语“互补”可以指两个核苷酸之间精确配对的能力。例如,如果核酸在给定位置处的核苷酸能够与另一个核酸的核苷酸形成氢键,则这两个核酸被认为在该位置处是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在全部互补性时它可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则第一核苷酸序列可以被称为第二序列的“互补物”。如果第一核苷酸序列和与第二序列相反的序列(即,核苷酸顺序相反)互补,则第一核苷酸序列可以被称为第二序列的“反向互补物”。如本文使用的,“互补”序列可以指序列的“互补物”或“反向互补物”。从本公开内容理解,如果一个分子可以与另一个分子杂交,则其可以与其所杂交的分子互补或部分互补。
如本文使用的,术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶关联的独特标记的数目的步骤。这种方法(其本质上可以是随机的)将计数分子的问题从相同分子的定位和鉴定之一转化为有关检测一组预定义标记的一系列是/否数字问题。
如本文使用的,术语“一个标记(label)”或“多于一个标记(labels)”可以指与样品中的靶关联的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包括核酸序列的连接处,例如天然和非天然序列的连接处。如本文使用的,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在多种实施方案中,可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶。
如本文使用的,术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的条形码(例如,随机条形码)的池。非耗尽性储库可以包括大量不同的条形码,使得当非耗尽性储库与靶池关联时,每种靶可能与独特条形码关联。每种标记的靶分子的独特性可以通过随机选择的统计来确定,并且取决于与标记的多样性相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子的集合的大小可以通过条形码化处理的随机性质来确定,并且然后对检测到的条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特条形码的数目的比例低时,标记的靶分子是高度独特的(即,多于一个靶分子将被给定标记标记的概率非常低)。
如本文使用的,术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一种或更多种类似物(例如,改变的主链、糖或核酸碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、非天然核酸(xeno nucleic acid)、吗啉代核酸(morpholinos)、锁核酸、二醇核酸、苏糖核酸、二脱氧核苷酸、虫草菌素、7-脱氮-GTP、荧光团(例如,罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿苷、二氢尿苷、辫苷(queuosine)以及怀俄苷(wyosine)。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。
核酸可以包括一种或更多种修饰(例如,碱基修饰、主链修饰),以为核酸提供新的或增强的特征(例如,改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是还包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括呋喃戊糖的那些核苷,磷酸基团可以连接到糖的2’、3’或5’羟基部分。在形成核酸时,磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。继而,此线性聚合化合物的各端可以进一步连接而形成环状化合物;然而,线性化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中,磷酸基团通常可以称为形成核酸的核苷间主链。连接(linkage)或主链可以是3’到5’磷酸二酯连接。
核酸可以包括修饰的主链和/或修饰的核苷间连接。修饰的主链可以包括那些在主链中保留磷原子的主链和那些在主链中没有磷原子的主链。合适的其中含磷原子的修饰的核酸主链可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、亚膦酸酯、磷酰胺酯(phosphoramidate)(包括3’-氨基磷酰胺酯和氨基烷基磷酰胺酯、磷酸二酰胺酯(phosphorodiamidates)、硫代磷酰胺酯(thionophosphoramidates))、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒代磷酸酯和硼磷酸酯,具有正常3’-5’连接、2’-5’连接的类似物以及具有反向极性的类似物(其中一个或更多个核苷酸间连接是3’至3’、5’至5’或2’至2’连接)。
核酸可以包括由短链烷基或环烷基核苷间连接,混合杂原子,和烷基或环烷基核苷间连接,或者一个或更多个短链杂原子的或杂环的核苷间连接形成的多核苷酸主链。这些可以包括具有吗啉代(morpholino)连接的那些(部分由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基(formacetyl)和硫代甲乙酰基主链;亚甲基甲乙酰基和硫代甲乙酰基主链;核糖乙酰基主链;含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;和具有混合的N、O、S和CH2组分部分的其他的那些。
核酸可以包括核酸模拟物。术语“模拟物”可以意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间连接二者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环的替代也可以称为糖替代物(surrogate)。可以维持杂环碱基部分或修饰的杂环碱基部分,以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖主链可以被含酰胺的主链替代,特别是被氨基乙基甘氨酸主链替代。核苷酸可以被保留,并且直接或间接与主链的酰胺部分的氮杂氮原子结合。PNA化合物中的主链可以包含两个或更多个连接的氨基乙基甘氨酸单元,这使得PNA具有含酰胺的主链。杂环碱基部分可以直接或间接与主链的酰胺部分的氮杂氮原子结合。
核酸可以包括吗啉代主链结构。例如,核酸可以包含替代核糖环的6元吗啉代环。在这些实施方案的一些中,磷酸二酰胺酯或其他非磷酸二酯核苷间连接可以替代磷酸二酯连接。
核酸可以包括具有附接至吗啉代环的杂环碱基的连接的吗啉代单元(例如,吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白可以具有较少的不合意的相互作用。基于吗啉代核酸的多核苷酸可以是核酸的非离子模拟物。吗啉代类别内的各种化合物可以使用不同的连接基团来连接。另外类别的多核苷酸模拟物可以称为环己烯基核酸(CeNA)。核酸分子中通常存在的呋喃糖环可以被环己烯基环替代。使用亚磷酰胺化学可以制备CeNA DMT保护的亚磷酰胺单体并用于寡聚化合物合成。将CeNA单体掺入核酸链可以增加DNA/RNA杂合体的稳定性。CeNA寡腺苷酸酯可以与核酸互补物形成复合体,具有与天然复合体相似的稳定性。另外的修饰可以包括锁核酸(LNA),其中2’-羟基基团与糖环的4’碳原子连接,从而形成2’-C,4’-C-氧亚甲基连接,从而形成双环糖部分。连接可以是桥接2’氧原子和4’碳原子的亚甲基(-CH2-)n基团,其中n是1或2。LNA和LNA类似物可以显示与互补核酸的非常高的双链体热稳定性(Tm=+3℃至+10℃)、对3’-外切核酸酶降解的稳定性和良好的溶解性。
核酸还可以包括核碱基(通常简称为“碱基”)修饰或取代。如本文使用的,“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如,腺嘌呤(A)和鸟嘌呤(G)),以及嘧啶碱基(例如,胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。经修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物,2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤代尿嘧啶(5-halouracil)和胞嘧啶、5-丙炔基(-C≡C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶,8-卤代、8-氨基、8-硫代、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-钳(G-clamps)诸如被取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-钳诸如被取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。
如本文使用的,术语“样品”可以指包含靶的组合物。用于通过所公开的方法、装置和系统进行分析的合适样品包括细胞、组织、器官或生物体。
如本文使用的,术语“采样装置”或“装置”可以指可以取样品的切片和/或将所述切片放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(FACS)仪、细胞分选仪、活检针、活检装置、组织切片装置、微流体装置、刀片格栅和/或超薄切片机。
如本文使用的,术语“固体支持物”可以指可以附接多于一个条形码(例如,随机条形码)的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座(bearing)、圆柱体或由塑料、陶瓷、金属或聚合材料(例如,水凝胶)构成的其他类似配置,其上可以固定核酸(例如,共价地或非共价地)。固体支持物可以包括可以是球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述非球形或不规则形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多于一个固体支持物可以不包括基底。固体支持物可以与术语“珠”互换使用。
如本文使用的,术语“随机条形码”可以指本公开内容的包含标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如本文使用的,术语“基因特异性随机条形码”可以指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如本文使用的,术语“随机条形码化”可以指核酸的随机标记(例如,条形码化)。随机条形码化可以利用递归泊松策略来关联并对与靶关联的标记进行定量。如本文使用的,术语“随机条形码化”可以与“随机标记”互换使用。
如本文使用的,术语“靶”可以指可与条形码(例如,随机条形码)关联的组合物。用于通过所公开的方法、装置和系统进行分析的示例性合适的靶包括寡核苷酸、DNA、RNA、mRNA、微RNA、tRNA等。靶可以是单链的或双链的。在一些实施方案中,靶可以是蛋白、肽或多肽。在一些实施方案中,靶是脂质。如本文使用的,“靶”可以与“物质(species)”互换使用。
如本文使用的,术语“逆转录酶”可以指具有逆转录酶活性(即,催化从RNA模板合成DNA)的一组酶。通常,这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒(retroplasmid)逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II组内含子衍生的逆转录酶,及它们的突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和II组内含子逆转录酶。II组内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、细长嗜热聚球藻(Thermosynechococcus elongatus)TeI4c内含子逆转录酶或嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)GsI-IIC内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即,尤其是逆转录子、II组内含子、以及多样性产生型逆转录元件)。
术语“通用衔接子引物”、“通用引物衔接子”或“通用衔接子序列”可互换地使用,以指可以用于与条形码(例如,随机条形码)杂交以产生基因特异性条形码的核苷酸序列。通用衔接子序列可以例如是在本公开内容的方法中使用的遍及所有条形码通用的已知序列。例如,当使用本文公开的方法标记多于一个靶时,每一种靶特异性序列可以连接到相同的通用衔接子序列。在一些实施方案中,多于一个通用衔接子序列可以用于本文公开的方法中。例如,当使用本文公开的方法标记多于一个靶时,至少两种靶特异性序列连接到不同的通用衔接子序列。通用衔接子引物及其互补物可以被包括在两种寡核苷酸中,其中的一种寡核苷酸包含靶特异性序列且另一种寡核苷酸包含条形码。例如,通用衔接子序列可以是包含靶特异性序列的寡核苷酸的一部分以产生与靶核酸互补的核苷酸序列。包含条形码和通用衔接子序列的互补序列的第二寡核苷酸可与核苷酸序列杂交并产生靶特异性条形码(例如,靶特异性随机条形码)。在一些实施方案中,通用衔接子引物具有与本公开内容的方法中使用的通用PCR引物不同的序列。
条形码
条形码化,诸如随机条形码化,已描述于以下中:例如,Fu等人,Proc Natl AcadSci U.S.A.,2011年5月31日;108(22):9026-31;美国专利申请公布第US2011/0160078号;Fan等人,Science,2015年2月6日,347(6222):1258367;美国专利申请公布第US2015/0299784号和PCT申请公布第WO2015/031691号;这些中的每一个的内容,包括任何支持或补充信息或材料,通过引用以其整体并入本文。在一些实施方案中,本文公开的条形码可以是随机条形码,所述随机条形码可以是可以用于对靶进行随机标记(例如,条形码化、加标签)的多核苷酸序列。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现次数的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或这些值中的任何两个值之间的数字或范围,则条形码可以称为随机条形码。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现次数的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1,则条形码可以称为随机条形码。随机条形码的条形码序列可以称为分子标记。
条形码(例如,随机条形码)可以包括一种或更多种标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如,分子标记)、样品标记、板标记、空间标记和/或前空间标记(pre-spatial label)。图1图示了具有空间标记的示例性条形码104。条形码104可以包含可以将条形码与固体支持物108连接的5’胺。条形码可以包含通用标记、维度标记、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维度标记、空间标记、细胞标记和分子标记)的顺序可以变化。例如,如图1中所示,通用标记可以是最5’侧的标记(5’-most label),且分子标记可以是最3’侧的标记(3’-most label)。空间标记、维度标记和细胞标记可以处于任何顺序。在一些实施方案中,通用标记、空间标记、维度标记、细胞标记和分子标记处于任何顺序。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如,靶核酸、RNA、mRNA、DNA)相互作用。例如,靶结合区可以包含可以与mRNA的多(A)尾相互作用的寡(dT)序列。在一些情况下,条形码的标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列)可以由1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸隔开。
标记(例如,细胞标记)可以包含一组独特的定义长度的核酸子序列,例如每一组七个核苷酸(相当于一些汉明错误校正代码中使用的比特数目),其可被设计成提供错误校正能力。可以设计包含七个核苷酸序列的错误校正子序列组,使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数),例如一组错误校正子序列可被设计成展现三个核苷酸的遗传距离。在这种情况下,对于标记的靶核酸分子的序列数据组中的错误校正序列的审查(在下文更详细地描述)可允许人们检测或校正扩增或测序错误。在一些实施方案中,用于产生错误校正代码的核酸子序列的长度可以变化,例如,它们的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、31个、40个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。在一些实施方案中,其他长度的核酸子序列可以用来产生错误校正代码。
条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是以下或包括以下:核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、各自含有多(A)尾的RNA或其任何组合。在一些实施方案中,多于一个靶可以包括脱氧核糖核酸(DNA)。
在一些实施方案中,靶结合区可以包括可以与mRNA的多(A)尾相互作用的寡(dT)序列。条形码的一种或更多种标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列(例如,分子标记))可以通过间隔区(spacer)与条形码的剩余标记中的另一种或两种隔开。间隔区可以是例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸。在一些实施方案中,条形码的标记中没有一个标记被间隔区隔开。
通用标记
条形码可以包含一种或更多种通用标记。在一些实施方案中,一种或更多种通用标记对于附接至给定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施方案中,一种或更多种通用标记对于附接至多于一个珠的所有条形码可以是相同的。在一些实施方案中,通用标记可以包括能够与测序引物杂交的核酸序列。测序引物可以用于对包括通用标记的条形码进行测序。测序引物(例如,通用测序引物)可以包括与高通量测序平台相关的测序引物。在一些实施方案中,通用标记可以包括能够与PCR引物杂交的核酸序列。在一些实施方案中,通用标记可以包括能够与测序引物和PCR引物杂交的核酸序列。能够与测序引物或PCR引物杂交的通用标记的核酸序列可以被称为引物结合位点。通用标记可以包括可以用于引发条形码转录的序列。通用标记可以包括可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。例如,通用标记可以包括至少约10个核苷酸。通用标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。在一些实施方案中,可裂解接头或修饰的核苷酸可以是通用标记序列的一部分,以使条形码能够从支持物上被裂解下来。
维度标记
条形码可以包含一种或更多种维度标记。在一些实施方案中,维度标记可以包括提供关于标记(例如,随机标记)发生的维度的信息的核酸序列。例如,维度标记可以提供关于靶被条形码化的时间的信息。维度标记可以与样品中条形码化(例如,随机条形码化)的时间关联。维度标记可以在标记的时间被激活。不同的维度标记可以在不同的时间被激活。维度标记提供关于靶、靶的组和/或样品被条形码化的顺序的信息。例如,在细胞周期的G0期可以将细胞的群体条形码化。在细胞周期的G1期,可以用条形码(例如,随机条形码)对细胞再次进行脉冲处理。在细胞周期的S期,可以用条形码对细胞再次进行脉冲处理,等等。每次脉冲(例如,细胞周期的每个时期)时的条形码可以包含不同的维度标记。以这种方式,维度标记提供关于哪些靶在细胞周期的哪个时期被标记的信息。维度标记可以探询许多不同的生物学时间。示例性的生物学时间可以包括但不限于细胞周期、转录(例如,转录起始)和转录物降解。在另一个实例中,样品(例如,细胞、细胞的群体)可以在用药物和/或疗法治疗之前和/或之后标记。不同靶的拷贝数的变化可以指示样品对药物和/或疗法的响应。
维度标记可以是可激活的。可激活的维度标记可以在特定时间点被激活。可激活的标记可以被例如组成性地激活(例如,不关闭)。可激活的维度标记可以被例如可逆地激活(例如,可激活的维度标记可以被打开和关闭)。维度标记可以被例如可逆地激活至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。维度标记可以被可逆地激活例如至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。在一些实施方案中,可以用荧光、光、化学事件(例如,裂解、连接另一种分子、添加修饰(例如,聚乙二醇化、类泛素化(sumoylate)、乙酰化、甲基化、去乙酰化、去甲基化))、光化学事件(例如,光罩(photocaging))以及引入非天然的核苷酸将维度标记激活。
在一些实施方案中,维度标记对于附接至给定固体支持物(例如,珠)的所有条形码(例如,随机条形码)可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上至少60%、70%、80%、85%、90%、95%、97%、99%或100%的条形码可以包含相同的维度标记。在一些实施方案中,同一固体支持物上至少60%的条形码可以包含相同的维度标记。在一些实施方案中,同一固体支持物上至少95%的条形码可以包含相同的维度标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特的维度标记序列。维度标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸,或这些值中的任何两个值之间的数字或范围的核苷酸。维度标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。维度标记可以包含约5个至约200个之间的核苷酸。维度标记可以包含约10个至约150个之间的核苷酸。维度标记可以包含长度在约20个至约125个之间的核苷酸。
空间标记
条形码可以包含一种或更多种空间标记。在一些实施方案中,空间标记可以包含提供关于与条形码关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品中的坐标关联。坐标可以是固定的坐标。例如,坐标可以相对于基底固定。空间标记可以参考二维或三维网格。坐标可以相对于界标(landmark)固定。界标可在空间中被鉴定。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标,诸如具有可鉴定标识(identifiable identifier)(诸如色码、条形码、磁特性(magnetic property)、荧光、放射性或独特尺寸或形状)的结构。空间标记可以与物理分区(例如,孔、容器或液滴)关联。在一些实施方案中,将多于一个空间标记一起用于编码空间中的一个或更多个位置。
空间标记对于附接至给定固体支持物(例如,珠)的所有条形码可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是至少或至多60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,同一固体支持物上至少60%的条形码可以包含相同的空间标记。在一些实施方案中,同一固体支持物上至少95%的条形码可以包含相同的空间标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特的空间标记序列。空间标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。空间标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。空间标记可以包含约5个至约200个之间的核苷酸。空间标记可以包含约10个至约150个之间的核苷酸。空间标记可以包含长度在约20个至约125个之间的核苷酸。
细胞标记
条形码(例如,随机条形码)可以包含一种或更多种细胞标记。在一些实施方案中,细胞标记可以包含提供用于确定哪种靶核酸来源于哪种细胞的信息的核酸序列。在一些实施方案中,细胞标记对于附接至给定固体支持物(例如,珠)的所有条形码是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。例如,同一固体支持物上至少60%的条形码可以包含相同的细胞标记。作为另一个实例,同一固体支持物上至少95%的条形码可以包含相同的细胞标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特的细胞标记序列。细胞标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。例如,细胞标记可以包含约5个至约200个之间的核苷酸。作为另一个实例,细胞标记可以包含约10个至约150个之间的核苷酸。作为又另一个实例,细胞标记可以包含长度在约20个至约125个之间的核苷酸。
条形码序列
条形码可以包含一种或更多种条形码序列。在一些实施方案中,条形码序列可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器(例如,提供粗略估计)的核酸序列。
在一些实施方案中,将一组相异的(diverse)条形码序列附接至给定固体支持物(例如,珠)。在一些实施方案中,可以有以下或可以有约以下的独特分子标记序列:102种、103种、104种、105种、106种、107种、108种、109种或这些值中的任何两个值之间的数字或范围。例如,多于一个条形码可以包括约6561种具有不同序列的条形码序列。作为另一个实例,多于一个条形码可以包括约65536种具有不同序列的条形码序列。在一些实施方案中,可以有至少以下或可以有至多以下的独特条形码序列:102种、103种、104种、105种、106种、107种、108种或109种。独特分子标记序列可以附接至给定固体支持物(例如,珠)。在一些实施方案中,独特分子标记序列被颗粒(例如水凝胶珠)部分或全部包含。
在不同实施方式中,条形码的长度可以是不同的。例如,条形码的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。作为另一个实例,条形码的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。
分子标记
条形码(例如,随机条形码)可以包含一种或更多种分子标记。分子标记可以包含条形码序列。在一些实施方案中,分子标记可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。分子标记可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器的核酸序列。
在一些实施方案中,将一组相异的分子标记附接至给定固体支持物(例如,珠)。在一些实施方案中,可以有以下或可以有约以下的独特分子标记序列:102种、103种、104种、105种、106种、107种、108种、109种或这些值中的任何两个值之间的数字或范围。例如,多于一个条形码可以包括约6561种具有不同序列的分子标记。作为另一个实例,多于一个条形码可以包括约65536种具有不同序列的分子标记。在一些实施方案中,可以有至少以下或可以有至多以下的独特分子标记序列:102种、103种、104种、105种、106种、107种、108种或109种。具有独特分子标记序列的条形码可以附接至给定固体支持物(例如,珠)。
对于使用多于一个随机条形码进行的条形码化(例如,随机条形码化),不同分子标记序列的数目与任何靶的出现次数的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1,或这些值中的任何两个值之间的数字或范围。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。在一些实施方案中,不同分子标记序列的数目与任何靶的出现次数的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1。
分子标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。分子标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。
靶结合区
条形码可以包含一个或更多个靶结合区,诸如捕获探针。在一些实施方案中,靶结合区可以与感兴趣的靶杂交。在一些实施方案中,靶结合区可以包含与靶(例如,靶核酸、靶分子,例如待分析的细胞核酸)特异性地杂交(例如,与特定基因序列特异性地杂交)的核酸序列。在一些实施方案中,靶结合区可以包含可以附接(例如,杂交)至特定靶核酸的特定位置的核酸序列。在一些实施方案中,靶结合区可以包含能够与限制性酶位点突出端(例如,EcoRI粘性末端突出端)特异性地杂交的核酸序列。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。
在一些实施方案中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以指可以独立于靶核酸的特定序列结合多于一个靶核酸的序列。例如,靶结合区可以包含随机多聚体序列、多(dA)序列、多(dT)序列、多(dG)序列、多(dC)序列或其组合。例如,靶结合区可以是与mRNA分子上的多(A)尾杂交的寡(dT)序列。随机多聚体序列可以是,例如,随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施方案中,对于附接至给定珠的所有条形码,靶结合区是相同的。在一些实施方案中,对于附接至给定珠的多于一个条形码,靶结合区可以包括两种或更多种不同的靶结合序列。靶结合区的长度可以是以下或可以是约以下:5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。例如,可以使用逆转录酶诸如Moloney鼠白血病病毒(MMLV)逆转录酶逆转录mRNA分子,以产生具有多(dC)尾的cDNA分子。条形码可以包括具有多(dG)尾的靶结合区。在条形码的多(dG)尾和cDNA分子的多(dC)尾之间碱基配对后,逆转录酶将模板链从细胞RNA分子转换到条形码,并继续向条形码的5’末端复制。通过这样做,得到的cDNA分子在该cDNA分子3’末端上含有条形码序列(诸如分子标记)。
在一些实施方案中,靶结合区可以包含寡(dT),所述寡(dT)可以与包含多腺苷酸化末端的mRNA杂交。靶结合区可以是基因特异性的。例如,可以将靶结合区配置为与靶的特定区域杂交。靶结合区的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸。靶结合区的长度可以是约5-30个核苷酸。当条形码包含基因特异性靶结合区时,条形码在本文中可以称为基因特异性条形码。
定向特性
随机条形码(例如,随机条形码)可以包含一种或更多种可以用于定向(例如,比对)条形码的定向特性。条形码可以包含用于等电聚焦的部分。不同的条形码可以包含不同的等电聚焦点。当将这些条形码引入样品中时,样品可以经历等电聚焦,以便于将条形码定向成已知的方式。以这种方式,定向特性可以用于开发样品中条形码的已知的映射。示例性定向特性可以包括电泳迁移率(例如,基于条形码的尺寸)、等电点、自旋、电导率和/或自组装。例如,具有自组装的定向特性的条形码激活时可以自组装成特定的定向(例如,核酸纳米结构)。
亲和特性
条形码(例如,随机条形码)可以包含一种或更多种亲和特性。例如,空间标记可以包含亲和特性。亲和特性可以包括可以促进条形码与另一种实体(例如,细胞受体)结合的化学部分和/或生物部分。例如,亲和特性可以包括抗体,例如,对样品上的特定部分(例如,受体)特异性的抗体。在一些实施方案中,抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或特定细胞类型或分子附近的靶可以被标记(例如,被随机标记)。在一些实施方案中,亲和特性可以提供除了空间标记的核苷酸序列之外的空间信息,因为抗体可以将条形码引导至特定位置。抗体可以是治疗性抗体,例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。抗体可以是裸抗体或融合抗体。
抗体可以是全长(即,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,IgG抗体)或免疫球蛋白分子的免疫活性(即,特异性结合性)部分(如抗体片段)。
抗体片段可以是例如抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。在一些实施方案中,抗体片段可以与由全长抗体识别的相同抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段,诸如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、与细胞表面受体(CD8、CD34、CD45)结合的抗体和治疗性抗体。
通用衔接子引物
条形码可以包含一种或更多种通用衔接子引物。例如,基因特异性条形码(诸如基因特异性随机条形码)可以包含通用衔接子引物。通用衔接子引物可以指遍及所有条形码的通用的核苷酸序列。通用衔接子引物可以用于构建基因特异性条形码。通用衔接子引物的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。通用衔接子引物的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸。通用衔接子引物的长度可以是5-30个核苷酸。
接头
当条形码包含多于一个类型的标记(例如,多于一个细胞标记或多于一个条形码序列,诸如一个分子标记)时,标记之间可以散布有接头标记序列。接头标记序列的长度可以是至少约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。接头标记序列的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。在一些情况下,接头标记序列的长度是12个核苷酸。接头标记序列可以用于促进条形码的合成。接头标记可以包括错误校正(例如,汉明)代码。
固体支持物
在一些实施方案中,本文公开的条形码(诸如随机条形码)可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施方案中,固体支持物上的多于一个条形码(例如,第一多于一个条形码)的一些或所有条形码序列(诸如,随机条形码(例如,第一条形码序列)的分子标记)相差至少一个核苷酸。同一固体支持物上的条形码的细胞标记可以是相同的。不同的固体支持物上的条形码的细胞标记可以相差至少一个核苷酸。例如,第一固体支持物上的第一多于一个条形码的第一细胞标记可以具有相同的序列,且第二固体支持物上的第二多于一个条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多于一个条形码的第一细胞标记和第二固体支持物上的第二多于一个条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5-20个核苷酸长。条形码序列可以是例如约5-20个核苷酸长。合成颗粒可以是例如珠。
珠可以是例如硅胶珠、可控孔径玻璃珠、磁珠、Dynabead、Sephadex/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。珠可以包括材料诸如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮或其任何组合。
在一些实施方案中,珠可以是用条形码或随机条形码官能化的聚合物珠(例如可变形珠或凝胶珠)(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(TEMED))后,可以产生凝胶珠。
在一些实施方案中,颗粒可以是可破坏的(例如,可溶解的、可降解的)。例如,聚合物珠可以例如在期望的条件下溶解、熔化或降解。所期望的条件可以包括环境条件。所期望的条件可以导致聚合物珠以受控方式溶解、熔化或降解。凝胶珠可以由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。
例如,分析物和/或试剂(诸如寡核苷酸条形码)可以偶联/固定至凝胶珠的内表面(例如,经由寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散而可及的内部)和/或凝胶珠的外表面或本文描述的任何其他微胶囊。偶联/固定可以经由任何形式的化学键合(例如,共价键、离子键)或物理现象(例如,范德华力、偶极-偶极相互作用等)。在一些实施方案中,本文描述的试剂与凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的,诸如,例如经由不稳定部分(例如,经由化学交联物,包括本文描述的化学交联物)。在施加刺激后,不稳定部分可以被裂解并释放所固定的试剂。在一些实施方案中,不稳定部分是二硫键。例如,在经由二硫键将寡核苷酸条形码固定至凝胶珠的情况下,使二硫键暴露于还原剂可以裂解二硫键并从珠释放寡核苷酸条形码。不稳定部分可以作为凝胶珠或微胶囊的一部分、作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分被包括。在一些实施方案中,多于一个条形码中的至少一个条形码可以被固定在颗粒上、被部分地固定在颗粒上、被包封在颗粒中、被部分地包封在颗粒中或其任何组合。
在一些实施方案中,凝胶珠可以包括宽范围的不同的聚合物,包括但不限于:聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白和/或塑料。聚合物可以包括但不限于以下材料:诸如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸酯)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(双烯丙基二甲基-氯化铵)(PDADMAC)、聚(吡咯)(poly(pyrolle),PPy)、聚(乙烯基吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PPA)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-羟基乙酸)(PLGA)。
许多化学刺激可以用于触发珠的破坏、溶解或降解。这些化学改变的实例可以包括但不限于pH介导的珠壁改变、经由交联键的化学裂解使珠壁崩解、珠壁的触发解聚和珠壁转换反应。批量(bulk)改变也可以用于触发珠的破坏。
通过各种刺激对微胶囊的批量或物理改变在设计胶囊以释放试剂方面也提供了许多优点。在宏观尺度上发生批量或物理改变,其中珠破裂是由刺激引起的机械-物理力的结果。这些过程可以包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率的改变。
生物刺激也可以用于触发珠的破坏、溶解或降解。通常,生物触发物类似于化学触发物,但是许多实例使用生物分子或生命系统中常见的分子,诸如酶、肽、糖、脂肪酸、核酸等。例如,珠可以包含具有对特定蛋白酶的裂解敏感的肽交联的聚合物。更特别地,一个实例可以包括包含GFLGK肽交联的微胶囊。在添加生物触发物(诸如蛋白酶组织蛋白酶B)后,壳壁的肽交联被裂解并且珠的内容物被释放。在其他情况下,蛋白酶可以是热激活的。在另一个实例中,珠包括包含纤维素的壳壁。壳聚糖水解酶的添加用作纤维素键裂解、壳壁解聚及其内部内容物释放的生物触发物。
还可以在施加热刺激后诱导珠释放其内容物。温度的改变可以引起珠的各种改变。热量的变化可以引起珠熔化,使得珠壁崩解。在其他情况下,热量可以增加珠的内部组分的内部压力,使得珠破裂或爆炸。在又其他的情况下,热量可以使珠转化成收缩的脱水状态。热量还可以作用于珠壁内的热敏聚合物,从而引起珠的破坏。
将磁性纳米颗粒包括在微胶囊的珠壁中可以允许珠的触发破裂以及将珠引导成阵列。本公开内容的装置可以包括用于任一目的的磁珠。在一个实例中,将Fe3O4纳米颗粒掺入含聚电解质的珠中在存在振荡磁场刺激的情况下触发破裂。
珠也可以由于电刺激的结果被破坏、溶解或降解。与先前部分中描述的磁性颗粒类似,电敏珠可以允许珠的触发破裂以及其他功能,诸如电场中的对齐、电导率或氧化还原反应。在一个实例中,含电敏材料的珠在电场中对齐,从而可以控制内部试剂的释放。在其他实例中,电场可以在珠壁本身内引起氧化还原反应,这可以增加孔隙率。
可以使用光刺激来破坏珠。许多光触发物是可能的,并且可以包括使用各种分子(诸如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如,金属氧化物涂层可以用作胶囊触发物。涂覆有SiO2的聚电解质胶囊的UV照射可以导致珠壁的崩解。在又另一个实例中,可以将可光切换材料(诸如偶氮苯基团)掺入珠壁中。在施加UV或可见光后,诸如这些的化学物质在吸收光子后经历可逆的顺式至反式异构化。在此方面,掺入光子开关(photon switch)产生在施加光触发物后可以崩解或变得更多孔的珠壁。
例如,在图2中图示的条形码化(例如,随机条形码化)的非限制性实例中,在框208处将细胞(诸如单细胞)引入微孔阵列的多于一个微孔上之后,在框212处可以将珠引入微孔阵列的多于一个微孔上。每个微孔可以包含一个珠。珠可以包含多于一个条形码。条形码可以包含附接至珠的5’胺区域。条形码可以包含通用标记、条形码序列(例如,分子标记)、靶结合区或其任何组合。
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。与固体支持物关联的条形码可各自包含选自以下组的条形码序列,该组包括至少100种或1000种具有独特序列的条形码序列。在一些实施方案中,与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施方案中,与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如,所述百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%,或这些值中的任何两个值之间的数字或范围。作为另一个实例,所述百分比可以是至少以下或可以是至多以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,与固体支持物关联的条形码可以具有相同的细胞标记。与不同固体支持物关联的条形码可以具有选自以下组的不同的细胞标记,该组包括至少100种或1000种具有独特序列的细胞标记。
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。在一些实施方案中,可以用包括与多于一个条形码关联的多于一个合成颗粒的固体支持物将样品中的多于一个靶条形码化。在一些实施方案中,固体支持物可以包括与多于一个条形码关联的多于一个合成颗粒。不同固体支持物上的多于一个条形码的空间标记可以相差至少一个核苷酸。固体支持物可以例如在二维或三维包括多于一个条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔径玻璃珠、磁珠、Dynabead、Sephadex/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体或其任何组合。在一些实施方案中,固体支持物可以自由浮动。在一些实施方案中,固体支持物可以包埋到半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单独的核苷酸。条形码可以与基底关联。
如本文使用的,术语“拴系的”、“附接的”和“固定的”可以互换使用,并且可以指用于将条形码附接至固体支持物的共价或非共价方式。可以将各种不同的固体支持物中的任何一种用作固体支持物,以用于附接预先合成的条形码或用于条形码的原位固相合成。
在一些实施方案中,固体支持物是珠。珠可以包括一种或更多种类型的实心的、多孔的或空心的球体、球、承座、圆柱体或可以固定核酸(例如,共价地或非共价地)的其他类似配置。珠可以由例如塑料、陶瓷、金属、聚合物材料或其任何组合构成。珠可以是或包括球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述非球形或不规则形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。在一些实施方案中,珠的形状可以是非球形的。
珠可以包括各种材料,包括但不限于顺磁性材料(例如,镁、钼、锂和钽)、超顺磁性材料(例如,铁氧体(Fe3O4;磁铁矿)纳米颗粒)、铁磁材料(例如,铁、镍、钴,它们的一些合金,以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。
在一些实施方案中,珠(例如,标记所附接的珠)是水凝胶珠。在一些实施方案中,珠包括水凝胶。
本文公开的一些实施方案包括一个或更多个颗粒(例如,珠)。每个颗粒可以包含多于一个寡核苷酸(例如,条形码)。多于一个寡核苷酸中的每一个可以包含条形码序列(例如,分子标记序列)、细胞标记和靶结合区(例如,寡(dT)序列、基因特异性序列、随机多聚体或其组合)。多于一个寡核苷酸的每一个的细胞标记序列可以是相同的。不同颗粒上的寡核苷酸的细胞标记序列可以是不同的,使得可以鉴定不同颗粒上的寡核苷酸。在不同实施方式中,不同细胞标记序列的数目可以是不同的。在一些实施方案中,细胞标记序列的数目可以是以下或可以是约以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108、109、这些值中的任何两个值之间的数字或范围或更多。在一些实施方案中,细胞标记序列的数目可以是至少以下或可以是至多以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108或109。在一些实施方案中,多于一个颗粒中的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个颗粒包括具有相同细胞序列的寡核苷酸。在一些实施方案中,包括具有相同细胞序列的寡核苷酸的多于一个颗粒可以是至多0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更多。在一些实施方案中,多于一个颗粒全都不具有相同的细胞标记序列。
在每个颗粒上的多于一个寡核苷酸可以包含不同的条形码序列(例如,分子标记)。在一些实施方案中,条形码序列的数目可以是以下或可以是约以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108、109或这些值中的任何两个值之间的数字或范围。在一些实施方案中,条形码序列的数目可以是至少以下或可以是至多以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108或109。例如,多于一个寡核苷酸中的至少100种包含不同的条形码序列。作为另一个实例,在单个颗粒中,多于一个寡核苷酸中的至少100种、500种、1000种、5000种、10000种、15000种、20000种、50000种、这些值中的任何两个值之间的数字或范围或更多种包含不同的条形码序列。一些实施方案提供了多于一个包含条形码的颗粒。在一些实施方案中,待标记的靶和不同条形码序列的出现(或拷贝或数目)的比例可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更高。在一些实施方案中,多于一个寡核苷酸的每一个还包含样品标记、通用标记或二者。颗粒可以是例如纳米颗粒或微米颗粒。
珠的尺寸可以不同。例如,珠的直径范围可以为从0.1微米至50微米。在一些实施方案中,珠的直径可以是以下或可以是约以下:0.1微米、0.5微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米、50微米或这些值中的任何两个值之间的数字或范围。
珠的直径可以与基底的孔的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短以下或者约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或这些值中的任何两个值之间的数字或范围。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比细胞的直径长或短以下或约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,珠的直径可以比细胞的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%。
珠可以附接至基底和/或包埋到基底中。珠可以附接至凝胶、水凝胶、聚合物和/或基质和/或包埋到凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上的条形码上存在的空间标记来鉴定,该空间标记可以用作位置地址。
珠的实例可以包括但不限于链霉抗生物素蛋白珠、琼脂糖珠、磁珠、微珠、抗体缀合的珠(例如,抗免疫球蛋白微珠)、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基封端磁珠。
珠可以与量子点或荧光染料关联(例如,用量子点或荧光染料浸渍),以使其在一个荧光光学通道或多于一个光学通道中发荧光。珠可以与氧化铁或氧化铬关联,使其成为顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠成像。珠可以具有与珠关联的可检测代码。例如,珠可以包含条形码。珠可以改变尺寸,例如由于在有机溶液或无机溶液中溶胀。珠可以是疏水的或亲水的。珠可以是生物相容的。
固体支持物(例如,珠)可以被可视化。固体支持物可以包含可视化标签(例如,荧光染料)。固体支持物(例如,珠)可以蚀刻有标识符(例如,数字)。标识符可以通过对珠成像来可视化。
固体支持物可以包括可溶性、半溶性或不溶性材料。当固体支持物包括接头、支架、构建模块(building block)或其他与其附接的反应性部分时,固体支持物可以被称为“官能化的”,而当固体支持物缺少这种与其附接的反应性部分时,固体支持物可以被称为“非官能化的”。固体支持物可以以溶液中游离,诸如在微量滴定孔中的形式;以流通形式,诸如在柱中;或以浸量尺(dipstick)使用。
固体支持物可以包括膜、纸(paper)、塑料、涂覆表面、平坦表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以采取树脂、凝胶、微球或其他几何配置的形式。固体支持物可以包括二氧化硅芯片、微米颗粒、纳米颗粒、板、阵列、毛细管、平坦支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢、金、银、铝、硅和铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如,由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成),和/或晶片、梳、针或针头(例如,适于组合合成或分析的针阵列)或珠,平坦表面诸如晶片(例如,硅晶片)的凹陷或纳升孔阵列,具有凹陷的晶片(具有或不具有过滤器底部)。
固体支持物可以包括聚合物基质(例如,凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如,细胞器周围)。聚合物基质可以能够被泵送到整个循环系统。
基底和微孔阵列
如本文使用的,基底可以指固体支持物类型。基底可以指可以包含本公开内容的条形码或随机条形码的固体支持物。基底可以例如包括多于一个微孔。基底可以例如是包括两个或更多个微孔的孔阵列。在一些实施方案中,微孔可以包括定义体积的小的反应室。在一些实施方案中,微孔可以捕获一个或更多个细胞。在一些实施方案中,微孔可以仅捕获一个细胞。在一些实施方案中,微孔可以捕获一个或更多个固体支持物。在一些实施方案中,微孔可以仅捕获一个固体支持物。在一些实施方案中,微孔捕获单细胞和单个固体支持物(例如,珠)。微孔可以包含本公开内容的条形码试剂。
条形码化的方法
本公开内容提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中不同位置处的不同靶的数目的方法。该方法可以包括将条形码(例如,随机条形码)紧密接近样品放置,裂解样品,将不同的靶与条形码关联,对靶进行扩增和/或对靶进行数字计数。该方法还可以包括对从条形码上的空间标记获得的信息进行分析和/或将所述信息可视化。在一些实施方案中,该方法包括使样品中的多于一个靶可视化。将多于一个靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一个靶条形码化(例如,随机条形码化)之前或之后产生二维映射图和三维映射图。将样品中的多于一个靶可视化可以包括将多于一个靶映射到样品的映射图上。将多于一个靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在对样品中的多于一个靶进行条形码化之前或之后产生二维映射图和三维映射图。在一些实施方案中,可以在裂解样品之前或之后产生二维映射图和三维映射图。在产生二维映射图或三维映射图之前或之后裂解样品可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。
在一些实施方案中,将多于一个靶条形码化包括将多于一个条形码与多于一个靶杂交以产生条形码化靶(例如,随机条形码化靶)。将多于一个靶条形码化可以包括产生条形码化靶的索引文库。产生条形码化靶的索引文库可以用包含多于一个条形码(例如,随机条形码)的固体支持物来进行。
使样品和条形码接触
本公开内容提供了用于使样品(例如,细胞)与本公开内容的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如,随机条形码)接触。细胞可以例如通过重力流来接触,其中可以使细胞沉降并且产生单层。样品可以是组织薄切片。可以将薄切片放置于基底上。样品可以是一维的(例如,形成平坦表面)。可以使样品(例如,细胞)分散遍及基底,例如,通过在基底上生长/培养细胞。
当条形码紧密接近靶时,靶可以与条形码杂交。条形码可以按不可耗尽的比例接触,使得每一种不同的靶可以与本公开内容的不同条形码关联。为了确保靶与条形码之间的有效关联,可以将靶与条形码交联。
细胞裂解
在细胞和条形码的分配之后,可以将细胞裂解以释放靶分子。细胞裂解可以通过各种手段中的任何一种来完成,例如通过化学或生化手段,通过渗透冲击,或通过热裂解、机械裂解或光学裂解的手段。可以通过添加包含去污剂(例如,SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。为了增加靶与条形码的关联,可以通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。
在一些实施方案中,可以使用滤纸来裂解样品。可以在滤纸上部用裂解缓冲液浸泡滤纸。可以将滤纸用压力施加至样品,这可以促进样品的裂解以及样品的靶与基底的杂交。
在一些实施方案中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解来进行。化学裂解可以包括使用消化酶,诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过将裂解缓冲液添加至基底来进行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可以包含至少约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含至多约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含约0.1M Tris HCl。裂解缓冲液的pH可以是至少约1、2、3、4、5、6、7、8、9、10或更高。裂解缓冲液的pH可以是至多约1、2、3、4、5、6、7、8、9、10或更高。在一些实施方案中,裂解缓冲液的pH是约7.5。裂解缓冲液可以包含盐(例如,LiCl)。裂解缓冲液中的盐浓度可以是至少约0.1M、0.5M或1M或更高。裂解缓冲液中的盐浓度可以是至多约0.1M、0.5M或1M或更高。在一些实施方案中,裂解缓冲液中的盐浓度是约0.5M。裂解缓冲液可以包含去污剂(例如,SDS、十二烷基硫酸锂、triton X、tween、NP-40)。裂解缓冲液中的去污剂浓度可以是至少约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。裂解缓冲液中的去污剂浓度可以是至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施方案中,裂解缓冲液中的去污剂浓度是约1%的十二烷基硫酸锂。裂解方法中使用的时间可以取决于所使用的去污剂的量。在一些实施方案中,使用的去污剂越多,裂解所需的时间越少。裂解缓冲液可以包含螯合剂(例如,EDTA、EGTA)。裂解缓冲液中的螯合剂浓度可以是至少约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。裂解缓冲液中的螯合剂浓度可以是至多约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。在一些实施方案中,裂解缓冲液中的螯合剂浓度是约10mM。裂解缓冲液可以包含还原剂(例如,β-巯基乙醇、DTT)。裂解缓冲液中的还原剂浓度可以是至少约1mM、5mM、10mM、15mM或20mM或更高。裂解缓冲液中的还原剂浓度可以是至多约1mM、5mM、10mM、15mM或20mM或更高。在一些实施方案中,裂解缓冲液中的还原剂浓度是约5mM。在一些实施方案中,裂解缓冲液可以包含约0.1M Tris HCl,约pH 7.5,约0.5M LiCl,约1%十二烷基硫酸锂,约10mM EDTA和约5mM DTT。
裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度进行。裂解可以进行约1分钟、5分钟、10分钟、15分钟或20分钟或更多分钟。裂解的细胞可以包括至少约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。裂解的细胞可以包括至多约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。
将条形码附接至靶核酸分子
在细胞裂解和核酸分子从细胞释放之后,核酸分子可以与共定位的固体支持物的条形码随机关联。关联可以包括使条形码的靶识别区与靶核酸分子的互补部分杂交(例如,条形码的寡(dT)可以与靶的多(A)尾相互作用)。可以选择用于杂交的测定条件(例如,缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂交体。在一些实施方案中,可以将从裂解的细胞释放的核酸分子与基底上的多于一个探针关联(例如,与基底上的探针杂交)。当探针包含寡(dT)时,可以将mRNA分子与探针杂交并且逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如,在图2中图示的条形码化的非限制性实例中,在框216处,mRNA分子可以与珠上的条形码杂交。例如,单链的核苷酸片段可以与条形码的靶结合区杂交。
附接还可以包括将条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如,EcoRI)处理靶核酸以产生限制性位点突出端。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如,T4 DNA连接酶)可以用于连接两个片段。
例如,在图2中图示的条形码化的非限制性实例中,在框220处,随后可以将来自多于一个细胞(或多于一个样品)的标记的靶(例如,靶-条形码分子)汇集至例如管中。标记的靶可以通过例如回收(retrieving)条形码和/或附接靶-条形码分子的珠来汇集。
可以通过使用磁珠和外部施加的磁场来实现附接的靶-条形码分子的基于固体支持物的集合的回收。汇集靶-条形码分子后,所有进一步的处理可以在单个反应容器中进行。进一步的处理可以包括,例如,逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。进一步的处理反应可以在微孔内进行,即,不先汇集来自多于一个细胞的标记的靶核酸分子。
逆转录或核酸延伸
本公开内容提供了使用逆转录(例如,在图2的框224处)或核酸延伸来产生靶-条形码缀合物的方法。靶-条形码缀合物可以包含条形码以及靶核酸的全部或一部分的互补序列(即,条形码化的cDNA分子,诸如随机条形码化的cDNA分子)。关联的RNA分子的逆转录可以通过添加逆转录引物连同逆转录酶而发生。逆转录引物可以是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物的长度可以是12-18个核苷酸或可以是约12-18个核苷酸,并且与哺乳动物mRNA的3’末端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
在一些实施方案中,mRNA分子向标记的RNA分子的逆转录可以通过添加逆转录引物而发生。在一些实施方案中,逆转录引物是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。通常,寡(dT)引物的长度是12-18个核苷酸,并且与哺乳动物mRNA的3’末端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
在一些实施方案中,靶是cDNA分子。例如,可以使用逆转录酶诸如Moloney鼠白血病病毒(MMLV)逆转录酶逆转录mRNA分子,以产生具有多(dC)尾的cDNA分子。条形码可以包括具有多(dG)尾的靶结合区。在条形码的多(dG)尾和cDNA分子的多(dC)尾之间碱基配对后,逆转录酶将模板链从细胞RNA分子转换到条形码,并继续向条形码的5’末端复制。通过这样做,得到的cDNA分子在该cDNA分子3’末端上含有条形码序列(诸如分子标记)。
逆转录可以重复地发生以产生多于一个标记的cDNA分子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次逆转录反应。该方法可以包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次逆转录反应。
扩增
可以进行一个或更多个核酸扩增反应(例如,在图2的框228处)以产生标记的靶核酸分子的多于一个拷贝。扩增可以以多重化方式进行,其中多于一个靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如,分子标记)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、条形码序列(例如,分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多于一个核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或这些值中的任何两个值之间的范围或数字。该方法还可以包括进行一个或更多个cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如,分子标记)的靶-条形码分子的一个或更多个cDNA拷贝。
在一些实施方案中,扩增可以使用聚合酶链式反应(PCR)来进行。如本文使用的,PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。如本文使用的,PCR可以涵盖反应的衍生形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR以及组装PCR。
标记的核酸的扩增可以包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)、和Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。在一些实施方案中,扩增不产生环化转录物。
在一些实施方案中,本文公开的方法还包括对标记的核酸(例如,标记的RNA、标记的DNA、标记的cDNA)进行聚合酶链式反应以产生标记的扩增子(例如,随机标记的扩增子)。标记的扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如,分子标记)。标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本公开内容的核酸可以包括合成的或改变的核酸。
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代核酸和锁核酸(LNA)以及二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一个标记的靶(例如,随机标记的靶)的至少一部分。一种或更多种引物可以退火至多于一个标记的靶的3’末端或5’末端。一种或更多种引物可以退火至多于一个标记的靶的内部区域。内部区域可以与多于一个标记的靶的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种基因特异性引物。
一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如,分子标记)、靶或其任何组合。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶。靶可以包括一个或更多个样品中总核酸的子集。靶可以包括一个或更多个样品中总标记靶的子集。一种或更多种引物可以包括至少96种或更多种定制引物。一种或更多种引物可以包括至少960种或更多种定制引物。一种或更多种引物可以包括至少9600种或更多种定制引物。一种或更多种定制引物可以退火至两种或更多种不同的标记的核酸。两种或更多种不同的标记的核酸可以对应于一种或更多种基因。
可以在本公开内容的方法中使用任何扩增方案。例如,在一种方案中,第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物来扩增附接至珠的分子。第二轮PCR可以使用侧翼为Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物来扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引,以使PCR产物变成Illumina测序文库。使用150bp×2测序的测序可以揭示读段1上的细胞标记和条形码序列(例如,分子标记)、读段2上的基因以及索引1读段上的样品索引。
在一些实施方案中,可以使用化学裂解将核酸从基底去除。例如,存在于核酸中的化学基团或经修饰的碱基可以用于促进将核酸从固体支持物去除。例如,酶可以用于将核酸从基底去除。例如,通过限制性内切核酸酶消化可以将核酸从基底去除。例如,用尿嘧啶-d-糖基酶(uracil-d-glycosylase,UDG)处理含dUTP或ddUTP的核酸可以用于将核酸从基底去除。例如,可以使用进行核苷酸切除的酶(诸如,碱基切除修复酶,诸如无嘌呤/无嘧啶(apurinic/apyrimidinic,AP)内切核酸酶)将核酸从基底去除。在一些实施方案中,可以使用可光裂解基团以及光将核酸从基底去除。在一些实施方案中,可以使用可裂解接头将核酸从基底去除。例如,可裂解接头可以包括以下中的至少一种:生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、生物素/中性抗生物素蛋白、Ig蛋白A、光不稳定型接头、酸或碱不稳定型接头基团或适配体。
当探针是基因特异性时,可以将分子与探针杂交,并且逆转录和/或扩增。在一些实施方案中,在核酸已经合成(例如,逆转录)之后,核酸可以被扩增。扩增可以以多重方式进行,其中多种靶核酸序列同时扩增。扩增可以将测序衔接子添加至核酸。
在一些实施方案中,可以例如用桥接扩增在基底上进行扩增。cDNA可以加均聚物尾,以便产生相容末端,用于使用基底上的寡(dT)探针进行桥接扩增。在桥接扩增中,与模板核酸的3’末端互补的引物可以是共价地附接至固体颗粒的每对引物中的第一引物。当包含模板核酸的样品与颗粒接触并进行单个热循环时,可以将模板分子退火至第一引物,并且第一引物通过添加核苷酸而向前延长以形成双链体分子,所述双链体分子由模板分子和与模板互补的新形成的DNA链构成。在下一循环的加热步骤中,双链体分子可以变性,从颗粒释放模板分子并且留下通过第一引物附接至颗粒的互补DNA链。在随后的退火和延长步骤的退火阶段中,互补链可以与第二引物杂交,第二引物在从第一引物去除的位置处与互补链的区段互补。这种杂交可导致互补链在第一引物和第二引物之间形成桥,通过共价键连接第一引物并通过杂交连接第二引物。在延长阶段,通过在同一反应混合物中添加核苷酸,第二引物可以在反向方向上延长,从而将桥转化为双链桥。然后开始下一个循环,并且双链桥可以变性以产生两个单链核酸分子,每个单链核酸分子具有的一个末端分别经由第一引物和第二引物附接至颗粒表面,其中每个单链核酸分子的另一个末端是未附接的。在这第二个循环的退火和延长步骤中,每条链可以与同一颗粒上先前未使用的另外的互补引物杂交,以形成新的单链桥。现在杂交的两个先前未使用的引物延长从而将两个新的桥转换成双链桥。
扩增反应可以包括扩增多于一个核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。
标记的核酸的扩增可以包括基于PCR的方法或非基于PCR的方法。标记的核酸的扩增可以包括对标记的核酸的指数式扩增。标记的核酸的扩增可以包括对标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(PCR)来进行。PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。PCR可以涵盖反应的衍生形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR、抑制PCR、半抑制PCR以及组装PCR。
在一些实施方案中,标记的核酸的扩增包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)、Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或分支延伸扩增(RAM)。
本文公开的方法还包括对扩增的扩增子(例如,靶)进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可选地,扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本发明的核酸可以包括合成的或改变的核酸。
在一些实施方案中,方法包括反复扩增标记的核酸以产生多于一个扩增子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次扩增反应。可选地,方法包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次扩增反应。
扩增还可以包括将一种或更多种对照核酸添加至一个或更多个包含多于一个核酸的样品中。扩增还可以包括将一种或更多种对照核酸添加至多于一个核酸。对照核酸可以包含对照标记。
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定型和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代核酸和锁核酸(LNA)以及二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括一种或更多种寡核苷酸。一种或更多种寡核苷酸可以包含至少约7-9个核苷酸。一种或更多种寡核苷酸可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一个标记的核酸的至少一部分。一种或更多种引物可以退火至多于一个标记的核酸的3’末端和/或5’末端。一种或更多种引物可以退火至多于一个标记的核酸的内部区域。内部区域可以与多于一个标记的核酸的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种管家基因引物。一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或其产物。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶核酸。靶核酸可以包括一个或更多个样品中总核酸的子集。在一些实施方案中,引物是与本公开内容的阵列附接的探针。
在一些实施方案中,将样品中的多于一个靶条形码化(例如,随机条形码化)还包括产生条形码化靶(例如,随机条形码化靶)或靶的条形码化片段的索引文库。不同的条形码的条形码序列(例如,不同的随机条形码的分子标记)可以彼此不同。产生条形码化靶的索引文库包括从样品中的多于一个靶产生多于一个索引多核苷酸。例如,对于包括第一索引靶和第二索引靶的条形码化靶的索引文库,第一索引多核苷酸的标记区与第二索引多核苷酸的标记区可以相差以下、相差约以下、相差至少以下或相差至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。在一些实施方案中,产生条形码化靶的索引文库包括使多于一个靶(例如mRNA分子)与包含多(T)区和标记区的多于一个寡核苷酸接触;以及使用逆转录酶进行第一链合成以产生单链标记的cDNA分子(每一种包含cDNA区和标记区),其中多于一个靶包括至少两种不同序列的mRNA分子,且多于一个寡核苷酸包括至少两种不同序列的寡核苷酸。产生条形码化靶的索引文库还可以包括扩增单链标记的cDNA分子以产生双链标记的cDNA分子;以及对双链标记的cDNA分子进行巢式PCR以产生标记的扩增子。在一些实施方案中,方法可以包括产生衔接子标记的扩增子。
条形码化(例如,随机条形码化)可以包括使用核酸条形码或标签以标记个体核酸(例如,DNA或RNA)分子。在一些实施方案中,其包括在从mRNA产生cDNA分子时将DNA条形码或标签添加至cDNA分子。可以进行巢式PCR以使PCR扩增偏倚最小化。可以添加用于测序(例如下一代测序(NGS))使用的衔接子。例如在图2的框232处,可以使用测序结果来确定靶的一个或更多个拷贝的细胞标记、分子标记和核苷酸片段的序列。
图3是示出了产生条形码化靶(例如,随机条形码化靶)的索引文库,诸如条形码化的mRNA或其片段的索引文库的非限制性示例性过程的示意图。如步骤1中示出的,逆转录过程可以用独特分子标记序列、细胞标记序列和通用PCR位点对每个mRNA分子进行编码。具体地,通过将一组条形码(例如,随机条形码)310与RNA分子302的多(A)尾区308杂交(例如,随机杂交),可以将RNA分子302逆转录以产生标记的cDNA分子304(包括cDNA区306)。条形码310中的每一个可以包括靶结合区,例如多(dT)区312、标记区314(例如,条形码序列或分子)和通用PCR区316。
在一些实施方案中,细胞标记序列可以包含3个至20个核苷酸。在一些实施方案中,分子标记序列可以包含3个至20个核苷酸。在一些实施方案中,多于一个随机条形码中的每一个还包括通用标记和细胞标记中的一种或更多种,其中通用标记对于固体支持物上的多于一个随机条形码是相同的,并且细胞标记对于固体支持物上的多于一个随机条形码是相同的。在一些实施方案中,通用标记可以包含3个至20个核苷酸。在一些实施方案中,细胞标记包含3个至20个核苷酸。
在一些实施方案中,标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施方案中,标记区314可以包括通用标记、维度标记和细胞标记中的一种或更多种。条形码序列或分子标记318的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何值之间的数字或范围的核苷酸。细胞标记320的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何值之间的数字或范围的核苷酸。通用标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何值之间的数字或范围的核苷酸。通用标记对于固体支持物上的多于一个随机条形码可以是相同的,并且细胞标记对于固体支持物上的多于一个随机条形码是相同的。维度标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何值之间的数字或范围的核苷酸。
在一些实施方案中,标记区314可以包括以下、可以包括约以下、可以包括至少以下或可以包括至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或这些值中的任何值之间的数字或范围的不同标记,诸如条形码序列或分子标记318和细胞标记320。每一种标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或这些值中的任何值之间的数字或范围的核苷酸。一组条形码或随机条形码310可以含有以下、可以含有约以下、可以含有至少以下或可以是至多以下:10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、1010种、1011种、1012种、1013种、1014种、1015种、1020种或这些值中的任何值之间的数字或范围的条形码或随机条形码310。并且条形码或随机条形码310的组可以例如,各自包含独特标记区314。标记的cDNA分子304可以进行纯化以去除过量的条形码或随机条形码310。纯化可以包括Ampure珠纯化。
如步骤2中示出的,来自步骤1中的逆转录过程的产物可以汇集至1支管中,并且用第1PCR引物池和第1通用PCR引物进行PCR扩增。因为独特标记区314,汇集是可能的。特别地,可以将标记的cDNA分子304扩增以产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括以单一反应体积用96种多重引物进行的多重PCR扩增。在一些实施方案中,在单一反应体积中,多重PCR扩增可以利用、利用约、利用至少或利用至多10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、1010种、1011种、1012种、1013种、1014种、1015种、1020种或这些值中的任何值之间的数字或范围的多重引物。扩增可以包括使用包括靶向特定基因的定制引物326A-C的第1PCR引物池324和通用引物328。定制引物326可以与标记的cDNA分子304的cDNA部分306’内的区域杂交。通用引物328可以与标记的cDNA分子304的通用PCR区域316杂交。
如图3的步骤3中示出的,来自步骤2中的PCR扩增的产物可以用巢式PCR引物池和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏倚最小化。特别地,巢式PCR标记的扩增子322可通过巢式PCR进行进一步扩增。巢式PCR可以包括在单个反应体积中用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行的多重PCR。巢式PCR引物池328可以包含以下、可以包含约以下、可以包含至少以下或可以包含至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或这些值中的任何值之间的数字或范围的不同的巢式PCR引物330。巢式PCR引物332可以包含衔接子334,并与标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以包含衔接子336,并与标记的扩增子322的通用PCR区域316杂交。由此,步骤3产生衔接子标记的扩增子338。在一些实施方案中,巢式PCR引物332和第2通用PCR引物328’可以不包含衔接子334和衔接子336。而是,衔接子334和衔接子336可以连接至巢式PCR的产物以产生衔接子标记的扩增子338。
如步骤4中示出的,可以使用文库扩增引物将来自步骤3的PCR产物进行PCR扩增用于测序。特别地,可以使用衔接子334和衔接子336对衔接子标记的扩增子338进行一个或更多个另外的测定。衔接子334和衔接子336可以与引物340和引物342杂交。一种或更多种引物340和引物342可以是PCR扩增引物。一种或更多种引物340和引物342可以是测序引物。一种或更多种衔接子334和衔接子336可以用于衔接子标记的扩增子338的进一步扩增。一种或更多种衔接子334和衔接子336可以用于对衔接子标记的扩增子338测序。引物342可以包含板索引344,使得使用同一组条形码或随机条形码310产生的扩增子可以使用下一代测序(NGS)在一个测序反应中测序。
空间多组学方法与组合物
在一些实施方案中,提供了用于进行空间多组学的方法、组合物、系统和试剂盒(例如,空间mRNA和蛋白质复制器)。在一些实施方案中,方法和组合物可以包括使用本文提供的空间标记寡核苷酸的原位逆转录。
本公开内容包括用于进行空间转录组学实验的方法和组合物。目前可用的空间转录组学方法涉及从组织切片释放mRNA或使用具有可裂解条形码的原位探针(随后被测序以获得空间mRNA信息)。本文提供的空间转录组学实施方案不同于这两种方法,并且因此不会存在它们相关的缺陷。在一些实施方案中,本文提供的方法可以包括,空间固定的引物与RNA结合并进行逆转录,以使用包含空间条形码的寡核苷酸将mRNA序列拷贝到cDNA中,而不是从固定的组织切片释放mRNA。因此,在一些实施方案中,即使在复制信息的逆转录步骤之后,切片也将保持结构,并且之后可用于免疫染色。然后,在一些实施方案中,免疫染色信息可以与测序数据相结合,用于如本文描述的比较和分析。目前可用的从组织中释放RNA并捕获RNA的方法存在扩散风险。目前可用的采用具有可裂解条形码的原位探针和条形码测序的方法不获得关于靶的实际序列信息(例如,突变)。
在上述当前可用的方法中,当RNA从组织切片中释放时,存在限制空间信息分辨率的扩散风险。此外,所述方法需要在每个位置之间的间隔来防止扩散噪声。然而,在本文提供的方法和组合物的一些实施方案中,这种扩散风险被降低或消除,因为没有mRNA从组织中释放出来,并且包含空间标记的寡核苷酸在空间中物理连接,以仅捕获空间区域周围的局部mRNA。此外,在RNA复制完成后,切片可以保持完整用于其他应用(例如,免疫染色、组织学和RNA scope)。本文提供的方法和组合物有利地使得能够测序RNA而不是可裂解条形码(如在目前可用的方法中完成的)。因此,现有技术方法存在的非特异性条形码问题在本文提供的一些方法和组合物中不构成问题。此外,由于所述现有技术测定的低灵敏度,它们也不能提供高分辨率数据。相反,本文提供的方法和组合物可以实现高分辨率。有利的是,在一些实施方案中,RNA将尽可能保持固定,并且仅用作逆转录的模板,具有很小的扩散风险或没有扩散风险。有利的是,在一些实施方案中,切片将保持原样,因此可以在以后用于IF/IHC而没有问题。有利的是,在一些实施方案中,如果用户对RNA的亚细胞定位感兴趣,则切片随后可用于原位分析。有利的是,在用户希望仅对切片的一小部分区域进行测序的情况下,本文提供的杂交/下拉方法可以捕获包含用于测序的文库的预期空间标记,从而降低测序成本。有利的是,在一些实施方案中,由于检测是通过测序,而不是通过成像,所以不需要重复原位探测/检测。
不受任何特定理论的约束,在一些实施方案中,原位逆转录可以在切片上操作。在一些实施方案中,逆转录可以在固定细胞中进行(例如,Split-seq)。在一些实施方案中,测序可以分段进行(例如,Readcoor)。在不受任何特定理论约束的情况下,在一些实施方案中,靶向探针可以特异性地与RNA结合,并且这可以通过测序结果(探针-序列配对)来解决。在一些实施方案中,靶结合区域包含randomer。在一些实施方案中,靶结合区对于一个或更多个期望的靶是特异性的。在一些实施方案中,使用本文提供的方法和组合物阻断不合意的物质(例如,基因组DNA、rRNA)。在一些实施方案中,用诱饵寡核苷酸(例如,用延伸阻断剂)阻断不合意的物质。不受任何特定理论的约束,在一些实施方案中,来自固定样品的RNA不会扩散出去—如果它们在原位期间稳定地处于固定条件下,则在逆转录期间也可以如此。
图4A-图4C描绘了本文公开的非限制性示例性空间多组学工作流程。在工作流程的步骤400a,样品(例如,组织切片400)可以与基底(例如,微孔阵列402)接触。接触可以包括用RT试剂覆盖组织切片顶部的基底。微孔阵列402可以包含多于一个空间区域。在一些实施方案中,微孔阵列包含至少100个微孔404,每个微孔具有从约10μm3至约786,000μm3的体积范围,并且每个微孔包含不同的空间区域。在一些实施方案中,多于一种寡核苷酸条形码406与空间区域中的每一个(例如,微孔404)关联。寡核苷酸条形码406可以包含通用序列、分子标记、靶结合区和预定空间标记。在一些实施方案中,相同空间区域的寡核苷酸条形码406包含相同的空间标记,并且不同空间区域的寡核苷酸条形码406包含不同的空间标记。在一些实施方案中,每个孔404具有不同的空间标记。在一些实施方案中,空间标记是针对孔位置(空间区域)预设的—它是预定的。在一些实施方案中,靶结合区是dT,而在其他实施方案中,多于一种寡核苷酸条形码包含靶向探针组。寡核苷酸条形码可以与基底关联(例如,经由5’胺)。样品可以包含核酸靶408(例如,mRNA)。样品可以包含细胞组分靶。工作流程可以包括使多于一种细胞组分结合试剂410与样品接触。多于一种细胞组分结合试剂410中的每一种可以包含细胞组分结合试剂特异性寡核苷酸,该寡核苷酸包含细胞组分结合试剂的独特标识符序列。细胞组分结合试剂410可以能够与多于一种细胞组分靶中的至少一种特异性地结合。工作流程可以包括原位逆转录。工作流程可以包括延伸与细胞组分结合试剂特异性寡核苷酸412杂交的寡核苷酸条形码和/或与核酸靶414杂交的寡核苷酸条形码(步骤400b),从而产生条形码化细胞组分结合试剂特异性寡核苷酸416和条形码化核酸分子418。工作流程可以包括使寡核苷酸变性(步骤400c)。工作流程可以包括样品和基底的物理分离(步骤400d)。工作流程可以包括样品的成像(例如,H&E染色和/或IHC/IF染色)(步骤400e)。工作流程可以包括条形码化细胞组分结合试剂特异性寡核苷酸416和条形码化核酸分子418或其产物的文库生成和/或测序(步骤400f)。工作流程可以包括成像和测序数据的分析(步骤400g)。本文提供的方法和组合物的一些实施方案包括在接触步骤之后对样品的进一步分析。例如,在一些实施方案中,如本文描述的裂解和分析样品的一个或更多个细胞(例如,单细胞)。
图5描绘了非限制性示例性空间多组学平台。基底(例如,寡核苷酸阵列502)可以包含多于一个空间区域。寡核苷酸阵列可包含至少100个点506。寡核苷酸阵列502的每个点506可以包含多于一个空间区域中的不同空间区域。多于一种寡核苷酸条形码508可以与空间区域中的每一个关联。寡核苷酸条形码中的每一个可以包含通用序列、分子标记、靶结合区和预定空间标记。相同空间区域的寡核苷酸条形码可以包含相同的空间标记,并且不同空间区域的寡核苷酸条形码可以包含不同的空间标记。在一些实施方案中,阵列单独或作为盒和/或流动池的一部分,可以包含以下中的至少一个:入口端口、出口端口、泵、阀、通风口、储库、样品收集室、温度控制设备或其任何组合。基底可以包含用于缓冲液交换或添加的缓冲液输入槽504。在一些实施方案中,基底中没有分隔物(例如,孔壁),但是由于寡核苷酸的长度,寡核苷酸结合将被限制在局部区域。
本文描述的方法和系统可以与使用与寡核苷酸关联(例如,与寡核苷酸附接或缀合)的抗体(本文也称为AbO或AbOligo)的方法和系统一起使用。使用AbO来确定单细胞中的蛋白表达谱和追踪样品来源的一些实施方案已在US2018/0088112和US2018/0346970中描述;每一项的内容通过引用以其整体并入本文。在一些实施方案中,本文公开的方法允许对T细胞和B细胞的V(D)J谱分析、3’靶向扩增、5’靶向扩增、3’全转录组扩增(WTA)、5’WTA、用AbO进行蛋白表达谱分析和/或单个实验中的样品多重化分析。使用5’条形码化和/或3’条形码化确定核酸靶(例如,免疫受体的V(D)J区)的序列的方法在US2020/0109437中描述;该文献的内容通过引用以其整体并入本文。用于在核酸靶的5’末端上进行分子条形码化的系统、方法、组合物和试剂盒已经在例如US2019/0338278中描述,该文献的内容通过引用以其整体并入本文。在一些实施方案中,本文提供的用于基于5’的基因表达分析的系统、方法、组合物和试剂盒可以与使用美国专利申请第17/091,639号中描述的组合5’条形码化和随机引发方法获得全长V(D)J信息的方法(例如,通过Rhapsody系统上的Illumina测序)协同使用,所述美国专利申请的内容通过引用以其整体并入本文。在一些实施方案中,本文提供的用于基于5’的基因表达谱分析的系统、方法、组合物和试剂盒可以与基于随机引发和延伸(RPE)的全转录组分析方法和组合物协同使用,所述基于随机引发和延伸(RPE)的全转录组分析方法和组合物已在美国专利申请第16/677,012号中描述;所述美国专利申请的内容通过引用以其整体并入本文。
本公开内容包括用于确定样品中核酸靶的空间位置和拷贝数的方法。在一些实施方案中,该方法包括:提供包含多于一个空间区域的基底,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、能够与核酸靶杂交的靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。该方法可以包括:使基底与包含核酸靶的拷贝的样品接触,其中接触包括使多于一个空间区域与样品接触,使得每个不同的空间区域接触样品的不同空间位置。该方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,多于一个条形码化核酸分子各自包含与所述核酸靶的至少一部分互补的序列。该方法可以包括:获得测序数据,该测序数据包括多于一个条形码化核酸分子或其产物的多于一个测序读段,其中多于一个测序读段中的每一个包含空间标记序列、分子标记序列和核酸靶的子序列。该方法可以包括:对于每个独特的空间标记序列,其与基底的不同空间区域关联并且从而与样品的不同空间位置关联,计数具有与核酸靶关联的不同序列的分子标记的数量,以确定在样品的每个空间位置处核酸靶的拷贝数。
本文公开的内容包括用于确定样品中细胞组分靶的空间位置和拷贝数的方法。该方法可以包括:使多于一种细胞组分结合试剂与样品接触,其中多于一种细胞组分结合试剂中的每一种包含细胞组分结合试剂特异性寡核苷酸,细胞组分结合试剂特异性寡核苷酸包含针对细胞组分结合试剂的独特标识符序列,并且其中细胞组分结合试剂能够与多于一种细胞组分靶中的至少一种特异性地结合。该方法可以包括:使与细胞组分结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞组分结合试剂特异性寡核苷酸,多于一种条形码化细胞组分结合试剂特异性寡核苷酸各自包含与独特标识符序列的至少一部分互补的序列。该方法可以包括:获得测序数据,该测序数据包括多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的多于一个测序读段,其中多于一个测序读段中的每一个包含空间标记序列、分子标记序列和独特标识符序列的至少一部分。该方法可以包括:对于每个独特的空间标记序列,其与基底的不同空间区域关联并且从而与样品的不同空间位置关联,计数具有与独特标识符序列关联的不同序列的分子标记的数量,以确定在样品的每个空间位置处多于一种细胞组分靶中的至少一种细胞组分靶的拷贝数。
在一些实施方案中,接触步骤中的至少一部分在存在延伸试剂的情况下进行,任选地,整个接触步骤在存在延伸试剂的情况下进行,还任选地,接触和延伸步骤是同时的,任选地,样品和基底在延伸步骤期间接触,任选地,延伸在原位进行。在一些实施方案中,延伸试剂包括逆转录试剂,任选地逆转录试剂包括逆转录酶和dNTP。在一些实施方案中,该方法包括变性步骤,任选地变性将核酸靶与条形码化核酸分子分离和/或将细胞组分结合试剂特异性寡核苷酸与条形码化细胞组分结合试剂特异性寡核苷酸分离。在一些实施方案中,接触步骤包括在样品上覆盖基底。该方法可以包括:在接触步骤之后,将样品与基底分离。在一些实施方案中,在接触步骤之前、期间和/或之后,样品与固定剂和/或透化剂接触。在一些实施方案中,在接触步骤之前、期间和/或之后,样品不与固定剂和/或透化剂接触。
在一些实施方案中,该方法(i)包括在接触步骤之前固定样品,或者(ii)不包括在接触步骤之前固定样品。在一些实施方案中,样品在接触步骤期间被物理分割或保持完整。在一些实施方案中,样品中核酸靶的空间位置在样品的表面上、样品内部、在样品中的亚细胞位置或其任何组合。在一些实施方案中,样品包含多于一个细胞,任选地,核酸靶与多于一个细胞关联。在一些实施方案中,多于一个细胞包括一种或更多种细胞类型,任选地,所述一种或更多种细胞类型选自由以下组成的组:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移细胞、良性细胞、原代细胞和循环细胞,或其任何组合。在一些实施方案中,样品包括组织、细胞单层、固定细胞、组织切片或其任何组合。在一些实施方案中,样品包括生物样品、临床样品、环境样品、生物流体、组织、来源于受试者的组织切片或其任何组合,任选地受试者是人类、小鼠、狗、大鼠或脊椎动物。
该方法可以包括:基于样品中核酸靶的空间位置确定受试者的基因型、表型或一个或更多个基因突变。该方法可以包括:预测受试者对一种或更多种疾病的易感性。在一些实施方案中,一种或更多种疾病中的至少一种是癌症或遗传性疾病。该方法可以包括:确定样品中多于一个细胞的细胞类型。在一些实施方案中,基于样品中多于一个细胞的细胞类型的预测反应性来选择药物。该方法可以包括:分离对应于感兴趣的空间位置的一个或更多个条形码化核酸分子(或其产物),任选地,分离包括包含对应于感兴趣的空间位置的空间区域的独特空间标记的一个或更多个条形码化核酸分子的选择性杂交和下拉。
在一些实施方案中,寡核苷酸条形码包含含有捕获序列的靶结合区,任选地,靶结合区包含多(dT)区。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含与被配置为捕获细胞组分结合试剂特异性寡核苷酸的捕获序列互补的序列,任选地,与捕获序列互补的序列包含多(dA)区。在一些实施方案中,核酸靶包括核酸分子。在一些实施方案中,核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸、细胞组分结合试剂特异性寡核苷酸或其任何组合。在一些实施方案中,空间区域中的每一个包含被配置成与一组核酸靶杂交的多于一种寡核苷酸条形码。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含第二通用序列。在一些实施方案中,获得多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的序列信息包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞组分结合试剂特异性寡核苷酸;以及获得多于一种扩增的条形码化细胞组分结合试剂特异性寡核苷酸或其产物的测序数据。在一些实施方案中,获得测序数据包括将测序衔接子附接至(i)多于一个条形码化核酸分子或其产物,和/或(ii)多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物。
该方法可以包括:在使多于一种细胞组分结合试剂与样品接触之后,去除多于一种细胞组分结合试剂中未与样品接触的一种或更多种细胞组分结合试剂,任选地,去除未与样品接触的一种或更多种细胞组分结合试剂包括:去除未与多于一种细胞组分靶中的相应的至少一种接触的一种或更多种细胞组分结合试剂。在一些实施方案中,细胞组分靶包括细胞内蛋白、糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。
在一些实施方案中,使多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’外切核酸酶活性和3’至5’外切核酸酶活性中的至少一种的DNA聚合酶使多于一种寡核苷酸条形码延伸,任选地DNA聚合酶包括Klenow片段,还任选地逆转录酶包括病毒逆转录酶,任选地其中病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。在一些实施方案中,少于约5%的核酸靶由于所述核酸靶从起始空间位置扩散而被映射到不正确的空间位置。
在一些实施方案中,其中多于一种寡核苷酸条形码中的每一种包含基底接头官能团,多于一个基底中的每一个包含基底官能团,并且基底官能团和基底接头官能团相互关联。在一些实施方案中,基底接头官能团和基底官能团单独地选自由C6、生物素、链霉抗生物素蛋白、伯胺、醛、酮及其任何组合组成的组。在一些实施方案中,寡核苷酸条形码通过基底接头与基底关联。在一些实施方案中,基底接头包含碳链,任选地碳链包含2-30个碳,并且还任选地碳链包含12个碳。在一些实施方案中,基底接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。在一些实施方案中,空间标记的长度为6-60个核苷酸。在一些实施方案中,寡核苷酸条形码的长度为50-500个核苷酸。在一些实施方案中,寡核苷酸条形码被附接至基底。在一些实施方案中,寡核苷酸条形码被共价附接至基底。在一些实施方案中,寡核苷酸条形码被缀合至基底。在一些实施方案中,寡核苷酸条形码通过选自由以下组成的组的化学基团被缀合至基底:UV光可裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。在一些实施方案中,寡核苷酸条形码被非共价附接至基底。
在一些实施方案中,寡核苷酸条形码被配置为可从基底分离。该方法可以包括:使寡核苷酸条形码从基底解离,并且任选地,使寡核苷酸条形码从基底解离包括通过UV光裂解、化学处理、加热、酶处理或其任何组合使寡核苷酸条形码从基底分离。在一些实施方案中,解离发生在对寡核苷酸条形码进行条形码化之后。
在一些实施方案中,寡核苷酸条形码被配置为不可从基底分离。在一些实施方案中,寡核苷酸条形码被配置为通过1,3-偶极环加成反应、杂-第尔斯-阿尔德反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合被缀合至基底。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被固定在基底上、被部分地固定在基底上、被包封在基底中、被部分地包封在基底中或其组合。在一些实施方案中,基底包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮,及其任何组合。在一些实施方案中,靶结合区包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。在一些实施方案中,多于一种寡核苷酸条形码的每一种空间标记包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。
在一些实施方案中,基底包括固体支持物。在一些实施方案中,固体支持物包括平坦表面。在一些实施方案中,基底包含含有多于一个点的寡核苷酸阵列,并且其中寡核苷酸阵列的每个点包含多于一个空间区域中的不同空间区域。在一些实施方案中,基底包含微孔阵列,并且其中微孔阵列的每个微孔包含多于一个空间区域中的不同空间区域。
成像
该方法可以包括:对样品成像,任选地在接触步骤之后对样品成像,任选地,成像产生成像数据。在一些实施方案中,对样品成像包括用染色剂对样品染色,其中染色剂是荧光染色剂、负染色剂、抗体染色剂或其任何组合,任选地染色包括免疫细胞化学(ICC)、免疫组织化学(IHC)、免疫荧光(IF)或其任何组合。在一些实施方案中,成像包括显微术、共焦显微术、时差成像显微术、荧光显微术、多光子显微术、定量相位显微术、表面增强拉曼光谱、摄像、手动视觉分析、自动视觉分析或其任何组合。
可以分析与基底接触的样品(例如,用免疫组织化学、染色和/或成像)。免疫组织化学的示例性方法可以包括使通过将标记引入能够识别待检测生物物质的物质中而获得的标记的探针生物物质与组织切片发生反应的步骤,以经由生物物质之间的特异性结合反应来可视化存在于组织切片上的待检测生物物质。
对于组织学样本,组织块可以被固定在合适的固定剂(通常是福尔马林)中,并包埋在熔化的石蜡中。蜡块可以在超薄切片机上切割,以产生含有组织的石蜡薄片。样本切片可以被施加至基底,被风干,并被加热以使样本粘附至载玻片。残留的石蜡可以用合适的溶剂溶解,合适的溶剂通常是二甲苯、甲苯或其他溶剂。这些所谓的脱蜡溶剂可以在染色前用洗涤-脱水型试剂去除。切片可以由冷冻样本制备,在10%福尔马林中短暂固定,然后注入脱水试剂。脱水试剂可以在用水性染色剂染色之前被去除。
在一些实施方案中,可以使用巴氏染色技术(Papanicolaou stainingtechnique)(例如,进行性染色和/或苏木精伊红[H&E],即退行性染色)。HE(苏木精-伊红)染色使用苏木精和伊红作为染料。苏木精是一种蓝紫色染料,并且具有对嗜碱性组织诸如细胞核、骨组织、部分软骨组织和浆液组分染色的特性。伊红是一种红色至粉红色的染料,并且具有对嗜酸性组织诸如细胞质、软组织中的结缔组织、红细胞、纤维蛋白和内分泌颗粒染色的特性。
免疫组织化学(IHC)可被称为“免疫染色”,这是由于颜色显影的过程用于可视化本来不可见的抗原-抗体反应(在下文中,术语“免疫组织化学染色”可用于免疫组织化学)。凝集素染色是一种可以使用凝集素以非免疫且特异性方式结合特定糖链的特性以便使用凝集素检测组织样本中的糖链的技术。
HE染色、免疫组织化学和凝集素染色可用于检测例如细胞样本中癌细胞的位置。例如,当期望确认细胞样本中癌细胞的位置时,病理学家为了确定细胞样本中癌细胞的存在或不存在,可以制备组织切片并将它们放置在本公开内容的基底上。可以对阵列上的切片进行HE染色、成像或任何免疫组织化学分析,以便获得其形态学信息和/或任何其他识别特征(诸如稀有细胞的存在或不存在)。可以使用本公开内容的方法裂解样品并且可以确定核酸分子的存在或不存在。核酸信息可以与图像进行比较(例如,在空间上比较),从而指示样品中核酸的空间位置。
在一些实施方案中,用染色增强剂(例如,化学渗透增强剂)对组织进行染色。促进染色剂渗透到组织中的组织化学渗透增强剂的实例包括但不限于聚乙二醇(PEG)、表面活性剂诸如聚氧乙烯脱水山梨糖醇、聚氧乙烯醚(聚氧乙烯脱水山梨糖醇单月桂酸酯(Tween20)和其他Tween衍生物)、聚氧乙烯23月桂基醚(Brij 35)、Triton X-100、Brij 35、Nonidet P-40、去污剂样物质诸如溶血卵磷脂、皂苷、非离子型去污剂诸如X-100等、非质子溶剂诸如二甲基亚砜(DMSO)、醚诸如四氢呋喃、二氧六环等等;酯诸如乙酸乙酯、乙酸丁酯、乙酸异丙酯;烃诸如甲苯,氯化溶剂诸如二氯甲烷、二氯乙烷、氯苯等;酮诸如丙酮、腈诸如乙腈和/或其他增加细胞膜渗透性的剂。
在一些实施方案中,提供了有利于哺乳动物组织样品染色的组合物。该组合物可包含染色剂,诸如苏木精或苏木精和伊红-Y,至少一种组织化学渗透增强剂,诸如表面活性剂、非质子溶剂和/或PEG,或其任何组合。
在一些实施方案中,对样品成像(例如,在IHC之前或之后或者不进行IHC)。成像可以包括显微术,诸如明场成像、倾斜照明、暗场成像、色散染色、相衬、微分干涉像差、干涉反射显微术、荧光显微术、共焦显微术、电子显微术、透射电子显微术、扫描电子显微术和单平面照明,或其任何组合。成像可以包括使用负染色剂(例如,苯胺黑(nigrosin)、钼酸铵、乙酸铀酰、甲酸铀酰、磷钨酸、四氧化锇)。成像可以包括使用可以散射电子的重金属(例如,金、锇)。
成像可以包括对样品的一部分进行成像(例如,载玻片/阵列)。成像可以包括对样品的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%进行成像。成像可以包括对样品的至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%进行成像。成像可以在离散的步骤中完成(例如,成像可以不需要是连续的)。成像可以包括拍摄至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个不同的图像。成像可以包括拍摄至多1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个不同的图像。
测序数据和成像数据的分析
该方法可以包括:将样品的一个或更多个空间位置的成像数据和测序数据关联。该方法可以包括:空间位置的成像数据和测序数据的相关性分析,任选地,相关性分析识别以下中的一个或更多个:候选生物标志物、候选治疗剂、治疗剂的候选剂量和/或候选治疗剂的细胞靶。在一些实施方案中,所述成像产生用于构建所述样品的物理表示的映射的图像,任选地,所述映射是二维或三维的。该方法可以包括:将核酸靶和/或细胞组分靶映射到样品的图谱上。
来自基底扫描的数据可以与基底上未裂解样品的图像关联。数据可以被叠加,从而生成图谱。可以使用用本文描述的方法生成的信息来构建来自样品的靶的位置的图谱。图谱可用于定位靶的物理位置。图谱可用于鉴定多于一个靶的位置。多于一个靶可以是相同种类的靶,或多于一个靶可以是多于一个不同的靶。例如,可以构建脑的图谱,以示出多于一个靶的量和位置。
可以从来自单个样品的数据生成图谱。可以使用来自多于一个样品的数据构建图谱,从而生成组合图谱。可以使用来自数十、数百和/或数千个样品的数据构建图谱。从多于一个样品构建的图谱可以示出与多于一个样品共有的区域关联的靶的分布。例如,重复的测定可以显示在相同的图谱上。可以在相同的图谱上显示至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个重复(例如,覆盖)。可以在相同的图谱上显示至多1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个重复(例如,覆盖)。靶的空间分布和数目可以由各种统计学来表示。
组合来自多于一个样品的数据可以增加组合图谱的位置分辨率。多于一个样品的定向可以通过阵列上的公共界标和/或x-y位置来记录,其中样品中的单独的位置测量是至少部分非连续的。复用上述方法将允许样品中靶核酸的高分辨率图谱。
数据分析和相关性可用于确定特定细胞类型(例如,稀有细胞、癌细胞)的存在和/或不存在。数据相关性可用于确定细胞内或样品内不同位置的靶核酸的相对比率。
本文公开的方法和组合物可以是医学专业人员(例如,病理学家)的伴随诊断,其中可以通过视觉观察病理图像并将图像与遗传表达关联(例如,识别癌基因的表达)来诊断受试者。该方法和组合物可用于从细胞群中识别细胞,并确定样品中细胞的遗传异质性。该方法和组合物可用于确定样品的基因型。
样品处理
本文提供的方法和组合物的一些实施方案包括在与基底接触之前、期间和/或之后,用固定剂、解固定剂和/或透化剂处理样品。
固定剂和解固定剂
如本文描述的,固定剂可以包括交联剂。固定剂可以包括可裂解交联剂。可裂解交联剂可以包括硫醇可裂解交联剂。可裂解交联剂可以包括或可以衍生自二硫代双(琥珀酰亚胺基丙酸酯)(DSP,Lomant试剂)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP,Wang和Richard试剂)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。可裂解交联剂可以包含选自由以下组成的组的可裂解连接:化学可裂解连接、光可裂解连接、酸不稳定接头、热敏感性连接、酶促可裂解连接或其任何组合。可裂解交联剂可以包括二硫化物接头。固定剂可以包括BD Cytofix。固定剂可以包括可逆交联物。固定剂可以包括非交联固定剂。非交联固定剂可以包括甲醇。在一些实施方案中,固定剂(fixing agent)(即,固定剂(fixative))是或包括醛,包括但不限于多聚甲醛(PFA)、甲醛和戊二醛,或其组合。
固定剂的非限制性实例包括但不限于NHS(N-羟基琥珀酰亚胺);磺基-NHS(N-羟基磺基琥珀酰亚胺);EDC(1-乙基-3-[3-二甲基氨基丙基])碳二亚胺盐酸盐;SMCC(琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯);磺基-SMCC;DSS(二琥珀酰亚胺基辛二酸酯);DSG(二琥珀酰亚胺基戊二酸酯);DFDNB(1,5-二氟-2,4-二硝基苯);BS3(双(磺基琥珀酰亚胺基)辛二酸酯);TSAT(三-(琥珀酰亚胺基)氨基三乙酸酯);BS(PEG)5(聚乙二醇化的双(磺基琥珀酰亚胺基)辛二酸酯);BS(PEG)9(聚乙二醇化的双(磺基琥珀酰亚胺基)-辛二酸酯);DSP(二硫代双(琥珀酰亚胺基丙酸酯));DTSSP(3,3’-二硫代双(磺基琥珀酰亚胺基丙酸酯));DST(二琥珀酰亚胺基酒石酸酯);BSOCOES(双(2-(琥珀酰亚胺基氧羰基氧基)-乙基)砜);EGS(乙二醇双(琥珀酰亚胺基琥珀酸酯));DMA(二亚胺代己二酸二甲酯);DMP(庚二亚氨酸二甲酯);DMS(辛二亚氨酸二甲酯);DTBP(Wang和Richard试剂);BM(PEG)2(1,8-双马来酰亚胺基二乙二醇);BM(PEG)3(1,11-双马来酰亚胺基三乙二醇);BMB(1,4-双马来酰亚胺基丁烷);DTME(二硫代双马来酰亚胺基乙烷);BMH(双马来酰亚胺基己烷);BMOE(双马来酰亚胺基乙烷);TMEA(三(2-马来酰亚胺基乙基)胺);SPDP(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯);SMCC(琥珀酰亚胺基反式-4-(马来酰亚胺基甲基)环己烷-1-甲酸酯);SIA(琥珀酰亚胺基碘乙酸酯);SBAP(琥珀酰亚胺基3-(溴乙酰胺基)丙酸酯);STAB(琥珀酰亚胺基(4-碘乙酰基)氨基苯甲酸酯);磺基-SIAB(磺基琥珀酰亚胺基(4-碘乙酰基)氨基苯甲酸酯);AMAS(N-α-马来酰亚胺基乙酰氧基琥珀酰亚胺酯);BMPS(N-β-马来酰亚胺基丙氧基琥珀酰亚胺酯);GMBS(N-γ-马来酰亚胺基丁酰氧基琥珀酰亚胺酯);磺基-GMBS(N-γ-马来酰亚胺基丁酰氧基磺基琥珀酰亚胺酯);MBS(间马来酰亚胺基苯甲酰基-N-羟基琥珀酰亚胺酯);磺基-MBS(间马来酰亚胺基苯甲酰基-N-羟基磺基琥珀酰亚胺酯);SMCC(琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯);磺基-SMCC(磺基琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯);EMCS(N-ε-马来酰亚胺基己酰氧基琥珀酰亚胺酯);磺基-EMCS(N-ε-马来酰亚胺基己酰氧基磺基琥珀酰亚胺酯);SMPB(琥珀酰亚胺基4-(对马来酰亚胺基苯基)丁酸酯);磺基-SMPB(磺基琥珀酰亚胺基4-(N-马来酰亚胺基苯基)丁酸酯);SMPH(琥珀酰亚胺基6-((β-马来酰亚胺基丙酰胺基)-己酸酯));LC-SMCC(琥珀酰亚胺基4-(N-马来酰亚胺基甲基)环己烷-1-羧基-(6-酰氨基己酸酯));磺基-KMUS(N-κ-马来酰亚胺基十一烷酰氧基磺基琥珀酰亚胺酯);SPDP(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯);LC-SPDP(琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯);LC-SPDP(琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯);磺基-LC-SPDP(磺基琥珀酰亚胺基6-(3’-(2-吡啶基二硫代)丙酰胺基)己酸酯);SMPT(4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯);PEG4-SPDP(聚乙二醇化的长链SPDP交联剂);PEG12-SPDP(聚乙二醇化的长链SPDP交联剂);SM(PEG)2(聚乙二醇化的SMCC交联剂);SM(PEG)4(聚乙二醇化的SMCC交联剂);SM(PEG)6(聚乙二醇化的长链SMCC交联剂);SM(PEG)8(聚乙二醇化的长链SMCC交联剂);SM(PEG)12(聚乙二醇化的长链SMCC交联剂);SM(PEG)24(聚乙二醇化的长链SMCC交联剂);BMPH(N-β-马来酰亚胺基丙酸酰肼);EMCH(N-ε-马来酰亚胺基己酸酰肼);MPBH(4-(4-N-马来酰亚胺基苯基)丁酸酰肼);KMUH(N-κ-马来酰亚胺基十一烷酸酰肼);PDPH(3-(2-吡啶基二硫代)-丙酰肼);ATFB-SE(4-叠氮基-2,3,5,6-四氟苯甲酸琥珀酰亚胺酯);ANB-NOS(N-5-叠氮基-2-硝基苯甲酰氧基琥珀酰亚胺);SDA(NHS-二氮丙啶)(琥珀酰亚胺基4,4’-叠氮戊酸酯);LC-SDA(NHS-LC-二氮丙啶)(琥珀酰亚胺基6-(4,4’-叠氮戊酰胺基)己酸酯);SDAD(NHS-SS-二氮丙啶)(琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯);磺基-SDA(磺基-NHS-二氮丙啶)(磺基琥珀酰亚胺基4,4’-叠氮戊酸酯);磺基-LC-SDA(磺基-NHS-LC-二氮丙啶)(磺基琥珀酰亚胺基6-(4,4’-叠氮戊酰胺基)己酸酯);磺基-SDAD(磺基-NHS-SS-二氮丙啶)(磺基琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯);SPB(琥珀酰亚胺基-[4-(补骨脂素-8-基氧基)]-丁酸酯);磺基-SANPAH(磺基琥珀酰亚胺基6-(4’-叠氮基-2’-硝基苯基氨基)己酸酯);DCC(二环己基碳二亚胺);EDC(1-乙基-3-(3-二甲基氨基丙基)碳二亚胺盐酸盐);戊二醛、甲醛、多聚甲醛、琥珀醛、乙二醛、亚甲基二醇或其任何组合。在一些实施方案中,在本文提供的方法中采用戊二醛缩醛、1,4-吡喃、2-烷氧基-3,4-二氢-2H-吡喃(例如,2-乙氧基-3,4-二氢-2H-吡喃)或其任何组合。
交联剂的非限制性实例包括同型双官能性交联剂、异型双官能性交联剂、三官能性交联剂、多官能性交联剂及其组合。同型双官能性交联剂具有两端具有相同反应性基团的间隔臂(spacer arm)。异型双官能性交联剂具有两端具有不同反应性基团的间隔臂。三官能性交联剂具有连接到中心原子(诸如氮)的三个短间隔臂,并且每个间隔臂以反应性基团结束。本文公开的交联剂可以使氨基-氨基基团、氨基-巯基基团、巯基-巯基基团、氨基-羧基基团等交联。可以使用本领域已知的使蛋白交联的任何交联剂。另外,交联剂可以是化学交联剂或UV诱导交联剂。
固定剂可以是膜可渗透的(例如,膜可渗透交联剂)。可裂解和/或膜可渗透交联剂可以包括二硫代双(琥珀酰亚胺基丙酸酯)(DSP,Lomant试剂)、二琥珀酰亚胺基酒石酸酯(DST)、双[2-(琥珀酰亚胺基氧羰基氧基)乙基]砜(BSOCOES)、乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)、二甲基3,3’-二硫代双丙亚氨酸酯(DTBP,Wang和Richard试剂)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)、琥珀酰亚胺基6-(3(2-吡啶基二硫代)丙酰胺基)己酸酯(LC-SPDP)、4-琥珀酰亚胺基氧羰基-α-甲基-α(2-吡啶基二硫代)甲苯(SMPT)、3-(2-吡啶基二硫代)丙酰肼(PDPH)、琥珀酰亚胺基2-((4,4’-叠氮戊酰胺基)乙基)-1,3’-二硫代丙酸酯(SDAD,NHS-SS-二氮丙啶)或其任何组合。
本文描述的方法可以包括将样品的固定逆转,其可以包括使样品与解固定剂接触。解固定剂可以是膜可渗透的。解固定剂可以包括硫醇、羟胺、高碘酸盐、碱或其任何组合。解固定剂可以包括DTT。将样品的固定逆转可以包括UV光裂解、化学处理、加热、酶处理或其任何组合。将样品的固定逆转可以包括裂解样品。裂解样品可以包括加热、使样品与去污剂接触、改变pH或其任何组合。
不受任何特定理论的束缚,据信使用加热逆转甲醛交联,并使用蛋白酶K解离(例如,分解)在细胞固定期间形成的蛋白质-核酸复合体可能是有利的,这可以改善RNA的保存和回收。本文描述的方法和组合物在固定/透化细胞用于蛋白质检测和保存mRNA以及逆转mRNA交联用于涉及蛋白质和RNA两者的检测和分析的样品分析(例如,RNAseq)方面可以产生意想不到的和优异的结果。
透化剂
本文公开的内容包括能够透化样品的细胞膜的透化剂。透化剂能够使细胞膜对蛋白质靶结合试剂(例如,细胞内靶结合试剂)可渗透。透化剂可以包括溶剂、去污剂或表面活性剂或其任何组合。透化剂可以包括BD Cytoperm。透化剂可以包括皂苷或其衍生物、毛地黄皂苷或其衍生物或其任何组合。
如本文使用的,使细胞“透化”可指减少细胞膜完整性从而允许分子(例如,修饰剂、酶、抗体、其他蛋白)进入细胞内空间的处理。透化可以包括破坏、溶解、修饰脂质膜和/或在脂质膜中形成孔。在一些实施方案中,透化不涉及细胞形态的破坏或细胞的裂解。可使用多种溶剂、表面活性剂和/或市售试剂中的任何一种或更多种进行透化。在一些实施方案中,使用有机溶剂使细胞透化。有机溶剂的实例包括但不限于苯、正丁醇、正丙醇、异丙醇、甲苯、乙醚、苯乙醇、氯仿、己烷、乙醇和丙酮。在一些实施方案中,表面活性剂、去污剂或乳化剂用于使细胞膜透化。透化剂的非限制性实例包括皂苷、NP-40、Tween-20、triton X-100、brij 35、杜邦纳(Duponal)、毛地黄皂苷、硫堇、氯丙嗪、丙咪嗪、聚乙烯亚胺、十二烷基硫酸钠、脱氧胆酸钠和N-月桂基肌氨酸钠。在另外的实施方案中,市售的透化试剂和试剂盒包括但不限于LeucopermTM、PerFix-EXPOSE、PerFix-nc、试剂盒、Cytofix/CytopermTM溶液和/>固定透化试剂盒。可以使用其他合适的透化试剂和方法,并且这些透化试剂和方法是本领域已知的。
微阵列
本文公开的内容包括组合物。在一些实施方案中,该组合物包含:包含多于一个空间区域的寡核苷酸阵列,其中寡核苷酸阵列包含至少100个点,其中寡核苷酸阵列的每个点包含多于一个空间区域中的不同空间区域,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
组合物可以包含:盒,其中盒包括以下中的至少一个:入口端口、出口端口、泵、阀、通风口、储库、样品收集室、温度控制设备或其任何组合。组合物可以包含:缓冲液。组合物可以包含:一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂,或两者。在一些实施方案中,盒包括用于对至少100个微孔进行光学成像的透明窗。
在一些实施方案中,固体支持物/基底可以指微阵列(例如,寡核苷酸阵列)。微阵列可以包含多于一种聚合物,例如寡聚物,原位合成或预合成并以阵列图案沉积在基底上。通过固相DNA合成制造的寡聚物的微阵列可以具有接近106个/微米2的寡聚物密度。如本文使用的,支持物结合的寡聚物可被称为“探针”或“寡核苷酸条形码”,其功能是与被测DNA或RNA材料的样品结合或杂交。然而,这些术语可以可互换地使用,其中表面结合的寡核苷酸作为靶,并且核酸的溶液样品作为探针。此外,一些研究人员将被测靶样品结合至微阵列基底,并将寡聚物探针放入溶液中进行杂交。“靶”或“探针”中的任何一个都可以是待由另一个评估的一个(因此,任何一个都可以是待通过与另一个结合来评估的多核苷酸的未知混合物)。所有这些迭代都在本文讨论的范围内。仅为了简单起见,本文中探针是具有已知序列的表面结合的寡核苷酸,并且靶是待通过表面结合的探针检测的流动相(通常是流体)中的部分。阵列中每个位置(例如,点)中的多于一个探针和/或靶可以被称为“核酸特征”或“特征”。特征被定义为在其上固定的大量探针和/或靶都具有相似或相同的核苷酸序列(例如,特征特异性空间标记)的位置(locus)。
“阵列”可以指有意创建的分子集合,其可以被合成地或生物合成地制备。阵列中的分子可以彼此相同或不同。阵列可以采用多种形式,例如,可溶性分子的文库;拴系至树脂珠、二氧化硅芯片或其他固体支持物的化合物的文库。阵列板或板是具有多于一个阵列的物体,其中每个阵列可以通过阻止液体通过的物理屏障与其他阵列分开,并形成被称为孔的区域或空间。
微阵列的密度可以高于每cm2 500个、5000个、50000个或500,000个不同的探针。探针的特征尺寸可以小于500μm2、150μm2、25μm2、9μm2或1μm2。探针的位置可以被确定或是可破译的。例如,在一些阵列中,探针的具体位置在结合测定之前是已知的。在一些其他阵列中,探针的具体位置直到测定后才知道。探针可以任选地经由接头、珠等被固定在基底上。
阵列可以包含由寡(dT)探针组成的特征。阵列可以包含由基因特异性探针组成的特征。在一些实施方案中,阵列是微阵列。在一些实施方案中,阵列是平坦的。在一些实施方案中,阵列具有地形特征。
微孔阵列
基底可以指一种类型的固体支持物。基底可以指可以包含本公开内容的随机条形码的固体支持物。基底可以包含多于一个微孔。微孔可以包含限定体积的小反应室。本文公开的内容包括组合物。在一些实施方案中,组合物包含:包含多于一个空间区域的微孔阵列,其中所述微孔阵列包含至少100个微孔,其中每个微孔具有从约10μm3至约786,000μm3的体积,其中每个微孔包含不同的空间区域,其中多于一种寡核苷酸条形码与空间区域中的每一个关联,其中寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
阵列的微孔可以制造成多种形状和尺寸。合适的孔几何形状可以包括但不限于圆柱形、圆锥形、半球形、矩形或多面体(例如,包含若干个平面的三维几何形状,例如六边形柱、八边形柱、倒三棱锥、倒四棱锥、倒五棱锥、倒六棱锥或倒截棱锥)。微孔可以包括组合这些几何形状中的两种或更多种的形状。例如,微孔可以部分地是圆柱形,其余部分具有倒锥形。微孔可以包括两个并排的圆柱体,一个比另一个直径大,它们通过延伸圆柱体全长(深度)的垂直通道(即平行于圆柱体轴线)被连接。微孔的开口可以位于基底的上表面。微孔的开口可以位于基底的下表面。微孔的封闭端(或底部)可以是平坦的。微孔的封闭端(或底部)可以具有曲面(例如,凸的或凹的)。
微孔尺寸可以根据孔的直径和深度来表征。如本文使用的,微孔的直径是指可以内切在微孔几何形状的平面横截面内的最大圆。
微孔的直径可以以绝对尺寸来指定。微孔的直径可以在从约5微米至约50微米的范围内。微孔直径可以是至少5微米、至少10微米、至少15微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少45微米或至少50微米。微孔直径可以是至多50微米、至多45微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米、至多15微米、至多10微米或至多5微米。微孔直径可以是约30微米。
在一些实施方案中,每个微孔的直径可以是或可以是约1纳米、2纳米、3纳米、4纳米、5纳米、6纳米、7纳米、8纳米、9纳米、10纳米、20纳米、30纳米、40纳米、50纳米、60纳米、70纳米、80纳米、90纳米、100纳米、200纳米、300纳米、400纳米、500纳米、600纳米、700纳米、800纳米、900纳米、1000纳米或这些值中的任何两个之间的数字。在一些实施方案中,每个微孔的直径可以是或可以是约1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米、50微米、60微米、70微米、80微米、90微米、100微米、200微米、300微米、400微米、500微米、600微米、700微米、800微米、900微米、1000微米或这些值中的任何两个之间的数字。在一些实施方案中,每个微孔的直径可以是或可以是约1毫米、2毫米、3毫米、4毫米、5毫米、6毫米、7毫米、8毫米、9毫米、10毫米、20毫米、30毫米、40毫米、50毫米、60毫米、70毫米、80毫米、90毫米、100毫米、200毫米、300毫米、400毫米、500毫米、600毫米、700毫米、800毫米、900毫米、1000毫米或这些值中的任何两个之间的数字。
微孔的深度可以以绝对尺寸来指定。微孔的深度可以在从约10微米至约60微米的范围内。微孔深度可以是至少10微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少50微米或至少60微米。微孔深度可以是至多60微米、至多50微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米或至多10微米。微孔深度可以是约30微米。
在一些实施方案中,每个微孔的深度可以是或可以是约1纳米、2纳米、3纳米、4纳米、5纳米、6纳米、7纳米、8纳米、9纳米、10纳米、20纳米、30纳米、40纳米、50纳米、60纳米、70纳米、80纳米、90纳米、100纳米、200纳米、300纳米、400纳米、500纳米、600纳米、700纳米、800纳米、900纳米、1000纳米或这些值中的任何两个之间的数字。在一些实施方案中,每个微孔的深度可以是或可以是约1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米、50微米、60微米、70微米、80微米、90微米、100微米、200微米、300微米、400微米、500微米、600微米、700微米、800微米、900微米、1000微米或这些值中的任何两个之间的数字。在一些实施方案中,每个微孔的深度可以是或可以是约1毫米、2毫米、3毫米、4毫米、5毫米、6毫米、7毫米、8毫米、9毫米、10毫米、20毫米、30毫米、40毫米、50毫米、60毫米、70毫米、80毫米、90毫米、100毫米、200毫米、300毫米、400毫米、500毫米、600毫米、700毫米、800毫米、900毫米、1000毫米或这些值中的任何两个之间的数字。
在本公开内容的方法、装置和系统中使用的微孔的体积可以不同,例如在从约200微米3至约120,000微米3的范围内。微孔体积可以是至少200微米3、至少500微米3、至少1,000微米3、至少10,000微米3、至少25,000微米3、至少50,000微米3、至少100,000微米3或至少120,000微米3。微孔体积可以是至多120,000微米3、至多100,000微米3、至多50,000微米3、至多25,000微米3、至多10,000微米3、至多1,000微米3、至多500微米3或至多200微米3。微孔体积可以是约25,000微米3。微孔体积可以落在由这些值中的任何值限定的任何范围内(例如,从约18,000微米3至约30,000微米3)。
在一些实施方案中,微孔中的每一个可以具有以下体积:10纳升、20纳升、30纳升、40纳升、50纳升、60纳升、70纳升、80纳升、90纳升、100纳升、200纳升、300纳升、400纳升、500纳升、600纳升、700纳升、800纳升、900纳升、1000纳升,或者这些值中的任何两个之间的数字。在一些实施方案中,微孔中的每一个可以具有以下体积:1微升、2微升、3微升、4微升、5微升、6微升、7微升、8微升、9微升、10微升、20微升、30微升、40微升、50微升、60微升、70微升、80微升、90微升、100微升、200微升、300微升、400微升、500微升、600微升、700微升、800微升、900微升、1000微升,或者这些值中的任何两个之间的数字。在一些实施方案中,微孔中的每一个可以具有1毫升、2毫升、3毫升、4毫升、5毫升、6毫升、7毫升、8毫升、9毫升、10毫升、20毫升、30毫升、40毫升、50毫升、60毫升、70毫升、80毫升、90毫升、100毫升、200毫升、300毫升、400毫升、500毫升、600毫升、700毫升、800毫升、900毫升、1000毫升的体积,或者这些值中的任何两个之间的数字。
微孔阵列的孔可以以一维阵列、二维阵列或三维阵列布置。例如,通过堆叠一系列两个或更多个二维阵列(即,通过堆叠包含微孔阵列的两个或更多个基底),可以实现三维阵列。
微孔之间的图案和间距可以不同。微孔可以根据多种随机或非随机图案分布。例如,它们可以完全随机地分布在阵列基底的表面上,或者它们可以以正方形网格、矩形网格、六边形网格等布置。孔之间的中心到中心的距离(或间距)可以从约15微米至约75微米变化。在其他实施方案中,孔之间的间距是至少15微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少45微米、至少50微米、至少55微米、至少60微米、至少65微米、至少70微米或至少75微米。微孔间距可以是至多75微米、至多70微米、至多65微米、至多60微米、至多55微米、至多50微米、至多45微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米或至多15微米。微孔间距可以是约55微米。微孔间距可以落在由这些值中的任何值限定的任何范围内(例如,从约18微米至约72微米)。
在一些实施方案中,微孔可以彼此之间间隔不超过0.01微米、0.1微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米、50微米、60微米、70微米、80微米、90微米、100微米、200微米、300微米、400微米、500微米、600微米、700微米、800微米、900微米、1000微米或这些值中的任何两个之间的数字。在一些实施方案中,微孔可以彼此之间间隔不超过1毫米、2毫米、3毫米、4毫米、5毫米、6毫米、7毫米、8毫米、9毫米、10毫米、20毫米、30毫米、40毫米、50毫米、60毫米、70毫米、80毫米、90毫米、100毫米、200毫米、300毫米、400毫米、500毫米、600毫米、700毫米、800毫米、900毫米、1000毫米或这些值中的任何两个之间的数字。
在一些实施方案中,微孔阵列可以包括100孔/英寸2、200孔/英寸2、300孔/英寸2、400孔/英寸2、500孔/英寸2、600孔/英寸2、700孔/英寸2、800孔/英寸2、900孔/英寸2、1000孔/英寸2、2000孔/英寸2、3000孔/英寸2、4000孔/英寸2、5000孔/英寸2、6000孔/英寸2、7000孔/英寸2、8000孔/英寸2、9000孔/英寸2、10000孔/英寸2或这些值中的任何两个之间的数字。在一些实施方案中,微孔阵列可以包括10孔/cm2、20孔/cm2、30孔/cm2、40孔/cm2、50孔/cm2、60孔/cm2、70孔/cm2、80孔/cm2、90孔/cm2、100孔/cm2、200孔/cm2、300孔/cm2、400孔/cm2、500孔/cm2、600孔/cm2、700孔/cm2、800孔/cm2、900孔/cm2、1000孔/cm2、2000孔/cm2、3000孔/cm2、4000孔/cm2、5000孔/cm2、6000孔/cm2、7000孔/cm2、8000孔/cm2、9000孔/cm2、10000孔/cm2或这些值中的任何两个之间的数字。
微孔阵列可以包括表面特征,表面特征包括但不限于环绕孔或跨过孔之间的表面的圆顶状、脊状或尖顶状表面特征。
微孔阵列中孔的总数可以由孔的图案和间距以及阵列的总尺寸来确定。阵列中微孔的数量可以变化,例如,范围从约96个至约5,000,000个或更多。阵列中微孔的数量可以是至少96个、至少384个、至少1,536个、至少5,000个、至少10,000个、至少25,000个、至少50,000个、至少75,000个、至少100,000个、至少500,000个、至少1,000,000个或至少5,000,000个。阵列中微孔的数量可以是至多5,000,000个、至多1,000,000个、至多75,000个、至多50,000个、至多25,000个、至多10,000个、至多5,000个、至多1,536个、至多384个或至多96个孔。阵列中微孔的数量可以是约96个。微孔的数量可以是约150,000个。阵列中微孔的数量可以落在由这些值中的任何值限定的任何范围内(例如,从约100个至325,000个)。
微孔阵列可以使用多种制造技术中的任何一种来制造。可以使用的制造方法的实例包括但不限于本体微加工技术(bulk micromachining techniques),诸如光刻和湿法化学蚀刻、等离子体蚀刻或深度反应性离子蚀刻;微成型和微压花;激光微加工;使用可固化材料的3D打印或其他直接写入制造工艺;以及类似的技术。
微孔阵列可以由多种基底材料中的任何一种制造。材料的选择可以取决于制造技术的选择,并且反之亦然。合适材料的实例可以包括但不限于硅、熔融二氧化硅、玻璃、聚合物(例如琼脂糖、明胶、水凝胶、聚二甲基硅氧烷(PDMS;弹性体)、聚甲基丙烯酸甲酯(PMMA)、聚碳酸酯(PC)、聚丙烯(PP)、聚乙烯(PE)、高密度聚乙烯(HDPE)、聚酰亚胺、环烯烃聚合物(COP)、环烯烃共聚物(COL)、聚对苯二甲酸乙二醇酯(PET)、环氧树脂、基于硫醇烯的树脂、金属或金属膜(例如铝、不锈钢、铜、镍、铬和钛)等。亲水性材料对于微孔阵列的制造可以是合意的(例如,增强润湿性并使细胞和其他生物材料的非特异性结合最小化)。也可以使用可以被处理或被涂覆(例如通过氧等离子体处理或接枝聚环氧乙烷表面层)的疏水性材料。使用多孔、亲水性材料来制造微孔阵列可以是合意的,以便促进毛细管芯吸/排出装置中捕获的气泡。微孔阵列可以由单一材料制造。微孔阵列可以包括已经结合在一起或机械连接的两种或更多种不同材料。
微孔阵列可以使用多种尺寸和形状中的任何尺寸和形状的基底来制造。例如,其中制造微孔的基底的形状(或占用空间(footprint))可以是正方形、矩形、圆形或不规则形状。微孔阵列基底的占用空间可以类似于微量滴定板的占用空间。微孔阵列基底的占用空间可以类似于标准显微镜载玻片的占用空间,例如约75mm长×25mm宽(约3”长×1”宽),或约75mm长×50mm宽(约3”长×2”宽)。其中制造微孔的基底的厚度可以在从约0.1mm厚至约10mm厚或更厚的范围内。微孔阵列基底的厚度可以是至少0.1mm厚、至少0.5mm厚、至少1mm厚、至少2mm厚、至少3mm厚、至少4mm厚、至少5mm厚、至少6mm厚、至少7mm厚、至少8mm厚、至少9mm厚或至少10mm厚。微孔阵列基底的厚度可以是至多10mm厚、至多9mm厚、至多8mm厚、至多7mm厚、至多6mm厚、至多5mm厚、至多4mm厚、至多3mm厚、至多2mm厚、至多1mm厚、至多0.5mm厚或至多0.1mm厚。微孔阵列基底的厚度可以是约1mm厚。微孔阵列基底的厚度可以是这些范围内的任何值,例如,微孔阵列基底的厚度可以在约0.2mm和约9.5mm之间。
多种表面处理和表面修饰技术可用于改变微孔阵列表面的性质。实例可以包括但不限于氧等离子体处理以使疏水性材料表面更亲水,使用湿法或干法蚀刻技术使玻璃和硅表面光滑(或粗糙),将聚环氧乙烷或其他聚合物层(诸如pluronic)或牛血清白蛋白吸附或接枝到基底表面以使其更亲水且更不易于生物分子和细胞的非特异性吸附,使用硅烷反应将化学反应性官能团接枝到本来惰性的硅和玻璃表面,等等。光脱保护技术可以用于选择性地激活阵列结构中特定位置的化学反应性官能团,例如,在微孔内壁上选择性地添加或激活化学反应性官能团诸如伯胺或羧基基团可以用于将寡核苷酸探针、肽、蛋白质或其他生物分子共价偶联至微孔的壁。所使用的表面处理或表面修饰的选择可以取决于期望的表面性质的类型和制造微孔阵列的材料的类型中的两者或任一种。
流动池和盒
本文提供的基底(例如,微孔阵列基底)可以被包装在流动池内,该流动池提供了与流体处理系统的其余部分的方便接口连接,并且促进流体的交换,流体例如被递送至微孔阵列的细胞和固体支持物悬浮液、裂解缓冲液、冲洗缓冲液等,和/或乳液滴。设计特征可以包括:(i)一个或更多个入口端口,用于引入细胞样品、固体支持物悬浮液或其他测定试剂,(ii)一个或更多个微孔阵列室,其被设计成提供均匀填充和有效流体交换,同时使回涡或死区最小化,以及(iii)一个或更多个出口端口,用于将流体递送至样品收集点或废物储库。流动池的设计还可以包括用于产生均匀流速概况(即“活塞流”)的特征。在一些实施方案中,流动池可以封闭或并入多于一种微孔阵列基底。在一些实施方案中,集成的微孔阵列/流动池组件可以构成系统的固定部件。在一些实施方案中,微孔阵列/流动池组件可以是从仪器上可移除的。
在该系统的一些实施方案中,具有或不具有附接的流动池的基底(例如,微孔阵列)可以被包装在与仪器系统界面连接的可消耗盒内。盒的设计特征可以包括(i)一个或更多个入口端口,用于与仪器建立流体连接或手动将细胞样品、珠悬浮液或其他测定试剂引入盒中,(ii)一个或更多个旁路通道,即用于细胞样品和珠悬浮液的自动计量,以避免过量填充或回流,(iii)一个或更多个集成的微孔阵列/流动池组件,或一个或更多个其中放置微阵列基底的室,(iv)集成的微型泵或其他流体致动机构,用于控制通过装置的流体流动,(v)集成的微型阀(或其他控制机构),用于分隔预加载的试剂(例如,珠悬浮液)或控制通过装置的流体流动,(vi)一个或更多个通风口,用于提供用于留存空气的逃逸路径,(vii)一个或更多个样品和试剂废物储库,(viii)一个或更多个出口端口,用于与仪器建立流体连接或提供经处理的样品的收集点,(ix)机械接口特征,用于相对于仪器系统可重复地定位可移除的、可消耗的盒,并且用于提供使得外部磁体可以靠近微孔阵列的通路,(x)集成的温度控制组件或热接口,用于提供与仪器系统的良好热接触,以及(xi)光学接口特征,例如透明窗,用于在微孔阵列的光学询问中使用。
阻断寡核苷酸和诱饵寡核苷酸
公开的方法和组合物可以减少样品中不合意的核酸物质的扩增和/或延伸,和/或允许选择性去除样品中不合意的核酸物质,例如使用题为“SELECTIVE EXTENSION INSINGLE CELL WHOLE TRANSCRIPTOME ANALYSIS”的US20200190564中描述的方法和组合物,该文献的内容通过引用以其整体并入本文。
在一些实施方案中,本文公开的方法包括提供特异性地结合一种或更多种不合意的核酸物质中的至少一种的阻断寡核苷酸。阻断寡核苷酸可以在本文公开的方法期间的任何点提供,使得它们可以减少不合意的核酸物质的扩增和/或延伸。例如,阻断寡核苷酸可以在延伸步骤之前、期间或之后,扩增步骤之前或期间,使多于一种寡核苷酸条形码与多于一种核酸靶分子接触用于杂交之前、期间或之后或者其任何组合时被提供。如本文使用的“阻断寡核苷酸”是指可以特异性地结合一种或更多种不合意的核酸物质中的至少一种,由此阻断寡核苷酸和一种或更多种不合意的核酸物质之间的特异性结合可以减少一种或更多种不合意的核酸物质的扩增或延伸(例如,逆转录)的核酸分子。例如,阻断寡核苷酸可以包含能够与一种或更多种不合意的核酸物质杂交的核酸序列。在一些实施方案中,可以提供多于一种阻断寡核苷酸。多于一种阻断寡核苷酸可以特异性地结合一种或更多种不合意的核酸物质中的至少1种、至少2种、至少5种、至少10种、至少50种、至少100种、至少200种、至少500种、至少1000种或更多种,或在这些值中的任何两个之间的范围。阻断寡核苷酸与不合意的核酸物质特异性地结合的位置可以变化。例如,阻断寡核苷酸可以特异性地结合靠近不合意的核酸物质的5’末端的序列。在一些实施方案中,阻断寡核苷酸可以特异性地结合到一种或更多种不合意的核酸物质中至少一种的5’末端的1nt、3nt、5nt、8nt、10nt、15nt、20nt、25nt、30nt、35nt、40nt、50nt、75nt、100nt、200nt、300nt、400nt、500nt或1000nt内,或在这些值中的任何两个之间的范围内。在一些实施方案中,阻断寡核苷酸可以特异性地结合靠近不合意的核酸物质的3’末端的序列。例如,阻断寡核苷酸可以特异性地结合到一种或更多种不合意的核酸物质中至少一种的3’末端的1nt、3nt、5nt、10nt、15nt、20nt、25nt、30nt、35nt、40nt、45nt、50nt、75nt、100nt、200nt、300nt、400nt、500nt或1000nt或更多内,或在这些值中的任何两个之间的范围内。在一些实施方案中,阻断寡核苷酸可以特异性地结合不合意的核酸物质的中间部分的序列。例如,阻断寡核苷酸可以特异性地结合到距离一种或更多种不合意的核酸物质中的至少一种的中点1nt、3nt、5nt、10nt、20nt、25nt、30nt、35nt、40nt、45nt、50nt、75nt、100nt、200nt、300nt、400nt、500nt或1000nt或更多内,或在这些值中的任何两个之间的范围内。在一些实施方案中,不合意的核酸物质是mRNA物质。阻断寡核苷酸可以结合或不结合mRNA物质的多(A)尾。在一些实施方案中,阻断寡核苷酸特异性地结合到与mRNA物质的多(A)尾相邻的区域。在一些实施方案中,阻断寡核苷酸特异性地结合mRNA物质的多(A)尾和邻近多(A)尾的区域。在一些实施方案中,一种或更多种不合意的核酸物质是mRNA分子,并且阻断寡核苷酸特异性结合到一种或更多种不合意的核酸物质的3’多(A)尾的1nt、3nt、5nt、8nt、10nt内或在这些值中的任何两个之间的范围内。
阻断寡核苷酸可以包含各种序列组分。例如,阻断寡核苷酸可以包含(i)特异性地结合一种或更多种不合意的核酸物质中的至少一种的序列,和(ii)靶结合区的序列或子序列。
在一些实施方案中,阻断寡核苷酸和不合意的核酸物质之间的特异性结合可以将不合意的核酸物质的扩增和/或延伸减少至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或更多。
预期,阻断寡核苷酸可以通过例如与不合意的核酸物质形成具有高解链温度(Tm)的杂交复合体,通过不能用作逆转录酶、聚合酶或其组合的引物,来减少不合意的核酸物质的扩增和/或延伸。在一些实施方案中,阻断寡核苷酸可以具有的Tm为以下,为约以下,为至少以下:40℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、90℃、95℃或这些值中的任何两个之间的范围。在一些实施方案中,通过与扩增和/或延伸引物竞争与不合意的核酸物质杂交,阻断寡核苷酸可以减少不合意的核酸物质的扩增和/或延伸。在一些实施方案中,阻断寡核苷酸不能用作逆转录酶或聚合酶或两者的引物。
阻断寡核苷酸可以包含一种或更多种非天然核苷酸。非天然核苷酸可以是例如光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代核酸和锁核酸(LNA)以及二醇核酸(GNA)与苏糖核酸(TNA)。在一些实施方案中,阻断寡核苷酸是嵌合寡核苷酸,诸如LNA/PNA/DNA嵌合体、LNA/DNA嵌合体、PNA/DNA嵌合体、GNA/DNA嵌合体、TNA/DNA嵌合体或其任何组合。
阻断寡核苷酸的长度可以变化。例如,在一些实施方案中,可以通过调节阻断寡核苷酸的长度来改变阻断寡核苷酸的解链温度(Tm)。例如,阻断寡核苷酸可以具有的长度为以下,为约以下,小于以下,大于以下:4nt、6nt、8nt、10nt、12nt、15nt、20nt、21nt、25nt、30nt、35nt、40nt、45nt、50nt、60nt、70nt、80nt、90nt、100nt、150nt、200nt,或上述值中的任何两个之间的范围。在一些实施方案中,阻断寡核苷酸是或是约8nt至100nt长。在一些实施方案中,阻断寡核苷酸是或是约10nt至50nt长。在一些实施方案中,阻断寡核苷酸是或是约12nt至21nt长。在一些实施方案中,阻断寡核苷酸是或是约20nt至30nt长,例如25nt长。
在一些实施方案中,阻断寡核苷酸的Tm通过包含LNA/DNA嵌合体或PNA/DNA嵌合体的阻断寡核苷酸中的DNA残基的数量调节。例如,包含LNA/DNA嵌合体或PNA/DNA嵌合体的阻断寡核苷酸可以具有的DNA残基百分比为以下,为约以下,小于以下,大于以下:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%,或上述值中的任何两个之间的范围。
在一些实施方案中,阻断寡核苷酸可以被设计成不能用作扩增和/或延伸反应的引物或探针。例如,阻断寡核苷酸可能不能用作逆转录酶或聚合酶的引物。例如,包含LNA/DNA嵌合体或PNA/DNA嵌合体的阻断寡核苷酸可以被设计成具有一定百分比的LNA或PNA残基,或者在某些位置上具有LNA或PNA残基,诸如在接近或在寡核苷酸的3’末端、5’末端或中间部分的位置。在一些实施方案中,包含LNA/DNA嵌合体或PNA/DNA嵌合体的阻断寡核苷酸可以具有的LNA或PNA残基的百分比为以下,为约以下,小于以下,大于以下:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%,或上述值中的任何两个之间的范围。
在一些实施方案中,阻断寡核苷酸可以特异性地结合至少一种或更多种不合意的核酸物质,并且由于其3’末端与一种或更多种不合意的核酸物质缺乏杂交,因此可能不能用作扩增和/或延伸反应的引物或探针。在一些实施方案中,阻断寡核苷酸可以包含3’非退火区。3’非退火区可以位于阻断寡核苷酸的最3’末端。3’非退火区可以包含一个或更多个核苷酸,该核苷酸与由阻断寡核苷酸的5’区特异性地结合的不合意的核酸物质非互补。由于3’非退火区与不合意的核酸物质没有杂交,阻断寡核苷酸可能不能被逆转录酶或DNA聚合酶延伸。
在一些实施方案中,阻断寡核苷酸包含可以特异性地结合至少一种或更多种不合意的核酸物质的5’区和3’非退火区。在一些这样的实施方案中,5’区特异性地结合至少一种或更多种不合意的核酸物质的3’末端。在一些实施方案中,阻断寡核苷酸包含结合不合意的核酸物质(例如,管家mRNA)的5’多(dT)区、不结合不合意的核酸物质的3’非退火区和特异性地结合不合意的核酸物质的间插区。在一些实施方案中,相对于阻断寡核苷酸的总长度,3’非退火区的长度为以下,为约以下,小于以下,大于以下:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%,或上述值中的任何两个之间的范围。3’非退火区的序列可以在靶向不同的不合意的核酸物质的不同阻断寡核苷酸之间共享。在一些这样的实施方案中,3’非退火区包含被配置为不与一些或所有不合意的核酸物质杂交的序列。在其他实施方案中,3’非退火区的序列被配置为防止与特定的不合意的核酸物质杂交。
阻断寡核苷酸的3’非退火区的GC含量可以根据实施方案而变化。在一些实施方案中,较高的GC含量防止3’非退火区与不合意的核酸物质的非特异性结合。在一些实施方案中,3’非退火区的GC含量为以下,为约以下,小于以下,大于以下:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%,或上述值中的任何两个之间的范围。3’非退火区可以包含二级结构(例如,发夹),其可以防止阻断寡核苷酸的延伸。在一些实施方案中,3’非退火区被配置为防止分子内杂交、与其他阻断寡核苷酸的分子间杂交和/或二级结构形成。3’非退火区可以仅包含天然核苷酸。可选择地,3’非退火区可以包含一个或更多个非天然核苷酸。
3’非退火区的长度可以变化。例如,3’非退火区可以具有的长度为以下,为约以下,小于以下,大于以下:4nt、6nt、8nt、10nt、12nt、15nt、20nt、21nt、25nt、30nt、35nt、40nt、45nt、50nt、60nt、70nt、80nt、90nt、100nt、150nt、200nt,或上述值中的任何两个之间的范围。在一些实施方案中,3’非退火区是或是约1nt至100nt长。在一些实施方案中,3’非退火区是或是约1nt至50nt长。在一些实施方案中,3’非退火区是或是约1nt至21nt长。在一些实施方案中,3’非退火区是或是约1nt至10nt长。在一些实施方案中,3’非退火区是或是约5nt长。
阻断寡核苷酸的3’非退火区和不合意的核酸物质之间的非互补程度可以变化。在一些实施方案中,3’非退火区与与被阻断寡核苷酸特异性地结合的序列相邻的不合意的核酸物质的序列具有完全的非互补性。在一些实施方案中,3’非退火区和不合意的核酸物质的与被阻断寡核苷酸特异性地结合的序列5’相邻的区域之间的非互补性为以下,为约以下,小于以下,大于以下:10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%,或上述值中的任何两个之间的范围。
在一些实施方案中,本文公开的方法可以包括去除阻断寡核苷酸和不合意的核酸物质之间形成的杂交复合体。例如,阻断寡核苷酸可以包含亲和部分。亲和部分可以是选自由以下组成的组的官能团:生物素、链霉抗生物素蛋白、肝素、适配体、点击化学部分、地高辛、伯胺、羧基、羟基、醛、酮及其任何组合。在一些实施方案中,亲和部分是生物素。在一些实施方案中,阻断寡核苷酸可以通过亲和部分固定到具有亲和部分的结合配偶体的固体支持物。在一些实施方案中,亲和配偶体是链霉抗生物素蛋白。
阻断寡核苷酸可以结合,例如特异性地结合一种或更多种不合意的核酸物质。在一些实施方案中,阻断寡核苷酸可以结合两种或更多种不合意的核酸物质。在一些实施方案中,本文公开的方法包括提供特异性地结合样品中两种或更多种不合意的核酸物质的阻断寡核苷酸。例如,该方法可以包括阻断寡核苷酸,该阻断寡核苷酸特异性地结合样品中至少5种、10种、15种、20种、30种、50种、60种、70种、80种、90种、100种、150种、200种、250种、300种、350种、400种、500种或更多种,或这些值中的任何两个之间的范围的不合意的核酸物质。
本文提供的方法和组合物可以与阻断试剂协同使用,阻断试剂诸如在2021年8月31日提交的题为“USE OF DECOY POLY NUCLEOTIDES IN SINGLE CELL MULTIOMICS”的美国专利申请第63/239,367号中描述的那些,该美国专利申请的内容通过引用以其整体并入本文。阻断试剂可以包含例如(a)能够与蛋白质靶结合试剂特异性寡核苷酸的至少一部分(例如,AbSeq寡核苷酸、细胞组分结合试剂特异性寡核苷酸)杂交的一种或更多种寡核苷酸;(b)能够与一种或更多种非靶核酸中的至少一种杂交的一种或更多种诱饵寡核苷酸,或其任何组合。样品可以在存在阻断试剂的情况下被固定和/或渗透,样品可以在样品被固定和/或渗透后接触阻断试剂,或两者。在一些实施方案中,本文描述的方法包括在样品与固定剂和/或透化剂接触后,使细胞与阻断试剂(例如,诱饵寡核苷酸)接触。本文提供的方法和组合物可以与2021年8月31日提交的题为“RNA PRESERVATION AND RECOVERY FROMFIXED CELLS”的美国专利申请第63/239,369号中描述的方法和组合物协同使用,该美国专利申请的内容通过引用以其整体并入本文。在一些实施方案中,诱饵寡核苷酸(例如,表1中示出的那些)不包含3’修饰。在一些实施方案中,3’修饰能够减少或阻止诱饵寡核苷酸的聚合酶延伸(例如,3’双脱氧-C修饰(ddC))。在一些实施方案中,诱饵寡核苷酸被配置为通过包含例如延伸阻断剂来阻止其经由聚合酶的3’延伸。3’修饰可以是一种或更多种延伸阻断剂。3’修饰可以是配置为不退火至寡核苷酸条形码的靶结合区的序列。延伸阻断剂可以包含一个或更多个2’-O-甲基(2’OM)RNA核苷酸。延伸阻断剂可以包含无碱基位点、稳定的无碱基位点、化学捕获的无碱基位点或其任何组合中的一种或更多种。在一些实施方案中,稳定的无碱基位点包含1’,2’-双脱氧。在一些实施方案中,化学捕获的无碱基位点包括与烷氧基胺或硼氢化钠反应的无碱基位点。在一些实施方案中,无碱基位点包括无嘌呤位点、无嘧啶位点或两者。在一些实施方案中,无碱基位点由烷基化剂或氧化剂产生。在一些实施方案中,一种或更多种延伸阻断剂包括:一个或更多个硝基吲哚、一个或更多个肌苷、一个或更多个吖啶、一个或更多个2-氨基嘌呤、一个或更多个2-6-二氨基嘌呤、一个或更多个5-溴脱氧尿苷、一个或更多个反向胸苷(反向dT)、一个或更多个反向双脱氧胸苷(ddT)、一个或更多个双脱氧胞苷(ddC)、一个或更多个5-甲基胞苷、一个或更多个5-羟甲基胞苷、一个或更多个2’-O-甲基RNA碱基、一个或更多个未甲基化RNA碱基、一个或更多个异脱氧胞苷(Iso-dC)、一个或更多个异脱氧鸟苷(Iso-dG)、一个或更多个C3(OC3H6OPO3)基团、一个或更多个可光裂解(PC)[OC3H6-C(o)NHCH2-C6H3NO2-CH(CH3)OPO3]基团、一个或更多个己二醇基团、一个或更多个spacer 9(iSp9)[(OCH2CH2)3OPO3]基团、一个或更多个spacer 18(iSp18)[(OCH2CH2)6OPO3]基团,或其任何组合。在一些实施方案中,诱饵寡核苷酸被配置为模拟细胞内靶结合试剂特异性寡核苷酸和/或细胞表面靶结合试剂特异性寡核苷酸,并且从而结合在公开的方法中本来将结合到细胞内靶结合试剂特异性寡核苷酸和/或细胞表面靶结合试剂特异性寡核苷酸的不合意的核酸物质。在一些实施方案中,本文提供的诱饵寡核苷酸包含、不包含和/或包含本文提供的细胞内靶结合试剂特异性寡核苷酸和/或细胞表面靶结合试剂特异性寡核苷酸的一种或更多种元件的修饰形式,诸如,例如对齐序列、UMI、抗体特异性条形码序列、引物衔接子、通用PCR手柄和/或配置为结合寡核苷酸条形码的靶结合区的序列(例如多(A)尾)。在一些实施方案中,本文提供的系统、方法、组合物和试剂盒可以与PCT申请公布第WO/2021/163374号中描述的系统、方法、组合物和试剂盒协同使用,该PCT申请公布的内容通过引用以其整体并入本文。
不受任何特定理论的束缚,据信诱饵寡核苷酸可以例如防止或减少蛋白质靶结合试剂特异性寡核苷酸与非靶细胞/内源性核酸的不合意的非特异性结合,因此减少方法中的噪声。例如,诱饵寡核苷酸可能能够与一种或更多种非靶核酸中的至少一种或其一部分杂交。诱饵寡核苷酸可以包含与蛋白质靶结合试剂特异性寡核苷酸的一个或更多个共有特征。例如,诱饵寡核苷酸可以包含与蛋白质靶结合试剂特异性寡核苷酸相同或基本相同的AbSeq条形码。在一些实施方案中,AbSeq条形码是约20个至50个核苷酸,例如20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个或者这些值中的任何两个之间的范围的核苷酸。在一些实施方案中,诱饵寡核苷酸不具有AbSeq条形码。在一些实施方案中,诱饵寡核苷酸包含与蛋白质靶结合试剂特异性寡核苷酸序列相同或基本相似的序列。例如,诱饵寡核苷酸可以具有与蛋白质靶结合试剂特异性寡核苷酸具有、具有约、具有至少约100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%、70%、65%、60%或这些值中的任何两个之间的数字或范围的序列同一性的序列。诱饵寡核苷酸的这样的序列的长度可以是、可以是约、可以是至少、或可以是至多3个、5个、8个、10个、12个、14个、15个、18个、20个、25个、30个、35个、40个核苷酸,或者这些值中的任何两个之间的数字或范围的核苷酸。在一些实施方案中,诱饵寡核苷酸与蛋白质靶结合试剂特异性寡核苷酸具有、具有约或具有至多5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、这些值中的任何两个之间的数字或范围的序列同一性。
在一些实施方案中,诱饵寡核苷酸包含随机序列区,其中在每4个、5个、6个或7个核苷酸链段(即,4个、5个、6个或7个连续的核苷酸)中存在至少一个G或C。在一些实施方案中,诱饵寡核苷酸不包含具有多于3个、4个、5个或6个连续T或A的任何多(dT)或多(dA)区。在一些实施方案中,诱饵寡核苷酸包含AbSeq条形码序列和长度约12-15个核苷酸的随机序列。
诱饵寡核苷酸可以包含一个或更多个修饰的核苷酸、5’修饰、3’修饰或其任何组合。3’修饰可以是例如3’双脱氧-C修饰(ddC)。5’修饰可以是例如5’氨基修饰物C12修饰(5AmMC12)。诱饵寡核苷酸的长度可以变化,例如诱饵寡核苷酸的长度可以是或是约25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个或这些值中的任何两个之间的范围的核苷酸。诱饵寡核苷酸可以包含一个或更多个UMI或UMI区。在一些实施方案中,诱饵寡核苷酸不包含UMI。在一些实施方案中,诱饵寡核苷酸包含一个或更多个随机序列区(例如,1个、2个、3个、4个随机序列区)。在一些实施方案中,诱饵寡核苷酸不包含随机序列。UMI的长度可以变化,例如,UMI的长度可以是或是约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或这些值中的任何两个之间的范围的核苷酸。随机序列区的长度可以变化,例如,随机序列区的长度可以是、是约、是至多或是至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个或这些值中的任何两个之间的范围的核苷酸。在一些实施方案中,诱饵寡核苷酸包含长度为30个核苷酸或为约30个核苷酸的随机序列区,并且其中随机序列区在每个6个核苷酸链段中具有至少一个G或C。
在一些实施方案中,阻断试剂包含一种或更多种寡核苷酸,该寡核苷酸具有与蛋白质靶结合试剂特异性寡核苷酸的序列的一部分互补的序列。在一些实施方案中,本文描述的方法包括在存在阻断试剂的情况下,使多于一种蛋白质靶结合试剂特异性寡核苷酸与细胞接触。在一些实施方案中,诱饵寡核苷酸包含随机序列,该随机序列具有蛋白质靶结合试剂特异性寡核苷酸中的一种或更多种的分子标记的基本相同的长度。
本文描述的方法、组合物和试剂盒可以减少由条形码寡核苷酸(例如,寡核苷酸缀合的抗体中的抗体特异性寡核苷酸)与非靶细胞蛋白(例如,细胞表面蛋白和细胞内蛋白)的非特异性结合引起的噪声。当暴露大量细胞/内源性核酸时,在样品分析中使用本文公开的方法、组合物和试剂盒可能是有利的。如本文描述的,通过使用诱饵寡核苷酸可以减少由非特异性结合引起的噪声(例如,部分减少、接近完全减少和完全减少)。
在一些实施方案中,使样品与1个、2个或3个独特诱饵寡核苷酸接触并孵育持续合意的时间段(例如,约1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、7分钟、8分钟、9分钟、10分钟、12分钟、15分钟、20分钟、30分钟、60分钟或者这些值中的任何两个之间的数字或范围的分钟)。例如,诱饵寡核苷酸可以导致、导致约或导致至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、100%或这些值中的任何两个之间的数字或范围的与非靶核酸的非特异性结合的减少。在一些实施方案中,诱饵寡核苷酸可以导致、导致约或导致至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、100%或这些值中任何两个之间的数字或范围的蛋白质基因组学或使用AbO的其他蛋白质组学工作流程中的噪声的减少。
尽管本文已经公开了各种方面和实施方案,但其他方面和实施方案对本领域技术人员将是明显的。本文公开的各种方面和实施方案用于说明的目的而并不意在限制由附随权利要求指示的实际范围和精神。
本领域的技术人员将理解,对于本文公开的这个和其他过程和方法,在该过程和方法中执行的功能可以以不同的顺序实现。此外,所概述的步骤和操作仅作为实例提供,并且该步骤和操作中的一些可以是任选的,组合成较少的步骤和操作,或者扩展成另外的步骤和操作,而不偏离所公开的实施方案的本质。
关于本文中基本上任何复数和/或单数术语的使用,在对于上下文和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。
本领域技术人员将理解,一般来说,本文使用的术语,并且尤其是所附权利要求(例如,所附权利要求的主体)中的术语,通常意在作为“开放式”术语(例如,术语“包括(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括(includes)”应解释为“包括但不限于(includes but is not limited to)”,等等)。本领域技术人员将进一步理解,如果意图所介绍的权利要求陈述的特定数字,则这样的意图将明确地陈述于权利要求中,并且在不存在这种陈述的情况下,不存在这种意图。例如,作为对理解的帮助,以下所附权利要求书可以包含介绍性措辞“至少一种”和“一种或更多种”的使用,以介绍权利要求陈述。然而,此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含此类介绍的权利要求陈述的具体权利要求限制为包含仅一种此类陈述的实施方案,甚至当同一权利要求包括介绍性措辞“一种或更多种”或“至少一种”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如,“一(a)”和/或“一(an)”应解释为意指“至少一种”或“一种或更多种”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数字,本领域技术人员将认识到,此类陈述应解释为意指至少所陈述的数字(例如,仅陈述“两种陈述”而没有其他修饰词意指至少两种陈述或两种或更多种陈述)。此外,在使用类似于“A、B和C等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有A、B和C中的至少一种的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。在使用类似于“A、B或C等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有A、B或C中的至少一种的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。
此外,当本公开内容的特征或方面以马库什组(Markush group)描述时,本领域技术人员将意识到,本公开内容还由此以马库什组的任何个体成员或成员子组描述。
如本领域技术人员将理解的,为了任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还包括该范围的任何和所有可能的子范围和子范围的组合。任何列出的范围都可以很容易地被识别为充分描述并使相同的范围能被分解为至少相等的一半、三分之一、四分之一、五分之一、十分之一等。作为非限制性实例,本文讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言,诸如“多达”、“至少”等包括所陈述的数字,并且指可以随后分解为如上文讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个单独的成员。因此,例如,具有1-3个细胞的组是指具有1个、2个或3个细胞的组。类似地,具有1-5个细胞的组是指具有1个、2个、3个、4个或5个细胞的组,等等。
从前述内容,应当理解,本文出于说明的目的已经描述了本公开内容的各种实施方案,并且可以在不脱离本公开内容的范围和精神的情况下进行各种修改。因此,本文公开的各种实施方案并不旨在进行限制,真正的范围和精神由附随权利要求来指示。

Claims (98)

1.一种用于确定样品中核酸靶的空间位置和拷贝数的方法,包括:
提供包含多于一个空间区域的基底,其中多于一种寡核苷酸条形码与所述空间区域中的每一个关联,其中所述寡核苷酸条形码中的每一个包含通用序列、分子标记、能够与核酸靶杂交的靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记;
使所述基底与包含核酸靶的拷贝的样品接触,其中所述接触包括使所述多于一个空间区域与所述样品接触,使得每个不同的空间区域接触所述样品的不同空间位置;
使与所述核酸靶的拷贝杂交的所述多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,所述多于一个条形码化核酸分子各自包含与所述核酸靶的至少一部分互补的序列;
获得测序数据,所述测序数据包括所述多于一个条形码化核酸分子或其产物的多于一个测序读段,其中所述多于一个测序读段中的每一个包含空间标记序列、分子标记序列和所述核酸靶的子序列;并且
对于每个独特的空间标记序列,其与所述基底的不同空间区域关联,并且从而与所述样品的不同空间位置关联,计数具有与核酸靶关联的不同序列的分子标记的数量,以确定在所述样品的每个空间位置处所述核酸靶的拷贝数。
2.根据权利要求1所述的方法,其中所述样品包含多于一种细胞组分靶,所述方法还包括:
使多于一种细胞组分结合试剂与所述样品接触,其中所述多于一种细胞组分结合试剂中的每一种包含细胞组分结合试剂特异性寡核苷酸,所述细胞组分结合试剂特异性寡核苷酸包含针对所述细胞组分结合试剂的独特标识符序列,并且其中所述细胞组分结合试剂能够与所述多于一种细胞组分靶中的至少一种特异性地结合;
使与所述细胞组分结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一种条形码化细胞组分结合试剂特异性寡核苷酸,所述多于一种条形码化细胞组分结合试剂特异性寡核苷酸各自包含与独特标识符序列的至少一部分互补的序列;
获得测序数据,所述测序数据包括所述多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的多于一个测序读段,其中所述多于一个测序读段中的每一个包括空间标记序列、分子标记序列和所述独特标识符序列的至少一部分;以及
对于每个独特的空间标记序列,其与所述基底的不同空间区域关联并且从而与所述样品的不同空间位置关联,计数具有与独特标识符序列关联的不同序列的分子标记的数量,以确定在所述样品的每个空间位置处所述多于一种细胞组分靶中的至少一种细胞组分靶的拷贝数。
3.根据权利要求1-2中任一项所述的方法,其中接触步骤中的至少一部分在存在延伸试剂的情况下进行,任选地整个接触步骤在存在所述延伸试剂的情况下进行,还任选地接触步骤和延伸步骤是同时的,任选地所述样品和基底在延伸步骤期间接触,任选地所述延伸在原位进行。
4.根据权利要求1-3中任一项所述的方法,其中所述延伸试剂包括逆转录试剂,任选地逆转录试剂包括逆转录酶和dNTP。
5.根据权利要求1-4中任一项所述的方法,其中所述方法包括变性步骤,任选地变性将所述核酸靶与所述条形码化核酸分子分离和/或将所述细胞组分结合试剂特异性寡核苷酸与所述条形码化细胞组分结合试剂特异性寡核苷酸分离。
6.根据权利要求1-5中任一项所述的方法,其中接触步骤包括在所述样品上覆盖所述基底。
7.根据权利要求1-6中任一项所述的方法,包括在接触步骤之后将所述样品与所述基底分离。
8.根据权利要求1-7中任一项所述的方法,其中所述方法(i)包括在接触步骤之前固定所述样品,或者(ii)不包括在接触步骤之前固定所述样品。
9.根据权利要求1-8中任一项所述的方法,其中所述样品在接触步骤期间被物理分割或保持完整。
10.根据权利要求1-9中任一项所述的方法,其中所述样品中所述核酸靶的空间位置在所述样品的表面上、在所述样品内部、在所述样品中的亚细胞位置或其任何组合。
11.根据权利要求1-10中任一项所述的方法,其中所述样品包含多于一个细胞,任选地,所述核酸靶与所述多于一个细胞关联。
12.根据权利要求11所述的方法,其中所述多于一个细胞包括一种或更多种细胞类型,任选地,所述一种或更多种细胞类型选自由以下组成的组:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移细胞、良性细胞、原代细胞和循环细胞,或其任何组合。
13.根据权利要求1-12中任一项所述的方法,其中所述样品包括组织、细胞单层、固定细胞、组织切片或其任何组合。
14.根据权利要求1-13中任一项所述的方法,其中所述样品包括生物样品、临床样品、环境样品、生物流体、组织、来源于受试者的组织切片或其任何组合,任选地所述受试者是人类、小鼠、狗、大鼠或脊椎动物。
15.根据权利要求1-14中任一项所述的方法,还包括基于所述样品中所述核酸靶的空间位置确定所述受试者的基因型、表型或一个或更多个基因突变。
16.根据权利要求1-15中任一项所述的方法,还包括预测所述受试者对一种或更多种疾病的易感性。
17.根据权利要求1-16中任一项所述的方法,其中所述一种或更多种疾病中的至少一种是癌症或遗传性疾病。
18.根据权利要求1-17中任一项所述的方法,还包括确定所述样品中所述多于一个细胞的细胞类型。
19.根据权利要求1-18中任一项所述的方法,其中基于所述样品中所述多于一个细胞的细胞类型的预测反应性来选择药物。
20.根据权利要求1-19中任一项所述的方法,包括对所述样品成像,任选地在接触步骤之后对所述样品成像,任选地所述成像产生成像数据。
21.根据权利要求1-20中任一项所述的方法,其中对所述样品成像包括用染色剂对所述样品染色,其中所述染色剂是荧光染色剂、负染色剂、抗体染色剂或其任何组合,任选地染色包括免疫细胞化学(ICC)、免疫组织化学(IHC)、免疫荧光(IF)或其任何组合。
22.根据权利要求1-21中任一项所述的方法,其中成像包括显微术、共焦显微术、时差成像显微术、荧光显微术、多光子显微术、定量相位显微术、表面增强拉曼光谱、摄像、手动视觉分析、自动视觉分析或其任何组合。
23.根据权利要求1-22中任一项所述的方法,还包括将所述样品的一个或更多个空间位置的成像数据和测序数据关联。
24.根据权利要求1-23中任一项所述的方法,包括所述空间位置的成像数据和测序数据的相关性分析,任选地,所述相关性分析识别以下中的一个或更多个:候选生物标志物、候选治疗剂、治疗剂的候选剂量和/或候选治疗剂的细胞靶。
25.根据权利要求1-24中任一项所述的方法,其中所述成像产生用于构建所述样品的物理表示的图谱的图像,任选地,所述图谱是二维或三维的。
26.根据权利要求1-25中任一项所述的方法,包括将所述核酸靶和/或细胞组分靶映射到所述样品的所述图谱上。
27.根据权利要求1-26中任一项所述的方法,所述方法包括分离对应于感兴趣的空间位置的一个或更多个条形码化核酸分子,任选地,所述分离包括包含对应于感兴趣的空间位置的空间区域的独特空间标记的一个或更多个条形码化核酸分子的选择性杂交和下拉。
28.根据权利要求1-27中任一项所述的方法,其中所述寡核苷酸条形码包含含有捕获序列的靶结合区,任选地所述靶结合区包含多(dT)区。
29.根据权利要求1-28中任一项所述的方法,其中所述细胞组分结合试剂特异性寡核苷酸包含与被配置为捕获所述细胞组分结合试剂特异性寡核苷酸的捕获序列互补的序列,任选地与所述捕获序列互补的序列包含多(dA)区。
30.根据权利要求1-29中任一项所述的方法,其中所述核酸靶包括核酸分子。
31.根据权利要求1-30中任一项所述的方法,其中所述核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸、细胞组分结合试剂特异性寡核苷酸或其任何组合。
32.根据权利要求1-31中任一项所述的方法,其中所述空间区域中的每一个包含被配置成与一组核酸靶杂交的多于一种寡核苷酸条形码。
33.根据权利要求1-32中任一项所述的方法,其中所述细胞组分结合试剂特异性寡核苷酸包含第二通用序列。
34.根据权利要求1-33中任一项所述的方法,其中获得所述多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物的序列信息包括:
使用能够与所述第一通用序列或其互补物杂交的引物和能够与所述第二通用序列或其互补物杂交的引物扩增所述多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物,以产生多于一种扩增的条形码化细胞组分结合试剂特异性寡核苷酸;以及
获得所述多于一种扩增的条形码化细胞组分结合试剂特异性寡核苷酸或其产物的测序数据。
35.根据权利要求1-34中任一项所述的方法,其中获得测序数据包括将测序衔接子附接至(i)所述多于一个条形码化核酸分子或其产物,和/或(ii)所述多于一种条形码化细胞组分结合试剂特异性寡核苷酸或其产物。
36.根据权利要求1-35中任一项所述的方法,所述方法包括在使所述多于一种细胞组分结合试剂与所述样品接触之后,去除所述多于一种细胞组分结合试剂中未与所述样品接触的一种或更多种细胞组分结合试剂,任选地去除未与所述样品接触的一种或更多种细胞组分结合试剂包括:去除未与所述多于一种细胞组分靶中的相应的至少一种接触的一种或更多种细胞组分结合试剂。
37.根据权利要求1-36中任一项所述的方法,其中所述细胞组分靶包括细胞内蛋白、糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。
38.根据权利要求1-37中任一项所述的方法,其中使所述多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’外切核酸酶活性和3’至5’外切核酸酶活性中的至少一种的DNA聚合酶使所述多于一种寡核苷酸条形码延伸,任选地所述DNA聚合酶包括Klenow片段,还任选地所述逆转录酶包括病毒逆转录酶,任选地其中所述病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。
39.根据权利要求1-38中任一项所述的方法,其中少于约5%的核酸靶由于所述核酸靶从起始空间位置扩散而被映射到不正确的空间位置。
40.根据权利要求1-39中任一项所述的方法,
其中所述多于一种寡核苷酸条形码中的每一种包含基底接头官能团,
其中所述多于一个基底中的每一个包含基底官能团,并且
其中所述基底官能团和所述基底接头官能团相互关联。
41.根据权利要求40所述的方法,其中所述基底接头官能团和所述基底官能团单独地选自由以下组成的组:C6、生物素、链霉抗生物素蛋白、伯胺、醛、酮,及其任何组合。
42.根据权利要求1-41中任一项所述的方法,其中所述寡核苷酸条形码通过基底接头与所述基底关联。
43.根据权利要求42所述的方法,其中所述基底接头包含碳链,任选地所述碳链包含2-30个碳,并且还任选地所述碳链包含12个碳。
44.根据权利要求42-43中任一项所述的方法,其中所述基底接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。
45.根据权利要求1-44中任一项所述的方法,其中所述空间标记的长度是6-60个核苷酸。
46.根据权利要求1-45中任一项所述的方法,其中所述寡核苷酸条形码:
长度为50-500个核苷酸;
附接至所述基底;
共价附接至所述基底;
缀合至所述基底;
通过选自由UV光可裂解基团、链霉抗生物素蛋白、生物素、胺及其组合组成的组的化学基团缀合至所述基底;
非共价附接至所述基底;和/或
被配置为可从所述基底分离。
47.根据权利要求1-46中任一项所述的方法,包括使所述寡核苷酸条形码从所述基底解离,并且任选地使所述寡核苷酸条形码从所述基底解离包括通过UV光裂解、化学处理、加热、酶处理或其任何组合使所述寡核苷酸条形码从所述基底分离。
48.根据权利要求47所述的方法,其中所述解离发生在对所述寡核苷酸条形码进行条形码化之后。
49.根据权利要求1-48中任一项所述的方法,其中所述寡核苷酸条形码被配置为不可从所述基底分离。
50.根据权利要求1-49中任一项所述的方法,其中所述寡核苷酸条形码被配置为通过1,3-偶极环加成反应、杂-第尔斯-阿尔德反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合被缀合至所述基底。
51.根据权利要求1-50中任一项所述的方法,其中所述多于一种寡核苷酸条形码中的至少一种寡核苷酸条形码被固定在所述基底上、被部分地固定在所述基底上、被包封在所述基底中、被部分地包封在所述基底中或其组合。
52.根据权利要求1-51中任一项所述的方法,其中所述基底包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合。
53.根据权利要求1-52中任一项所述的方法,其中所述靶结合区包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。
54.根据权利要求1-53中任一项所述的方法,其中所述多于一种寡核苷酸条形码的每一种空间标记包含至少6个核苷酸。
55.根据权利要求1-54中任一项所述的方法,其中所述多于一种寡核苷酸条形码的每一种分子标记包含至少6个核苷酸。
56.根据权利要求1-55中任一项所述的方法,其中所述基底包括固体支持物。
57.根据权利要求1-56中任一项所述的方法,其中所述固体支持物包括平坦表面。
58.根据权利要求1-57中任一项所述的方法,其中所述基底包含含有多于一个点的寡核苷酸阵列,并且其中所述寡核苷酸阵列的每个点包含所述多于一个空间区域中的不同空间区域。
59.根据权利要求1-58中任一项所述的方法,其中所述基底包含微孔阵列,并且其中所述微孔阵列的每个微孔包含所述多于一个空间区域中的不同空间区域。
60.根据权利要求1-59中任一项所述的方法,包括在使多于一种细胞组分结合试剂与所述样品接触和/或使所述基底与所述样品接触之前,使所述样品与阻断试剂、一个或更多个诱饵寡核苷酸和/或一个或更多个阻断寡核苷酸接触。
61.根据权利要求1-60中任一项所述的方法,其中使多于一种细胞组分结合试剂与所述样品接触在存在阻断试剂的情况下进行。
62.根据权利要求1-61中任一项所述的方法,其中所述阻断试剂包含与所述细胞组分结合试剂特异性寡核苷酸的至少一部分互补的多于一种寡核苷酸。
63.根据权利要求1-62中任一项所述的方法,其中所述阻断试剂包含来源于第一物种的抗体或其片段,并且其中所述阻断试剂包含来源于所述第一物种的血清。
64.根据权利要求1-63中任一项所述的方法,其中所述样品包含一种或更多种非靶核酸,其中所述阻断试剂包含能够与所述一种或更多种非靶核酸中的至少一种杂交的多于一个诱饵寡核苷酸。
65.根据权利要求1-64中任一项所述的方法,其中所述多于一个诱饵寡核苷酸中的每一个能够与非靶核酸的至少一部分杂交。
66.根据权利要求1-65中任一项所述的方法,其中所述诱饵寡核苷酸包含与非靶核酸的至少一部分互补的序列。
67.根据权利要求1-66中任一项所述的方法,其中所述诱饵寡核苷酸包含与所述细胞组分结合试剂特异性寡核苷酸的序列相同或基本相似的序列。
68.根据权利要求67所述的方法,其中所述序列的长度为3-40个核苷酸。
69.根据权利要求1-68中任一项所述的方法,其中所述诱饵寡核苷酸与所述细胞组分结合试剂特异性寡核苷酸具有至多50%的序列同一性。
70.根据权利要求1-69中任一项所述的方法,其中所述诱饵寡核苷酸不包含UMI。
71.根据权利要求1-69中任一项所述的方法,其中所述诱饵寡核苷酸包含随机序列,并且任选地,所述随机序列的长度为约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸。
72.根据权利要求1-71中任一项所述的方法,其中所述诱饵寡核苷酸不包含具有多于4个、5个、6个或7个连续T或A的任何序列。
73.根据权利要求1-72中任一项所述的方法,其中所述诱饵寡核苷酸在每4个、5个、6个或7个连续的核苷酸中包含至少一个G或C。
74.根据权利要求1-73中任一项所述的方法,其中所述诱饵寡核苷酸包含一个或更多个修饰的核苷酸。
75.根据权利要求1-74中任一项所述的方法,其中所述诱饵寡核苷酸包含5’修饰,并且任选地所述5’修饰包含5’氨基修饰物C12修饰(5AmMC12)。
76.根据权利要求1-75中任一项所述的方法,其中所述诱饵寡核苷酸包含3’修饰,并且任选地所述3’修饰包含3’双脱氧-C修饰(ddC)。
77.根据权利要求1-76中任一项所述的方法,其中所述诱饵寡核苷酸的长度为30个至65个核苷酸。
78.根据权利要求1-77中任一项所述的方法,其中所述样品包含一种或更多种不合意的核酸物质,所述方法包括:
使阻断寡核苷酸与所述样品接触,其中所述阻断寡核苷酸特异性地结合所述一种或更多种不合意的核酸物质中的至少一种;
由此通过所述阻断寡核苷酸减少所述一种或更多种不合意的核酸物质中的至少一种的延伸。
79.根据权利要求78所述的方法,其中所述阻断寡核苷酸:
在所述基底与所述样品接触之前与所述样品接触;
在所述基底与所述样品接触之后与所述样品接触;和/或
当所述基底与所述样品接触时与所述样品接触。
80.根据权利要求78-79中任一项所述的方法,其中所述阻断寡核苷酸包含:(i)特异性地结合所述一种或更多种不合意的核酸物质中的至少一种的序列,和(ii)所述靶结合区的序列或子序列。
81.根据权利要求78-80中任一项所述的方法,其中所述阻断寡核苷酸包含(i)特异性地结合所述一种或更多种不合意的核酸物质中的至少一种的序列,(ii)所述靶结合区的序列或子序列,以及(iii)不与所述一种或更多种不合意的核酸物质中的至少一种杂交的序列。
82.根据权利要求78-81中任一项所述的方法,其中所述阻断寡核苷酸包含3’非退火区,所述3’非退火区被配置为不与所述一种或更多种不合意的核酸物质退火;并且任选地,所述3’非退火区和与被所述阻断寡核苷酸特异性地结合的序列5’相邻的不合意的核酸物质的区域之间的非互补性为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或约100%。
83.根据权利要求82所述的方法,其中所述3’非退火区为1nt至100nt长,1nt至50nt长,1nt至21nt长,1nt至10nt长,或约5nt长。
84.根据权利要求78-83中任一项所述的方法,其中所述阻断寡核苷酸是锁核酸(LNA)、肽核酸(PNA)、DNA、LNA/PNA嵌合体、LNA/DNA嵌合体或PNA/DNA嵌合体。
85.根据权利要求78-83中任一项所述的方法,其中所述阻断寡核苷酸不包含非天然核苷酸。
86.根据权利要求78-85中任一项所述的方法,所述方法包括提供特异性地结合所述样品中两种或更多种不合意的核酸物质,任选地至少10种或至少100种不合意的核酸物质的阻断寡核苷酸。
87.根据权利要求78-86中任一项所述的方法,其中所述阻断寡核苷酸:
具有至少50℃、至少60℃或至少70℃的Tm
不能用作逆转录酶或聚合酶的引物;和/或
为8nt至100nt长,为10nt至50nt长,为12nt至21nt长,为20nt至30nt长,或为约25nt长。
88.根据权利要求78-87中任一项所述的方法,其中所述一种或更多种不合意的核酸物质占所述样品的核酸含量的约50%、约60%、约70%或约80%。
89.根据权利要求78-88中任一项所述的方法,其中所述不合意的核酸物质选自由以下组成的组:核糖体RNA、线粒体RNA、基因组DNA、内含子序列、高丰度序列及其组合。
90.根据权利要求78-89中任一项所述的方法,其中所述阻断寡核苷酸特异性地结合到所述一种或更多种不合意的核酸物质的3’末端的100nt内、50nt内或25nt内。
91.根据权利要求78-90中任一项所述的方法,其中所述阻断寡核苷酸特异性地结合到所述一种或更多种不合意的核酸物质的5’末端的100nt内,或者所述阻断寡核苷酸特异性地结合到所述一种或更多种不合意的核酸物质的中点的100nt内。
92.根据权利要求78-91中任一项所述的方法,其中所述一种或更多种不合意的核酸物质是mRNA分子,并且所述阻断寡核苷酸特异性结合到所述一种或更多种不合意的核酸物质的3’多(A)尾的10nt内。
93.一种组合物,所述组合物包含:
包含多于一个空间区域的微孔阵列,
其中所述微孔阵列包含至少100个微孔,其中每个微孔具有从约10μm3至约786,000μm3的体积,其中每个微孔包含不同的空间区域,其中多于一种寡核苷酸条形码与所述空间区域中的每一个关联,其中所述寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
94.一种组合物,所述组合物包含:
包含多于一个空间区域的寡核苷酸阵列,
其中所述寡核苷酸阵列包含至少100个点,其中所述寡核苷酸阵列的每个点包含所述多于一个空间区域中的不同空间区域,其中多于一种寡核苷酸条形码与所述空间区域中的每一个关联,其中所述寡核苷酸条形码中的每一个包含通用序列、分子标记、靶结合区和预定空间标记,其中相同空间区域的寡核苷酸条形码包含相同的空间标记,并且其中不同空间区域的寡核苷酸条形码包含不同的空间标记。
95.根据权利要求93-94中任一项所述的组合物,所述组合物还包含盒,其中所述盒包括以下中的至少一个:入口端口、出口端口、泵、阀、通风口、储库、样品收集室、温度控制设备或其任何组合。
96.根据权利要求93-95中任一项所述的组合物,所述组合物包含缓冲液。
97.根据权利要求93-96中任一项所述的组合物,所述组合物包含一种或更多种用于逆转录反应的试剂、一种或更多种用于扩增反应的试剂,或两者。
98.根据权利要求93-97中任一项所述的组合物,其中所述盒包括用于对所述至少100个微孔进行光学成像的透明窗。
CN202280059380.9A 2021-09-01 2022-08-31 使用原位逆转录的空间多组学 Pending CN117916389A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163239897P 2021-09-01 2021-09-01
US63/239,897 2021-09-01
PCT/US2022/075774 WO2023034872A1 (en) 2021-09-01 2022-08-31 Spatial multiomics using in situ reverse transcription

Publications (1)

Publication Number Publication Date
CN117916389A true CN117916389A (zh) 2024-04-19

Family

ID=83447918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280059380.9A Pending CN117916389A (zh) 2021-09-01 2022-08-31 使用原位逆转录的空间多组学

Country Status (2)

Country Link
CN (1) CN117916389A (zh)
WO (1) WO2023034872A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
CA3034924A1 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
KR20230074639A (ko) 2013-08-28 2023-05-30 벡톤 디킨슨 앤드 컴퍼니 대량의 동시 단일 세포 분석
ES2836802T3 (es) * 2015-02-27 2021-06-28 Becton Dickinson Co Códigos de barras moleculares espacialmente direccionables
CA3034924A1 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
US10676779B2 (en) 2017-06-05 2020-06-09 Becton, Dickinson And Company Sample indexing for single cells
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
US20210317524A1 (en) * 2018-08-28 2021-10-14 10X Genomics, Inc. Resolving spatial arrays
EP3861134A1 (en) 2018-10-01 2021-08-11 Becton, Dickinson and Company Determining 5' transcript sequences
WO2020123384A1 (en) 2018-12-13 2020-06-18 Cellular Research, Inc. Selective extension in single cell whole transcriptome analysis
WO2021142233A1 (en) * 2020-01-10 2021-07-15 10X Genomics, Inc. Methods for determining a location of a target nucleic acid in a biological sample
US20210246492A1 (en) 2020-02-12 2021-08-12 Becton, Dickinson And Company Intracellular abseq
WO2021168261A1 (en) * 2020-02-21 2021-08-26 10X Genomics, Inc. Capturing genetic targets using a hybridization approach

Also Published As

Publication number Publication date
WO2023034872A1 (en) 2023-03-09

Similar Documents

Publication Publication Date Title
US20220348904A1 (en) Molecular barcoding on opposite transcript ends
ES2945191T3 (es) Análisis de muestras multiómicas de alto rendimiento
US20210230583A1 (en) Barcoded wells for spatial mapping of single cells through sequencing
US11492660B2 (en) Selective extension in single cell whole transcriptome analysis
CN110719959B (zh) 针对单细胞的样品索引
US20220010362A1 (en) cDNA SPIKE-IN CONTROL FOR SINGLE CELL ANALYSIS
US20220033810A1 (en) Single cell assay for transposase-accessible chromatin
US20220010361A1 (en) TARGET ENRICHMENT USING NUCLEIC ACID PROBES FOR scRNAseq
EP4242324A2 (en) Aptamer barcoding
EP4090764A1 (en) Cell capture using du-containing oligonucleotides
CN115803445A (zh) 用于5撇基因表达测定的寡核苷酸和珠
CN117916389A (zh) 使用原位逆转录的空间多组学
CN115427584A (zh) 嗜中温dna聚合酶延伸阻断物
CN113454234A (zh) 杂合体靶向和全转录物组扩增
CN115244184A (zh) 用于定量蛋白和rna的方法和组合物
CN116438316A (zh) 用于肿瘤学诊断的无细胞核酸和单细胞组合分析
WO2023034794A1 (en) Rna preservation and recovery from fixed cells
WO2023034790A1 (en) Use of decoy polynucleotides in single cell multiomics
WO2024097718A1 (en) Polymerase mediated end modification of abseq
WO2024097719A1 (en) Application for peptide nucleic acid (pna) blocker
CN117957330A (zh) 全长单细胞rna测序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination