CN114729392A - 用于对细胞和细胞珠粒进行条形码化的系统和方法 - Google Patents

用于对细胞和细胞珠粒进行条形码化的系统和方法 Download PDF

Info

Publication number
CN114729392A
CN114729392A CN202080077458.0A CN202080077458A CN114729392A CN 114729392 A CN114729392 A CN 114729392A CN 202080077458 A CN202080077458 A CN 202080077458A CN 114729392 A CN114729392 A CN 114729392A
Authority
CN
China
Prior art keywords
cell
barcode
molecule
nucleic acid
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080077458.0A
Other languages
English (en)
Inventor
谢伊·T·兰斯
杰弗里·麦克德莫特
保罗·威廉·怀亚特
丹尼尔·P·里尔登
迈克尔·史诺-莱文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
10X Genomics Inc
Original Assignee
10X Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 10X Genomics Inc filed Critical 10X Genomics Inc
Publication of CN114729392A publication Critical patent/CN114729392A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了用于通过在组合的拆分‑池迭代过程中对细胞进行条形码化来分析细胞的细胞分析物的方法。在一些情况下,可以从细胞生成细胞珠粒,并将其中的分析物在组合的拆分‑池迭代过程中进行条形码化,同时在迭代分区期间,使分析物保留在细胞珠粒中。

Description

用于对细胞和细胞珠粒进行条形码化的系统和方法
交叉引用
本申请要求2019年9月6日提交的美国临时申请号62/897,181的权益,该申请的全部内容通过引用并入本文。
背景技术
可以出于各种目的而对样品进行处理,例如鉴定样品内的部分的类型。样品可以是生物样品。生物样品可以经处理例如用于例如检测疾病(例如,癌症)或鉴定特定的物质。用于处理样品的方法有多种,例如聚合酶链反应(PCR)和测序。
生物样品可以在各种反应环境(如分区)中进行处理。分区可以是孔或液滴。可以采用液滴或孔以能够使得生物样品被单独分区和处理的方式来处理生物样品。例如,这样的液滴可以与其他液滴流体隔离,从而能够精确控制液滴中各自的环境。
分区中的生物样品可以经受各种处理,如化学处理或物理处理。分区中的样品可以经受加热或冷却,或者化学反应,以产生可进行定性或定量处理的物质。
发明内容
基于分区的单细胞测序技术通过将细胞物理分离到不同的隔室,然后对目标分析物施加细胞特异性分子条形码而保留关于细胞内分析物的细胞起源信息。然而,细胞捕获的泊松统计需要确保在封装到分区中的过程中大部分单个细胞被隔离,这意味着所需的液滴和分子条形码池的数量显著大于细胞的数量。例如,分区输出可能包括包含单个细胞和分子条形码的分区的(期望的)子集,以及包含分子条形码但不包含细胞的分区的另一(不期望的)子集,导致后一子集中有价值资源的浪费。
为了克服这个问题,在原位或“拆分-池(split-pool)”条形码化方法中,将细胞本身用作容器,且对细胞的细胞内分析物使用组合索引进行分子标记。在实践中,将固定细胞拆分到微孔板的不同孔中,然后在其中将孔特异性条形码附加到固定细胞内夹带的细胞内分析物。然后,将细胞再汇集在一起。通过重复该过程多次,细胞经受独特的孔组合,使得相应的细胞内分析物包含指示其来源细胞的孔特异性条形码的组合。然而,对于每一轮拆分-池化,测定灵敏度可受到目标细胞内分析物从固定细胞环境中扩散出去的影响。在每一轮细胞清洗和池化过程中,分析物的细胞内浓度也可能发生固有的降低。
为了解决基于分区和拆分-池的条形码化方法的缺点,本发明公开内容描述了一种结合这两种技术原理的方法。本发明总体涉及分子条形码化和基于乳液的微流体的组合,以通过对细胞进行条形码化,以高产量的方式对来自单个细胞的细胞内分析物进行分离、裂解和条形码化。
本文提供的方法允许快速且廉价地分析来自单个细胞的细胞内分析物。为此,使用用于组合标记的拆分-池方法,首先用复合条形码在单个细胞的外表面上对其进行分子索引。将被分子索引的单个细胞封装在分区(例如,液滴、孔)中,并在其中裂解它们。然后,从其表面释放的分子条形码用于标记细胞内包含的细胞内分析物。可以将每个细胞进行独特地条形码化,使得每个细胞及其内容物与其他细胞及其内容物区分开来。
在另一方面,提供了通过利用细胞珠粒以及在每次分区迭代期间使细胞珠粒超载而以高产量对单个细胞的细胞内分析物进行迭代条形码化的方法,所述细胞珠粒可封装细胞并在这些细胞珠粒的连续分区和条形码化过程之间物理地保留细胞内分析物。在每次迭代中,可将细胞珠粒拆分到不同的分区中,将分区特异性条形码递送至细胞珠粒,以对由细胞珠粒封装的细胞内分析物进行条形码化,然后再汇集在一起。在分区的每次迭代中,细胞珠粒可超载以使每个分区能够以更大的产量处理多个细胞,然后可以通过正常的亚泊松细胞加载有效地实现。也就是说,在一个分区中,可存在多于一个细胞珠粒。在n次迭代后,每个细胞珠粒的细胞内分析物可包含独特的条形码组合,其可从源细胞池中独特地识别起源细胞。
在一些情况下,细胞珠粒本身可以根据本文所述的用于对细胞进行条形码化方法进行条形码化。在一些情况下,用于对细胞进行条形码化的方法可在迭代分区操作期间额外地使细胞超载以增加产量。
在一个方面中,本文还提供了处理细胞的方法,包括:(a)将多个细胞和包含条形码序列的多个核酸条形码分子分区到多个分区中,其中多个分区中的一个分区包含多个细胞中的第一细胞和多个核酸条形码分子中的第一条形码分子,其中第一条形码分子包含第一条形码序列,其对于多个分区中的所述分区是独特的;(b)在该分区中,将第一条形码分子附接到第一细胞的表面,其中第一条形码序列不同于在多个分区的其他分区中的其他条形码序列;(c)从多个分区汇集来自多个细胞的细胞,所述多个细胞包括第一细胞;(d)将多个细胞和附加的多个核酸条形码分子重新分区到附加的多个分区中,其中附加的多个分区中的一个分区包含第一细胞和一个附加的条形码分子,所述附加条形码分子包含对附加的多个分区的所述分区独特的附加条形码序列;(e)在(d)的分区中,将附加的条形码分子偶联到第一条形码分子,从而用核酸复合条形码分子索引第一细胞,该核酸复合条形码分子包含复合条形码序列,该复合条形码序列包含第一条形码序列和附加条形码序列,其中核酸复合条形码分子包含被配置为捕获分析物的捕获序列。
在一些情况下,在(e)之后,将(c)-(e)重复N次,其中N是大于或等于1的整数,并且其中复合条形码序列包含第一条形码序列和N+1个附加条形码序列。根据权利要求2所述的方法,其中第(N+1)个条形码分子被配置为偶联到第N个条形码核酸分子。在一些情况下,方法还包括在(a)之前将细胞偶联剂偶联到第一细胞的表面,其中将细胞偶联剂偶联到寡核苷酸,该寡核苷酸被配置为偶联到第一条形码分子。
在一些情况下,在(a)之前,将多个细胞偶联剂偶联至第一细胞的表面,其中多个细胞偶联剂包含所述细胞偶联剂。在一些情况下,第一条形码分子被配置为偶联到第二条形码分子。
在一些情况下,第一条形码分子被配置为偶联到一个或多个夹板分子,其中该一个或多个夹板分子被配置为偶联到第二条形码分子。在一些情况下,细胞偶联剂包含肽或多肽。
在一些情况下,肽或多肽被配置为与第一细胞的细胞表面上的抗原偶联。在一些情况下,肽或多肽被配置为与第一细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,细胞偶联剂包含脂质分子,其中脂质分子被配置为嵌入第一细胞的细胞膜中,且寡核苷酸被配置为与第一条形码分子偶联。
在一些情况下,细胞偶联剂包含二硫键。在一些情况下,方法还包括,在用包含复合条形码序列的核酸复合条形码分子索引第一细胞之后,将第一细胞分区到第三分区中。
在一些情况下,方法还包括将包含复合条形码序列的核酸复合条形码分子偶联到分析物,其中分析物是第一细胞的细胞分析物,由此产生条形码化分析物。在一些情况下,方法还包括确定条形码分析物的序列,其中所确定的条形码化分析物序列包含复合条形码序列或其互补序列。
在一些情况下,方法还包括,使用复合条形码序列或其互补序列将分析物识别为第一细胞的细胞分析物
在一些情况下,方法还包括在第三分区中裂解细胞以释放分析物。在一些情况下,分析物选自核糖核酸(RNA)分子、DNA分子、gDNA分子、蛋白质或其任何组合。在一些情况下,RNA分子是信使RNA(mRNA)分子。在一些情况下,方法还包括从细胞表面释放细胞偶联剂或从细胞偶联剂释放寡核苷酸。
在一些情况下,释放细胞偶联剂包括切割二硫键。在一些情况下,分区是液滴。在一些情况下,分区是孔。
在一些情况下,分区是微孔或纳米孔。
在一些情况下,分区是纳米孔,其中纳米孔来自纳米孔阵列。在一些情况下,微孔来自96孔板或384孔板。在一些情况下,在(a)之后,分区包含多于一个细胞。在一些情况下,在(e)之后,将(c)-(e)重复2次,其中在(d)中,附加的多个分区包括至少96个分区。在一些情况下,在(e)之后,将(c)-(e)重复3次。
在一些情况下,对多个细胞中的每个细胞进行(a)-(e),并且其中在(e)之后,多个细胞中的相应细胞的至少99%各自包含对多个细胞中的相应细胞独特的相应复合条形码序列。
在另一方面,还提供了细胞处理的方法,包括:(a)将细胞与偶联至寡核苷酸分子的细胞偶联剂接触,由此产生偶联至偶联剂的细胞;(b)将(i)偶联至偶联剂的细胞和(ii)包含第一条形码序列的第一条形码核酸分子分区到一个分区中,并将第一条形码核酸分子附接到寡核苷酸分子;(c)将偶联至偶联剂的细胞与多个细胞汇集;(d)将(i)偶联至偶联剂的细胞和(ii)包含第二条形码序列的第二条形码核酸分子分区到第二分区中,并将第二核酸条形码分子附接到第一条形码核酸分子以生成包含第一条形码序列和第二条形码序列的核酸复合条形码分子,其中,在(d)之后,核酸复合条形码分子包含被配置为捕获分析物的捕获序列。
在一些情况下,在(d)之后,将(b)-(d)重复N次,其中N是大于或等于1的整数,并且其中核酸复合条形码分子包含第一条形码序列和N个附加条形码序列。
在一些情况下,第N个条形码序列被配置为附接到核酸复合条形码分子的第(N-1)个条形码序列。在一些情况下,第N个条形码核酸分子包含第N个条形码序列和捕获序列。
在一些情况下,分析物是基因组脱氧核糖核酸(gDNA)分子。在一些情况下,分析物是核糖核酸(RNA)分子。在一些情况下,RNA分子是信使RNA分子(mRNA)。在一些情况下,RNA分子是(i)成簇的规律间隔的短回文(CRISPR)RNA分子(crRNA)或(ii)单个引导RNA(sgRNA)分子。在一些情况下,分析物是蛋白质。在一些情况下,分区是液滴。
在一些情况下,分区是孔。在一些情况下,方法包括对多个细胞进行(a)-(d)。在一些情况下,第一条形码核酸分子附接到第一珠粒和/或第二条形码核酸分子附接到第二珠粒。
在一些情况下,细胞偶联剂包含二硫键。在一些情况下,方法还包括将细胞分区到第三分区中。在一些情况下,方法还包括将核酸复合条形码分子偶联到分析物,其中分析物是细胞的细胞分析物。在一些情况下,细胞偶联剂包含作为肽或多肽的部分基团。在一些情况下,肽或多肽被配置为与细胞的细胞表面上的抗原偶联。在一些情况下,肽或多肽被配置为与细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,细胞偶联剂包含脂质分子,其中脂质分子被配置为嵌入细胞的细胞膜中,且寡核苷酸被配置为与第一条形码分子偶联。
在一个方面中,还公开了系统,其包括:包含多个细胞的多个分区,其中多个细胞包含与其偶联的多个核酸条形码分子,其中多个分区中的一个分区包含(i)多个细胞中的一个细胞,其中所述细胞包含偶联到细胞表面的多个核酸条形码分子中的一个核酸条形码分子,其中所述条形码分子包含对多个细胞中的所述细胞独特的条形码序列,(ii)核酸分子,所述核酸分子包含被配置成捕获分析物的捕获序列,以及(iii)试剂,其被配置为将核酸分子偶联到核酸条形码分子以生成包含条形码序列和捕获序列的复合条形码分子。
在一些情况下,试剂包含夹板分子,其被配置为与核酸条形码分子和核酸分子中的每一个偶联。在一些情况下,多个分区是多个液滴。在一些情况下,多个分区是多个孔。在一些情况下,分区是微孔或纳米孔。在一些情况下,分区是纳米孔,其中纳米孔来自纳米孔阵列。在一些情况下,微孔来自96孔板或384孔板。在一些情况下,分区包含多于一个细胞。在一些情况下,核酸条形码分子通过细胞偶联剂偶联到细胞的表面。在一些情况下,细胞偶联剂包含肽或多肽。
在一些情况下,肽或多肽与细胞表面上的抗原偶联。在一些情况下,肽或多肽与细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,细胞偶联剂包含脂质分子,其中脂质分子嵌入细胞的细胞膜中。
在一些情况下,细胞偶联剂包含二硫键。在一些情况下,捕获序列包括聚-T(聚胸苷酸)序列。在一些情况下,捕获序列包括模板转换寡核苷酸序列。在一些情况下,捕获序列包括聚-G序列。
在另一个方面中,提供了组合物,其包含:多个细胞,该多个细胞包含与其偶联的多个核酸条形码分子,其中多个细胞中的一个细胞包含偶联到所述细胞表面的多个核酸条形码分子中的一个核酸条形码分子,其中该核酸条形码分子包含(i)对多个细胞中的所述细胞独特的条形码序列,以及(ii)被配置为捕获分析物的捕获序列。
在一些情况下,多个细胞以本体溶液提供。在一些情况下,在多个分区中提供多个细胞。在一些情况下,多个分区是多个液滴。在一些情况下,多个分区是多个孔。在一些情况下,多个分区是微孔或纳米孔。在一些情况下,多个分区是纳米孔阵列中的纳米孔。在一些情况下,多个分区是来自96孔板或384孔板的微孔。在一些情况下,多个分区中的一个分区包含细胞。在一些情况下,核酸条形码分子通过细胞偶联剂偶联到细胞的表面。在一些情况下,细胞偶联剂包含肽或多肽。在一些情况下,肽或多肽与细胞表面上的抗原偶联。在一些情况下,肽或多肽与细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,细胞偶联剂包含脂质分子,其中脂质分子嵌入细胞的细胞膜中。在一些情况下,细胞偶联剂包含二硫键。在一些情况下,捕获序列包括聚-T序列。在一些情况下,捕获序列包括模板转换寡核苷酸序列。
在一些情况下,捕获序列包括聚-G序列。在一些情况下,(a)的多个分区和(d)的附加的多个分区来自同一组的分区。在一些情况下,(a)的多个分区和(d)的附加的多个分区来自不同组的分区。
在一个方面,还提供了细胞分析的方法,包括:(a)从多个细胞生成多个细胞珠粒,其中多个细胞珠粒被配置为在细胞珠粒中物理地保留衍生自细胞的分析物;(b)将多个细胞珠粒和包含条形码序列的多个核酸条形码分子分区到多个分区中,其中多个分区中的一个分区包含两个或更多个细胞珠粒和核酸条形码分子,所述两个或更多个细胞珠粒包括第一细胞珠粒,所述核酸条形码分子包含第一条形码序列,其中第一条形码序列不同于多个分区中的其他分区中的其他条形码序列;(c)在该分区中,将第一条形码序列附接到衍生自第一细胞珠粒的分析物上;(d)从多个分区汇集来自多个细胞珠粒的细胞珠粒,所述多个细胞珠粒包括第一细胞珠粒;以及(e)将(b)-(d)进行N次以将N个不同的条形码序列引入第一细胞珠粒,其中N是大于或等于2的整数,以生成复合条形码。
本公开的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,该机器可执行代码在由一个或多个计算机处理器执行时,实现了以上或本文其他地方的任何方法。
本公开的另一方面提供了一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器。该计算机存储器包括机器可执行代码,该机器可执行代码在由一个或多个计算机处理器执行时,实现了以上或本文其他地方的任何方法。
根据以下详细描述,本公开的其他方面和优点对于本领域技术人员将变得显而易见,其中仅示出和描述了本公开的说明性实施方案。应认识到,本公开能够具有其他不同的实施方案,并且其若干细节能够在各种显而易见的方面进行修改,所有这些均不脱离本公开。因此,附图和说明本质上应被认为是说明性的,而非限制性的。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同明确且单独地指出每个单独的出版物、专利或专利申请通过引用并入。在通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相抵触的程度上,本说明书旨在取代和/或优先于任何此类相抵触的材料。
附图说明
在所附的权利要求书中具体阐述本发明的新颖性特征。通过参考以下对利用了本发明原理的说明性实施方案加以阐述的详细描述以及附图,将获得对本发明的特征和优点的更好的理解,在这些附图(本文也称为“图”和“FIG.”)中:
图1示出了用于分配单个生物颗粒的微流体通道结构的示例。
图2示出了用于将携带条形码的珠粒递送至液滴的微流体通道结构的示例。
图3示出了用于对生物颗粒和试剂进行共分区的微流体通道结构的示例。
图4示出了用于将珠粒受控分区到离散液滴中的微流体通道结构的示例。
图5示出了用于增加液滴产生产量的微流体通道结构的示例。
图6示出了用于增加液滴产生产量的微流体通道结构的另一示例。
图7A示出了具有用于受控分区的几何特征的微流体通道结构的另一示例的横截面图。图7B示出了图7A的通道结构的透视图。
图8显示了携带条形码的珠粒的示例。
图9显示了携带条形码的细胞的示例。
图10显示了用于对单个表面条形码化细胞进行分区以分析细胞内分析物的微流体通道结构的示例。
图11示出了用于生成表面条形码化细胞的拆分-池工作流。
图12示出了被编程或以其他方式配置为实现本文提供的方法的计算机系统。
图13显示了迭代细胞珠粒条形码化的流程。
图14示意性地显示了示例性微孔阵列。
图15示意性地显示了用于处理核酸分子的示例性工作流。
具体实施方式
虽然本文已示出和描述了本发明的各种实施方案,但对于本领域技术人员显而易见的是,这样的实施方案仅以示例的方式提供。本领域技术人员可以在不背离本发明的情况下想到许多变型、改变和替代。应当理解,可以采用对本文所描述的本发明的实施方案的各种替代方案。
在将数值描述为范围的情况下,应当理解,此类公开内容包括在该范围内的所有可能的子范围的公开内容,以及落入此类范围内的特定数值,而不论特定数值或特定子范围是否都是明确指出的。
如本文所用,术语“条形码”通常是指传达或能够传达关于分析物的信息的标签或标识符。条形码可以是分析物的一部分。条形码可独立于分析物。除了条形码可以是分析物的内源性特征(例如,分析物的大小或末端序列)之外,还可以是附接于分析物(例如,核酸分子)的标签或标签组合。条形码可以是独特的。条形码可以具有多种不同的形式。例如,条形码可以包括:多核苷酸条形码;随机核酸和/或氨基酸序列;以及合成的核酸和/或氨基酸序列。条形码可以以可逆或不可逆的方式附接在分析物上。可以在对样品进行测序之前、期间和/或之后将条形码添加至例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段。条形码可以能够对单个序列读段进行识别和定量。
如本文所用的,术语“实时”可以指小于约1秒、十分之一秒、百分之一秒、毫秒或更短的响应时间。响应时间可大于1秒。在一些情况下,实时可以指同时或基本上同时进行的处理、检测或识别。
如本文所用,术语“对象”通常是指动物如哺乳动物(例如,人)或禽类(例如,鸟),或其他生物,例如植物。例如,对象可以是脊椎动物、哺乳动物、啮齿动物(例如小鼠)、灵长类动物、猿或人。动物可以包括但不限于农场动物、运动动物和宠物。对象可以是健康或无症状的个体,患有或疑似患有疾病(例如癌症)或有患病倾向的个体,和/或需要治疗或疑似需要治疗的个体。对象可以是患者。对象可以是微生物体或微生物(例如细菌、真菌、古细菌、病毒)。
如本文所用,术语“基因组”通常是指来自对象的基因组信息,其可以是例如对象的遗传信息的至少一部分或全部。基因组可以用DNA或RNA编码。基因组可以包含编码区(例如,编码蛋白质的)以及非编码区。基因组可以包括生物体中所有染色体的序列。例如,人类基因组通常具有总计46条染色体。所有这些的序列可共同构成人类基因组。
术语“衔接子(adaptor)”、“衔接子(adapter)”和“标签”作为同义词使用。可以通过任何方法,包括连接、杂交或其他方法,使衔接子或标签与待“标记的”多核苷酸序列偶联。
如本文所用,术语“测序”通常是指用于确定一种或多种多核苷酸中核苷酸碱基序列的方法和技术。多核苷酸可以是例如核酸分子,例如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括其变体或衍生物(例如单链DNA)。可以通过当前可用的各种系统,例如但不限于通过
Figure BDA0003630416840000111
Pacific Biosciences
Figure BDA0003630416840000112
Oxford
Figure BDA0003630416840000113
或LifeTechnologies(Ion
Figure BDA0003630416840000114
)的测序系统进行测序。替代地或另外地,可以使用核酸扩增、聚合酶链反应(PCR)(例如,数字PCR、定量PCR或实时PCR)或等温扩增来进行测序。这样的系统可以提供对应于对象(例如,人)的遗传信息的多个原始遗传数据,如由系统从对象提供的样品中产生的。在一些示例中,这样的系统提供测序读段(在本文中也称为“读段”)。读段可包括与已测序的核酸分子的序列相对应的一串核酸碱基。在一些情况下,本文提供的系统和方法可以与蛋白质组学信息一起使用。
如本文所用,术语“珠粒”通常是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可包括聚合物基质(例如,通过聚合或交联形成的基质)。聚合物基质可包括一种或多种聚合物(例如,具有不同官能团或重复单元的聚合物)。聚合物基质中的聚合物可以无规排列,如在无规共聚物中;和/或具有有序结构,如在嵌段共聚物中。交联可以经由共价、离子或感应、相互作用或物理缠结进行。珠粒可以是大分子。珠粒可以由结合在一起的核酸分子形成。珠粒可以经由分子(例如,大分子)如单体或聚合物的共价或非共价组装来形成。这样的聚合物或单体可以是天然的或合成的。这样的聚合物或单体可以是或包括例如核酸分子(例如,DNA或RNA)。珠粒可以由聚合材料形成。珠粒可以是磁性的或非磁性的。珠粒可以是刚性的。珠粒可以是柔性的和/或可压缩的。珠粒可以是可破裂的或可溶解的。珠粒可以是覆盖有包含一种或多种聚合物的涂层的固体颗粒(例如,包括但不限于氧化铁、金或银的金属基颗粒)。这样的涂层可能是可破裂的或可溶解的。
如本文所用,术语“条形码化的核酸分子”通常是指,例如,通过核酸序列(例如,与核酸条形码分子所包含的核酸引物序列互补的核酸序列)处理核酸条形码分子而产生的核酸分子。核酸序列可以是靶向序列或非靶向序列。例如,在本文描述的方法和系统中,细胞的核酸分子(例如,信使RNA(mRNA)分子)与核酸条形码分子(例如,包含条形码序列和与mRNA分子的核酸序列互补的核酸引物序列的核酸条形码分子)的杂交和逆转录产生具有与mRNA的核酸序列和条形码序列(或其反向互补序列)相对应的序列的条形码化的核酸分子。条形码化的核酸分子可以用作模板,例如模板多核苷酸,其可以被进一步处理(例如,扩增)并测序以获得靶核酸序列。例如,在本文描述的方法和系统中,可进一步处理(例如,扩增)条形码化的核酸分子并测序以获得mRNA的核酸序列。
如本文所用,术语“样品”通常是指对象的生物样品。生物样品可以包含任何数量的大分子,例如细胞大分子。样品可以是细胞样品。样品可以是细胞系或细胞培养物样品。样品可以包括一个或多个细胞。样品可以包括一种或多种微生物。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。生物样品可以源自另一样品。样品可以是组织样品,如活检物、芯针活检物、针抽吸物或细针抽吸物。样品可以是流体样品,例如血液样品、尿液样品或唾液样品。样品可以是皮肤样品。样品可以是脸颊拭子。样品可以是血浆或血清样品。样品可以是无细胞或无细胞的样品。无细胞样品可以包括细胞外多核苷酸。从身体样品分离细胞外多核苷酸,该身体样品可选自血液、血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便和泪液。
如本文所用,术语“生物颗粒”通常是指衍生自生物样品的离散的生物系统。生物颗粒可以是大分子。生物颗粒可以是小分子。生物颗粒可以是病毒。生物颗粒可以是细胞或细胞的衍生物。生物颗粒可以是细胞器。生物颗粒可以是来自细胞群体的稀有细胞。生物颗粒可以是任何类型的细胞,包括但不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其他动物细胞类型、支原体、正常组织细胞、肿瘤细胞或无论从单细胞还是多细胞生物体衍生的任何其他细胞类型。生物颗粒可以是细胞的组分。生物颗粒可以是或可以包括DNA、RNA、细胞器、蛋白质或其任意组合。生物颗粒可以是或可以包括基质(例如,凝胶或聚合物基质),所述基质包含细胞或一种或多种来自细胞的组分(例如细胞珠粒),如来自细胞的DNA、RNA、细胞器、蛋白质或其任意组合。生物颗粒可以获自对象的组织。生物颗粒可以是硬化的细胞。这样的硬化的细胞可以包括或可以不包括细胞壁或细胞膜。生物颗粒可以包括细胞的一种或多种组分,但是可以不包括细胞的其他组分。这种组分的一个示例是细胞核或细胞器。细胞可以是活细胞。活细胞可以是能够被培养的,例如,当被封闭在凝胶或聚合物基质中时被培养,或者当包含凝胶或聚合物基质时被培养。
如本文所用,术语“大分子组分”通常是指包含在生物颗粒内或来自生物颗粒的大分子。大分子组分可以包含核酸。在一些情况下,生物颗粒可以是大分子。大分子组分可以包含DNA。大分子组分可以包含RNA。RNA可以是编码的或非编码的。RNA可以是例如信使RNA(mRNA)、核糖体RNA(rRNA)或转移RNA(tRNA)。RNA可以是转录物。RNA可以是长度小于200个核酸碱基的小RNA,或长度大于200个核酸碱基的大RNA。小RNA可包括5.8S核糖体RNA(rRNA)、5S rRNA、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、Piwi相互作用RNA(piRNA)、tRNA-衍生的小RNA(tsRNA)和小的rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。大分子组分可以包含蛋白质。大分子组分可以包含肽。大分子组分可包含多肽。
如本文所用,术语“分子标签”通常是指能够结合大分子组分的分子。分子标签可以以高亲和力与大分子组分结合。分子标签可以以高特异性与大分子组分结合。分子标签可以包含核苷酸序列。分子标签可以包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可包含DNA适配体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可以包含多肽。分子标签可以是条形码。
如本文所用,术语“分区”通常是指可适合于包含一种或多种物质或进行一种或多种反应的空间或体积。分区可以是物理隔室,诸如液滴或孔。分区可以将空间或体积与另一个空间或体积隔开。液滴可以是与第一相不混溶的第二相(例如油)中的第一相(例如水相)。液滴可以是不与第一相相分离的第二相中的第一相,例如水相中的胶囊或脂质体。分区可以包括一个或多个其他(内部)分区。在一些情况下,分区可以是虚拟隔室,其可以由跨多个和/或远程物理隔室的索引(例如,索引库)来定义和识别。例如,物理隔室可以包括多个虚拟隔室。
如本文所用,术语“偶联到”,通常是指对象之间的物理缔合。物理缔合可以是可逆的,或基本不可逆的。例如,物理缔合可以是暂时的,或基本上永久的。例如,偶联到第二对象的第一对象可以从第一对象释放。在一些情况下,在施加刺激后,第一对象可从第二对象释放,反之亦然,该刺激可包括光刺激(例如,紫外光)、热刺激、化学刺激(例如,还原剂)或任何其他有用刺激。在一个示例中,将核酸分子偶联到颗粒或支持物(例如珠粒)。在另一个示例中,将核酸分子偶联到另一个核酸分子。偶联可以包括固定化(例如,如本文所述)。类似地,偶联可以包括附接,例如附连。偶联可包括影响两个对象之间的物理缔合的任何相互作用,包括例如,共价键,非共价相互作用(例如,静电相互作用[例如,氢键合、离子相互作用和卤素键合]、π相互作用[例如,π-π相互作用、极性-π相互作用、阳离子-π相互作用和阴离子-π相互作用]、基于范德华力的相互作用[例如,偶极-偶极相互作用、偶极-诱导偶极相互作用和诱导偶极-诱导偶极相互作用]、疏水相互作用)、磁相互作用(例如,磁偶极-偶极相互作用、间接偶极-偶极偶联)、电磁相互作用、吸附或任何其他有用的相互作用。例如,核酸分子可通过共价相互作用或非共价相互作用与支持物偶联。第一对象和第二对象之间的偶联可包含不稳定部分,例如包含酯键、邻二醇键、磷酸二酯键、肽键、糖苷键、砜键、Diels-Alder键或类似键的部分。第一对象和第二对象之间的偶联强度可由离解常数Kd表示,其指示包括第一对象和第二对象的偶联对象离解成未偶联的第一和第二对象的倾向,并且可以表示为离解(例如,未偶联)对象与偶联对象的比率。较小的离解常数通常表示偶联对象之间的偶联更强。在一些情况下,偶联对象可以与相应的未偶联组分处于动态平衡存在。在第一对象偶联到第二对象的情况下,第一对象可以通过第一对象的组分(例如,第一序列区段)和第二对象的组分(例如,第二序列区段)的相互作用直接偶联到第二对象。替代地或另外,第一对象可以通过第一对象和第二对象中的一个或两者与一个或多个中间对象(例如,附加分子)的相互作用而间接地偶联到第二对象。在一个示例中,第一核酸分子经由夹板分子偶联到第二核酸分子。
在一些情况下,偶联对象及其相应的未偶联组分可以彼此以动态平衡存在。例如,包含多个偶联对象(每个偶联对象包括第一对象和第二对象)的溶液还可包含彼此不缔合的多个第一对象和多个第二对象。在给定的时间点,给定的第一对象和给定的第二对象可以相互偶联,或者对象可以不偶联;整个溶液中偶联和未偶联组分的相对浓度将取决于第一和第二对象之间的偶联强度(反映在离解常数中)。
细胞和细胞珠粒的分子条形码化
在一些实施方案中,本文提供的方法允许快速且廉价地分析来自单个细胞的细胞内分析物。使用用于组合标记的拆分-池方法,可以首先在单个细胞的外表面上用复合条形码(例如,包含分子索引或分子条形码)对单个细胞进行标记或分子索引。然后,可以将经分子索引的单个细胞封装在分区(例如,液滴、孔)中,并在其中裂解它们。然后,可使用从其表面释放的分子条形码(例如,在此类裂解之前、期间或之后)标记细胞内包含的细胞内分析物。每个细胞可以被独特地条形码化,使得每个细胞及其内容物与其他细胞及其内容物区分开来。细胞外表面上的分子条形码可在串联分区和池化的情况下使用拆分-池组合机制生成,如本文其他地方所述。
在其他方面,提供了通过利用细胞珠粒以及在每次分区迭代期间使细胞珠粒超载而以高产量对单个细胞的细胞内分析物进行迭代条形码化的方法,所述细胞珠粒可封装细胞并在这些细胞珠粒的连续分区和条形码化过程之间物理地保留细胞内分析物。在每次迭代中,可将细胞珠粒拆分到不同的分区中,将分区特异性条形码递送至细胞珠粒,以对由细胞珠粒封装的细胞内分析物进行条形码化,然后将其汇集在一起。在分区的每次迭代中,细胞珠粒可以超载,以使得于是能够通过正常的亚泊松细胞加载有效地实现以更大的产量在每个分区处理多个细胞。也就是说,在一个分区中,可存在多于一个细胞珠粒。在n次迭代后,每个细胞珠粒的细胞内分析物可包含独特的条形码组合,该条形码可从源细胞池中独特地识别起源细胞。
在一些情况下,细胞珠粒本身可以根据本文所述的用于对细胞进行条形码化的方法进行条形码化。在一些情况下,用于对细胞进行条形码化的方法可在迭代分区操作期间额外地使细胞超载以增加产量。
本公开中包括可包含多种试剂集合的细胞组合物,例如附接到大量含有条形码序列的寡核苷酸上的细胞的多种文库,以及制备和使用它们的方法。本公开提供了用于生成与多核苷酸共价或非共价附接的细胞的方法、组合物、装置和试剂盒。此类细胞可用于任何应用,包括细胞内分析物的分析。
本公开提供了用于通过以下处理样品材料的方法、系统和组合物:将试剂受控递送给样品组分子集,然后部分地使用递送的试剂对这些样品组分进行分析。在许多情况下,方法和组合物用于处理细胞内分析物和用于核酸分析应用。
例如,某些方面涉及用于在分区(例如液滴或孔)内标记细胞分析物的系统和方法。在一组实施方案中,细胞分析物和/或标记可包含核酸。在一些情况下,标记可包括“条形码”或独特序列,其可用于将一个分区(例如,液滴)中的分析物与另一个分区中的分析物加以区分,例如,在分区内容物汇集在一起之后。在一些情况下,可以使用表面索引化细胞将独特序列引入液滴,并将其附接到液滴内包含的分析物(例如,从裂解细胞释放的分析物)。
本公开的某些方面涉及用于将分析物和寡核苷酸标签包含或封装在微流体液滴或其他合适隔室(例如,微孔阵列的孔)内并将它们共价键合在一起的系统和方法。在一些情况下,分析物可产生自裂解的细胞,并且所述方法可涉及用寡核苷酸标签对细胞进行分区,然后裂解细胞以将分析物释放到具有寡核苷酸标签的分区中。例如,在多个分区(或多个细胞)内,一个分区例如液滴内(或附接到细胞)的寡核苷酸标签,可以与其他分区中(或附接到其他细胞)的寡核苷酸标签区分开。例如,寡核苷酸标签可包含一个或多个在不同分区(或细胞)之间不同的独特序列或条形码,因此可以通过确定与分析物相关联的条形码来独特地识别每个分区例如液滴(或细胞)内的分析物。
本公开的某些方面涉及通过如下将寡核苷酸标签引入分区的系统和方法:最初将寡核苷酸标签附接到细胞表面,而不是在细胞被分区到分区(例如,液滴)中后将其从细胞表面释放。应当理解,虽然本文所述的系统和方法使用“液滴”作为分区的示例,但可以应用任何其他类型的分区或合适的隔室,例如孔。可以将细胞制备为,使得相对于具有其他可区分的寡核苷酸标签的其他细胞,大多数或所有细胞可仅包含一组独特可区分的寡核苷酸标签。如果细胞以1个细胞/液滴(或更小)的密度存在于液滴中,那么一旦寡核苷酸标签从细胞表面释放,则大部分或所有液滴将包含一个独特的寡核苷酸标签或没有寡核苷酸标签,从而允许每个液滴(以及其中包含的分析物)被独特地标记。
本公开的某些方面提供了用于生成携带偶联(例如,共价结合)在细胞表面上的寡核苷酸标签(例如,每个表面结合的寡核苷酸包括条形码、引物和/或适用于例如核酸的捕获、扩增和/或测序的其他功能序列)的表面条形码化细胞的系统和方法。可制备细胞使得相对于具有其他可区分的寡核苷酸标签的其他细胞,给定细胞的表面可以仅用一个独特可区分的寡核苷酸标签修饰。在一些情况下,表面索引化细胞被封装到液滴中,且寡核苷酸标签从细胞表面释放。在一些情况下,细胞被裂解以释放细胞的内容物,并且独特的寡核苷酸可以并入释放的细胞分析物中。在一些情况下,细胞可以1个细胞/液滴(或更小)的密度存在于液滴中,因此从细胞释放的独特寡核苷酸标签可以允许对每个液滴(以及其中包含的分析物)进行独特识别。
本公开的某些方面提供了在对细胞或细胞珠粒进行组合条形码索引或对其内容物(例如,分析物)进行条形码化期间,用于通过使用多个细胞或细胞珠粒(例如,每个分区)使分区超载来增加产量的系统和方法。
表面条形码化
在某些实施方案中,本文提供了用于生成表面条形码化细胞或表面索引化细胞的方法,其中细胞表面经修饰以携带包含条形码序列(也称为“寡核苷酸标签”)的多个核酸分子。细胞表面可携带高浓度(例如,1至100微摩尔)的寡核苷酸标签。给定细胞表面缔合的寡核苷酸标签可包含复合条形码序列,其衍生自至少2个或更多个单独组成型条形码分子(各自包含部分条形码序列)的组合。给定表面索引化细胞上的所有或大部分核酸片段可包含相同的复合条形码序列。
本文所述的系统、方法和试剂盒可包括或使用包含多个细胞的混合物,多个细胞的相应的表面携带多个寡核苷酸标签。在一些情况下,包含复合条形码序列的寡核苷酸标签可包含以下各项中的一个或多个:细胞偶联剂、将细胞偶联剂附接到寡核苷酸标签的接头分子,以及一个或多个功能序列例如衔接子序列、引物或引物结合序列(例如,测序引物或测序引物结合位点)、独特分子索引(UMI)、配置为附接到测序器流动池的序列(例如,Illumina P5、P7或其部分序列)、配置为与特定序列或分子杂交的捕获序列(例如,配置为附接到含有聚-A(聚腺苷酸)的分子,例如mRNA的聚-T序列)等。
生成表面索引化细胞的方法通常可包括使用细胞偶联剂使细胞表面功能化,该细胞偶联剂可(1)直接附接到寡核苷酸序列(例如,包含用于部分条形码附接的通用衔接子)或(2)通过使用接头间接附接到寡核苷酸序列。在其他实施方案中,寡核苷酸可通过共价键直接附接到细胞表面。例如,在一些情况下,细胞与在细胞表面(例如,在细胞表面的蛋白质上)生成官能团的试剂(例如,化学试剂)接触。在一些实施方案中,细胞表面上的组分(例如,表面蛋白质或碳水化合物)经修饰以包含-COOH(羧酸)、-NH2(胺)、-CH2Cl(氯甲基)、-CONH2(酰胺)、-CONHNH2(酰肼)、-CHO(醛)-OH(羟基)-SH(巯基)、-COC-(环氧基)、点击化学官能团或马来酰亚胺基团。然后,寡核苷酸(例如,包含如本文别处所述的通用衔接子序列)可与官能团反应以将寡核苷酸附接到细胞表面。在一些情况下,寡核苷酸包含与细胞表面上的官能团反应的官能团。在一些实施方案中,待缀合到细胞表面的寡核苷酸包括氨基修饰、巯基修饰或acrydite修饰。在一些实施方案中,寡核苷酸和细胞表面各自通过点击化学官能团(例如,无铜点击化学的组分,例如SPAAC)被官能化,如在例如Takayama Y等人,ClickChemistry as a Tool for Cell Engineering and Drug Delivery;Molecules 2019,24(1),172中所述的。在一些实施方案中,利用化学交联剂将寡核苷酸偶联到细胞表面上的组分。在一些情况下,使用商业缀合试剂盒和化学法(如
Figure BDA0003630416840000191
或蛋白质-寡核苷酸缀合试剂盒(HyNic/4FB缀合–Solulink))将寡核苷酸附接到细胞表面上的组分。
细胞偶联剂是能够与细胞表面缔合的试剂或分子。在一些情况下,细胞偶联剂可包含能够附接或结合到细胞表面或其组分或能够插入质膜中的材料、化学物质、分子或部分。细胞偶联剂还可以能够结合或附接到天然或修饰的核苷酸。天然或修饰的寡核苷酸可与细胞偶联剂缀合(通过化学和生物方法共价附接),所述细胞偶联剂例如抗体或其片段、脂质体组分、糖、激素、蛋白质和肽、毒素、荧光团或光探针、抑制剂、酶、生长因子和维生素。细胞偶联剂可以是天然的或合成的配体。配体可以是蛋白质、多肽、碳水化合物、脂质或其组合,其具有充分暴露以被细胞表面结构识别的官能团。细胞偶联剂可以是可以插入或锚定到细胞膜的脂质双层中的分子。细胞偶联剂可以是肽、脂肪酸或其他能够插入细胞质膜中的分子。细胞偶联剂还可以是生物有机体,例如病毒、细胞(例如,哺乳动物、细菌、原生动物)或人工载体,例如脂质体的组分。细胞偶联剂可包括纳米颗粒、聚(乳酸-乙醇酸)(PLGA)微球、类脂质(lipidoid)、脂质体复合物(lipoplex)、脂质体、碳水化合物(包括单糖)、阳离子脂质、纤维蛋白和纤维蛋白衍生物、聚合物、凝血酶、快速消除的脂质纳米颗粒(reLNP)及其组合。本文描述了细胞偶联剂的各种实施方案。
细胞偶联剂可以是天然或合成配体,其特异性结合细胞表面结构。细胞偶联剂还可以是受体或受体样分子,例如抗体或抗体的类似物,即单链抗体,其结合细胞表面结构例如配体(例如,抗原)。细胞表面结构可以是受体,例如肝细胞的脱唾液酸糖蛋白受体。所使用的细胞偶联剂可根据要索引的靶细胞类型而变化。例如,对于肝细胞,可以使用具有暴露的末端碳水化合物基团的糖蛋白,例如脱唾液酸糖蛋白(半乳糖末端),但是也可以使用其他配体,例如多肽激素。其他类型的配体可用于将分子缀合物靶向细胞表面受体,例如用于巨噬细胞(淋巴瘤)的甘露糖、用于成纤维细胞(纤维肉瘤)的甘露糖-6-磷酸糖蛋白、用于肠上皮细胞的内因子-维生素B12和用于脂肪细胞的胰岛素。细胞偶联剂可以是细胞粘附分子或其功能片段。在一些情况下,细胞偶联剂可以是粘附分子的抗体。粘附分子的示例包括但不限于钙粘蛋白、免疫球蛋白样超家族,例如ICAM1、ICAM2、VCAM、整联蛋白等。
细胞偶联剂(例如,与寡核苷酸“寡核苷酸缀合物”缀合的细胞偶联剂)可以使用例如阻断剂被选择性地引导以使寡核苷酸缀合物靶向适当的细胞。例如,细胞偶联剂可以是非活性形式,其中可以通过将细胞偶联剂可切割地连接到掩蔽剂或阻断剂来掩蔽细胞偶联剂,从而阻止寡核苷酸-缀合物插入细胞质膜或以其他方式与细胞表面上的分子相缔合。阻断剂可以是本体的或带电的部分。它可为氨基酸、肽或蛋白质。阻断剂可以是细胞表面受体(例如,病毒抗原受体)的抗体或配体,其可用于将寡核苷酸-缀合物靶向于多个细胞中的期望细胞或细胞群。例如,特异于在肿瘤细胞上表达的肿瘤相关细胞表面抗原或特异于在病毒感染细胞表面上表达的病毒特异性抗原的单克隆抗体可用于将寡核苷酸复合物引导至给定多个细胞中的特定靶细胞。参见Pastan,I等人(1986)Cell47:641-648;Vitetta,E.S.等人(1987)Science 238:1098-1104,其各自通过引用整体并入本文。其他示例是结合白细胞介素-2受体的白细胞介素-2,以及结合在病毒粒子和HIV-1感染的细胞表面上表达的HIV-1的包膜糖蛋白gp120的重组可溶性CD4抗原。阻断剂可以是短肽或氨基酸。短肽可以是Cys-Glu或Cys-Glu-Glu。此外,两种或更多种细胞偶联剂可以相互连接。
细胞偶联剂可以是能够插入细胞膜中的肽。示例包括促融合多肽,例如来自合胞体(syncitia)形成病毒的融合蛋白的肽段、离子通道形成多肽和对膜脂具有亲和力的其他肽。另一个示例是细胞色素b5的疏水性C末端肽段。其他示例包括膜结合IgE的跨膜区。
将细胞偶联剂(例如寡核苷酸-缀合物)附接到细胞表面可涉及细胞表面pH的调节。例如,细胞表面的酸度可与pH(低)插入肽(pHLIP)结合使用,其中插入机制由低pH下肽的带负电残基的质子化触发,导致肽的疏水性增加,从而为了将肽分区到双层中而转移平衡。用pHLIP-寡核苷酸复合物修饰的基于脂质、聚合物或金属的纳米材料可用作用于靶向细胞表面的生物相容性纳米载体。在一些情况下,脂质体和囊泡与phLIP寡核苷酸复合物结合可将复合物引导至细胞膜。在一些情况下,pHLIP束(包含由聚乙二醇连接的两个或更多个pHLIP肽的缀合物)或包含非标准氨基酸、γ-羧基谷氨酸或甘氨酸-亮氨酸-亮氨酸基序的Var3pHLIP可与寡核苷酸复合,以将复合物引导至细胞膜。
可使用大肠杆菌酶生物素连接酶(BirA)将细胞偶联剂引导至细胞膜,该大肠杆菌酶生物素连接酶(BirA)可将生物素的酮等排体序列特异性地连接至15-氨基酸受体肽(AP)。AP融合的重组细胞表面蛋白可以用酮探针标记,然后特异性地缀合到用酰肼或羟胺部分功能化的核酸分子上。
细胞偶联剂可设计为自组装肽。用细胞表面结合肽(例如KRSR)修饰的肽两亲性纳米球可以与寡核苷酸复合用于无毒地递送到细胞表面。
肽/寡核苷酸缀合物可通过固相合成制备,或通过肽与寡核苷酸的溶液相缀合制备,然后进行纯化。多种键可用于肽与寡核苷酸的缀合,包括酰胺、硫醚、巯基-马来酰亚胺、酯和二硫键。具有非带电寡核苷酸的肽缀合物可通过反相HPLC纯化,而具有带电寡核苷酸的缀合物可通过离子交换或通过大规模PAGE纯化。参见Juliano等人,Acc Chem Res.2012年7月17日;45(7):1067–76,其通过引用整体并入本文。
细胞偶联剂可以是膜锚定部分,例如可以溶解在细胞膜的疏水核中的疏水部分。膜附接复合物的膜锚定部分本身可嵌入膜的疏水区域内,使寡核苷酸暴露为从表面向外延伸的突出物。疏水锚定部分可以是例如,类固醇、脂肪酸、疏水肽和脂质。疏水锚定部分可以是胆固醇或其衍生物。在一些实施方案中,寡核苷酸(例如,核酸条形码分子或条形码化寡核苷酸)与亲脂性分子(即,细胞偶联剂)偶联,且标记细胞包括通过亲脂性分子将核酸条形码分子递送至细胞膜或核膜(参见例如,WO2019113533,其通过引用整体并入本文)。亲脂性分子可以插入诸如细胞膜和核膜的脂膜中。在一些情况下,插入可以是可逆的。在一些情况下,核酸条形码分子或包含核酸条形码分子的条形码化寡核苷酸可进入细胞内空间和/或细胞核。可在本文实施方案中使用的亲脂性分子的非限制性示例包括甾醇脂质,例如胆固醇、生育酚及其衍生物、二十四烷酸和棕榈酸。其他此类示例性亲脂性分子包括两亲性分子,其中头基(例如,电荷、脂肪族内容物和/或芳香族内容物)和/或脂肪酸链长度(例如C12、C14、C16或C18)可以变化。例如,脂肪酸侧链(例如,C12、C14、C16或C18)可与甘油或甘油衍生物(例如,3-叔丁基二苯基甲硅烷基甘油)偶联,其也可包括,例如,阳离子头基。然后,本文公开的寡核苷酸(例如,用于细胞表面索引的核酸条形码分子)可以(直接或间接)与这些两亲性分子偶联。
在一些情况下,将寡核苷酸(例如,核酸条形码分子)附接到亲脂性部分(例如,胆固醇分子)。在一些实施方案中,将寡核苷酸(例如,核酸条形码分子)通过接头(例如四乙二醇(TEG)接头)附接到亲脂性部分。其他示例性接头包括但不限于氨基接头C6、氨基接头C12、间隔子C3、间隔子C6、间隔子C12、间隔子9、间隔子18。在一些情况下,将寡核苷酸(例如,核酸条形码分子)附接到亲脂性部分或核酸条形码分子的5'端的接头。在一些情况下,将寡核苷酸(例如,核酸条形码分子)附接到亲脂性部分或核酸条形码分子的3'端的接头。在一些情况下,将第一寡核苷酸(例如,核酸条形码分子)附接到亲脂性部分或寡核苷酸(例如,核酸条形码分子)的5'端的接头,并将第二寡核苷酸(例如,核酸条形码分子)附接至亲脂性部分或核酸条形码分子的3'端的接头。接头可以是乙二醇或其衍生物。在一些情况下,接头是四乙二醇(TEG)或聚乙二醇(PEG)。在一些情况下,将寡核苷酸(例如,核酸条形码分子)可释放地附接到接头或亲脂性部分(例如,如本文其他地方所述,用于核酸分子的可释放附接),使得寡核苷酸(例如,核酸条形码分子)或其一部分可从亲脂性分子中释放。
在一些情况下,可以使细胞与一种或多种附加试剂以及部分缀合的寡核苷酸(例如,本文所述的亲脂性分子)接触。例如,在一些实施方案中,使细胞与亲脂性部分缀合的条形码分子和一个或多个附加部分(例如,亲脂性部分)缀合的“锚定”分子接触。在一些情况下,使细胞与(1)与第一核酸分子缀合的亲脂性部分和(2)锚定分子接触,所述第一核酸分子包含捕获序列(例如,聚-A序列)、条形码或索引序列以及引物序列;所述锚定分子包含与第二核酸分子缀合的亲脂性部分,所述第二核酸分子包含与引物序列互补的序列。在其他情况下,使细胞与(1)与第一核酸分子缀合的亲脂性部分和(2)锚定分子以及(3)共锚定分子接触,所述第一核酸分子包含捕获序列(例如,聚-A序列)、条形码或索引序列以及引物序列;所述锚定分子包含与第二核酸分子缀合的亲脂性部分,所述第二核酸分子包含锚定序列和与引物序列互补的序列;所述共锚定分子包含与第三核酸分子缀合的亲脂性部分,所述第三核酸分子包含与锚定序列互补的序列。部分缀合的寡核苷酸可包含任意数量的修饰,例如防止由聚合酶延伸的修饰和本文别处描述的其他此类修饰。
部分附接的条形码寡核苷酸的结构可包含除条形码或索引序列之外的许多序列元件。寡核苷酸可包含在后续处理中使用的功能序列,其可包括一个或多个测序器特定的流动池附接序列,例如,用于Illumina测序系统的P5或P7序列;以及测序引物序列,例如,用于Illumina测序系统的R1或R2测序引物序列。特定的引发和/或捕获序列,例如聚-A序列,也可以包括在寡核苷酸结构中。
如上所述,可对部分附接的条形码寡核苷酸进行处理以附接细胞条形码序列。在一些实施方案中,细胞条形码寡核苷酸(其可附接到珠粒)包含聚-T序列,其被设计用于杂交和捕获含有聚-A的部分附接的条形码寡核苷酸。在一些实施方案中,聚-T细胞条形码分子包含锚定序列片段,以确保聚-T序列与部分附接的条形码寡核苷酸的聚-A序列杂交。该锚定序列可以包括核苷酸的随机短序列,例如,1-聚体、2-聚体、3-聚体或更长的序列。在细胞条形码寡核苷酸分子中可包含附加序列区段。在一些情况下,附加序列提供独特分子标识符(UMI)序列区段,例如,作为随机序列(例如,随机N-聚体序列),其在单个寡核苷酸(例如,偶联到单个珠粒的细胞条形码分子)之间变化,而寡核苷酸当中的细胞条形码序列是恒定的(例如,偶联到单个珠粒的细胞条形码分子)。该独特序列可用于提供捕获的起始核酸分子的独特标识符,以允许存在定量的原始分子的数量(例如,部分缀合核酸条形码分子的数量)。
例如,细胞偶联剂可以是胆固醇、脂肪酸、疏水肽、麦角固醇、烷基链、二-o-烷基-rac-甘油、富勒烯或金刚烷。细胞偶联剂也可以是长链脂肪酸,例如肉豆蔻酸(十四烷酸)、棕榈酸(十六烷酸)或其他不同长度的脂肪酸。寡核苷酸可以与小的亲脂性分子缀合。参见Gosse.等人,J.Phys.Chem.B 2004,108:6485-6497,其通过引用整体并入本文。细胞偶联剂可包括促融合脂质、胆固醇和PEG脂质。在一些情况下,制剂的摩尔比可为50:10:38.5:1.5-3.0(阳离子脂质:促融合脂质:胆固醇:PEG脂质)。PEG脂质可选自但不限于PEG-c-DOMG、PEG-DMG。促融合脂质可为DSPC。
在一些示例中,细胞偶联剂可包括具有至少一种脂质的纳米颗粒。脂质可选自但不限于DLin-DMA、DLin-K-DMA、98N12-5、C12-200、DLin-MC3-DMA、DLin-KC2-DMA、DODMA、PLGA、PEG、PEG-DMG和聚乙二醇化脂质。在另一个方面中,脂质可以是阳离子脂质,例如但不限于DLin-DMA、DLin-D-DMA、DLin-MC3-DMA、DLin-KC2-DMA和DODMA。脂质与寡核苷酸比例可为10:1至30:10。包含经修饰的mRNA的纳米颗粒制剂的PDI可为0.03至0.15。脂质的ζ电位在pH为7.4下可为-10至+10。
本领域中已知多种用于将脂质与寡核苷酸缀合的方法。例如,寡核苷酸可具有与脂膜接触的两个或更多个疏水性锚定部分,从而通过在同一膜上的相邻位点的部分实现寡核苷酸的直接附接。可化学合成含脂质亚磷酰胺的合成寡核苷酸,其可被动地掺入细胞膜中,如Selden等人,JACS.2011 28;134(2):765-8(其通过引用整体并入本文)所述。寡核苷酸-脂质缀合物可通过与胶束相互作用,例如与1-辛基-β-d-吡喃葡萄糖苷胶束或卵磷脂酰胆碱囊泡相互作用而制备。在一些情况下,疏水衍生物(例如寡核苷酸的类固醇衍生物)可通过非共价相互作用附接到细胞表面。例如,硫代磷酰寡核苷酸的棕榈酰衍生物可与低密度脂蛋白复合使用以靶向细胞表面。在一些示例中,脂质结构域可被设计为用作带有寡核苷酸衍生物的膜锚定部分,以靶向细胞表面(Borisenko等人,Nucleic Acids Research,2009,其通过引用整体并入本文)。
寡核苷酸/阳离子聚合物纳米颗粒(多聚物(polyplex))可用于将寡核苷酸缀合物递送至细胞表面。例如,可使用负载有DNA/PEI多聚物的PEG水凝胶将寡核苷酸递送至细胞表面。负载有未聚集的多聚物的透明质酸或纤维蛋白水凝胶也可用于将寡核苷酸复合物递送到细胞表面。
寡核苷酸可在与细胞偶联剂(例如,脂质)缀合之前被进行化学修饰,以保护寡核苷酸不被降解,或改变寡核苷酸的稳定性和其他期望性质。化学修饰可发生在三个不同的位点:(i)在本文所述的寡核苷酸的磷酸基团上,(ii)在本文所述的寡核苷酸的糖部分上,和/或(iii)在本文所述的寡核苷酸的整个骨架结构上。在其他示例中,可修饰核苷酸类似物以改善寡核苷酸复合物的两亲性质并随后增强膜摄取。例如,寡核苷酸可在糖磷酸背景上被修饰以包括硫代磷酰和硫代氨基磷酸酯。
细胞偶联剂可以是纳米颗粒。纳米颗粒可以是金属纳米颗粒、碳基纳米颗粒、陶瓷纳米颗粒、半导体纳米颗粒、聚合物纳米颗粒或脂质基纳米颗粒。在一些示例中,纳米颗粒可为量子点(QD)。QD可以使用多种策略进行功能化,以与寡核苷酸(例如,通用引物)缀合,如在Banerjee等人,2016,Ineterface Focus,6(6):20160064(其通过引用整体并入本文)中所讨论的。例如,经化学修饰的DNA上的官能团(例如,巯基修饰、多组氨酸修饰和硫代磷酸酯修饰)与QD的无机外壳的天然亲和力可用于寡核苷酸与QD表面的非共价附接。例如,QD-DNA缀合可首先涉及QD与巯基丙酸(MPA)的配体交换,然后通巯基官能化的DNA(DNA-SH)直接替换MPA。在其他示例中,DNA的多阴离子磷酸二酯主链可以通过静电相互作用被QD上的阳离子表面涂层吸附。这种策略的另一个变体可涉及多组氨酸标记的DNA直接与QD表面的亲和力。
脂质寡核苷酸缀合物(LON)可以通过疏水相互作用嵌入QD上的两亲性覆盖层中。参见Aime等人,2013Bioconjug.Chem.24,1345-1355,其通过引用整体并入本文。在这种DNA缀合的方法中,可以首先将寡核苷酸缀合到两亲性脂质上,然后添加到整体封装制剂中,以直接在QD上显示缀合的DNA。QD可以通过特定的有机或生物分子配体进行表面官能化,以与寡核苷酸缀合。商业双官能接头,例如SMCC、SPDP、MBS等,可用于共价形成QD寡核苷酸缀合物。在另一示例中,胺官能化DNA(DNA-NH2)可通过与1-乙基-3-(3-(二甲基氨基)-丙基)碳二亚胺盐酸盐(EDC)及N-羟基琥珀酰亚胺(NHS)反应而偶联至QD。在一个示例中,Ni-NTA修饰的QD可与多组氨酸修饰的DNA复合。替代地,可以先用链霉亲和素对QD进行官能化,然后添加生物素化DNA。与寡核苷酸缀合的QD可与膜受体蛋白连接用于将寡核苷酸-QD复合物引导至细胞表面。可使用本领域常规使用的直接生物缀合方法将封装的或水性QD衍生为蛋白质或肽及其他生物分子。QD可与膜受体蛋白缀合,如先前以NGF受体、乙酰胆碱受体、乙酰胆碱受体或GPCR所示。作为膜结合受体的配体的肽已与QD缀合,用于细胞膜靶向。参见Barroso等人,J Histochem Cytochem.2011年3月;59(3):237-251,其通过引用整体并入本文。
可使用生物素化的细胞表面蛋白质将包含与链霉亲和素连接的QD缀合的寡核苷酸的细胞偶联剂定向到细胞表面。例如,目标细胞可携带遗传编码的细胞表面蛋白质,以在目标蛋白质的N末端或C末端携带受体肽(AP),GLNDIFEAQKIEWHE。受体肽可在ATP和生物素存在下通过重组表达的生物素连接酶(BirA)和过量生物素(通过洗涤去除)进行生物素化。在其他示例中,可以通过将目标细胞与胆固醇-PEG2k-生物素一起孵育,用生物素基团对细胞膜进行工程化。然后,用抗生物素蛋白官能化的QD-寡核苷酸缀合物可被主动招募到细胞表面。
细胞偶联剂也可以是碳水化合物。寡核苷酸-碳水化合物缀合物可以具有单价配体(一个碳水化合物基团)、二元低聚糖(通过键附接的两个碳水化合物基团)、三元低聚糖(通过键各自附接到支架的三个碳水化合物基团)或更高,以用于更高的亲和力。寡核苷酸-碳水化合物缀合物(糖-低聚缀合物)可以靶向在受体上发现的碳水化合物识别结构域(CRD),例如脱唾液酸糖蛋白受体(ASGP-R)。由在脱唾液酸糖蛋白受体(ASGP-R)上发现的碳水化合物识别结构域(CRD)识别的碳水化合物部分的示例包括半乳糖和乳糖、甘露糖、唾液酸等。
在一些示例中,糖可以附接到小肽上以模拟多价N-连接的低聚糖,该多价N-连接的低聚糖可以被细胞表面上的碳水化合物识别结构域识别。参见Haensler等人,Bioconjugate Chem.,1993,4,85,其通过引用整体并入本文。在一些情况下,可对细胞表面低聚糖进行化学修饰以并入功能性叠氮基,且表面唾液叠氮化物(sialic azide)可通过共价键与经施陶丁格连接被膦基修饰的合成寡核苷酸缀合。
寡核苷酸-碳水化合物复合物可通过用于表面碳水化合物型受体的载体或高亲和力配体靶向细胞,所述表面碳水化合物型受体介导各种配体的摄取。可用于表面碳水化合物型受体的糖靶向的载体或高亲和力配体包括糖蛋白或新糖蛋白、糖肽或新糖肽或糖基化聚合物。
携带特定细胞表面受体配体(如碳水化合物)的膜附接复合物可选择性地定向到具有识别配体的表面受体的细胞。例如,可以使用具有暴露的末端碳水化合物基团的糖蛋白,例如脱唾液酸糖蛋白(半乳糖末端)靶向肝细胞,但也可以使用其他配体,例如多肽激素。这种配体可以通过糖蛋白的化学或酶促去唾液酸化形成,所述糖蛋白具有末端唾液酸和倒数第二的半乳糖残基。替代地,脱唾液酸糖蛋白配体可以通过如下形成:通过还原性乳糖氨基化(lactosamination)将半乳糖末端碳水化合物(如乳糖或阿拉伯半乳聚糖)偶联到非半乳糖承载蛋白。其他类型的配体可用于将分子缀合物靶向细胞表面受体,例如用于巨噬细胞(淋巴瘤)的甘露糖、用于成纤维细胞(纤维肉瘤)的甘露糖-6-磷酸糖蛋白。
在其他情况下,细胞偶联剂可包含可结合在细胞表面上表达的碳水化合物基序的蛋白质或其功能结构域或功能片段。例如,细胞偶联剂可选自但不限于凝集素、L-选择素、E-选择素、P-选择素或其功能结构域或功能片段。凝集素的示例包括但不限于刀豆球蛋白(Concanavilin)A、加纳籽凝集素4、麦胚凝集素、蓖麻毒素、半乳糖凝集素-1、甘露糖结合蛋白、流感病毒血球凝集素、多瘤病毒蛋白1、肠毒素、霍乱毒素等。
非共价连接的寡核苷酸-新糖蛋白复合物可用于细胞表面靶向,例如,生物素化的寡核苷酸可与甘露糖基化的链霉亲和素非共价连接。寡核苷酸可以与脱唾液酸糖蛋白-多聚赖氨酸缀合物非共价连接,用于更有效地跨膜摄取。参见Bunnel等人,Somatic CellMolecular Genetics,1992,18,559;Reinis等人,J.Virol.Meth.,1993,42,99,其各自都通过引用整体并入。例如,与合成的新糖蛋白缀合的寡核苷酸可用于靶向细胞表面,该新糖蛋白对凝集素(例如ASGP-R)具有靶向亲和力,在非还原性末端位置含有半乳吡喃糖基残基。
碳水化合物-寡核苷酸缀合物可以通过制备含亚磷酰胺的碳水化合物来制备。点击化学可用于合成包括分支结构的寡核苷酸糖缀合物。参见Pourceau等人,J.Org.Chem.,2009,74(3),第1218–22页,其通过引用整体并入本文。糖缀合物可以通过靶向脱唾液酸糖蛋白受体(在肝细胞上发现的细胞表面凝集素)递送到特定的细胞类型。参见Akinc等人,Mol Ther.2010年7月;18(7):1357-1364,其通过引用整体并入本文。如美国专利号6660720(其通过引用整体并入本文)中所述,碳水化合物配体可通过接头分子连接到寡核苷酸或寡核苷。
在一些情况下,对特定细胞表面受体具有高亲和力的小分子配体可以用作细胞偶联剂,用于设计靶向细胞表面的寡核苷酸缀合物。例如,固相DNA合成可用于制备单价或三价茴香酰胺-寡核苷酸缀合物,茴香酰胺是σ受体的配体。茴香酰胺的亚磷酰胺版本--σ受体的配体可由N-[2-(2-羟基乙氧基)乙基]-4-甲氧基苯甲酰胺(带有反应性羟基的茴香酰胺的一种衍生物)转化而来。参见Nakagawa等人,J Am Chem Soc.2010年7月7日;132(26):8848-49,其通过引用整体并入本文。在另一个示例中,氯氮平和CNO的类似物可与1,1'-羰基二咪唑反应,并与具有5'-氨基接头的单链寡核苷酸缀合,以产生定向于对氯氮平或氯氮平-N-氧化物反应的特定GPCR的小分子寡核苷酸缀合物。参见Alam等人,Bioorg MedChem.2013年10月15日;21(20):6217-6223,其通过引用整体并入本文。
在一些情况下,细胞偶联剂可以是寡核苷酸结合剂,例如聚阳离子。合适的聚阳离子是聚赖氨酸、聚精氨酸、聚鸟氨酸和基础蛋白质,例如组蛋白、抗生物素蛋白、鱼精蛋白等。在一些情况下,包含DNA、聚阳离子和多糖(例如,裂褶菌多糖)的复合物可用于诱导目标靶细胞对该复合物的细胞摄取。在一些情况下,由具有PHPMA的涂层诱导的DNA与线性可还原聚阳离子的侧向稳定复合物,可靶向细胞表面受体以进行特定跨膜摄取。参见Oupicky等人,J.Am.Chem.Soc.,2002,124(1):8-9,其通过引用整体并入本文。
细胞偶联剂可通过引入到细胞偶联剂、寡核苷酸或两者中的官能团与寡核苷酸缀合。在一些示例中,可在巯基修饰的寡核苷酸和通过暴露N-琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)引入的活性亲电子的S原子之间生成二硫键。活性亲电子的S键可被直接引入细胞偶联剂或细胞表面。例如,细胞表面上的游离巯基随后可与包含另一个二硫键的寡核苷酸的游离巯基反应(例如,通过巯基-二硫键交换),使得寡核苷酸-缀合物可连接到细胞(例如,通过生成的二硫键)。在一些情况下,细胞的游离巯基可与任何其他合适的基团发生反应。例如,细胞表面上的游离巯基可与包含丙烯酰胺基(acrydite)部分的寡核苷酸反应。细胞表面的游离巯基可通过Michael加成化学与丙烯酰胺基反应,使得包含丙烯酰胺基的寡核苷酸可连接到细胞表面。在一些情况下,可以通过包含巯基封端剂(如乙基马来酰胺或碘乙酸酯)来防止非受控反应。
寡核苷酸与细胞偶联剂的缀合可涉及寡核苷酸的化学修饰。化学修饰的核苷酸可含有活性基团,细胞偶联剂随后可以与之连接。在一些情况下,可对寡核苷酸的一个或多个核苷酸进行修饰,以改善寡核苷酸的细胞摄取、细胞渗透性,或改善与细胞偶联剂的缀合。已经开发了多种使用化学修饰的寡核苷酸合成寡核苷酸缀合物的方法,包括例如,掺入修饰的亚磷酰胺、分步(在线)固相合成、支持物上片段偶联和溶液相偶联。
本文所公开的寡核苷酸可包含位于不同位置的一种或多种化学修饰,包括在糖部分、磷酸二酯键和/或碱基处。寡核苷酸可包含天然、化学修饰、生化修饰、非天然、合成或衍生的核苷酸碱基。例如,寡核苷酸可包含有包含磷酰胺、硫代磷酸酯、二硫代磷酸酯、硼烷基磷酸酯键、O-甲基亚磷酰胺键和/或肽核酸的主链。寡核苷酸可包含2'氟阿拉伯糖基核酸、三环DNA(tc-DNA)、肽核酸、环己烯核酸(CeNA)、锁定核酸(LNA)、包含在核糖环的2'和4'碳之间的亚甲基桥的锁定核酸(LNA)核苷酸、桥接核酸(BNA)、乙烯桥接核酸(ENA)、二氨基磷酸酯吗啉基(phosphodiamidate morpholino)或其组合。
所述寡核苷酸可包含一个或多个非天然存在的核苷酸或核苷酸类似物,例如,具有硫代磷酸酯键、硼烷基磷酸酯键的核苷酸、包含在核糖环的2'和4'碳之间的亚甲基桥的锁定核酸(LNA)核苷酸或桥接核酸(BNA)。非天然存在的核苷酸或核苷酸类似物可以是2'-0-甲基类似物、2'-脱氧类似物、2-硫尿苷类似物、N6-甲基腺苷类似物或2'-氟类似物。
寡核苷酸可以包含一个或多个修饰的碱基。一个或多个修饰的碱基可以是2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N^甲基假尿苷(mel P)、5-甲氧基尿苷(5moU)、肌苷或7-甲基鸟苷。
寡核苷酸可以包含糖部分。糖部分可以是天然的未改性糖,例如单糖(例如戊糖,例如核糖、脱氧核糖)、改性糖或糖类似物。在一些情况下,糖部分可以具有被卤素、杂原子、脂肪族基团取代的一个或多个羟基,或者一个或多个羟基可以被官能化为醚、胺、硫醇等。
寡核苷酸可以包含在核糖2'位置的一个或多个修饰。2'部分可以是H、OR、R、卤代基、SH、SR、H2、HR、R2或ON,其中R是Ci-C6烷基、烯基或炔基,卤代基是F、Cl、Br或I。糖修饰的示例包括2'-脱氧-2'-氟-寡核糖核苷酸(2'-氟-2'-脱氧胞苷-5'-三磷酸、2'-氟-2'-脱氧尿苷-5'-三磷酸)、2'-脱氧-2'-脱胺寡核糖核苷酸(2'-氨基-2'-脱氧胞苷-5'-三磷酸、2'-氨基-2'-脱氧尿苷-5'-三磷酸)、2'-0-烷基寡核糖核苷酸、2'-脱氧-2'-C-烷基寡核糖核苷酸(2'-O-甲基胞苷-5'-三磷酸、2'-甲基尿苷-5'-三磷酸)、2'-C-烷基寡核糖核苷酸及其异构体(2'-阿糖胞苷-5'-三磷酸、2'-阿糖胞苷-5'-三磷酸)、叠氮基三磷酸(2'-叠氮基-2'-脱氧胞苷-5'-三磷酸、2'-叠氮基-2'-脱氧尿苷-5'-三磷酸)及其组合。糖修饰的核糖核苷酸可具有被H、烷氧基(或OR)、R或烷基、卤素、SH、SR、氨基(例如NH2、NHR、NR2)或CN基团取代的2’OH基团,其中R为低级烷基、烯基或炔基。
寡核苷酸可包含一个或多个核碱基修饰的核糖核苷酸。一个或多个修饰的核糖核苷酸可包含非天然存在的碱基(而非天然存在的碱基),例如在5′位修饰的尿苷或胞苷,例如5′(2-氨基)丙基尿苷或5′-溴尿苷;在8位修饰的腺苷和鸟苷,例如8-溴鸟苷;去氮核苷酸,例如7-去氮-腺苷;和N-烷基化核苷酸,例如N6-甲基腺苷。
核碱基修饰的核苷酸可为m5C(5-甲基胞苷)、m5U(5-甲基尿苷)、m6A(N6-甲基腺苷)、s2U(2-硫尿苷)、Um(2'-0-甲基尿苷)、mlA(1-甲基腺苷)、m2A(2-甲基腺苷)、Am(2-1-O-甲基腺苷)、ms2m6A(2-甲基硫代-N6-甲基腺苷)、i6A(N6-异戊烯基腺苷),ms2i6A(2-甲硫基-N6异戊烯腺苷)、io6A(N6-(顺-羟基异戊烯基)腺苷)、ms2io6A(2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷)、g6A(N6-甘氨酸基氨基甲酰基腺苷)、t6A(N6-苏氨酰基氨基甲酰基腺苷)、ms2t6A(2-甲硫基-N6-苏氨酰基氨基甲酰基腺苷、m6t6A(N6-甲基-N6-苏氨酰基氨基甲酰基腺苷)、hn6A(N6-羟基正缬氨酰基氨基甲酰基腺苷)、ms2hn6A(2-甲硫基-N6-羟基正缬氨酰基氨基甲酰基腺苷)、Ar(p)(2'-0-核糖基腺苷(磷酸))、I(肌苷)、mi l(1-甲基肌苷)、m'lm(l,2'-0-二甲基肌苷)、m3C(3-甲基胞苷)、Cm(2T-0-甲基胞苷)、s2C(2-硫代胞苷)、ac4C(N4-乙酰胞苷)、f5C(5-甲酰基胞苷(5-fonnylcytidine))、m5Cm(5,2-O-二甲基胞苷)、ac4Cm(N4乙酰基2TO甲基胞苷)、k2C(赖胞苷)、mlG(1-甲基鸟苷)、m2G(N2-甲基鸟苷)、m7G(7-甲基鸟苷)、Gm(2'-0-甲基鸟苷)、m22G(N2,N2-二甲基鸟苷)、m2Gm(N2,2'-0-二甲基鸟苷)、m22Gm(N2,N2,2'-0-三甲基鸟苷)、Gr(p)(2'-0-核糖基鸟苷(磷酸))、yW(怀丁苷)、o2yW(过氧怀丁苷)、OHyW(羟基怀丁苷)、OHyW*(欠修饰的羟基怀丁苷)、imG(怀俄苷)、mimG(甲基鸟苷)、Q(辫苷)、oQ(环氧辫苷)、galQ(半乳糖基辫苷)、manQ(甘露糖基辫苷)、preQo(7-氰基-7-脱氮鸟苷)、preQi(7-氨基甲基-7-脱氮鸟苷)、G(古嘌苷)、D(二氢尿苷)、m5Um(5,2'-0-二甲基尿苷)、s4U(4-硫代尿苷)、m5s2U(5-甲基-2-硫代尿苷)、s2Um(2-硫代-2'-0-甲基尿苷)、acp3U(3-(3-氨基-3-羧基丙基)尿苷)、ho5U(5-羟基尿苷)、mo5U(5-甲氧基尿苷)、cmo5U(尿苷5-氧乙酸)、mcmo5U(尿苷5-氧乙酸甲酯)、chm5U(5-(羧基羟甲基)尿苷)、mchm5U(5-(羧基羟甲基)尿苷甲酯)、mcm5U(5-甲氧基羰基甲基尿苷)、mcm5Um(S-甲氧基羰基甲基-2-O-甲基尿苷)、mcm5s2U(5-甲氧基羰基甲基-2-硫代尿苷)、nm5s2U(5-氨基甲基-2-硫代尿苷)、mnm5U(5-甲基氨基甲基尿苷)、mnm5s2U(5-甲基氨基甲基-2-硫代尿苷)、mnm5se2U(5-甲基氨基甲基-2-硒代尿苷)、ncm5U(5-氨基甲酰基甲基尿苷)、ncm5Um(5-氨基甲酰基甲基-2'-0-甲基尿苷)、cmnm5U(5-羧甲基氨基甲基尿苷)、cnmm5Um(5-羧甲基氨基甲基-2-L-O甲基尿苷)、cmnm5s2U(5-羧甲基氨基甲基-2-硫代尿苷)、m62A(N6,N6-二甲基腺苷)、Tm(2'-0-甲基肌苷)、m4C(N4-甲基胞苷)、m4Cm(N4,2-0-二甲基胞苷)、hm5C(5-羟甲基胞苷)、m3U(3-甲基尿苷)、cm5U(5-羧甲基尿苷)、m6Am(N6,T-0-二甲基腺苷)、rn62Am(N6,N6,0-2-三甲基腺苷)、m2'7G(N2,7-二甲基鸟苷)、m2'2'7G(N2,N2,7-三甲基鸟苷)、m3Um(3,2T-0-二甲基尿苷)、m5D(5-甲基二氢尿苷)、f5Cm(5-甲酰基-2'-0-甲基胞苷)、mlGm(l,2'-0-二甲基鸟苷)、m'Am(1,2-0-二甲基腺苷)irino甲基尿苷)、tm5s2U(S-牛磺酰甲基-2-硫代尿苷))、imG-14(4-去甲基鸟苷)、imG2(异鸟苷)或ac6A(N6乙酰基腺苷)、次黄嘌呤、肌苷、8-氧代-腺嘌呤、其7-取代的衍生物、二氢尿嘧啶、假尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-氨基尿嘧啶、5-(Ci-C6)-烷基尿嘧啶、5-甲基尿嘧啶、5-(C2-C6)-烯基尿嘧啶、5-(C2-C6)-炔基尿嘧啶、5-(羟甲基)尿嘧啶、5-氯尿嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羟基胞嘧啶、5-(Ci-C6)-烷基胞嘧啶、5-甲基胞嘧啶、5-(C2-C6)-烯基胞嘧啶、5-(C2-C6)-炔基胞嘧啶、5-氯胞嘧啶、5-氟胞嘧啶、5-溴胞嘧啶、N2-二甲基鸟嘌呤、7-脱氮鸟嘌呤、8-氮杂鸟嘌呤、7-脱氮-7-取代的鸟嘌呤、7-脱氮-7-(C2-C6)炔基鸟嘌呤、7-脱氮-8-取代的鸟嘌呤、8-羟基鸟嘌呤、6-硫代鸟嘌呤、8-氧代鸟嘌呤、2-氨基嘌呤、2-氨基-6-氯嘌呤、2,4-二氨基嘌呤、2,6-二氨基嘌呤、8-氮杂嘌呤、取代的7-脱氮嘌呤、7-脱氮-7-取代的嘌呤、7-脱氮-8-取代的嘌呤及其组合。
核碱基修饰的核苷酸可以是氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、5-溴-dU、脱氧尿苷、反向dT、反向双脱氧-T、双脱氧-C、5-甲基dC、超(T)、超(G)、5-硝基吲哚、2'-O-甲基RNA碱基、羟甲基dC、异dG、异dC、氟C、氟U、氟A、氟G、2-甲氧基乙氧基MeC、2-甲氧基乙氧基G、或2-甲氧基乙氧基T。
在一些情况下,寡核苷酸的3′端和5′端可以例如通过修饰3′或5′键基本上免受核酸酶的影响。例如,可以通过包含一个或多个阻断基团使寡核苷酸具有抗性。一个或多个末端阻断基团可以是封端结构(例如,7-甲基鸟苷封端)、倒置核单体(例如,具有3′-3′或5′-5′末端倒位)、甲基膦酸酯、亚磷酰胺、非核苷酸基团(例如,非核苷酸接头、氨基接头、缀合物)等。3′端核单体可包含修饰的糖部分。例如,3′-羟基可以通过3′→3′核苷酸间键酯化成核苷酸。例如,烷氧基自由基可以是甲氧基、乙氧基或异丙氧基。任选地,3′端的3′→3′连接的核苷酸可以通过取代键进行连接。为了减少核酸酶降解,最靠近5′的3′→5′键可以是修饰键,例如硫代磷酸酯键或对烷氧基磷酸三酯键。
寡核苷酸可通过键与细胞偶联剂连接。在一些情况下,与寡核苷酸连接的化学部分可包含不稳定键,例如化学键、热键或光敏键,例如二硫键、UV敏感性键等。丙烯酰胺基部分或包含不稳定键的其他部分可掺入细胞偶联剂或细胞表面。例如,不稳定键可用于将物质(例如条形码、引物等)可逆连接(例如共价连接)到细胞。在一些情况下,热不稳定键可包括基于核酸杂交的附接,例如,其中寡核苷酸与附接到细胞的互补序列杂交,使得杂合体的热解链从细胞或微囊释放寡核苷酸,例如,含有条形码的序列。
该键可包括对光辐射敏感的光可切割键。寡核苷酸可以在掺入含有对光不稳的基团的修饰核苷酸的情况下合成,该对光不稳的基团容易被特定波长的光切割。例如,适当的条件可以是暴露于UV光。对光不稳的基团可以通过亚磷酰胺化学法引入到寡核苷酸中。PC氨基标记亚磷酰胺与生长的寡核苷酸链的游离5′-OH基的选择性反应,然后从支持物上切割并脱保护,可导致引入通过光可切割的接头与初级脂肪族氨基连接的磷酸二酯基。然后,该氨基可用于通过与胺反应试剂的合成后修饰反应引入多种光可切割的标志物。
除了热可切割键、二硫键和UV敏感键外,可与细胞偶联的不稳定键的其他非限制性示例包括酯键(例如,可用酸、碱或羟胺切割)、邻二醇键(例如,可通过高碘酸钠切割)、Diels-Alder键(例如,可通过热切割)、砜键(例如,可通过碱切割)、甲硅烷基醚键(例如,可通过酸切割)、糖苷键(例如,可通过淀粉酶切割)、肽键(例如,可通过蛋白酶切割)或磷酸二酯键(例如,可通过核酸酶(例如,DNAase)切割)。
在一些情况下,可使用经修饰的核苷间键将可切割的接头引入寡核苷酸中。修饰的核苷间键可以是具有磷原子的核苷酸间键,或者是不具有磷原子的核苷酸间键。其中含有磷原子的核苷间键包括例如,二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯包括3′-亚烷基膦酸酯、5′-亚烷基膦酸酯和手性膦酸酯、亚膦酸酯,氨基磷酸酯包括3′-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、对乙氧基磷酸二酯、对乙氧基磷酸二酯、对烷氧基磷酸三酯、甲基膦酸酯、硫羰基氨基磷酸酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、硒代磷酸酯和硼烷基磷酸酯,以及非含磷的键,例如缩醛和酰胺,如本领域已知的,具有这些的正常的3′-5′键、2′-5′连接的类似物,以及具有反极性的那些,其中一个或多个核苷酸间键为3′-3′、5′-5′或2′-2′键。具有反极性的多核苷酸可在最靠近3′的核苷酸间键处包含单个3′-3′键,即单个反核苷残基,其可以是无碱基的(核碱基缺失或在其适当位置有羟基)。
非含磷的核苷间键包括短链烷基、环烷基、混合杂原子烷基、混合杂原子环烷基、一个或多个短链杂原子和一个或多个短链杂环。这些核苷间键包括但不限于硅氧烷、硫化物、亚砜、砜、乙酰基、甲酰基(formacetyl)、硫代甲酰基、亚甲基甲酰基、硫代甲酰基、烯基、氨基磺酸酯基;亚甲基亚氨基、亚甲基肼基、磺酸酯基、磺酰胺、酰胺和具有混合N、O、S和CH2组分部分的其他核苷间键。其他其中不含磷原子的修饰的核苷间键包括-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(称为亚甲基(甲基亚氨基)主链)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-。
可切割的接头本质上可以是非核苷酸。“非核苷酸”可以是指取代一个或多个核苷酸单元掺入多核苷酸链中的任何基团或化合物,包括糖和/或磷酸取代。该基团或化合物可以是无碱基的,因为它不包含公认的核苷酸碱基,例如在糖的C1位置处的腺苷、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶。
非核苷酸接头可以是例如,无碱基残基(dSpacer)、低聚乙二醇(如三甘醇(间隔子9)或六甘醇(间隔子18))或烷烃二醇(如丁二醇)。间隔子单元可以优选地通过磷酸二酯或硫代磷酸酯键连接。接头单元可在分子中仅出现一次,或可例如通过磷酸二酯、硫代磷酸酯、甲基膦酸酯或酰胺键掺入多次。进一步优选的接头是烷基氨基接头,例如C3、C6、C12氨基接头,以及烷基巯基接头,例如C3或C6巯基接头。在一些示例中,异双功能和同双功能连接部分可用于将肽和蛋白质与核苷酸缀合。示例包括5′-氨基改性剂C6和3′-氨基改性剂C6试剂。
寡核苷酸还可以通过中间连接基团(例如ω-氨基烷氧基和ω-氨基烷基氨基)与多种分子,例如类固醇、报告分子、报告酶、维生素、非芳香族亲脂性分子、螯合剂、卟啉、嵌入剂、肽和蛋白质缀合,以能实现更好的跨膜摄入。已报道在寡核苷酸的3′-、5′-、2′-、核苷酸间键和核碱基位置的缀合。参见例如,Manoharan等人PCT申请WO 93/07883,其通过引用整体并入本文。
靶向细胞的一种或多种细胞偶联剂可用于生成包含多个细胞偶联剂的细胞。在一些情况下,多个细胞偶联剂是相同的。在一些情况下,多个细胞偶联剂是不同的。例如,细胞可包含偶联至细胞表面的第一细胞偶联剂(例如包含抗体)和第二细胞偶联剂(例如包含亲脂性分子)。作为另一个示例,细胞可包含偶联至细胞表面的包含第一亲脂性分子的第一类型细胞偶联剂和包含第二亲脂性分子的第二细胞偶联剂,其中第一亲脂性分子和第二亲脂性分子不同。在一些情况下,使用1、2、3、4、5、6、7、8、9、10或更多个不同的细胞偶联剂。
用于条形码延伸的拆分-
在一些情况下,可以使用拆分-池法在细胞的表面上生成寡核苷酸标签的核酸序列,使得在拆分-池化的每个循环中,生成和/或附加寡核苷酸标签的一部分(例如,部分条形码序列)。拆分-池循环可以重复或迭代两次或更多次,以用于与细胞表面相缔合的条形码序列的高度复用生成的任意数量的合适循环。
细胞表面上的核苷酸或寡核苷酸序列是分子条形码。分子条形码可以是由至少2个单独组成条形码(部分条形码或条形码子序列)组成的复合条形码序列。
一种用于制备多个表面条形码化细胞的方法,其中条形码包含独特的核酸序列,该方法可包括:在池-拆分过程中,在多个细胞的表面上迭代延伸寡核苷酸(例如,如本文其他地方所述,与细胞偶联剂偶联的寡核苷酸),使得在每个循环中,细胞被拆分到多个分区中,其中,在每个分区中,细胞表面经受核酸反应(例如连接或延伸反应),包括条形码与附加寡核苷酸序列的延伸;并将池-拆分过程重复任意数量的循环。例如,可以存在至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000或更多个循环。
可将单个细胞表面进行修饰(例如,化学、酶促或通过本文其他地方所述的细胞偶联剂)以偶联到任何数量的单个核酸分子,例如,一个至几十个至几十万个或甚至数百万个单个核酸分子。单个核酸分子可以包含共有序列区段或相对共有序列区段,以及偶联到同一细胞的不同单个核酸分子之间的可变或独特序列片段。例如,附接到给定细胞的单个寡核苷酸标签可全部包含共有条形码序列(例如,由拆分-池生成的部分条形码序列组成的组成型条形码序列),但也包含可变独特分子索引(UMI)。
在一些实施方案中,本文公开了用于同时制备多个索引化细胞的方法,包括:形成包含多个细胞的混合物,其中细胞表面携带连接到包含通用衔接子序列的核酸分子的细胞偶联剂(例如,如本文所述);将细胞分离到多个分区中;通过将第一部分条形码序列附加到核酸分子(例如,通过连接到通用衔接子序列)来延伸细胞表面上的核酸分子序列;将分区中的细胞汇集到单个共有池中;以及将分区和部分条形码添加重复多次,以通过迭代拆分-池方法组合产生多个寡核苷酸标签,该多个寡核苷酸标签包含连接或附接到细胞(索引化细胞)的相应细胞表面的复合条形码序列。
附加或附接第一条形码核酸条形码分子或其序列可通过向第二条形码核酸分子的5'或3'添加来实现。在一些情况下通过连接、杂交或其任何组合来实现附加或附接。例如,第一条形码分子和第二条形码可以直接偶联。在另一示例中,夹板寡核苷酸分子可用于附接第一条形码分子和第二条形码分子。夹板寡核苷酸分子可包含双链区和一个或多个单链区。例如,夹板寡核苷酸分子可包含作为双链区的中心部分和作为单链区的两侧上的相邻区域。分子的单链区域可位于相同或不同链上。分子一端或两端上的单链区可包含1、2、3、4、5、6或更多核苷酸。该单链区域可被称为包含“突出端”序列。第一突出端序列可包括与第一条形码分子的一部分互补的序列,且第二突出端序列可包括与第二条形码分子的一部分互补的序列。互补序列可以包括任何有用的长度和碱基组成。类似地,双链区域可包括任何有用的长度和组成。第一条形码分子可与第一突出端序列杂交并连接。第二条形码分子可与第二突出端序列杂交并连接。在一些情况下,夹板寡核苷酸分子可包含用于组合组装的条形码序列,使得第n个条形码分子本身是夹板寡核苷酸分子。包含复合条形码序列的组装型双链分子可通过如下而转化为单链:通过变性以去除链并保留附接到细胞表面的单链核酸条形码分子。替代地,可在双链核酸条形码分子从表面去偶联(例如释放)后进行变性。US2020/0063191(其通过引用整体并入本文)中进一步描述了用于在附接到表面时组装条形码序列和其他功能序列的方法,包括通过夹板寡核苷酸。夹板寡核苷酸可包含一个或多个功能序列,例如衔接子序列、引物或引物结合序列(例如,测序引物或测序引物结合位点)、独特分子索引(UMI)、配置为附接到测序器的流动池的序列(例如,Illumina P5、P7或其部分序列)、配置为与特定序列或分子杂交的捕获序列(例如,配置为附接到含有聚-A的分子,例如mRNA的聚-T序列)等。另外地,在组装复合条形码分子期间,可以在任何一轮拆分-池之后添加一个或多个功能序列。在一些情况下,在最后一轮拆分-池中添加一个或多个功能序列。
在一些情况下,连接(例如,酶促或化学)用于偶联第一条形码分子和第二条形码分子。在一些情况下,杂交用于偶联第一条形码分子和第二条形码分子。在一些情况下,夹板寡核苷酸用于偶联第一和第二条形码分子。
此外,本文在一些实施方案中提供了用于检测特定细胞表面组分的出现的方法。例如,包含如本文其他地方所述的复合条形码序列的寡核苷酸标签连接到标记配体,例如细胞偶联剂(例如,抗体),其中复合条形码序列的存在指示标记配体特异性结合的细胞组分的存在。在一些情况下,复合条形码序列可以连接到用于特定细胞组分的抗体。如果样品中存在细胞组分,则抗体将结合,并且可以检测到条形码序列。如果样品中不存在细胞组分,则抗体将不结合,且条形码将不会在背景之上检测到。
在一些情况下,复合条形码序列的长度范围可为8至1000个核苷酸。在一些情况下,复合条形码序列可包含约8至约20、30、40、50、60、70、80、90、100或更多个核苷酸。在一些情况下,复合条形码序列的长度可为约8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,复合条形码序列的长度可为至少约8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,复合条形码序列的长度可至多约8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。复合条形码序列的这些核苷酸可以是完全连续的,即在相邻核苷酸的单个伸展链段(stretch)中,或者它们可以被分离(即非连续)成由1个或多个核苷酸分隔的两个或更多个子序列(部分条形码序列)。在一些情况下,条形码子序列被约2至约16个核苷酸分隔。在一些情况下,条形码子序列由约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸分隔。在一些情况下,条形码子序列由至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、2个或更多个核苷酸分隔。在一些情况下,条形码子序列由至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸分隔。在一些情况下,条形码子序列的长度可为约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列的长度可为至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列的长度可为至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。
因此,在一些情况下,例如,然后可以使用拆分-池方法将每个分区中的条形码元件的一个或多个单独的“池”接合在一起,以产生最终的条形码。例如,第一池可以包含x1元件,且第二池可以包含x2元件;形成包含来自第一池的元件和来自第二池的元件的条形码可以产生例如可使用的x1*x2可能的条形码,其中x1和x2可能相等,或者可能不相等。这个过程可以重复任意次数;例如,条形码可以包含来自第一池、第二池和第三池的元件(例如,产生x1*x2*x3可能的条形码),或来自第一池、第二池、第三池和第四池的元件(例如,产生x1*x2*x3*x4可能的条形码)等。还可以有5个、6个、7个、8个或任何其他合适数量的池。因此,即使相对小数量的条形码元件也可用于产生更大数量的可区分条形码。举例来说,3轮具有96个分区的拆分-池将产生96^3个不同的条形码;4轮具有96个分区的拆分-池将产生96^4个不同的条形码;3轮具有384分区的拆分-池将产生384^3个不同的条形码。
在拆分-池化工作流或其中的任何步骤期间,分区可以包括单个细胞或多个细胞。在一些情况下,分区包括单个细胞。在一些情况下,分区包括多个细胞。可以对细胞进行分区,使得在多个分区的每个分区中存在至少一个细胞(或细胞珠粒)。可对细胞分区使得至少1;2;3;4;5;10;20;50;100;500;1,000;5,000;10,000;100,000;1,000,000;或更多个细胞存在于单个分区中。可对细胞分区使得至多1,000,000;100,000;10,000;5,000;1,000;500;100;50;20;10;5;4;3;2;或1个细胞存在于单个分区中。细胞可以随机配置进行分区。
分区可以是各种不同类型的分区中的任何一种,例如,孔、微孔、管、小瓶、微囊、乳液中的液滴(例如,水滴)。在每个分区循环期间,可以将多个细胞分区到多个分区中。在一些情况下,多个分区可包括各自在其中封装有单个细胞的分区。在一些情况下,多个分区可包括各自在其中没有封装细胞的分区。在一些情况下,多个分区可包括各自在其中封装有多个细胞的分区,其中细胞是超载的。在这种情况下,有益地,可以实现高产量。
分区可以包括一个或多个独特标识符,例如条形码。例如,这种分区特异性条形码可以是单独的条形码子序列,当与其他分区的其他子序列组合时,最终形成复合条形码序列。条形码可以被预先、随后或同时递送到容纳隔室化或分区细胞的分区。例如,条形码可以在将细胞分区到孔中之前、之后或同时被递送到孔中。在另一示例中,条形码可在液滴生成之前、之后或同时被注入液滴中。将条形码递送到特定分区允许将单个细胞的特征随后归属于特定分区。条形码可以通过任何合适的机制被递送到分区,例如在核酸分子(例如,寡核苷酸)上。条形码化的核酸分子可以通过微囊被递送到一个分区。在一些情况下,微囊可包含珠粒(例如,凝胶珠粒)。本文进一步详细描述了珠粒。在一些情况下,条形码化的核酸分子最初可与微囊缔合,然后从微囊中释放,以附接在细胞表面。条形码化的核酸分子的释放可以是被动的(例如,通过扩散出微囊)。另外或替代地,可在施加刺激后从微囊释放,该刺激允许条形码化的核酸核酸分子从微囊解离或释放。这种刺激可破坏微囊,破坏将条形码化的核酸分子偶联到微囊或在微囊内的相互作用,或两者。此类刺激可包括,例如,热刺激、光刺激、化学刺激(例如,pH变化或还原剂(多种)的使用)、机械刺激、辐射刺激;生物刺激(如,酶),或其任何组合。
该方法还可包括通过拆分-池连接方法为每个细胞生成复合条形码序列,其中连接到细胞表面的通用手柄包括连接手柄序列,该连接手柄序列被配置为产生能够与第一条形码核苷酸序列上的互补突出端杂交的DNA突出端,其中,第一条形码核苷酸序列进一步包含与后续条形码序列(其可以是或可以不是最终条形码序列)互补的第二突出端,其中,后续条形码序列包含与第一条形码序列和下一个后续条形码序列(可以是也可以不是最终条形码序列)互补的突出端,其中,第n个后续条形码序列包含与前述条形码序列和与第n+1个后续条形码序列互补的突出端,并且其中最终条形码序列具有与前述条形码序列互补的突出端。在一些情况下,第n个条形码序列选自多个独特序列,所述多个独特序列包含相容的DNA突出端和6至30个碱基对的独特序列。
独特的复合条形码序列可以通过拆分-池方法生成。图11显示了用于生成表面条形码化(索引化)细胞的示例性拆分-池工作流1100。使用细胞偶联剂(如本文其他地方所述)对多个细胞进行表面官能化,使得至少一些细胞各自包含有包含通用衔接子序列的细胞表面缔合的核酸分子(表面官能化细胞1102)。在一些情况下,将细胞与连接(例如,共价地)到包含通用衔接子序列1120的核酸分子的偶联剂接触。在其他情况下,首先将细胞与偶联剂接触,将偶联剂与细胞表面缔合,随后将包含通用衔接子的核酸分子附接(例如,化学缀合)到偶联剂,从而生成表面官能化细胞1102。然后将表面官能化细胞1102分区1104(即,拆分)到单独的分区1106(例如,微孔阵列的孔)中,每个单独的分区1106包含独特的第一部分条形码序列1110;将第一部分条形码序列1110附接(例如,连接)到通用衔接子序列;将包含细胞(例如,多个细胞1112)的离散分区进行池化1108;任选地,将细胞池拆分1122到单独的分区1124中,每个单独的分区1124包含独特的第二部分条形码序列1114;将第二部分条形码序列附接(例如,连接)到第一部分条形码序列1110;以及将细胞池化1126。该方法可包括将拆分-池步骤任选地重复足够次数以生成期望的条形码多样性。例如,方法还可包括将包含第一和第二部分条形码序列的细胞池拆分到包含第三部分条形码序列的分区中;以及将第三部分条形码序列附接(例如,连接或杂交)到第二部分条形码序列。可以重复该拆分-池过程,由此在拆分-池部分条形码添加的迭代轮次之后,每个细胞表面包含由部分条形码序列组成的独特复合条形码序列。附加条形码序列的添加和/或附接条形码序列(例如,部分条形码序列)可以通过本文公开的方法和本领域已知的方法实现。例如,可以通过连接、杂交或其组合来实现附接第一条形码序列(例如,部分条形码序列)。在一些实施方案中,附接条形码序列(例如,部分条形码序列)包括使第一和第二核酸序列杂交,其中第一和第二核酸序列彼此互补。在一些实施方案中,附接条形码序列(例如,部分条形码序列)包括使第一和第二核酸条形码分子连接,其中连接可通过酶促或化学方式(例如,化学连接,例如使用点击化学反应;或酶促连接,例如使用连接酶)实现。
复合条形码序列可具有至少2个组成条形码序列,多至10000个连续条形码序列或更多。在一些情况下,可以选择条形码的数量,使得在任何两个单个细胞上具有相同复合条形码序列的概率接近于零。
在一些情况下,连接手柄序列可包括用于产生与第一条形码序列突出端互补的突出端的限制位点,并且该方法可包括用限制性酶进行消化。连接手柄可包括与连接引物序列互补的序列。在一些情况下,可通过连接引物与连接手柄的杂交产生突出端。在一些情况下,连接手柄可包括双链DNA部分,该部分已经包括条形码连接所需的突出端。
任何适当数量的分子标签分子(例如,引物、条形码化的寡核苷酸)都可以与细胞相缔合,从而在从细胞释放时,分子标签分子(例如,引物、条形码化的寡核苷酸)以预定义的浓度存在于分区中。可以选择这样的预定浓度以促进用于在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定义浓度可受到产生携带核酸分子(例如,寡核苷酸)的细胞的过程的限制。
细胞可包含一个或多个包含条形码序列的附接的复合条形码分子。附接到单个细胞的条形码序列可以是相同的,或者包含部分相同的序列。在一些情况下,附接到单个细胞的条形码序列可以不同,或包含部分不同(例如,独特)序列。在一些情况下,细胞可附接到约1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000或100000000000个复合条形码分子。在一些情况下,细胞可附接到至少约1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000或更多个复合条形码分子。在一些情况下,细胞可附接到少于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、500000、1000000、5000000、10000000、50000000、1000000000、5000000000、10000000000、50000000000或100000000000个相同和/或不同的复合条形码分子。
图9示出了携带条形码的细胞的示例。包含通用手柄序列的核酸分子902可通过可释放键906(诸如例如,二硫化物接头)偶联到细胞表面904。核酸分子902可通过与细胞偶联剂924、926、928之中的细胞偶联剂926缀合而偶联到细胞表面904。同一细胞表面904可通过分别与其他细胞偶联剂928、924缀合与一个或多个其他核酸分子918、920偶联(例如,通过可释放键)。核酸分子902可以是或包含条形码。如本文其他地方所述,条形码的结构可包括多个序列元件。核酸分子902可包含可在后续处理中使用的功能序列908。例如,功能序列908可包括通用手柄分子,例如测序器特定的流动池附接序列(例如,用于
Figure BDA0003630416840000441
测序系统的P5序列)和测序引物序列(例如,用于
Figure BDA0003630416840000442
测序系统的R1引物)中的一个或多个。核酸分子902可包含用于对样品(例如DNA、RNA、蛋白质等)进行条形码化的条形码序列910。在一些情况下,条形码序列910可以是细胞特异性的,使得条形码序列910对于偶联到同一细胞904的所有核酸分子(例如,包括核酸分子902)是共有的。替代地或另外,条形码序列910可以是分区特异性的,使得条形码序列910对于偶联到被分区到同一分区中的一个或多个细胞的所有核酸分子是共有的。在一些情况下,条形码序列910可以是或包括本文其他地方描述的复合条形码序列。例如,条形码序列910可由本文所述的拆分-池连接方法生成,并包含两个或更多个缀合条形码子序列,每个条形码子序列在每次迭代拆分-池操作中添加。本文描述的其他条形码序列(例如,916、912、914、908)可以是或者可以不是本文描述的复合条形码序列的一部分。
在一些情况下,附接到细胞的核酸分子(例如902、918、920)可包含细胞偶联剂标签,例如识别细胞偶联剂或细胞偶联剂配置为与之结合的分子(多个)和/或部分(多个)(例如蛋白质)的试剂条形码序列。有益地,在测序时,此类试剂条形码序列可识别细胞的细胞表面上的部分(多个)的存在和/或相对数量。本文所述的任何功能序列可与拆分-池操作一起添加,或独立于任何拆分-池操作(例如,例如成批添加)。
在一些示例中,条形码序列908可包括用于连接到910的连接手柄序列930。条形码序列910可包括用于连接到916的连接手柄序列932。条形码序列912可包括用于连接到914的连接手柄序列936。核酸分子902可包含特异性引发序列912,例如mRNA特异性引发序列(例如,聚-T序列)、靶向引发序列和/或随机引发序列。核酸分子902可包含锚定序列914,以确保特异性引发序列912在(例如mRNA的)序列末端杂交。例如,锚定序列914可包括核苷酸的随机短序列,例如1-聚体、2-聚体、3-聚体或更长的序列,其可确保聚-T区段更有可能在mRNA的聚-A尾的序列末端杂交。特异性引物序列和/或锚定序列可作为捕获序列,其被配置为捕获目标分析物(例如,mRNA或其cDNA衍生物)。
在一些情况下,核酸分子可包含细胞偶联剂标签和捕获序列之一。在一些情况下,核酸分子可包含细胞偶联剂标签和捕获序列两者。
核酸分子902可包含独特分子识别序列916(例如,独特分子标识符(UMI))。在一些情况下,独特分子识别序列916可包含约5至约9个核苷酸。替代地,独特分子识别序列916可包含小于约5个或大于约9个核苷酸。独特分子识别序列916可以是在偶联到单个细胞(例如,细胞904)的单个核酸分子(例如,902、919、920等)之间变化的独特序列。在一些情况下,独特分子识别序列916可以是随机序列(例如,随机N-聚体序列)。例如,UMI可提供捕获的起始mRNA分子的独特标识符,以允许对原始表达的RNA的数量进行定量。如所理解的,尽管图9显示了偶联到细胞904的表面的三个核酸分子902、919、920,但单个细胞可以偶联到任意数量的单个核酸分子,例如,一个至几十个至几十万个或甚至数百万个单个核酸分子。单个核酸分子的各自条形码可以包括共有序列区段或相对共有序列区段(例如909、910、912等)和偶联到同一细胞的不同单个核酸分子之间的可变或独特序列区段(例如916)。
在操作中,携带条形码的细胞904可被分区到液滴中。在一些情况下,细胞904可被裂解。条形码化的核酸分子902、919、920可从分区中的细胞904表面释放。细胞中所含的分析物也可被释放。举例来说,在分析样品RNA的上下文中,释放的核酸分子之一(例如902)的聚-T片段(例如912)可与mRNA分子的聚-A尾杂交。逆转录可产生mRNA的cDNA转录物,但该转录物包含核酸分子902的每个序列区段909、910、916。由于核酸分子902包含锚定序列914,因此它更有可能与mRNA的聚-A尾的序列末端杂交并引发逆转录。在任何给定的分区内,单个mRNA分子的所有cDNA转录物可包含共有条形码序列区段910。然而,由给定分区内的不同mRNA分子生成的转录物可以在独特分子识别序列912区段(例如,UMI区段)处变化。有益地,即使在给定分区的内容物的任何后续扩增之后,不同UMI的数量也可以指示来自给定分区并因此来自生物颗粒(例如细胞)的mRNA的量。如上所述,可以对转录物进行扩增、清理和测序,以识别mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段进行测序。虽然描述了聚-T引物序列,但也可以使用其他靶向或随机引发序列来引发逆转录反应。类似地,尽管描述为将条形码化寡核苷酸释放到分区中,但在一些情况下,结合到细胞的核酸分子可用于杂交并捕获细胞固相上的mRNA,例如,以促进RNA与其他细胞内容物的分离。
附加或附接核酸条形码分子或其序列可通过向分析物进行5'或3'添加来实现。在一些情况下,通过连接、杂交或其任何组合来实现附加或附接。在一些情况下,模板转换可以用来增加cDNA的长度。在一些情况下,模板转换可用于将预定义的核酸序列附加到cDNA。在模板转换的示例中,可以通过模板(例如细胞mRNA)的逆转录生成cDNA,其中具有末端转移酶活性的逆转录酶可以模板独立性方式向cDNA添加附加核苷酸(例如聚C)。转换寡核苷酸可包括与附加核苷酸互补的序列,例如聚G。cDNA上的附加核苷酸(例如聚C)可以与转换寡核苷酸上的互补序列(例如聚G)杂交,由此转换寡核苷酸可被逆转录酶用作模板来进一步延伸cDNA。模板转换寡核苷酸可包含杂交区和模板区。杂交区可包括能够与靶标杂交的任何序列。如前所述,在一些情况下,杂交区包括一系列G碱基,以补充位于cDNA分子的3′端处的突出端C碱基。G碱基系列可包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或大于5个G碱基。模板区可包含要并入cDNA中的任何序列。在一些情况下,模板区包括至少1个(例如,至少2、3、4、5个或更多个)标签序列和/或功能序列。转换寡核苷酸可包括脱氧核糖核酸;核糖核酸;修饰的核酸包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2′-脱氧肌苷、超级T(5-羟基丁炔基-2′-脱氧尿苷)、超级G(8-氮杂-7-脱氮鸟苷)、锁定核酸(LNA)、解锁核酸(UNA,例如UNA-A、UNA-U、UNA-C、UNA-G)、异dG、异dC、2′氟碱基(例如,氟C、氟U、氟A和氟G)或任何组合。参考图9,偶联到细胞表面的条形码分子的捕获序列(例如,912和/或914)可包括转换寡核苷酸序列或配置为捕获源自mRNA的cDNA(例如,包含聚C序列)的其他序列。
可被条形码化的细胞包括细菌、古细菌或真核细胞,并且可构成均质细胞系或混合培养物。合适的哺乳动物细胞包括来自例如小鼠、大鼠、仓鼠、灵长类动物和人类的那些细胞系和原代培养物。这些细胞包括干细胞包括胚胎干细胞和造血干细胞、合子、成纤维细胞、淋巴细胞、中国仓鼠卵巢细胞(CHO)、小鼠成纤维细胞(NIH3T3)、肾脏细胞、肝脏细胞、肌肉细胞和皮肤细胞。其他目标真核细胞包括植物细胞,如玉米、水稻、小麦、棉花、大豆、甘蔗、烟草和拟南芥;鱼类、藻类、真菌(青霉属、曲霉属、柄孢壳菌属、脉孢菌属、酵母菌属)、昆虫(如杆状鳞翅目(baculo lepidoptera))、酵母(毕赤酵母和酵母菌、粟酒裂殖酵母(Schizosaccharomyces pombe))。目标还有许多细胞类型(革兰氏阴性和革兰氏阳性),如枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(B.licehniformis)、蜡样芽孢杆菌(B.cereus)、大肠杆菌(Escherichia coli)、链霉菌属(Streptomyces)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、放线菌属(Actinomycetes)和欧文氏菌属(Erwinia)。
在一些情况下,细胞可以长期储存,并用作后续应用的试剂。
在一些情况下,复合条形码可包含促进下游反应的寡核苷酸序列。例如,下游反应用于评价表面条形码化细胞的细胞内分析物。细胞内分析物可包括核酸。在一些情况下,细胞内分析物可以是大分子。细胞内分析物可包括DNA。细胞内分析物可包括RNA。RNA可以是编码的或非编码的。例如,RNA可以是信使RNA(mRNA)、核糖体RNA(rRNA)或转移RNA(tRNA)。RNA可以是转录物。RNA可以是长度小于200个核酸碱基的小RNA,或长度大于200个核酸碱基的大RNA。小RNA可包括5.8S核糖体RNA(rRNA)、5S rRNA、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、Piwi-相互作用RNA(piRNA)、tRNA-衍生的小RNA(tsRNA)和小的rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。细胞内分析物可包括蛋白质。细胞内分析物可包括肽。细胞内分析物可包括多肽。
下游反应可包括例如,成熟mRNA的逆转录、捕获转录组的特定部分、针对DNA聚合酶和/或类似酶的引发等。例如,复合条形码序列可包含关于图9的锚定序列914。
在一些情况下,下游分子生物反应用于评价细胞中的细胞内蛋白质分析物。在另一个示例中,下游分子生物反应可涉及蛋白质、蛋白质复合物、具有翻译修饰的蛋白质以及蛋白质/核酸复合物的分析。蛋白质靶标包括肽,并且还包括酶、激素、结构组分,如病毒衣壳蛋白和抗体。
在一些情况下,核酸分子可包含功能序列,例如,用于附接到测序流动池,例如,用于
Figure BDA0003630416840000491
测序的P5序列。在一些情况下,核酸分子或其衍生物(例如,由核酸分子生成的寡核苷酸或多核苷酸)可包含另一功能序列,例如,用于附接到用于Illumina测序的测序流动池的P7序列。在一些情况下,核酸分子可以包含条形码序列。在一些情况下,引物还可包含独特分子标识符(UMI)。在一些情况下,引物可包含用于Illumina测序的R1引物序列。在一些情况下,引物可包含用于Illumina测序的R2引物序列。可与本公开的组合物、装置、方法和系统一起使用的此类核酸分子(例如,寡核苷酸、多核苷酸等)及其用途的示例在美国专利公开号2014/0378345和2015/0376609中提供,其各自通过引用整体并入本文。
可将表面条形码化细胞引入分区(例如乳液的液滴或孔)中,使得表面条形码化细胞在分区内裂解,并且当施加适当刺激时,任何缔合物质(例如寡核苷酸)在液滴内释放。游离物质(例如,寡核苷酸、核酸分子)可与分区中包含的其他试剂相互作用。例如,包含附接复合物(包含通过二硫键连接到通用条形码序列的脂质)的表面条形码化细胞可与油包水乳液的液滴内的还原剂结合。在液滴内,还原剂可以破坏各种二硫键,导致细胞降解,并将条形码序列释放到液滴的水性内部环境中。在另一个示例中,在碱性溶液中加热包含细胞结合条形码序列的液滴也可能导致细胞降解,并将附接条形码序列释放到液滴的水性内部环境中。
本公开的微流体系统,如图10所示的系统1000可以很容易地用于对表面索引化细胞进行分区。特别地,参考图10,包含细胞1014的水性流体1012流入通道汇合处1010,其中其通过非水性流体1016的流动被分区到液滴1018、1020中。分区还可包含试剂,例如可导致相应分区中的细胞裂解1024的裂解溶液1022。因此,表面附接的条形码1026将从细胞中释放,并附接到细胞的细胞内分析物上。有益地,通过递送在其中包含分析物的细胞上的条形码,包含条形码化细胞的每个分区保证同时包含分析物和条形码。此外,这防止可能由泊松加载造成的在分区中仅对条形码分区(无细胞)或仅对细胞分区(无条形码),从而防止昂贵资源(例如,试剂)的严重浪费和效率的损失。
任何适当数量的分子标签分子(例如,引物、条形码化的寡核苷酸)都可以与表面条形码化细胞相缔合,从而在从细胞释放时,分子标签分子(例如,引物、条形码化的寡核苷酸)以预定义的浓度存在于分区中。可以选择这样的预定浓度以促进用于在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定义浓度可受到产生携带核酸分子(例如,寡核苷酸)的细胞的过程的限制。
注入或以其他方式引入分区中的表面条形码化细胞可包含可释放、可切割或可逆地附接的条形码。条形码可以可释放、可切割或可逆地附接在表面条形码化细胞上,使得条形码可以通过条形码分子和细胞之间的键的切割而释放或可释放,或者通过基础细胞本身的降解或两者而释放,从而允许条形码被其他试剂触及或可触及。在非限制性示例中,可通过还原二硫键、使用限制性内切酶、光激活切割或通过其他类型的刺激(例如,化学、热、pH、酶促等)和/或反应(如本文其他地方所述)进行切割来实现切割。
向细胞中添加多种类型的不稳定键可产生能够对不同刺激作出反应的细胞。每种类型的不稳定键可对相关刺激(例如,化学刺激、光、温度、酶促等)敏感,使得通过每种不稳定键附接到细胞的物质的释放可以通过施加适当的刺激来控制。这种功能性可用于将物质从细胞表面受控释放。
如将理解的,可释放、可切割或可逆地附接到本文所述细胞的条形码包括可以通过条形码分子和细胞偶联剂之间的键的切割而释放或可释放的条形码,或者通过基础细胞本身的降解或两者而释放的条形码,从而允许条形码被其他试剂触及或可触及。
在分区形成期间或之后,可以在分区(例如,液滴)中对物质进行分区。此类物质可包括,例如,核酸分子(例如,寡核苷酸);用于核酸扩增反应的试剂(例如,引物、聚合酶、dNTP、辅因子(例如,离子辅因子)、缓冲液),包括本文所述的那些;用于酶促反应的试剂(例如,酶、辅因子、底物、缓冲液);用于诸如聚合、连接或消化的核酸修饰反应的试剂;和/或用于一个或多个测序平台(例如,用于
Figure BDA0003630416840000511
Figure BDA0003630416840000512
)的模板制备(例如,标签化(tagmentation))的试剂。此类物质可包括本文所述的一种或多种酶,包括但不限于聚合酶、逆转录酶、限制性酶(例如,核酸内切酶)、转座酶、连接酶、蛋白酶K、DNAse等。此类物质可包括本文其他地方描述的一种或多种试剂(例如,裂解剂、抑制剂、灭活剂、螯合剂、刺激物)。替代地,可以通过封装在珠粒中或连接到床层,来将此类物质引入分区。
在一些示例中,替代地或除条形码化细胞(例如,其表面)之外,可通过本文所述的拆分-池方法对封装细胞(例如,其表面)的细胞珠粒迭代地进行条形码化。
功能化核酸分子可以附接在细胞珠粒上。例如,细胞珠粒可以包含任何合适的功能化序列,例如本文其他地方描述的序列。例如,功能化核酸分子可包含配置为与核酸分子杂交的序列(例如,聚T序列、随机N-聚体序列、与细胞核酸序列互补的序列)、引物序列、模板转换寡核苷酸(TSO)序列、条形码序列、独特分子索引(UMI)序列、测序引物序列(或部分测序引物序列,例如部分R1和/或R2序列)、和/或一个或多个衔接子序列,例如配置为附接到测序器的流动池(例如P5、P7)的序列等。在一些实施方案中,附接到细胞珠粒上的核酸分子是单链核酸分子。在一些实施方案中,附接到细胞珠粒的核酸分子是双链核酸分子。在一些实施方案中,附接到细胞珠粒的核酸分子是部分双链核酸分子。
在一些示例中,替代地或除条形码化细胞(例如,其表面)之外,可通过本文所述的拆分-池方法对其中的分析物迭代地进行条形码化。这种系统和方法可以利用细胞珠粒。可以对细胞进行处理以生成细胞珠粒。这可以通过在诸如液滴的分区中提供细胞来进行。本文其他地方描述了诸如通过封装和聚合细胞来生成细胞珠粒的系统和方法。细胞可被裂解以释放细胞珠粒中的一种或多种分析物,例如第一分析物、第二分析物和第三分析物。替代地,可以在形成细胞珠粒之前裂解细胞,然后用裂解的内容物生成细胞珠粒。例如,将细胞提供在液滴中并裂解,随后对液滴进行聚合以生成细胞珠粒。可将多个这样的细胞珠粒分区到多个液滴中,以允许细胞珠粒超载,其中分区可以对多个细胞珠粒共分区。可将多个分区特异性条形码引入每个分区中,使得对于分区,分区中每个相应细胞珠粒的分析物接收该分区的分区特异性条形码。可将分区特异性条形码附加或以其他方式附接到分析物上。在一些情况下,分区特异性条形码可对一个或多个目标分析物(例如,蛋白质、核酸等)具有结合特异性。然后,可将分区的内容物汇集以提供多个细胞珠粒。在下一次迭代中,可将多个细胞珠粒再次拆分到分区中,以允许细胞珠粒超载。可将多个分区特异性条形码(用于第二轮分区)引入每个分区中,使得对于分区,分区中每个相应细胞珠粒的分析物接收该分区的分区特异性条形码。可将分区特异性条形码附加或以其他方式附接到分析物或已附加的条形码(在第一轮中接收的)。在一些情况下,分区特异性条形码可对一个或多个目标分析物(例如,蛋白质、核酸等)和/或另一个条形码分子(例如,第一轮的分区特异性条形码分子)具有结合特异性。
上述细胞珠粒的拆分-池(具有超载)可重复任意循环数,其中在每轮分区时向细胞珠粒提供分区特异性条形码。在一些情况下,可选择循环数以最小化在细胞珠粒中生成的条形码的最终组合在多个细胞珠粒之间不是独特的概率。在每次迭代中,细胞珠粒的超载使得每个分区能够处理多个细胞,并且与使用正常亚泊松细胞加载有效实现的相比具有更大的产量。多轮分区和条形码化可以使得能够实现基于条形码组合的具有独特细胞可识别性的高复用化。细胞珠粒中的分析物可附接到在每个拆分-池循环中接收到的分区特异性条形码。例如,如本文其他地方所述,分析物可附接到包含缀合的条形码子序列的复合条形码序列。条形码子序列可以按分区顺序相邻。在另一个示例中,分析物可以附接到例如在不同的位置(例如,在核酸序列的对置端等)的条形码分子的组合。
在拆分-池化之后,被处理的多个细胞的至少40%、50%、60%、70%、80%、90%、95%的相应细胞可以包含独特的复合条形码序列。在某些情况下,包含独特的复合条形码序列的经处理细胞的百分比为约10%至约100%。在某些情况下,包含独特的复合条形码序列的经处理细胞的百分比为约10%至约25%、约10%至约50%、约10%至约60%、约10%至约70%、约10%至约80%、约10%至约90%、约10%至约100%、约25%至约50%、约25%至约60%、约25%至约70%、约25%至约80%、约25%至约90%、约25%至约100%、约50%至约60%、约50%至约70%、约50%至约80%、约50%至约90%、约50%至约100%、约60%至约70%、约60%至约80%、约60%至约90%、约60%至约100%、约70%至约80%、约70%至约90%、约70%至约100%、约80%至约90%、约80%至约100%或约90%至约100%。在某些情况下,包含独特的复合条形码序列的经处理细胞的百分比为约10%、约25%、约50%、约60%、约70%、约80%、约90%或约100%。在某些情况下,包含独特的复合条形码序列的经处理细胞的百分比为至少约10%、约25%、约50%、约60%、约70%、约80%、或约90%。图13示出了迭代细胞珠粒条形码化的流程。可以处理多个细胞1302以生成多个细胞珠粒1304。在一些情况下,细胞可被裂解以在细胞珠粒中释放一种或多种分析物。在一些情况下,可在形成细胞珠粒之前裂解细胞,并在其后用裂解的内容物生成细胞珠粒。细胞珠粒可在物理上保留其中的内容物(例如,分析物)。多个细胞珠粒1304可以被分区1350到第一多个分区中,例如第一分区1305、第二分区1306和第三分区1308。可以用细胞珠粒使分区超载,使得分区包含多个细胞珠粒1304中的多于一个细胞珠粒。可将分区特异性条形码递送到每个分区中的相应细胞珠粒。例如,封装在第一分区1305中的三个细胞珠粒可各自接收第一分区特异性条形码1384。三个细胞珠粒中的分析物可附接至第一分区特异性条形码1384。封装在第二分区1306中的两个细胞珠粒可各自接收第二分区特异性条形码1386。两个细胞珠粒中的分析物可附接至第二分区特异性条形码1386。封装在第三分区1308中的两个细胞珠粒可各自接收第三分区特异性条形码1388。两个细胞珠粒中的分析物可附接至第三分区特异性条形码1388。
此后,可将第一多个分区或其中的细胞珠粒汇集并重新分区1360到第二多个分区中,例如包括第四分区1310、第五分区1312和第六分区1314。可以用细胞珠粒使分区超载,使得分区包含多个细胞珠粒1304中的多于一个细胞珠粒。可将分区特异性条形码递送到每个分区中的相应细胞珠粒。例如,衍生自第一分区1305、第二分区1306和第三分区1308中的每一个的封装在第四分区1310中的三个细胞珠粒可各自接收第四分区特异性条形码1390。三个细胞珠粒中的分析物可以附接到第四分区特异性条形码1390,使得衍生自第一分区1305的细胞珠粒中的分析物附接到第一分区特异性条形码1384和第四分区特异性条形码1390两者,衍生自第二分区1306的细胞珠粒中的分析物附接到第二分区特异性条形码1386和第四分区特异性条形码1390两者,并且衍生自第三分区1308的细胞珠粒中的分析物附接到第三分区特异性条形码1388和第四分区特异性条形码1390两者。例如,衍生自第一分区1305和第三分区1308中的每一个的封装在第五分区1312中的两个细胞珠粒可各自接收第五分区特异性条形码1392。两个细胞珠粒中的分析物可以附接到第五分区特异性条形码1392,使得衍生自第一细胞珠粒1305的细胞珠粒中的分析物附接到第一分区特异性条形码1384和第五分区特异性条形码1392两者,以及衍生自第三分区1308的细胞珠粒中的分析物附接到第三分区特异性条形码1388和第五分区特异性条形码1392两者。例如,衍生自第一分区1305、第二分区1306和第三分区1308中的每一个的封装在第六分区1314中的三个细胞珠粒可各自接收第六分区特异性条形码1394。三个细胞珠粒中的分析物可以附接到第六分区特异性条形码1394,使得衍生自第一分区1305的细胞珠粒中的分析物附接到第一分区特异性条形码1384和第六分区特异性条形码1394两者,衍生自第二分区1306的细胞珠粒中的分析物附接到第二分区特异性条形码1386和第六分区特异性条形码1394,并且衍生自第三分区1308的细胞珠粒中的分析物附接到第三分区特异性条形码1388和第六分区特异性条形码1394两者。此后,可将第二个多个分区或其中的细胞珠粒汇集并重新分区1370任意次数到随后的多个分区中,使得细胞珠粒中的分析物在每个超载分区循环接收分区特异性条形码。有益地,附接到分析物的条形码的独特组合(对于同一细胞珠粒中的分析物相同)可以将分析物与衍生自其他细胞珠粒(或细胞)的分析物区分开来。
细胞珠粒可包含一个或多个包含条形码序列的附接的复合条形码分子。与单个细胞珠粒相缔合的条形码序列可以是相同的,或者包含部分相同的序列。在一些情况下,与单个细胞珠粒相缔合的条形码序列可以是不同的,或者包含部分不同(例如,独特)的序列。在一些情况下,细胞珠粒可附接到约1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000或100000000000个复合条形码分子。在一些情况下,细胞珠粒可与至少约1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000或更多个复合条形码分子相缔合。在一些情况下,细胞珠粒可与少于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、500000、1000000、5000000、10000000、50000000、1000000000、5000000000、10000000000、50000000000或100000000000个复合条形码分子相缔合。
单个条形码文库,例如细胞或细胞珠粒的条形码化的文库,可包括一个或多个条形码化细胞或细胞珠粒。在一些情况下,单个条形码文库可包括约1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000或100000000000个单个条形码化细胞或细胞珠粒。在一些情况下,文库可包括至少约1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000或更多个单个条形码化细胞或细胞珠粒。在一些情况下,每个文库可包括少于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、500000、1000000、5000000、10000000、50000000、1000000000、5000000000、10000000000、50000000000或100000000000个单个条形码化细胞或细胞珠粒。文库中的条形码化细胞或细胞珠粒可具有相同的序列或不同的序列。
在一些情况下,条形码文库中的细胞或细胞珠粒可具有独特的条形码序列。然而,条形码文库中具有独特条形码序列的细胞或细胞珠粒的数量可能受到组合极限的限制。例如,使用四种不同的核苷酸,如果条形码的长度为12个核苷酸,则独特结构的数量可能限制为412=16777216个独特结构。如果条形码文库包括比16777216多得多的细胞,则在这种情况下,可能有一些文库具有相同条形码的多个拷贝。在一些情况下,给定文库中相同条形码的多个拷贝的百分比可为1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%或50%。在一些情况下,给定文库中相同条形码的多个拷贝的百分比可大于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、50%或更高。在一些情况下,给定文库中相同条形码的多个拷贝的百分比可小于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、40%或50%。
在一些情况下,每个细胞或细胞珠粒可包含一个独特的条形码序列,但包含多个不同的随机N-聚体。在一些情况下,每个细胞或细胞珠粒可具有一个或多个不同的随机N-聚体。同样,条形码文库中具有不同随机N-聚体的细胞或细胞珠粒的数量可受到组合极限的限制。例如,使用四种不同的核苷酸,如果N-聚体序列的长度为12个核苷酸,则不同结构的数量可以限制为412=16777216个不同的结构。如果条形码文库可包含比16777216多得多的细胞或细胞珠粒,则在这种情况下,可能会有一些文库具有相同N-聚体序列的多个拷贝。在一些情况下,给定文库中相同N-聚体序列的多个拷贝的百分比可为1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%或50%。在一些情况下,给定文库中相同N-聚体序列的多个拷贝的百分比可大于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、50%或更高。在一些情况下,给定文库中相同N-聚体序列的多个拷贝的百分比可小于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、40%或50%。
因此,本文提供了处理细胞的方法,包括:(a)将多个细胞和包含条形码序列的多个核酸条形码分子分区到多个分区中,其中多个分区中的一个分区包含多个细胞中的第一细胞和多个核酸条形码分子中的第一条形码分子,其中第一条形码分子包含第一条形码序列,其对于多个分区中的该分区是独特的;(b)在该分区中,将第一条形码分子附接到第一细胞的表面,其中第一条形码序列不同于在多个分区的其他分区中的其他条形码序列;(c)从多个分区汇集来自多个细胞的细胞,所述多个细胞包括第一细胞;(d)将多个细胞和附加的多个核酸条形码分子重新分区到附加的多个分区中,其中附加的多个分区中的一个分区包括第一细胞和一个附加条形码分子,所述附加条形码分子包含对附加的多个分区的该分区独特的附加条形码序列;(e)在(d)的分区中,将附加条形码分子偶联到第一条形码分子,从而用核酸复合条形码分子索引第一细胞,该核酸复合条形码分子包含有包含第一条形码序列和附加条形码序列的复合条形码序列,其中核酸复合条形码分子包含被配置为捕获分析物的捕获序列。
在一些情况下,在(e)之后,将(c)-(e)重复N次,其中N是大于或等于1的整数,并且其中复合条形码序列包含第一条形码序列和N+1个附加条形码序列。根据权利要求2所述的方法,其中第(N+1)条形码分子被配置为偶联到第N条形码化的核酸分子。在一些情况下,方法还包括在(a)之前将细胞偶联剂偶联到第一细胞的表面,其中将细胞偶联剂偶联到被配置为偶联到第一条形码分子的寡核苷酸。在一些情况下,在(a)之前,将多个细胞偶联剂偶联至第一细胞的表面,其中多个细胞偶联剂包含所述细胞偶联剂。
在一些情况下,第一条形码分子被配置为偶联到第二条形码分子。在一些情况下,第一条形码分子被配置为偶联到一个或多个夹板分子,其中一个或多个夹板分子被配置为偶联到第二条形码分子。在一些情况下,细胞偶联剂包含肽或多肽。在一些情况下,肽或多肽被配置为与第一细胞的细胞表面上的抗原偶联。在一些情况下,肽或多肽被配置为与第一细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,细胞偶联剂包含脂质分子,其中脂质分子被配置为嵌入第一细胞的细胞膜中,且寡核苷酸被配置为与第一条形码分子偶联。在一些情况下,细胞偶联剂包含二硫键。
在一些情况下,方法还包括,在用包含复合条形码序列的核酸复合条形码分子索引第一细胞之后,将第一细胞分区到第三分区中。在一些情况下,方法还包括将包含复合条形码序列的核酸复合条形码分子偶联到分析物,其中分析物是第一细胞的细胞分析物,由此产生条形码化分析物。在一些情况下,方法还包括确定条形码化分析物的序列,其中所确定的条形码化分析物的序列包含复合条形码序列或其互补序列。在一些情况下,方法还包括,使用复合条形码序列或其互补序列将分析物识别为第一细胞的细胞分析物。在一些情况下,方法还包括在第三分区中裂解细胞以释放分析物。在一些情况下,分析物选自核糖核酸(RNA)分子、DNA分子、gDNA分子、蛋白质或其任何组合。在一些情况下,RNA分子是信使RNA(mRNA)分子。
在一些情况下,方法还包括从细胞表面释放细胞偶联剂或从细胞偶联剂释放寡核苷酸。在一些情况下,释放细胞偶联剂包括切割二硫键。在一些情况下,分区是液滴。在一些情况下,分区是孔。在一些情况下,分区是微孔或纳米孔。在一些情况下,分区是纳米孔,其中纳米孔来自纳米孔阵列。在一些情况下,微孔来自96孔板或384孔板。在一些情况下,在(a)之后,分区包含多于一个细胞。
在一些情况下,在(e)之后,将(c)-(e)重复2次,其中在(d)中,附加的多个分区包括至少96个分区。在一些情况下,在(e)之后,将(c)-(e)重复3次。在一些情况下,对多个细胞中的每个细胞进行(a)-(e),并且其中在(e)之后,多个细胞中的相应细胞的至少99%各自包含对多个细胞中的相应细胞独特的相应复合条形码序列。
用于样品隔室化的系统和方法
一方面,本文所述的系统和方法提供了用于将一个或多个颗粒(例如,生物颗粒、生物颗粒的细胞内分析物、珠粒、试剂等)隔室化、沉积或分区到离散的隔室或分区(在此可互换地称为分区),其中每个分区保持其自身内容物与其他分区的内容物分开。分区可以是乳液中的液滴。分区可以包括一个或多个其他分区。
分区可以包含一个或多个颗粒。分区可以包含一种或多种类型的颗粒。例如,本公开的分区可以包含一个或多个生物颗粒和/或其细胞内分析物。分区可以包含一个或多个凝胶珠粒。分区可包含一个或多个细胞珠粒。分区可包含单个凝胶珠粒、单个细胞珠粒、或单个细胞珠粒和单个凝胶珠粒两者。分区可以包含一种或多种试剂。或者,可以不占据分区。例如,分区可以不包含珠粒。细胞珠粒可以是生物颗粒和/或一种或多种诸如经由包含生物颗粒和能够聚合或胶凝的前体的液滴的聚合而包封在凝胶或聚合物基质内部的其细胞内分析物。如本文其他地方所述,可以在液滴产生之前、之后或与之同时,将诸如条形码的独特标识符诸如通过微囊(例如,珠粒)注入液滴中。如本文所述,微流体通道网络(例如,在芯片上)可用于产生分区。在单个生物颗粒的分区中还可以采用替代机制,包括多孔膜,细胞的水性混合物通过该多孔膜被挤出成非水性流体。
分区在流体流中是可流动的。分区可包括例如具有围绕内部流体中心或核心的外部屏障的微泡。在一些情况下,分区可以包括能够将材料夹带和/或保持在其基质内的多孔基质。分区可以是第二相内的第一相的液滴,其中第一相和第二相是不混溶的。例如,分区可以是非水性连续相(例如油相)内的水性流体的液滴。在另一个示例中,分区可以是水性相内的非水性流体的液滴。在一些示例中,分区可以以油包水乳液或水包油乳液的形式提供。在例如美国专利申请公开第2014/0155295号(出于所有目的将其全部通过引用并入本文)中描述了各种不同的容器。例如,在美国专利申请公开号2010/0105112中描述了用于在非水性或油连续相中产生稳定的液滴的乳液体系,出于所有目的将该专利申请通过引用整体并入本文。
在乳液中的液滴的情况下,在一个非限制性示例中,可通过将水性流体中的颗粒的流动流引入非水性流体的流动流中来实现将单个颗粒分配到离散的分区中,从而使得在两个流动流的交汇处生成液滴。可以调节流体特性(例如,流体流速、流体粘度等)、颗粒特性(例如,体积分数、粒径、颗粒浓度等)、微流体架构(例如,通道几何形状等)以及其他参数以控制所得分区的占据率(例如,每个分区的生物颗粒数量、每个分区的珠粒数量等)。例如,可以通过以一定浓度和/或颗粒流速提供水流来控制分区占据率。为了产生单个生物颗粒分区,可以选择不混溶流体的相对流速,以使得分区中的每个分区平均可以包含少于一种生物颗粒,以确保被占据的那些分区主要被单个占据。在一些情况下,多个分区中的分区可以包含至多一种生物颗粒(例如,珠粒、DNA、细胞或细胞材料)。在一些情况下,可以选择或调整各种参数(例如,流体性质、颗粒性质、微流体架构等),使得占据大多数分区,例如,仅允许小百分比的未被占据分区。可以控制流动和通道架构,以确保给定数量的单个占据的分区少于一定水平的未被占据分区和/或少于一定水平的多重占据的分区。
图1示出了用于对单个生物颗粒进行分区的微流体通道结构100的示例。通道结构100可以包括在通道交汇部110处连通的通道区段102、104、106和108。在操作中,包含悬浮的生物颗粒(或细胞)114的第一水性流体112可以沿着通道区段102被递送到交汇部110,而与水性流体112不混溶的第二流体116从通道区段104和106中的每一个被递送至交汇部110,以产生第一水性流体112的离散液滴118、120,该离散液滴118、120流入通道区段108,并远离交汇部110流动。通道区段108可以流体联接至出口储器,其中离散的液滴可以在该出口储器中存储和/或收集。产生的离散液滴可包含单个生物颗粒114(诸如液滴118)。产生的离散液滴可包含多于一个的单个生物颗粒114(图1中未示出)。离散的液滴可以不包含生物颗粒114(诸如液滴120)。每个离散的分区可以保持其自身内容物(例如,单个生物颗粒114)与其他分区的内容物分离。
第二流体116可以包括油,诸如氟化油,其包括用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴118、120的后续聚结。在例如美国专利申请公开第2010/0105112号中描述了特别有用的分区流体和含氟表面活性剂的示例,出于所有目的,该专利通过引用整体并入本文。
应理解,本文所述的通道区段可联接至各种不同的流体源或接收部件中的任何一个,包括储器、管道、歧管或其他系统的流体部件。应理解,微流体通道结构100可以具有其他几何形状。例如,微流体通道结构可以具有多于一个的通道交汇部。例如,微流体通道结构可具有2、3、4或5个通道区段,每个通道区段携带在通道交汇部相遇的颗粒(例如,生物颗粒、细胞珠粒和/或凝胶珠粒)。可以经由一个或多个流体流动单元引导流体沿着一个或多个通道或储器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可以或以其他方式经由施加的压差、离心力、电动泵送、真空、毛细管或重力流等来控制流体。
产生的液滴可以包括液滴的两个子集:(1)包含一个或多个生物颗粒114的被占据的液滴118,以及(2)不包含任何生物颗粒114的未被占据的液滴120。被占据的液滴118可以包括单一被占据的液滴(具有一个生物颗粒)和多重被占据的液滴(具有多于一个生物颗粒)。如本文其他地方所述,在一些情况下,大多数被占据的分区的每个分区可以包含不超过一个生物颗粒,并且一些生成的分区可以是未被占据的(任何生物颗粒)。但是,在一些情况下,一些被占据的分区可包含多于一个生物颗粒。在一些情况下,可以控制分区过程,以使得少于约25%的被占据分区的每个分区包含多于一个生物颗粒,并且在许多情况下,少于约20%的被占据分区的每个分区具有多于一个生物颗粒,而在一些情况下,少于约10%或甚至少于约5%的被占据分区的每个分区包括多于一个生物颗粒。
在一些情况下,可期望最小化地生成过多数量的空分区,以降低成本和/或提高效率。尽管可以通过在分区交汇部110处提供足够数量的生物颗粒(例如,生物颗粒114)来实现这种最小化,以确保至少一个生物颗粒被封装在分区中,但泊松分布可能预期会增加包含多个生物颗粒的分区的数量。如此一来,在要获得单一占据分区的情况下,至多约95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更少的生成的分区可以被占据。
在一些情况下,可以控制一种或多种生物颗粒(例如,在通道区段102中)或被引导进入分区交汇部的其他流体(例如,在通道区段104、106中)的流动,以使得在许多情况下,不超过约50%的已生成分区、不超过约25%的已生成分区或不超过约10%的已生成分区未被占据。可以控制这些流动,以提供单一占据分区的非泊松分布,同时提供低水平的未被占据分区。可以实现未被占据分区的上述指出范围,同时仍然提供上述的单一占据率中的任何一个。例如,在许多情况下,本文所述的系统和方法的使用可以生成具有小于约25%、小于约20%、小于约15%、小于约10%,并且在许多情况下小于约5%的多重占据率的所得分区,而未被占据分区小于约50%、小于约40%、小于约30%、小于约20%、小于约10%、小于约5%或更少。
应理解,上述占据率也适用于既包含生物颗粒又包含其他试剂的分区,包括但不限于携带条形码化的核酸分子(例如寡核苷酸)的微囊或珠粒(例如凝胶珠粒)(关于图2描述)。被占据分区(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的被占据分区)可以包含有包含条形码化的核酸分子的微囊(例如珠粒)和生物颗粒两者。
在另一方面,除了基于液滴的分区或作为基于液滴的分区的替代,生物颗粒可以被包封在微囊内,该微囊包括外壳、层或多孔基质,在微囊中夹带了一个或多个单独的生物颗粒或小的生物颗粒群组。微囊可以包含其他试剂。生物颗粒的包封可以通过多种方法进行。这样的方法可以将含有生物颗粒的水性流体与聚合物前体材料组合,该聚合物前体材料在向聚合物前体施加特定的刺激时能够形成凝胶或其他固体或半固体基质。这样的刺激可以包括例如热刺激(例如,加热或冷却)、光刺激(例如,通过光固化)、化学刺激(例如,通过交联、前体的聚合引发(例如,通过添加的引发剂))、机械刺激或其组合。
可以通过各种方法制备包含生物颗粒的微囊。例如,气刀液滴或气雾剂发生器可用于将前体流体的液滴分配到胶凝溶液中,以形成包括单个生物颗粒或小的生物颗粒群组的微囊。同样,基于膜的封装体系可以用于产生包含如本文所述的封装的生物颗粒的微囊。诸如图1所示的本公开的微流体系统可以容易地用于封装如本文所述的细胞。特别地,并且参考图1,包含(i)生物颗粒114和(ii)聚合物前体材料(未示出)的水性流体112流入通道交汇部110,水性流体112在所述通道交汇部110处通过非水性流体116的流动被分区成液滴118、120。在封装方法的情况下,非水性流体116还可以包含引发剂(未示出),以引起聚合物前体的聚合和/或交联,从而形成包含所夹带的生物颗粒的微囊。聚合物前体/引发剂对的示例包括在美国专利申请公开号2014/0378345中描述的那些,该申请出于所有目的通过引用整体并入本文。
例如,在聚合物前体材料包含线性聚合物材料例如线性聚丙烯酰胺、PEG或其他线性聚合物材料的情况下,活化剂可以包含交联剂,或激活在所形成的液滴内的交联剂的化学品。同样,对于包含可聚合单体的聚合物前体,活化剂可以包含聚合引发剂。例如,在某些情况下,当聚合物前体包含丙烯酰胺单体与N,N’-双-(丙烯酰基)胱胺(BAC)共聚单体的混合物时,可在通道区段104和106中的第二流体流116内提供试剂例如四乙基甲二胺(TEMED),该试剂可以引发丙烯酰胺和BAC共聚成交联的聚合物网络或水凝胶。
在液滴形成期间,一旦第二流体流116与第一流体流112在交汇部110接触,TEMED可从第二流体116扩散至包含线性聚丙烯酰胺的水性流体112中,这将激活液滴118、120内聚丙烯酰胺的交联,导致形成夹带细胞114的固体或半固体珠粒或颗粒形式的凝胶(例如水凝胶)微囊。虽然从聚丙烯酰胺封装的角度进行了描述,但在本文所述的方法和组合物的上下文中也可采用其他“可激活的”封装组合物。例如,可使用藻酸盐液滴形成及随后暴露于二价金属离子(例如Ca2+离子)作为使用所述方法的封装过程。同样地,还可通过基于温度的胶凝(例如,在冷却后等),将琼脂糖液滴转化成胶囊。
在一些情况下,封装的生物颗粒可以例如通过时间的流逝或在施加特定刺激时从微囊中选择性地释放出来,所述特定刺激足以降解微囊以使得生物颗粒(例如细胞)或其他内容物从微囊中释放出来,例如释放到分区(例如液滴)中。例如,在上述聚丙烯酰胺聚合物的情况下,微囊的降解可通过引入合适的还原剂诸如DTT等来实现,以裂解使聚合物基质交联的二硫键。参见,例如,美国专利申请公开第2014/0378345号,其出于所有目的通过引用整体并入本文。
生物颗粒可以经受足以使前体聚合或胶凝的其他条件。足以使前体聚合或胶凝的条件可以包括暴露于加热、冷却、电磁辐射和/或光。足以使前体聚合或胶凝的条件可以包括足以使前体聚合或胶凝的任何条件。在聚合或胶凝之后,可以在生物颗粒周围形成聚合物或凝胶。所述聚合物或凝胶对于化学试剂或生化试剂来说可以是扩散渗透性的。聚合物或凝胶对于生物颗粒的细胞内分析物来说可以是不可扩散渗透性的。以这种方式,聚合物或凝胶可以起到使生物颗粒经受化学或生化操作的作用,同时将细胞内分析物在空间上限制在由聚合物或凝胶限定的液滴的区域中。聚合物或凝胶可包括经二硫化物交联的聚丙烯酰胺、琼脂糖、藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG-丙烯酸酯、PEG-硫醇、PEG-叠氮化物、PEG-炔烃、其他丙烯酸酯、壳聚糖、透明质酸、胶原蛋白、纤维蛋白、明胶或弹性蛋白中的一种或多种。聚合物或凝胶可包括任何其他聚合物或凝胶。
可以将聚合物或凝胶功能化以结合至靶向的分析物,例如核酸、蛋白质、碳水化合物、脂质或其他分析物。聚合物或凝胶可以经由被动机制聚合或胶凝。聚合物或凝胶在碱性条件或高温下可以是稳定的。聚合物或凝胶可具有与珠粒的机械性能类似的机械性能。例如,聚合物或凝胶可以具有与珠粒相似的尺寸。聚合物或凝胶可具有与珠粒相似的机械强度(例如抗张强度)。聚合物或凝胶的密度可低于油。聚合物或凝胶的密度可大致类似于缓冲剂的密度。聚合物或凝胶可具有可调的孔径。可以选择孔径以例如保留变性的核酸。可以选择孔径以维持对外源化学品(诸如氢氧化钠(NaOH))和/或内源化学品(诸如抑制剂)的扩散渗透性。聚合物或凝胶可以是生物相容性的。聚合物或凝胶可以维持或增强细胞活力。聚合物或凝胶可以是生物化学相容性的。聚合物或凝胶可以通过热、化学、酶促和/或光学方式聚合和/或解聚。
该聚合物可以包括通过以二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物的制备可以包括两步反应。在第一活化步骤中,可以将聚(丙烯酰胺-共-丙烯酸)暴露于酰化剂以将羧酸转化成酯。例如,可以将聚(丙烯酰胺-共-丙烯酸)暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓氯化物(DMTMM)。可以将聚丙烯酰胺-共-丙烯酸暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓的其他盐。在第二交联步骤中,可以将在第一步骤中形成的酯暴露于二硫化物交联剂。例如,可以将该酯暴露于胱胺(2,2'-二硫代双(乙胺))。按照这两个步骤,生物颗粒可以被通过二硫键连接在一起的聚丙烯酰胺链围绕。以这种方式,生物颗粒可以被包封在凝胶或基质(例如,聚合物基质)内部或包含凝胶或基质(例如,聚合物基质)以形成“细胞珠粒”。细胞珠粒可包含生物颗粒(例如,细胞)或生物颗粒的细胞内分析物(例如,RNA、DNA、蛋白质等)。细胞珠粒可包含单个细胞或多个细胞,或单个细胞或多个细胞的衍生物。例如,在裂解和洗涤细胞之后,可以将抑制组分从细胞裂解物中洗掉,并且细胞内分析物可以结合作为细胞珠粒。本文公开的系统和方法可适用于包含生物颗粒的细胞珠粒(和/或液滴或其他分区)和包含生物颗粒的细胞内分析物的细胞珠粒(和/或液滴或其他分区)。
封装的生物颗粒可以提供比经基于液滴的分区的生物颗粒更易于储存和更便携的某些潜在的优势。此外,在一些情况下,可能希望在分析之前将生物颗粒温育选定的时间段,诸如,以便在存在或不存在不同刺激的情况下表征此类生物颗粒随时间的变化。在这种情况下,封装可以比在乳液液滴中的分区允许更长的温育时间,但在一些情况下,也可以将经液滴分区的生物颗粒温育不同的时间段,例如至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时或至少10小时或更长时间。生物颗粒的封装可以构成将其他试剂共分区到生物颗粒中的生物颗粒的分区。替代地或另外,封装的生物颗粒可以容易地沉积到如上所述的其他分区(例如,液滴)中。
如本文所述,可以在分区中执行一个或多个过程,分区可以是孔。该孔可以是基板的多个孔中的孔,例如微孔阵列或板的微孔,或者孔可以是包括基板的装置(例如微流体装置)的微孔或微腔室。孔可以是孔阵列或板的孔,或者孔可以是装置(例如,流体装置)的孔或腔室。因此,孔或微孔可呈现“开放”配置,其中孔或微孔暴露于环境(例如,包含开放表面)且可在所述基板的一个平面上触及,或者孔或微孔可呈现“封闭”或“密封”配置,其中在基板的平面上无法触及微孔。在一些情况下,孔或微孔可被配置为在“开放”和“封闭”配置之间切换。例如,如本文其他地方所述,可以使用膜(例如,半透膜)、油(例如,覆盖水溶液的氟化油)或盖来“封闭”或“密封”“开放”微孔或微孔集合。
孔的体积可小于1毫升(mL)。例如,孔可被配置为容纳至多1000微升(μL)、至多100μL、至多10μL、至多1μL、至多100纳升(nL)、至多10nL、至多1nL、至多100皮升(pL)、至多10(pL)或更少的体积。孔可被配置为容纳约1000μL、约100μL、约10μL、约1μL、约100nL、约10nL、约1nL、约100pL、约10pL等的体积。孔可被配置为容纳至少10pL、至少100pL、至少1nL、至少10nL、至少100nL、至少1μL、至少10μL、至少100μL、至少1000μL或更多的体积。孔可被配置为容纳本文所列体积范围内的体积,例如,约5nL至约20nL、约1nL至约100nL、约500pL至约100μL等。孔可以是具有不同体积的多个孔,并且可被配置为容纳适合于容纳本文所述的任何分区体积的体积。
在一些情况下,微孔阵列或板包括单一种类的微孔。在一些情况下,微孔阵列或板包括多种微孔。例如,微孔阵列或板可包括单个微孔阵列或板内的一种或多种类型的微孔。微孔类型可具有不同的尺寸(例如,长度、宽度、直径、深度、横截面积等)、形状(例如,圆形、三角形、方形、矩形、五边形、六边形、七边形、八边形、九边形、十边形等)、长宽比或其他物理特征。微孔阵列或板可以包括任意数量的不同类型的微孔。例如,微孔阵列或板可包括1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个不同类型的微孔。孔可以具有任何尺寸(例如,长度、宽度、直径、深度、横截面积、体积等)、形状(例如,圆形、三角形、方形、矩形、五边形、六边形、七边形、八边形、九边形、十边形、其他多边形等)、长宽比或本文所述的关于任何孔的其他物理特征。
在一些情况下,微孔阵列或板包括不同类型的微孔,其在阵列或板内彼此相邻放置。例如,具有一组尺寸的微孔可以与具有不同组的尺寸的另一微孔相邻放置并与之接触。类似地,不同几何形状的微孔可以彼此相邻放置或彼此接触。相邻的微孔可被配置为容纳不同的物品;例如,一个微孔可用于容纳细胞、细胞珠粒或其他样品(例如,细胞组分、核酸分子等),而相邻微孔可用于包含微囊、液滴、珠粒或其他试剂。在一些情况下,相邻微孔可被配置为,例如在施加刺激时,或自发地在接触每个微孔中的物品时,合并其中保持的内容物。
如本文其他地方所述,可在本文所述的系统、组合物和方法中使用多个分区。例如,可以生成或以其他方式提供任何适当数量的分区(例如,孔或液滴)。例如,在使用孔的情况下,可以生成或以其他方式提供至少约1,000个孔、至少约5,000个孔、至少约10,000个孔、至少约50,000个孔、至少约100,000个孔、至少约500,000个孔、至少约1,000,000个孔、至少约5,000,000个孔、至少约10,000,000个孔、至少约50,000,000个孔、至少约100,000,000个孔、至少约500,000,000个孔、至少约1,000,000,000个孔或更多个孔。此外,多个孔可包括未被占据的孔(例如,空孔)和被占据的孔。
孔可包含本文所述的任何试剂或其组合。这些试剂可包括例如,条形码分子、酶、衔接子及其组合。可以使试剂与放置在孔中的样品(例如,细胞、细胞珠粒或细胞组分,例如蛋白质、核酸分子等)物理分离。这种物理分离可以通过将试剂包含在或偶联到放置在孔内的微囊或珠粒来实现。物理分离也可以通过在将多核苷酸样品引入孔中之前在孔中分配试剂并用例如可溶解、可熔化或可渗透的层覆盖试剂来实现。例如,该层可以是油、蜡、膜(例如,半透膜)等。该孔可在任何时刻被密封,例如,在添加微囊或珠粒后,在添加试剂后,或在添加这些组分中的任何一种后。孔的密封可用于多种目的,包括防止珠粒或加载试剂从孔中逸出,允许选择递送某些试剂(例如,通过使用半透膜),用于在进一步处理之前或之后储存孔等。
孔可包含游离试剂和/或封装在微囊、珠粒或液滴中的试剂,或以其他方式与微囊、珠粒或液滴偶联或缔合的试剂。本公开中所述的任何试剂都可以用任何适合于涉及生物分子(例如但不限于核酸分子和蛋白质)的样品处理反应的化学品、颗粒和元件封装在微囊、液滴或珠粒中,或以其他方式偶联到微囊、液滴或珠粒。例如,用于DNA测序的样品制备反应中的珠粒或液滴可包含以下试剂中的一种或多种:酶、限制性酶(例如,多重切割器)、连接酶、聚合酶、荧光团、寡核苷酸条形码、衔接子、缓冲剂、核苷酸(例如,dNTP、ddNTP)等。
试剂的其他示例包括但不限于:缓冲剂、酸性溶液、碱性溶液、温度敏感酶、pH敏感酶、光敏酶、金属、金属离子、氯化镁、氯化钠、锰、水性缓冲剂、温和缓冲剂、离子缓冲剂、抑制剂、酶、蛋白质、多核苷酸、抗体、糖、脂质、油、盐、离子、洗涤剂、离子洗涤剂、非离子洗涤剂、寡核苷酸、核苷酸、脱氧核糖核苷酸三磷酸(dNTP)、双脱氧核糖核苷酸三磷酸(ddNTP)、DNA、RNA、肽多核苷酸、互补DNA(cDNA)、双链DNA(dsDNA)、单链DNA(ssDNA)、质粒DNA、粘粒DNA、染色体DNA、基因组DNA、病毒DNA、细菌DNA、mtDNA(线粒体DNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、微小RNA、dsRNA、核酶、核糖开关和病毒RNA、聚合酶、连接酶、限制性酶、蛋白酶、核酸酶、蛋白酶抑制剂、核酸酶抑制剂、螯合剂、还原剂、氧化剂、荧光团、探针、生色团、染料、有机物、乳化剂、表面活性剂、稳定剂、聚合物、水、小分子、药物、放射性分子、防腐剂、抗生素、适体和药学药物化合物。如本文所述,孔中的一种或多种试剂可用于执行一个或多个反应,包括但不限于:细胞裂解,细胞固定,透化,核酸反应,例如核酸延伸反应、扩增、逆转录、转座酶反应(例如标签化)等。
孔可以作为试剂盒的一部分提供。例如,试剂盒可包括使用说明、微孔阵列或装置以及试剂(例如,珠粒)。试剂盒可包括用于执行本文所述过程,例如核酸反应、核酸分子的条形码化、样品处理(例如用于细胞裂解、固定和/或透化)的任何有用试剂。
在一些情况下,孔包含微囊、珠粒或液滴,其包含一组具有类似属性的试剂(例如,一组酶、一组矿物质、一组寡核苷酸、不同条形码分子的混合物、相同条形码分子的混合物)。在其他情况下,微囊、珠粒或液滴包含试剂的非均相混合物。在一些情况下,试剂的非均相混合物可包含进行反应所必需的所有组分。在一些情况下,除了进行反应所必需的1、2、3、4、5或更多个组分之外,此类混合物可包含进行反应所必需的所有组分。在一些情况下,此类附加组分包含在不同的微囊、液滴或珠粒中或以其他方式与其偶联,或包含在系统分区(例如微孔)内的溶液中。
图14示意性地示出了微孔阵列的示例。该阵列可包含在基板1400内。基板1400包括多个孔1402。孔1002可以具有任何尺寸或形状,并且孔之间的间距、每个基板的孔数以及基板1400上孔的密度可以根据特定应用进行修改。在一个这样的示例性应用中,将可包含细胞或细胞组分(例如,核酸分子)的样品分子1406与珠粒1004进行共分区,珠粒1004可包含与其偶联的核酸条形码分子。可以使用重力或其他加载技术(例如,离心、液体处理器、声学加载、光电等)加载孔1002。在一些情况下,孔1402中的至少一个包含单个样品分子1406(例如,细胞)和单个珠粒1404。
可以将试剂依次或同时加载到孔中。在一些情况下,在特定操作之前或之后将试剂引入装置中。在一些情况下,依次引入试剂(其在某些情况下,可以微囊、液滴或珠粒提供),使得在不同的步骤中发生不同的反应或操作。也可在穿插有反应或操作步骤的操作中加载试剂(或微囊、液滴或珠粒)。例如,可将包含用于使多核苷酸片段化的试剂(例如,限制性酶)和/或其他酶(例如,转座酶、连接酶、聚合酶等)的微囊(或液滴或珠粒)加载到孔或多个孔中,然后加载包含用于将核酸条形码分子附接到样品核酸分子的试剂的微囊、液滴或珠粒。试剂可与样品,例如细胞或细胞组分(例如细胞器、蛋白质、核酸分子、碳水化合物、脂质等)同时或依次提供。因此,在执行多步骤操作或反应时,使用孔可以是有用的。
如本文其他地方所述,核酸条形码分子和其他试剂可包含在微囊、珠粒或液滴内。这些微囊、珠粒或液滴可在加载细胞之前、之后或同时被加载到分区(例如,微孔)中,使得每个细胞与不同的微囊、珠粒或液滴接触。该技术可用于将独特的核酸条形码分子附接到从每个细胞获得的核酸分子上。替代地或除此之外,可将样品核酸分子附接到支持物。例如,分区(例如,微孔)可包含珠粒,该珠粒已偶联有多个核酸条形码分子。可将样品核酸分子或其衍生物偶联或附接到支持物上的核酸条形码分子。然后可将所得的条形码化核酸分子从分区中移除,并且在一些情况下,可以对其进行汇集和测序。在这种情况下,核酸条形码序列可用于追踪样品核酸分子的来源。例如,可将具有相同条形码的多核苷酸确定为源自相同的细胞或分区,而可将具有不同条形码的多核苷酸确定为源自不同的细胞或分区。
可采用多种方法将样品或试剂加载到孔或微孔中。可通过如下将样品(例如,细胞、细胞珠粒或细胞组分)或试剂(如本文所述)加载到孔或微孔中:使用外力(例如重力、电力、磁力),或使用机构例如通过压力驱动流、离心、光电方式、声学加载、电动泵送、真空、毛细管流等来驱动样品或试剂进入孔中。在某些情况下,可以使用流体处理系统将样品或试剂加载到孔中。样品或试剂的加载可遵循泊松分布或非泊松分布,例如超泊松或亚泊松。微孔的几何形状、孔间距、密度和大小可以修改,以适应有用的样品或试剂分布;例如,可以调整微孔的大小和间距,使得样品或试剂可以超泊松方式分布。
在一个特定的非限制性示例中,微孔阵列或板包括微孔对,其中每个微孔对被配置为容纳液滴(例如,包括单个细胞)和单个珠粒(例如本文所述的那些,在一些情况下,其也可被封装在液滴中)。液滴和珠粒(或含有珠粒的液滴)可同时或依次加载,并且例如,在液滴和珠粒接触时,或在施加刺激(例如,外力、搅拌、热、光、磁力或电力等)时,液滴和珠粒可合并。在一些情况下,液滴和珠粒的加载是超泊松的。在微孔对的其他示例中,孔被配置为容纳包含不同试剂和/或样品的两个液滴,其在接触或施加刺激时合并。在这种情况下,所述微孔对的一个微孔的液滴可包含可与微孔对的另一个微孔的液滴中的试剂反应的试剂。例如,一个液滴可包含被配置为释放位于相邻微孔中的另一液滴中所含珠粒的核酸条形码分子的试剂。当合并液滴时,核酸条形码分子可从珠粒释放到分区中(例如,微孔或接触的微孔对),并可进行进一步处理(例如,条形码化、核酸反应等)。在其中在微孔中加载完整或活细胞的情况下,液滴中的一个可包含用于在液滴合并时裂解细胞的裂解试剂。
可将液滴或微囊分区到孔中。在将液滴加载到孔中之前,可选择液滴或对其进行预处理。例如,液滴可包含细胞,且可仅选择某些液滴,例如包含单个细胞(或至少一个细胞)的液滴,以用于孔的加载。这种预选择过程可用于有效加载单个细胞,例如以获得非泊松分布,或在孔中进一步分区之前针对所选特征对细胞进行预滤选。此外,该技术可用于在微孔加载之前或加载期间获得或防止细胞二重态或多重态的形成。
在一些情况下,孔可包含附接在其上的核酸条形码分子。核酸条形码分子可以附接到孔的表面(例如,孔的壁)。一个孔的核酸条形码分子(例如,分区条形码序列)可不同于另一孔的核酸条形码分子,这可以允许识别单个分区或孔中包含的内容物。在一些情况下,核酸条形码分子可以包含空间条形码序列,其可以识别孔的例如在孔阵列或孔板内的空间坐标。在一些情况下,核酸条形码分子可以包含用于单个分子识别的独特分子标识符。在一些情况下,核酸条形码分子可被配置为附接至或捕获分布在孔中的样品或细胞内的核酸分子。例如,核酸条形码分子可包含捕获序列,该捕获序列可用于捕获样品内的核酸分子(例如,RNA、DNA)或与其杂交。在一些情况下,核酸条形码分子可以是可从微孔释放的。例如,核酸条形码分子可包含化学交联剂,其可在施加刺激(例如,光、磁、化学、生物刺激)时被切割。可被杂交或配置为与样品核酸分子杂交的释放的核酸条形码分子,可被收集并汇集以进行进一步处理,这可包括核酸处理(例如,扩增、延伸、逆转录等)和/或表征(例如,测序)。在这种情况下,可以使用独特的分区条形码序列来识别核酸分子起源的细胞或分区。
可以对孔内的样品进行表征。在非限制性示例中,此类表征可包括对样品(例如,细胞、细胞珠粒或细胞组分)或其衍生物进行成像。诸如显微术或成像的表征技术可有助于在固定的空间位置测量样品轮廓。例如,当任选地使用珠粒对细胞进行分区时,每个微孔及其中所含内容物的成像可提供关于细胞双重态形成(例如,频率、空间位置等)、细胞-珠粒对效率、细胞活力、细胞大小、细胞形态、生物标志物(例如,表面标志物、其中荧光标记的分子等)的表达水平、细胞或珠粒加载率、细胞-珠粒对的数量等的有用信息。在一些情况下,成像可用于表征孔中的活细胞,包括但不限于:动态活细胞跟踪、细胞-细胞相互作用(当两个或更多个细胞被共分区时)、细胞增殖等。替代地或除此之外,成像可用于表征孔中的大量扩增产物。
在操作中,孔可以同时或依次加载有样品和试剂。当加载细胞或细胞珠粒时,可对孔进行洗涤,例如以从孔、微孔阵列或板中去除多余的细胞。类似地,可以进行洗涤,以从孔、微孔阵列或板中去除多余的珠粒或其他试剂。在其中使用活细胞的情况下,可以在各单个分区中裂解细胞,以释放细胞内组分或细胞分析物。替代地,可以在各单个分区中固定或透化所述细胞。可将细胞内组分或细胞分析物偶联到支持物,例如微孔表面上的支持物、固体支持物(例如珠粒),或可将其收集以供进一步下游处理。例如,在细胞裂解后,可将细胞内组分或细胞分析物转移到单个液滴或其他分区以进行条形码化。替代地或者除此之外,可将细胞内组分或细胞分析物(例如,核酸分子)偶联到包含核酸条形码分子的珠粒;随后,可收集珠粒并进一步处理,例如进行核酸反应例如逆转录、扩增或延伸,并且可例如通过测序进一步表征其上的核酸分子。替代地或者除此之外,可以在孔中对细胞内组分或细胞分析物进行条形码化(例如,使用包含可释放的核酸条形码分子的珠粒,或在包含核酸条形码分子的微孔表面上)。可在孔内对条形码化的核酸分子或分析物进一步处理,或可从各单个分区收集条形码化的核酸分子或分析物,并在分区外进行进一步处理。进一步处理可以包括核酸处理(例如,执行扩增、延伸)或表征(例如,扩增分子的荧光监测、测序)。在任何方便或有用的步骤中,可以密封孔(或微孔阵列或板)(例如,使用油、膜、蜡等),这使得能够实现分析或选择性引入的附加试剂的储存。
图15示意性地显示了用于处理样品中核酸分子的示例工作流。可提供包括多个微孔1502的基板1500。可在多个微孔1502中,将可包含细胞、细胞珠粒、细胞组分或分析物(例如,蛋白质和/或核酸分子)的样品1506与包含核酸条形码分子的多个珠粒1504共分区。在过程1510期间,可以在分区内处理样品1506。例如,在活细胞的情况下,可使细胞经受足以裂解细胞并释放其中所含的分析物的条件。在过程1520中,可进一步处理珠粒1504。举例来说,过程1520a和1520b示意性地示出了取决于珠粒1504的性质得不同的工作流程。
在1520a中,珠粒包含与其附接的核酸条形码分子,并且样品核酸分子(例如,RNA、DNA)可例如通过连接杂交附接到核酸条形码分子。这种附接可在珠粒上发生。在过程1530中,可收集并汇集来自多个孔1502的珠粒1504。可在过程1540中执行进一步的处理。例如,可以进行一个或多个核酸反应,例如逆转录、核酸延伸、扩增、连接、转位等。在一些情况下,将衔接子序列连接到核酸分子或其衍生物,如本文其他地方所述。例如,可以将测序引物序列附加到核酸分子的每一端。在过程1550中,可以执行诸如测序的进一步表征以生成测序读取。测序读取可以产生关于单个细胞或细胞群的信息,其可以被视觉地或图形化地表示,例如在绘图1555中。
在1520b中,珠粒包含可释放地与其附接的核酸条形码分子,如下所述。珠粒可降解或以其他方式将核酸条形码分子释放到孔1502中;然后,可以使用核酸条形码分子对孔1502内的核酸分子进行条形码化。可以在分区内部或分区外部执行进一步的处理。例如,可以进行一个或多个核酸反应,例如逆转录、核酸延伸、扩增、连接、转位等。在一些情况下,将衔接子序列连接到核酸分子或其衍生物,如本文其他地方所述。例如,可以将测序引物序列附加到核酸分子的每一端。在过程1550中,可以执行诸如测序的进一步表征以生成测序读取。测序读取可以产生关于单个细胞或细胞群的信息,其可以被视觉地或图形化地表示,例如在绘图1555中。
组合物
本文还提供了组合物,包含:多个细胞,其包含与其偶联的多个核酸条形码分子,其中所述多个细胞中的一个细胞包含偶联到所述细胞的表面的所述多个核酸条形码分子中的一个核酸条形码分子,其中,所述核酸条形码分子包含(i)对所述多个细胞中的所述细胞独特的条形码序列,以及(ii)被配置为捕获分析物的捕获序列。在一些情况下,所述多个细胞以本体溶液中提供。在一些情况下,所述多个细胞被提供在多个分区中。在一些情况下,所述多个分区是多个液滴。
在一些情况下,所述多个分区是多个孔。在一些情况下,所述多个分区是微孔或纳米孔。在一些情况下,所述多个分区是纳米孔阵列中的纳米孔。在一些情况下,多个分区是来自96孔板或384孔板的微孔。
在一些情况下,所述多个分区中的一个分区包含所述细胞。在一些情况下,所述核酸条形码分子通过细胞偶联剂偶联到所述细胞的所述表面。在一些情况下,所述细胞偶联剂包括肽或多肽。在一些情况下,所述肽或多肽与所述细胞的所述表面上的抗原偶联。在一些情况下,所述肽或多肽与所述细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,所述细胞偶联剂包括脂质分子,其中所述脂质分子嵌入所述细胞的细胞膜中。在一些情况下,所述细胞偶联剂包含二硫键。在一些情况下,所述捕获序列包括聚-T序列。在一些情况下,所述捕获序列包括模板转换寡核苷酸序列。在一些情况下,所述捕获序列包括聚-G序列。
系统
本文还提供了系统,其包括:包含多个细胞的多个分区,其中所述多个细胞包含与其偶联的多个核酸条形码分子,其中所述多个分区中的一个分区包含(i)所述多个细胞中的一个细胞,其中,所述细胞包含偶联到所述细胞的表面的所述多个核酸条形码分子中的一个核酸条形码分子,其中所述条形码分子包含对所述多个细胞中的所述细胞独特的条形码序列;(ii)核酸分子,所述核酸分子包含被配置成捕获分析物的捕获序列;以及(iii)试剂,其被配置为将所述核酸分子偶联到所述核酸条形码分子以生成包含所述条形码序列和所述捕获序列的复合条形码分子。
在一些情况下,所述试剂包括夹板分子,其被配置为与所述核酸条形码分子和所述核酸分子中的每一个偶联。在一些情况下,所述多个分区是多个液滴。在一些情况下,多个分区是多个孔。在一些情况下,分区是微孔或纳米孔。在一些情况下,所述分区是所述纳米孔,其中所述纳米孔来自纳米孔阵列。在一些情况下,微孔来自96孔板或384孔板。在一些情况下,所述分区包含多于一个细胞。
在一些情况下,所述核酸条形码分子通过细胞偶联剂偶联到所述细胞的所述表面。在一些情况下,所述细胞偶联剂包括肽或多肽。在一些情况下,所述肽或多肽与所述细胞的所述表面上的抗原偶联。在一些情况下,所述肽或多肽与所述细胞的细胞膜上的碳水化合物基团偶联。在一些情况下,所述细胞偶联剂包括脂质分子,其中所述脂质分子嵌入所述细胞的细胞膜中。在一些情况下,所述细胞偶联剂包含二硫键。在一些情况下,所述捕获序列包括聚-T序列。在一些情况下,所述捕获序列包括模板转换寡核苷酸序列。在一些情况下,所述捕获序列包括聚-G序列。
珠粒
分区可以包含一个或多个独特标识符,如条形码。条形码可以被预先、随后或同时递送到容纳隔室化的或分区的生物颗粒的分区中。例如,条形码可以在液滴产生之前、之后或与之同时注入到液滴中。条形码到特定分区的递送使稍后将单个生物颗粒的特性归属于特定分区。条形码可以经由任何合适的机制例如在核酸分子(例如,寡核苷酸)上递送至分区。条形码化的核酸分子可以通过微囊被递送至分区。在一些情况下,微囊可包含珠粒。下文进一步详细描述珠粒。
在一些情况下,条形码化的核酸分子可以首先与微囊结合,然后从微囊中释放出来。条形码化的核酸分子的释放可以是被动的(例如,通过扩散从微囊中出来)。另外地或替代地,从微囊的释放可以是在施加刺激后进行的,该刺激使得条形码化的核酸分子从微囊解离或释放。这种刺激可以破坏微囊——将条形码化的核酸分子与微囊偶联或偶联在微囊内或两者的相互作用。这种刺激可包括例如热刺激、光刺激、化学刺激(例如pH变化或使用还原剂)、机械刺激、辐射刺激;生物刺激(例如酶)或其任意组合。
图2示出了用于将携带条形码的珠粒递送至液滴的微流体通道结构200的示例。通道结构200可以包括在通道交汇部210处连通的通道区段201、202、204、206和208。在操作中,通道区段201可以将包含多个珠粒214(例如具有核酸分子、寡核苷酸、分子标签)的水性流体212沿着通道区段201递送到交汇部210中。多个珠粒214可以源自珠粒的悬浮液。例如,通道区段201可以与包含珠粒214的水性悬浮液的储器连接。通道区段202可以将包含多个生物颗粒216的水性流体212沿着通道区段202输送到交汇部210中。多个生物颗粒216可以源自生物颗粒的悬浮液。例如,通道区段202可以与包含生物颗粒216的水性悬浮液的储器连接。在一些情况下,在第一通道区段201或第二通道区段202中或在两个区段中的水性流体212可包含一种或多种试剂,如下文进一步描述的。可以将与水性流体212不混溶的第二流体218(例如,油)从通道区段204和206中的每个递送到交汇部210。当来自通道区段201和202中的每个的水性流体212以及来自通道区段204和206中的每个的第二流体218在通道交汇部210处相遇时,水性流体212可以在第二流体218中被分区为离散的液滴220,并沿着通道区段208远离交汇部210流动。通道区段208可将离散液滴递送到与通道区段208流体联接的出口储器中,在出口储器中可收集离散液滴。
作为替代,通道区段201和202可以在交汇部210上游的另一个交汇部处相遇。在该交汇部处,珠粒和生物颗粒可以形成混合物,该混合物沿着另一个通道被引导至交汇部210以产生液滴220。混合物可以以交替的方式提供珠粒和生物颗粒,使得例如液滴包含单个珠粒和单个生物颗粒。
珠粒、生物颗粒和液滴可以以基本上规则的流动特征(例如,以规则的流速)沿着通道流动。这样的规则流动特征可以使得液滴包括单个珠粒和单个生物颗粒。这样的规则流动特征可以使得液滴具有大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的占据率(例如,具有珠粒和生物颗粒的液滴)。在例如美国专利公开号2015/0292988(其通过引用整体并入本文)中提供了这种规则的流动特征和可用于提供这中规则的流动特征的装置。
第二流体218可包含油(诸如氟化油),其包含用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴220的后续聚结。
产生的离散液滴可以包含单个生物颗粒216。产生的离散液滴可以包含条形码或其他携带试剂的珠粒214。产生的离散液滴可以包含单个生物颗粒和携带条形码的珠粒两者,诸如液滴220。在一些情况下,离散液滴可包含多于一个的单个生物颗粒或不包含生物颗粒。在一些情况下,离散液滴可以包含多于一个珠粒或不包含珠粒。离散液滴可以不被占据(例如,不含珠粒、不含生物颗粒)。
有益地,对生物颗粒和携带条形码的珠粒进行分区的离散液滴可以有效地使条形码归属于分区内的生物颗粒的细胞内分析物。分区的内容物可以与其他分区的内容物保持离散。
应理解,本文所述的通道区段可联接至各种不同的流体源或接收部件中的任何一个,包括储器、管道、歧管或其他系统的流体部件。应理解,微流体通道结构200可以具有其他几何形结构。例如,微流体通道结构可以具有多于一个通道交汇部。例如,微流体通道结构可具有2、3、4或5个通道区段,每个通道区段携带在通道交汇部相遇的珠粒。可以经由一个或多个流体流动单元引导流体沿着一个或多个通道或储器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可以经由施加的压差、离心力、电动泵送、真空、毛细管或重力流等或以其他方式来控制流体。
珠粒可以是多孔的、无孔的、固体的、半固体的、半流体的、流体的和/或其组合。在一些情况下,珠粒可以是可溶解的、可破坏的或可降解的。在一些情况下,珠粒可以不是可降解的。在一些情况下,珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可以由分子前体例如聚合物或单体物质形成。半固体珠粒可以是脂质体珠粒。固体珠粒可包含金属,包括氧化铁、金和银。在一些情况下,珠粒可以是二氧化硅珠粒。在一些情况下,珠粒可以是刚性的。在其他情况下,珠粒可以是柔性的和/或可压缩的。
珠粒可以具有任何合适的形状。珠粒形状的示例包括但不限于球形、非球形、椭圆形、长圆形、无定形的、圆形、圆柱形和其变型。
珠粒可以具有均匀的大小或不均一的大小。在一些情况下,珠粒的直径可为至少约10纳米(nm)、100nm、500nm、1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下,珠粒可以具有小于约10nm、100nm、500nm、1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更小的直径。在一些情况下,珠粒可以具有在约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm或20-500μm的范围内的直径。
在某些方面,珠粒可以以具有相对单分散的大小分布的珠粒群体或多个珠粒提供。在期望在分区内提供相对一致量的试剂的情况下,维持相对一致的珠粒特征例如大小可以有助于总体的一致性。特别地,本文所述的珠粒可以具有如下大小分布:该大小分布在珠粒横截面尺寸方面具有小于50%、小于40%、小于30%、小于20%的变化系数,并且在一些情况下,该变化系数小于15%、小于10%、小于5%或更小。
珠粒可以包括天然的和/或合成的材料。例如,珠粒可包含天然聚合物、合成聚合物或天然聚合物和合成聚合物两者。天然聚合物的示例包括蛋白质和糖,诸如脱氧核糖核酸、橡胶、纤维素、淀粉(例如,直链淀粉、支链淀粉)、蛋白质、酶、多糖、丝、聚羟基链烷酸酯、壳聚糖、葡聚糖、胶原、角叉菜胶、卵叶车前子、阿拉伯树胶、琼脂、明胶、虫胶、梧桐树胶、黄原胶、玉米糖胶、瓜尔胶、刺梧桐树胶、琼脂糖、藻酸、藻酸盐或其天然聚合物。合成聚合物的示例包括丙烯酸树脂、尼龙、硅酮、氨纶(spandex)、粘胶人造丝、聚羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(氯三氟乙烯)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(甲醛)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(氟乙烯)和/或其组合(例如,共聚物)。珠粒也可由除聚合物之外的材料形成,该材料包括脂质、胶束、陶瓷、玻璃陶瓷、材料复合物、金属、其他无机材料等。
在一些情况下,珠粒可含有分子前体(例如,单体或聚合物),其可经由分子前体的聚合形成聚合物网络。在一些情况下,前体可以是能够经历进一步聚合(例如,经由化学交联键)的已经聚合的物质。在一些情况下,前体可包含丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些情况下,珠粒可包含预聚物,该预聚物是能够进一步聚合的低聚物。例如,可采用预聚物制备聚氨酯珠粒。在一些情况下,珠粒可含有可进一步聚合在一起的单个聚合物。在一些情况下,可通过不同前体的聚合产生珠粒,使其包含混合的聚合物、共聚物和/或嵌段共聚物。在一些情况下,珠粒可在聚合物前体(例如,单体、低聚物、线性聚合物)、核酸分子(例如,寡核苷酸)、引物和其他实体之间包含共价键或离子键。在一些情况下,该共价键可以是碳-碳键、硫醚键或碳-杂原子键。
根据所使用的特定交联剂,交联可以是永久的或可逆的。可逆交联可使得聚合物在合适的条件下线性化,或解离。在一些情况下,可逆交联也可使得结合至珠粒表面的材料可逆地附接。在一些情况下,交联剂可以形成二硫键。在一些情况下,形成二硫键的化学交联剂可以是胱胺或修饰的胱胺。
在一些情况下,可在分子前体单元(例如,单体、低聚物或线性聚合物)或引入到珠粒和核酸分子(例如,寡核苷酸)中的前体之间形成二硫键。例如,胱胺(包括修饰的胱胺)是包含二硫键的有机试剂,其可用作珠粒的单独单体或聚合前体之间的交联剂。聚丙烯酰胺可在胱胺或包含胱胺的物质(例如,修饰的胱胺)的存在下聚合,以产生包含二硫键的聚丙烯酰胺凝胶珠粒(例如,含有可化学还原的交联剂的可化学降解的珠粒)。二硫键可在珠粒暴露于还原剂时使得珠粒被降解(或溶解)。
在一些情况下,一种线性多糖聚合物——壳聚糖,可通过亲水链与戊二醛交联以形成珠粒。壳聚糖聚合物的交联可通过由热、压力、pH变化和/或辐射引发的化学反应来实现。
在一些情况下,珠粒可包含丙烯酰胺基部分,其在某些方面可用于将一种或多种核酸分子(例如,条形码序列、条形码化的核酸分子、条形码化的寡核苷酸、引物、其他寡核苷酸)附接至珠粒。在一些情况下,丙烯酰胺基部分可以指由丙烯酰胺基与一种或多种物质反应(诸如,在聚合反应期间丙烯酰胺基与其他单体和交联剂的反应)产生的丙烯酰胺基类似物。可以修饰丙烯酰胺基部分以与待附接的物质例如核酸分子(例如,条形码序列、条形码化的核酸分子、条形码化的寡核苷酸、引物或其他寡核苷酸)形成化学键。丙烯酰胺基部分可以用能够形成二硫键的巯基基团修饰,或者可以用已经包含二硫键的基团修饰。巯基或二硫键(通过二硫键交换)可用作待附接的物质的锚定点,或者丙烯酰胺基部分的另一部分可用于附接。在一些情况下,附接可以是可逆的,使得当二硫键断裂时(例如,在还原剂的存在下),附接的物质从珠粒释放。在其他情况下,丙烯酰胺基部分可包含可用于附接的反应性羟基基团。
为附接核酸分子(如寡核苷酸)对珠粒的功能化可通过多种不同的途径来实现,包括聚合物内化学基团的活化、聚合物结构中活性或可激活的官能团的引入,或者在珠粒产生的预聚物或单体阶段的附接。
例如,聚合以形成珠粒的前体(例如,单体、交联剂)可包含丙烯酰胺基部分,使得当珠粒生成时,该珠粒还包含丙烯酰胺基部分。可以将丙烯酰胺基部分附接至核酸分子(例如,寡核苷酸),该核酸分子可以包含引发序列(例如,用于扩增靶核酸的引物、随机引物、信使RNA的引物序列)和/或一个或多个条形码序列。一个或多个条形码序列可以包括对于与给定珠粒偶接的所有核酸分子相同的序列和/或跨与给定珠粒偶接的所有核酸分子不同的序列。可以将核酸分子掺入珠粒中。
在一些情况下,核酸分子可包含功能序列,其例如用于附接至测序流动池,例如用于
Figure BDA0003630416840000821
测序的P5序列。在一些情况下,核酸分子或其衍生物(例如,从核酸分子产生的寡核苷酸或多核苷酸)可包含另一功能序列,例如,用于附接至测序流动池以进行Illumina测序的P7序列。在一些情况下,核酸分子可包含条形码序列。在一些情况下,引物可以进一步包含独特分子标识符(UMI)。在一些情况下,引物可包含用于Illumina测序的R1引物序列。在一些情况下,引物可包含用于Illumina测序的R2引物序列。美国专利公开号2014/0378345和2015/0376609(其各自通过引用整体并入本文)中提供了可以与本公开的组合物、装置、方法和系统一起使用的此类核酸分子(例如,寡核苷酸、多核苷酸等)及其用途的示例。
图8图示了携带条形码的珠粒的示例。核酸分子802,诸如寡核苷酸,可以通过可释放的键806,例如二硫键接头,与珠粒804偶联。相同的珠粒804可以与一个或多个其他核酸分子818、820偶联(例如,经由可释放的键)。核酸分子802可以是条形码或包含条形码。如本文其他地方所述,条形码的结构可以包含多个序列元件。核酸分子802可以包含可以在后续处理中使用的功能序列808。例如,功能序列808可以包括一个或多个测序仪专用的流动池连接序列(例如,用于
Figure BDA0003630416840000831
测序系统的P5序列)和测序引物序列(例如,用于
Figure BDA0003630416840000832
测序系统的R1引物)。核酸分子802可包含用于对样品(例如,DNA、RNA、蛋白质等)进行条形码化的条形码序列810。在一些情况下,条形码序列810可以是珠粒特异性的,使得条形码序列810是与同一珠粒804偶联的所有核酸分子(例如,包括核酸分子802)所共有的。替代地或另外地,条形码序列810可以是分区特异性的,使得条形码序列810对于与一个或多个被分配到同一分区中的珠粒偶联的所有核酸分子是共有的。核酸分子802可包含特异性引发序列812,如mRNA特异性引发序列(例如,聚-T序列)、靶向引发序列和/或随机引发序列。核酸分子802可包含锚定序列814,以确保特异性引发序列812在序列末端(例如,mRNA的)杂交。例如,锚定序列814可以包括核苷酸的随机短序列,如1-聚体、2-聚体、3-聚体或更长的序列,其可以确保聚-T区段更可能在mRNA的聚-A尾的序列末端处杂交。
核酸分子802可包含独特分子识别序列816(例如,独特分子标识符(UMI))。在一些情况下,独特的分子识别序列816可包含约5至约8个核苷酸。或者,独特分子识别序列816可包含少于约5个或多于约8个核苷酸。独特分子识别序列816可以是在偶联于单个珠粒(例如珠粒804)上的单个核酸分子(例如802、818、820等)之间变化的独特序列。在一些情况下,独特分子识别序列816可以是随机序列(例如,随机N-聚体序列)。例如,UMI可以提供被捕获的起始mRNA分子的独特标识符,以便允许定量原始表达的RNA的数量。应当理解,尽管图8示出了与珠粒804的表面偶联的三个核酸分子802、818、820,但是单个珠粒可以与任何数量的单个核酸分子偶联,例如,一个到数十个到数十万甚至数百万个单个核酸分子。单个核酸分子的相应条形码可以包括共有序列区段或相对共有的序列区段(例如808、810、812等)和偶联到同一珠粒的不同单个核酸分子之间的可变或独特的序列区段(例如816)。
在操作中,可以将生物颗粒(例如细胞、DNA、RNA等)与带有条形码的珠粒804一起共分区。可以从分区中的珠粒804释放条形码化的核酸分子802、818、820。举例来说,在分析样品RNA的情况下,释放的核酸分子之一(例如802)的聚-T区段(例如812)可以与mRNA分子的聚-A尾杂交。逆转录可以产生mRNA的cDNA转录物,但是该转录物包含核酸分子802的每个序列区段808、810、816。因为核酸分子802包含锚定序列814,所以它更可能与mRNA的聚-A尾的序列末端杂交并引发逆转录。在任何给定的分区内,单个mRNA分子的所有cDNA转录物都可以包含一个共有的条形码序列区段810。但是,由给定分区内的不同mRNA分子组成的转录物可以在独特的分子识别序列812区段(例如UMI区段)上发生变化。有益地,即使在给定分区的内容物的任何后续扩增之后,不同UMI的数量也可以指示源自给定分区的mRNA的量,并因此指示源自生物颗粒(例如,细胞)的mRNA的量。如上所述,可以扩增、清理转录物和对转录物进行测序以识别mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段进行测序。尽管描述了聚-T引物序列,但是其他靶向或随机引发序列也可以用于引发逆转录反应。同样,尽管描述为将条形码化的寡核苷酸释放到分区中,但是在一些情况下,与珠粒(例如凝胶珠粒)结合的核酸分子可用于在珠粒固相上杂交和捕获mRNA,例如,以促进RNA与其他细胞内容物的分离。
在一些情况下,可以将包含反应性的或能够被活化以使其变为反应性的官能团的前体与其他前体聚合,以产生包含活化或可活化的官能团的凝胶珠粒。然后,官能团可用于使额外的物质(例如,二硫键接头、引物、其他寡核苷酸等)附接至凝胶珠粒。例如,一些包含羧酸(COOH)基团的前体可与其他前体共聚,以形成还包含COOH官能团的凝胶珠粒。在一些情况下,丙烯酸(包含游离COOH基团的物质)、丙烯酰胺和双(丙烯酰)胱胺可以共聚在一起以生成包含游离COOH基团的凝胶珠粒。该凝胶珠粒的COOH基团可被激活(例如,通过1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-二甲基吗啉鎓氯化物(DMTMM)),从而使得其是反应性的(例如,在使用EDC/NHS或DMTMM用于激活的情况下,对胺官能团是反应性的)。然后,激活的COOH基团可以与包含将要连接至珠粒的部分的合适物质(例如,在羧酸基团被激活为对胺官能团具有反应性的情况下,包含胺官能团的物质)反应。
可通过使一些二硫键还原为游离的巯基,将在其聚合物网络中包含二硫键的珠粒用另外的物质功能化。例如,可通过还原剂(例如,DTT、TCEP等)的作用,在不溶解珠粒的情况下使二硫键还原,以产生游离的巯基基团。然后,珠粒的游离巯基可以与物质的游离巯基或者与包含另一个二硫键的物质反应(例如,通过巯基-二硫键交换),使得该物质可连接至珠粒(例如,通过产生的二硫键)。在一些情况下,珠粒的游离巯基可以与任何其他合适的基团反应。例如,珠粒的游离巯基可以与包含丙烯酰胺基部分的物质反应。珠粒的游离巯基基团可通过迈克尔加成化学与丙烯酰胺基反应,使得包含丙烯酰胺基的物质连接至珠粒。在一些情况下,可以通过引入巯基封端剂诸如N-乙基马来酰亚胺(ethylmalieamide)和碘乙酸盐来防止不受控制的反应。
可以控制珠粒内的二硫键的活化,使得只有少量的二硫键被激活。例如,可通过控制用于产生游离巯基基团的还原剂的浓度和/或控制用于在珠粒聚合中形成二硫键的试剂的浓度来施加控制。在一些情况下,低浓度(例如,还原剂分子:凝胶珠粒的比率小于或等于约1:100,000,000,000、小于或等于约1:10,000,000,000、小于或等于约1:1,000,000,000、小于或等于约1:100,000,000、小于或等于约1:10,000,000、小于或等于约1:1,000,000、小于或等于约1:100,000、小于或等于约1:10,000)的还原剂可用于还原。控制被还原成游离巯基的二硫键的数量对于在功能化期间确保珠粒结构的完整性可以是有用的。在一些情况下,光活性剂例如荧光染料可通过珠粒的游离巯基偶接至珠粒,并用于定量珠粒中存在的游离巯基的数量和/或追踪珠粒。
在一些情况下,在凝胶珠粒形成之后向凝胶珠粒添加部分可以是有利的。例如,在凝胶珠粒形成后添加寡核苷酸(例如条形码化的寡核苷酸)可以避免在聚合期间可能发生的链转移终止过程中的物质损失。此外,较小的前体(例如,不包含侧链基团和连接的部分的单体或交联剂)可用于聚合,并可最低限度地阻碍由粘滞效应引起的链末端的生长。在一些情况下,在凝胶珠粒合成之后的功能化可使待负载的物质(例如,寡核苷酸)在潜在的损伤剂(例如,自由基)和/或化学环境中的暴露最小化。在一些情况下,所产生的凝胶可具有上临界共溶温度(UCST),UCST可使得珠粒的经温度驱动的溶胀和瓦解。这种功能性可在随后用寡核苷酸对珠粒的功能化期间帮助寡核苷酸(例如,引物)渗透到珠粒中。产生后的功能化还可用于控制珠粒中物质的负载比,使得例如负载比的可变性最小化。另外,物质负载可以在分批工艺中进行,使得多个珠粒可在单批次中用该物质功能化。
注入或以其他方式引入分区中的珠粒可以包含可释放、可裂解或可逆地附接的条形码。注入或以其他方式引入分区中的珠粒可以包含可激活的条形码。注入或以其他方式引入分区中的珠粒可以是可降解的、可破坏的或可溶解的珠粒。
条形码可以是可释放地、可裂解地或可逆地附接在珠粒上,从而使得条形码可以通过条形码分子与珠粒之间的键的裂解而被释放或可释放,或通过基础珠粒自身的降解而被释放或两者,从而使条形码能够被其他试剂触及或可触及。在非限制性示例中,可通过还原二硫键,使用限制性酶、光活化的裂解或通过其他类型的刺激(例如,化学、热、pH、酶促等)裂解和/或反应来实现裂解,如本文其他地方所述。可释放的条形码有时可被称为可激活的,因为其一旦被释放即可用于反应。因此,例如,可通过将条形码从珠粒(或本文所述的其他合适类型的分区)释放来激活可激活的条形码。在所描述的方法和系统的上下文中也想到其他可激活的配置。
除了在上述珠粒与缔合的分子例如含有条形码的核酸分子(例如,条形码化的寡核苷酸)之间的可裂解的键之外或作为其替代,珠粒可以是自发地或在暴露于一种或多种刺激(例如,温度变化、pH变化、暴露于特定化学物质或化学相、暴露于光、还原剂等)时可降解的、可破坏的或可溶解的。在一些情况下,珠粒可以是可溶解的,使得当暴露于特定化学物质或环境变化(诸如,例如温度变化或pH变化)时,珠粒的材料组分溶解。在一些情况下,凝胶珠粒可以在升高的温度和/或碱性条件下降解或溶解。在一些情况下,珠粒可以是可热降解的,使得当珠粒暴露于合适的温度变化(例如,热)时,珠粒降解。与物质(例如,核酸分子,例如条形码化的寡核苷酸)结合的珠粒的降解或溶解可导致该物质从珠粒上释放。
从上述公开内容将会理解,珠粒的降解可以指结合的或所夹带的物质从珠粒上的离解,伴随和不伴随物理珠粒自身的结构降解。例如,珠粒的降解可涉及可裂解的键借助本文其他地方描述的一种或多种物质和/或方法的裂解。在另一示例中,所夹带的物质可通过由于例如化学环境改变导致的渗透压差而从珠粒释放。举例而言,通常可以在珠粒自身没有结构降解的情况下发生由渗透压差引起的珠粒孔径的改变。在一些情况下,由珠粒的渗透性溶胀导致的孔径的增大可使得珠粒中所夹带的物质释放。在其他情况下,由于孔径收缩,珠粒的渗透性收缩可使珠粒更好地保持所夹带的物质。
可以将可降解的珠粒引入到分区例如乳液的液滴或孔中,使得当施加合适的刺激时,在分区内降解的珠粒和任何相缔合的物质(例如,寡核苷酸)均释放到液滴中。游离物质(例如,寡核苷酸、核酸分子)可以与分区中包含的其他试剂相互作用。例如,可将包含胱胺且通过二硫键与条形码序列连接的聚丙烯酰胺珠粒与还原剂在油包水乳液的液滴内混合。在液滴内,该还原剂可以破坏多个二硫键,导致珠粒降解且条形码序列释放到液滴的水性内部环境中。在另一个示例中,将包含结合珠粒的条形码序列的液滴在碱性溶液中加热也可导致珠粒降解且所附接的条形码序列释放到液滴的水性内部环境中。
任何合适数量的分子标签分子(例如,引物、条形码化的寡核苷酸)都可以与珠粒相缔合,以使得从珠粒上释放后,分子标签分子(例如,引物,例如条形码化的寡核苷酸)以预定浓度存在于分区中。可以选择这样的预定浓度以促进用于在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定浓度可通过产生带有核酸分子(例如,寡核苷酸)的珠粒的过程来限制。
在一些情况下,珠粒可以非共价地负载有一种或多种试剂。可以通过例如使珠粒经受足以溶胀珠粒的条件从而使试剂有足够的时间扩散到珠粒内部中,以及使珠粒经受足以使珠粒去溶胀的条件来对珠粒进行非共价地负载。珠粒的溶胀可例如通过将珠粒置于热力学上有利的溶剂中、使珠粒经受较高或较低的温度、使珠粒经受较高或较低的离子浓度和/或使珠粒经受电场来实现。珠粒的溶胀可以通过各种溶胀方法来完成。珠粒的去溶胀可以例如通过将珠粒转移到热力学上不利的溶剂中、使珠粒经受较低或较高的温度、使珠粒经受较低或较高的离子浓度和/或去除电场来实现。珠粒的去溶胀可以通过各种去溶胀方法来完成。转移珠粒可导致珠粒中的孔收缩。然后,收缩可以阻止珠粒内部的试剂扩散出珠粒的内部。阻止可以是由于试剂与微珠内部之间的空间相互作用。转移可以微流体地完成。例如,可以通过将珠粒从一种共流溶剂流移至另一种共流溶剂流来实现转移。珠粒的可溶胀性和/或孔径可以通过改变珠粒的聚合物组成来调节。
在一些情况下,与前体连接的丙烯酰胺基部分、与前体连接的另一物质或前体本身可包含不稳定键,例如化学、热或光敏感性键,例如二硫键、UV敏感性键等。一旦丙烯酰胺基部分或包含不稳定键的其他部分被引入珠粒中,该珠粒也可包含该不稳定键。例如,不稳定的键可以用于将物质(例如,条形码、引物等)可逆地连接(共价连接)至珠粒。在一些情况下,热不稳定性键可包括基于核酸杂交的附接(例如,当寡核苷酸与附接至珠粒的互补序列杂交时),使得杂合体的热解链从珠粒或微囊释放寡核苷酸,例如,含有条形码的序列。
向凝胶珠粒添加多种类型的不稳定键可导致产生能够响应于不同刺激的珠粒。每种类型的不稳定键可以对相关的刺激(例如,化学刺激、光、温度、酶促等)敏感,使得可通过施加合适的刺激来控制通过每种不稳定键附接至珠粒的物质的释放。这种功能性对物质从凝胶珠粒上的受控释放是有用的。在一些情况下,例如,通过如上文所述的凝胶珠粒的活化官能团,可在凝胶珠粒形成后将包含不稳定键的另一物质连接至凝胶珠粒。应当理解,可释放地、可裂解地或可逆地附接至本文所述的珠粒的条形码包括通过条形码分子与珠粒之间的键的裂解而被释放或可释放的条形码,或通过基础珠粒自身的降解而被释放的条形码,或两者,从而使条形码能够被其他试剂触及或可触及。
如本文所述的可释放的条形码有时可被称为可激活的,因为其一旦被释放即可用于反应。因此,例如,可通过将条形码从珠粒(或本文所述的其他合适类型的分区)释放来激活可激活的条形码。在所描述的方法和系统的上下文中也想到其他可激活的配置。
除可热裂解的键、二硫键和UV敏感性键之外,可与前体或珠粒偶联的不稳定键的其他非限制性示例还包括酯键(例如,可用酸、碱或羟胺裂解的)、邻二醇键(例如,可通过高碘酸钠裂解的)、Diels-Alder键(例如,可通过热裂解的)、砜键(例如,可通过碱裂解的)、甲硅烷基醚键(例如,可通过酸裂解的)、糖苷键(例如,可通过淀粉酶裂解的)、肽键(例如,可通过蛋白酶裂解的)或磷酸二酯键(例如,可通过核酸酶(例如DNAase)裂解的)。可以通过其他核酸分子靶向酶如限制性酶(例如,限制性核酸内切酶)来裂解键,如下文进一步描述的。
可在珠粒产生期间(例如,在前体聚合期间)将物质封装在珠粒中。这类物质可以参与或可以不参与聚合。这类物质可以进入聚合反应混合物,使得在珠粒形成时所产生的珠粒包含该物质。在一些情况下,这类物质可在凝胶珠粒形成后添加至凝胶珠粒。这类物质可以包括例如核酸分子(例如寡核苷酸)、包括本文所述的那些的用于核酸扩增反应的试剂(例如引物、聚合酶、dNTP、辅因子(例如离子辅因子)、缓冲剂)、用于酶促反应的试剂(例如,酶、辅因子、底物、缓冲剂)、用于核酸修饰反应(诸如,聚合、连接或消化)的试剂和/或用于一种或多种测序平台(例如,用于
Figure BDA0003630416840000891
Figure BDA0003630416840000892
)模板制备(例如,标签化)的试剂。这类物质可包括本文所述的一种或多种酶,包括但不限于聚合酶、逆转录酶、限制性酶(例如核酸内切酶)、转座酶、连接酶、蛋白酶K、DNAse等。这类物质可包括本文其他地方所述的一种或多种试剂(例如,裂解剂、抑制剂、灭活剂、螯合剂、刺激物)。这类物质的捕获可通过在前体聚合期间产生的聚合物网络密度、凝胶珠粒内离子电荷的控制(例如,通过与聚合的物质连接的离子型物质)或通过其他物质的释放来控制。封装的物质可在珠粒降解时和/或通过施加能够使物质从珠粒释放的刺激而从珠粒释放。替代地或另外,可以在分区形成期间或之后将物质分配在分区(例如,液滴)中。这类物质可以包括但不限于,也可以封装在珠粒中的上述物质。
可降解的珠粒可包含一种或多种具有不稳定键的物质,使得当珠粒/物质暴露于合适的刺激时,该键被破坏并且珠粒降解。该不稳定键可以是化学键(例如,共价键、离子键),或者可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些情况下,用于产生珠粒的交联剂可包含不稳定键。当暴露于合适的条件时,不稳定键可被破坏并且珠粒被降解。例如,当包含胱胺交联剂的聚丙烯酰胺凝胶珠粒珠粒暴露于还原剂珠粒时,胱胺的二硫键被破坏并且珠粒被降解。
当向珠粒施加合适的刺激时,与不降解的珠粒相比,可降解的珠粒可用于更快地从珠粒释放所附接的物质(例如,核酸分子、条形码序列、引物等)。例如,对于结合至多孔珠粒内表面的物质或在封装的物质的情况下,当珠粒降解时,该物质可以具有更高的迁移性和对溶液中其他物质的易触及性。在一些情况下,还可通过可降解的接头(例如,二硫键接头)将物质附接至可降解的珠粒。可降解的接头可以与可降解的珠粒响应于相同的刺激,或者两种可降解的物质可以响应于不同的刺激。例如,可通过二硫键将条形码序列附接至包含胱胺的聚丙烯酰胺珠粒上。当条形码化的珠粒暴露于还原剂时,珠粒降解,并且在条形码序列与珠粒之间的二硫键和珠粒中的胱胺的二硫键两者被破坏时条形码序列得以释放。
从上述公开内容将会理解,尽管称为珠粒的降解,但在许多上文提到的情况下,该降解可以指结合的或所夹带的物质从珠粒上的离解,伴随和不伴随物理珠粒自身的结构降解。例如,可通过例如由化学环境改变导致的渗透压差,使所夹带的物质从珠粒释放。举例而言,通常可以在珠粒自身没有结构降解的情况下发生由渗透压差引起的珠粒孔径的改变。在一些情况下,由珠粒的渗透性溶胀导致的孔径的增大可使得珠粒中所夹带的物质释放。在其他情况下,由于孔径收缩,珠粒的渗透性收缩可使珠粒更好地保持所夹带的物质。
当提供可降解的珠粒时,可有利的是,避免在给定时间之前将这类珠粒暴露于导致这类降解的一种或多种刺激,从而例如避免珠粒过早降解以及由这种降解所导致的问题,包括例如流动特性差以及聚结。举例而言,当珠粒包含可还原的交联基团如二硫键基团时,将期望避免使这类珠粒与还原剂(例如,DTT或其他二硫键裂解试剂)接触。在这类情况下,在一些情况下,将在无还原剂(如DTT)的情况下提供对本文所述珠粒的处理。因为还原剂常常在商用的酶制剂中提供,所以可期望在处理本文所述的珠粒时提供无还原剂(或无DDT)的酶制剂。这类酶的示例包括,例如聚合酶制剂、逆转录酶制剂、连接酶制剂以及许多其他可用于处理本文所述的珠粒的酶制剂。术语“无还原剂的”或“无DTT的”制剂是指具有降解珠粒中使用的这类材料的下限的小于约1/10、小于约1/50或甚至小于约1/100的制剂。例如,对于DTT,无还原剂的试剂可以具有少于0.01毫摩尔(mM)、0.005mM、0.001mM的DTT、0.0005mM的DTT或者甚至少于0.0001mM的DTT。在许多情况下,DTT的量将是检测不到的。
许多化学触发物可用于触发珠粒的降解。这些化学变化的示例可包括但不限于珠粒内组分整体的pH介导的变化、通过交联键的裂解发生的珠粒组分的降解以及珠粒组分的解聚。
在一些情况下,珠粒可以由包含可降解化学交联剂例如BAC或胱胺的材料形成。这类可降解交联剂的降解可通过多种机制实现。在一些示例中,可以使珠粒与可诱导氧化、还原或其他化学变化的化学降解剂接触。例如,化学降解剂可以是还原剂,如二硫苏糖醇(DTT)。还原剂的其他示例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可以降解在形成珠粒的凝胶前体之间形成的二硫键,因此使珠粒降解。在其他情况下,溶液pH的变化,如pH增加,可触发珠粒的降解。在其他情况下,暴露于水溶液(如水)可触发水解降解,因此使珠粒降解。在一些情况下,刺激的任何组合都可触发珠粒的降解。例如,pH的变化可以使化学试剂(例如,DTT)成为有效的还原剂。
当施加热刺激时,也可诱导珠粒释放其内容物。温度的变化可导致珠粒的多种变化。例如,热可引起固体珠粒液化。热的变化可导致珠粒的熔化,使得珠粒的一部分降解。在其他情况下,热可增加珠粒组分的内部压力,使得珠粒破裂或爆炸。热还可作用于用作构建珠粒的材料的热敏性聚合物。
任何合适的试剂都可以降解珠粒。在一些情况下,温度或pH的变化可用于降解珠粒内的热敏性或pH敏感性键。在一些实施方案中,化学降解剂可用于通过氧化、还原或其他化学变化降解珠粒内的化学键。例如,化学降解剂可以是还原剂,如DTT,其中DTT可以降解在交联剂与凝胶前体之间形成的二硫键,从而使珠粒降解。在一些实施方案中,可添加还原剂以降解珠粒,这可导致或可不导致珠粒释放其内容物。还原剂的示例可包括二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可以以约0.1mM、0.5mM、1mM、5mM或10mM的浓度存在。还原剂可以以至少约0.1mM、0.5mM、1mM、5mM、10mM或大于10mM的浓度存在。还原剂可以以至多约10mM、5mM、1mM、0.5mM、0.1mM或更低的浓度存在。
任何合适数量的分子标签分子(例如,引物、条形码化的寡核苷酸)都可以与珠粒相缔合,以使得从珠粒上释放后,分子标签分子(例如,引物,例如带条形码的寡核苷酸)以预定浓度存在于分区中。可以选择这样的预定浓度以促进用于在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定浓度可通过产生带有寡核苷酸的珠粒的过程来限制。
尽管在提供基本单一占据的分区方面描述了图1和图2,但在某些情况下,可希望提供多重占据的分区,例如在单个分区内含有两个、三个、四个或更多个包含条形码化的核酸分子(例如,寡核苷酸)的细胞和/或微囊珠粒(例如珠粒)。因此,如上文提到的,可以控制含生物颗粒和/或珠粒的流体和分区流体的流动特征,以提供这样的多重占据的分区。特别地,可以控制流动参数,以提供大于约50%、大于约75%并在一些情况下大于约80%、90%、95%或更高的分区的给定占据率。
在一些情况下,可以使用其他微囊将其他试剂递送到分区。在这样的情况下,可有利的是,通过进入共同通道或液滴生成交汇部(例如交汇部210)的不同通道入口,从不同的珠粒来源(即,含有不同缔合试剂)向这样的共同通道或液滴生成交汇部中引入不同的珠粒。在这样的情况下,可以控制不同珠粒进入该通道或交汇部中的流动和频率,以提供特定比率的来自每个来源的微囊,同时确保这样的珠粒的给定对和组合与给定数量的生物颗粒(例如,每个分区中一个生物颗粒和一个珠粒)进入分区。
本文所述的分区可包含小体积,例如小于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更小。
例如,在基于液滴的分区的情况下,液滴的总体积可小于约1000pL、900pL、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL或更少。当以微囊共分配时,应当理解,分区内的样品流体体积(例如包括共分配的生物颗粒和/或珠粒)可以小于上述体积的约90%、小于上述体积的约80%、小于约70%、小于约60%、小于约50%、小于约40%、小于约30%、小于约20%或小于约10%。
如本文其他地方所描述的,分区物质可以产生群体或多个分区。在这种情况下,可以生成或以其他方式提供任何合适数量的分区。例如,可以生成或以其他方式提供至少约1,000个分区、至少约5,000个分区、至少约10,000个分区、至少约50,000个分区、至少约100,000个分区、至少约500,000个分区、至少约1,000,000个分区、至少约5,000,000个分区、至少约10,000,000个分区、至少约50,000,000个分区、至少约100,000,000个分区、至少约500,000,000个分区、至少约1,000,000,000个分区或更多个分区。此外,多个分区可以包括未被占据的分区(例如,空的分区)和被占据的分区。
试剂
根据某些方面,可以将生物颗粒与裂解试剂一起分配,以在分区中释放生物颗粒的内容物。在这种情况下,可以在例如通过另外的通道或通道交汇部上游的通道将生物颗粒引入分区交汇部/液滴产生区(例如,交汇部210)的同时或紧接在其之前使裂解试剂与生物颗粒悬浮液接触。根据其他方面,附加地或替代地,生物颗粒可以与其他试剂一起分配,如将在下文进一步描述的。
图3示出了用于将生物颗粒和试剂共分配的微流体通道结构300的示例。通道结构300可以包括通道区段301、302、304、306和308。通道区段301和302在第一通道交汇部309处连通。通道区段302、304、306和308在第二通道交汇部310处连通。
在示例性操作中,通道区段301可以将包含多个生物颗粒314的水性流体312沿着通道区段301输送到第二交汇部310中。作为替代或补充,通道区段301可以输送珠粒(例如,凝胶珠粒)。珠粒可以包含条形码分子。
例如,通道区段301可以与包含生物颗粒314的水性悬浮液的储器连接。在第二交汇部310的上游且在到达第二交汇部310之前,通道区段301可在第一交汇部309处与通道区段302相遇。通道区段302可以将悬浮在水性流体312中的多种试剂315(例如,裂解剂)沿着通道区段302输送到第一交汇部309中。例如,通道区段302可以与包含试剂315的储器连接。在第一交汇部309之后,通道区段301中的水性流体312可以将生物颗粒314和试剂315两者载送向第二交汇部310。在一些情况下,通道区段301中的水性流体312可以包含一种或多种试剂,其可以是与试剂315相同或不同的试剂。与水性流体312不混溶的第二流体316(例如,油)可以从通道区段304和306中的每一个被递送到第二交汇部310。当来自通道区段301的水性流体312与来自通道区段304和306中的每一个的第二流体316在第二交汇部310处遇到时,水性流体312可以在第二流体316中被分区为离散的液滴318,并沿着通道区段308远离第二交汇部310流动。通道区段308可将离散液滴318递送到与通道区段308流体联接的出口储器,在出口储器中可收集离散液滴318。
第二流体316可包含油(诸如氟化油),其包含用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴318的后续聚结。
产生的离散液滴可包含单个生物颗粒314和/或一种或多种试剂315。在一些情况下,所产生的离散液滴可包含携带条形码的珠粒(未示出),诸如经由本文其他地方所述的其他微流体结构。在一些情况下,离散液滴可未被占据(例如,不含试剂、不含生物颗粒)。
有益地,当将裂解试剂和生物颗粒共分配时,裂解试剂可以促进在分区内释放生物颗粒的内容物。分区中释放的内容物可以与其他分区的内容物保持离散。
应理解,本文所述的通道区段可联接至各种不同的流体源或接收部件中的任何一个,包括储器、管道、歧管或其他系统的流体部件。应理解,微流体通道结构300可以具有其他几何形状。例如,微流体通道结构可以具有多于两个的通道交汇部。例如,微流体通道结构可具有2、3、4、5个或更多个通道区段,每个通道区段携带在通道交汇部相遇的相同或不同类型的珠粒、试剂和/或生物颗粒。可以控制每个通道区段中的流体流动,以控制将不同元件分区到液滴中。可以经由一个或多个流体流动单元引导流体沿着一个或多个通道或储器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。也可以经由施加的压差、离心力、电动泵送、真空、毛细管或重力流或以其他方式等来控制流体。
裂解剂的示例包括生物活性试剂,例如用于裂解不同细胞类型(例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等)的裂解酶,例如溶菌酶、无色肽酶、溶葡萄球菌素、labiase、kitalase(细胞裂解酶)、溶细胞酶和可从例如Sigma-Aldrich,Inc.(密苏里州圣路易斯)获得的多种其他裂解酶,以及其他市售裂解酶。其他裂解剂可以附加地或替代地与生物颗粒共分区,以引起生物颗粒的内容物释放到分区中。例如,在一些情况下,可以使用基于表面活性剂的裂解溶液来裂解细胞,但对于其中表面活性剂会干扰稳定乳液的基于乳液的体系而言,这些裂解溶液可能不太理想。在一些情况下,裂解溶液可包含非离子表面活性剂,例如TritonX-100和Tween 20。在一些情况下,裂解溶液可包含离子型表面活性剂,例如,十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。在某些情况下,也可以使用电穿孔、热、声或机械细胞破坏,例如,在可以作为液滴分区的补充或替代的基于非乳液的分区(例如封装生物颗粒)中,其中封装物的任何孔径足够小到保留在细胞破裂后的给定大小的核酸片段。
作为与上述生物颗粒共分配的裂解剂的替代或补充,其他试剂也可与生物颗粒共分配,包括例如DNase和RNase失活剂或抑制剂例如蛋白酶K、螯合剂例如EDTA,以及用于去除或以其他方式减少负活性或不同细胞裂解物组分对后续核酸处理的影响的其他试剂。另外,在封装的生物颗粒的情况下,可将生物颗粒暴露于适当的刺激下以从共分配的微囊中释放生物颗粒或其内容物。例如,在一些情况下,化学刺激物可以与封装的生物颗粒一起被共分配以使得微囊降解并使得细胞或其内容物释放到更大的分区中。在一些情况下,该刺激可以与本文其他地方所述的用于从其相应的微囊(例如,珠粒)释放核酸分子(例如,寡核苷酸)的刺激物相同。在替代方面,这可以是不同且不重叠的刺激物,从而使得被封装的生物颗粒在与将核酸分子释放到分区的不同时间释放到同一分区中。
其他试剂如核酸内切酶也可以与生物颗粒共分配,以使生物颗粒的DNA、DNA聚合酶和用于扩增生物颗粒的核酸片段的dNTP片段化,并将条形码分子标签附接到扩增的片段上。其他酶,包括但不限于聚合酶、转座酶、连接酶、蛋白酶K、DNAse等也可以共分配。其他试剂还可以包括逆转录酶,包括具有末端转移酶活性的酶、引物和寡核苷酸以及可用于模板转换的转换寡核苷酸(本文中也称为“转换寡核苷酸(switch oligos)”或“模板转换寡核苷酸”)。在一些情况下,模板转换可用于增加cDNA的长度。在一些情况下,模板转换可用于将预定义的核酸序列附加到cDNA。在模板转换的一个示例中,cDNA可以从模板例如细胞mRNA的逆转录中产生,其中具有末端转移酶活性的逆转录酶可以以模板独立性的方式向cDNA添加另外的核苷酸,例如聚胞苷酸(polyC)。转换寡核苷酸可包含与其他核苷酸互补的序列,例如聚鸟苷酸(polyG)。cDNA上的另外的核苷酸(例如,聚胞苷酸)可以与转换寡核苷酸上的另外的核苷酸(例如,聚鸟苷酸)杂交,由此通过逆转录酶可以将转换寡核苷酸用作模板以进一步扩展cDNA。模板转换寡核苷酸可包含杂交区和模板区。杂交区可包含能够与靶标杂交的任何序列。在一些情况下,如前所述,杂交区包含一系列G碱基,以与cDNA分子3’末端处突出的C碱基互补。一系列G碱基可包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或大于5个G碱基。模板序列可以包含要掺入cDNA的任何序列。在一些情况下,模板区包含至少1个(例如,至少2个、3个、4个、5个或更多个)标签序列和/或功能序列。转换寡核苷酸可包含脱氧核糖核酸;核糖核酸;修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2'-脱氧肌苷、超级T(5-羟基丁炔基-2'-脱氧尿苷)、超级G(8-氮杂7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如UNA-A、UNA-U、UNA-C、UNA-G)、异dG、异dC、2’氟碱基(例如,氟C、氟U、氟A和氟G)或任意组合。
在一些情况下,转换寡核苷酸的长度可以是至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。
在一些情况下,转换寡核苷酸的长度可以是至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。
一旦将细胞的内容物释放到它们相应的分区中,就可以在分区内进一步处理其中包含的大分子组分(例如,生物颗粒的细胞内分析物,例如RNA、DNA或蛋白质)。根据本文所述的方法和系统,可以为单个生物颗粒的大分子组分内容物提供独特的标识符,使得在表征那些大分子组分时,它们可以被归属于源自相同的一个或多个生物颗粒。通过将独特标识符特异性地分配给单个生物颗粒或生物颗粒群来提供将特征归属于单个生物颗粒或生物颗粒群的能力。可以为单个生物颗粒或生物颗粒群分配或缔合例如核酸条形码形式的独特标识符,以便用独特标识符加标签于或标记生物颗粒的大分子组分(因此,其特征)。然后,这些独特的标识符可用于将生物颗粒的组分和特征归属于单个生物颗粒或生物颗粒群。
在一些方面,这是通过将单个生物颗粒或生物颗粒群与独特标识符共分配来执行的,例如如上所述(参考图2)。在一些方面,以核酸分子(例如,寡核苷酸)的形式提供独特的标识符,所述核酸分子包含核酸条形码序列,所述核酸条形码序列可以附接或以其他方式缔合于单个生物颗粒的核酸内容物,或生物颗粒的其他组分,并且尤其是这些核酸的片段。核酸分子被分区,使得在给定分区中的核酸分子之间时,包含在其中的核酸条形码序列是相同的,但是在不同分区之间时,核酸分子可以并且确实具有不同的条形码序列,或者至少代表在给定分析中所有分区上的大量不同的条形码序列。在一些方面,仅一个核酸条形码序列可以与给定分区相关联,但是在一些情况下,可以存在两个或更多个不同的条形码序列。
核酸条形码序列可在核酸分子(例如,寡核苷酸)的序列内包含约6至约20或更多个核苷酸。核酸条形码序列可包含约6至约20、30、40、50、60、70、80、90、100或更多个核苷酸。在一些情况下,条形码序列的长度可以是约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以是至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可以是至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可以是完全连续的,即在相邻核苷酸的单个伸展链段中,或者它们可以被分成两个或更多个被1个或更多个核苷酸分开的单独子序列。在一些情况下,分开的条形码子序列的长度可以是约4至约16个核苷酸。在一些情况下,条形码子序列可以是约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可以是至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码子序列可以是至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。
共分区的核酸分子还可以包含可用于处理来自共分区的生物颗粒的核酸的其他功能序列。这些序列包括例如靶向或随机/通用扩增引物序列,用于扩增分区内单个生物颗粒的基因组DNA,同时连接相缔合的条形码序列、测序引物或引物识别位点;杂交或探测序列,例如用于识别序列的存在或用于下拉条形码化核酸;或许多其他潜在的功能性序列中的任何一个。也可以使用对寡核苷酸进行共分区的其他机制,包括例如两个或更多个液滴的聚结,其中一个液滴包含寡核苷酸;或将寡核苷酸微分散到分区,例如微流体体系中的液滴中。
在一个示例中,提供了微囊(例如珠粒),其各自包含大量可释放地附接于珠粒的上述条形码化的核酸分子(例如条形码化的寡核苷酸),其中附接于特定珠粒的所有核酸分子将包含相同的核酸条形码序列,但是其中在所使用的珠粒群体中呈现了大量不同的条形码序列。在一些情况下,例如包含聚丙烯酰胺聚合物基质的水凝胶珠粒用作使核酸分子进入分区的固相支持物和递送媒介物,因为它们能够携带大量核酸分子,并且可以被配置为当暴露于特定刺激下时释放那些核酸分子,如本文其他地方所述。在一些情况下,珠粒群体提供了多样化的条形码序列文库,该文库包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000个不同的条形码序列或至少约10,000,000个不同的条形码序列或更多。另外,可以为每个珠粒提供附接的大量核酸(例如,寡核苷酸)分子。特别地,在单个珠粒上的包含条形码序列的核酸分子的分子数量可以是至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸分子、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子,至少约100,000,000个核酸分子、至少约250,000,000个核酸分子,并且在一些情况下,至少约10亿个核酸分子或更多。给定珠粒的核酸分子可以包含相同(或共同)的条形码序列、不同的条形码序列或两者的组合。给定珠粒的核酸分子可包含多组核酸分子。给定组的核酸分子可以包含相同的条形码序列。该相同的条形码序列可以不同于另一组核酸分子的条形码序列。
此外,当对珠粒群体进行分区时,所得的分区群体也可以包括多样化的条形码文库,该条形码文库包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000不同的条形码序列或至少约10,000,000个不同的条形码序列。另外,每个群体分区可以包含至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸分子、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子,至少约100,000,000个核酸分子、至少约250,000,000个核酸分子,并且在一些情况下,至少约10亿个核酸分子。
在一些情况下,可期望将多个不同的条形码合并到给定分区中,或者附接在分区中的单个或多个珠粒上。例如,在一些情况下,混合但已知的条形码序列组可以在后续处理中提供更大的识别保证,例如,通过向给定分区提供更强地址或将条形码归属于给给定分区,作为给定分区的输出的复制品或独立确认。
在向珠粒施加特定刺激后,核酸分子(例如,寡核苷酸)可从珠粒上释放。在一些情况下,该刺激可以是光刺激,例如通过释放核酸分子的光不稳定键的裂解。在其他情况下,可以使用热刺激,其中珠粒环境温度的升高将导致核酸分子与珠粒的键的裂解或核酸分子从珠粒的其他释放。在其他情况下,可以使用裂解核酸分子与珠粒的键的化学刺激,或者以其他方式导致核酸分子从珠粒上释放。在一种情况下,这样的组合物包括上述用于封装生物颗粒的聚丙烯酰胺基质,并且可以通过暴露于还原剂例如DTT而降解以释放所附接的核酸分子。
在一些方面,提供了用于受控分区的系统和方法。液滴尺寸可通过调节通道架构(例如,微流体通道架构)中的某些几何特征来控制。例如,可以调节通道的扩张角度、宽度和/或长度来控制液滴尺寸。
图4示出了用于将珠粒受控地分区到离散液滴中的微流体通道结构的示例。通道结构400可以包括通道区段402,该通道区段402在通道交汇部406(或相交部)处与储器404连通。储器404可以是隔室。如本文所用,对“储器”的任何引用也可以指“隔室”。在操作中,包含悬浮珠粒412的水性流体408可以沿着通道区段402被输送到交汇部406中,以与和储器404中的水性流体408不混溶的第二流体410相遇,从而产生流入储器404的水性流体408的液滴416、418。在水性流体408和第二流体410相遇的交汇部406处,可以基于诸如在交汇部406处的流体动力、两种流体408、410的流速、流体特性和通道结构400的某些几何参数(例如,w、h0、α等)等因素形成液滴。通过从通道区段402通过交汇部406连续注入水性流体408,可以在储器404中收集多个液滴。
产生的离散液滴可包含珠粒(例如,如在被占据液滴416中一样)。或者,所产生的离散液滴可以包含多于一个珠粒。或者,所产生的离散液滴可以不包含任何珠粒(例如,如在未被占据的液滴418中一样)。在一些情况下,如本文其他地方所述,产生的离散液滴可包含一个或多个生物颗粒。在一些情况下,所产生的离散液滴可包含一种或多种试剂,如本文其他地方所述。
在一些情况下,水性流体408可具有基本上均匀的珠粒412浓度或频率。珠粒412可以从单独通道(图4中未示出)引入通道区段402中。通道区段402中的珠粒412的频率可以通过控制将珠粒412引入通道区段402的频率和/或通道区段402和单独通道中的流体的相对流速来控制。在一些情况下,珠粒可以从多个不同的通道被引入通道区段402,并且相应地控制频率。
在一些情况下,通道区段402中的水性流体408可包含生物颗粒(例如,参照图1和图2描述的)。在一些情况下,水性流体408可具有基本上均匀的生物颗粒浓度或频率。与珠粒一样,生物颗粒可以从单独通道引入通道区段402。可以通过控制将生物颗粒引入通道区段402中的频率和/或通道区段402和单独通道中的流体的相对流速来控制通道区段402中的水性流体408中的生物颗粒的频率或浓度。在一些情况下,可以将生物颗粒从多个不同的通道引入通道区段402,并相应地控制频率。在一些情况下,第一单独通道可以将珠粒引入通道区段402,第二单独通道可以将生物颗粒引入通道区段402。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。
第二流体410可包含油(诸如氟化油),其包含用于稳定所得液滴的含氟表面活性剂,例如,抑制所得液滴的后续聚结。
在一些情况下,第二流体410可以不经受和/或不被引导进入或流出储器404的任何流动。例如,第二流体410可以在储器404中基本上静止。在一些情况下,第二流体410可例如通过向储器404施加压力和/或受交汇部406处的水性流体408的流入流影响而在储器404内经受流动,但不流入或流出储器404。或者,第二流体410可以经受和/或被引导流入或流出储器404。例如,储器404可以是引导第二流体410从上游到下游的通道,从而输送所产生的液滴。
通道结构400在交汇部406处或附近可以具有某些几何特征,其至少部分地确定由通道结构400形成的液滴的尺寸。通道区段402可以在交汇部406处或附近具有高度h0和宽度w。举例来说,通道区段402可包括矩形横截面,该矩形横截面通向具有较宽横截面(例如在宽度或直径方面)的储器404。或者,通道区段402的横截面可以是其他形状,例如圆形、梯形、多边形或任何其他形状。在交汇部406处或附近的储器404的顶壁和底壁可以以扩张角α倾斜。扩张角α使得舌状部(水性流体408在交汇部406离开通道区段402并在液滴形成之前进入储器404的部分)的深度增加并且有助于减小中间形成的液滴的曲率。液滴尺寸可随着扩张角的增加而减小。对于上述h0、w和α的几何参数,可以通过以下方程式预测最终的液滴半径Rd:
Figure BDA0003630416840001041
举例来说,对于w=21μm、h=21μm和α=3°的通道结构,预测的液滴尺寸为121μm。在另一示例中,对于w=25μm、h=25μm和α=5°的通道结构,预测的液滴尺寸为123μm。在另一示例中,对于w=28μm、h=28μm和α=7°的通道结构,预测的液滴尺寸为124μm。
在一些情况下,扩张角α可以在约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围内。例如,扩张角可以为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更大。例如,扩张角可以为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下,宽度w可以在约100微米(μm)至约500μm的范围内。在一些情况下,宽度w可以在约10μm至约200μm的范围内。或者,宽度可以小于约10μm。或者,宽度可以大于约500μm。在一些情况下,进入交汇部406的水性流体408的流速可以在约0.04微升(μL)/分钟(min)至约40μL/min之间。在一些情况下,进入交汇部406的水性流体408的流速可以在约0.01微升(μL)/分钟(min)至约100μL/min之间。或者,进入交汇部406的水性流体408的流速可以小于约0.01μL/min。或者,进入交汇部406的水性流体408的流速可以大于约40μL/min,诸如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更高。在较低的流速下,例如约小于或等于10微升/分钟的流速,液滴半径可不取决于进入交汇部406的水性流体408的流速。
在一些情况下,所产生的至少约50%的液滴可以具有一致的尺寸。在一些情况下,所产生的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有一致的尺寸。或者,所产生的小于约50%的液滴可以具有一致的尺寸。
液滴产生的产量可以通过增加产生点来增加,例如增加水性流体408的通道区段(例如,通道区段402)和储器404之间的交汇部(例如,交汇部406)的数量。替代地或另外地,可以通过增加通道区段402中的水性流体408的流速来增加液滴产生的产量。
图5示出了用于增加液滴产生产量的微流体通道结构的示例。微流体通道结构500可以包括多个通道区段502和储器504。多个通道区段502中的每一个可与储器504流体连通。通道结构500可包括在多个通道区段502和储器504之间的多个通道交汇部506。每个通道交汇部可以是液滴产生的点。来自图4中的通道结构400的通道区段402及对其部件的任何描述可对应于通道结构500中的多个通道区段502的给定通道区段及其对应的部件的任何描述。来自通道结构400的储器404及对其任何部件的描述可以对应于来自通道结构500的储器504及对其相应部件的描述。
多个通道区段502中的每个通道区段可以包含水性流体508,该水性流体508包含悬浮的珠粒512。储器504可以包含与水性流体508不混溶的第二流体510。在一些情况下,第二流体510可以不经受和/或不被引导进入或流出储器504的任何流动。例如,第二流体510可以在储存器504中基本上静止。在一些情况下,第二流体510可例如通过向储器504施加压力和/或受交汇部的水性流体508的流入流影响而在储器504内经受流动,但不流入或流出储器504。或者,第二流体510可以经受和/或被引导流入或流出储器504。例如,储器504可以是引导第二流体510从上游到下游的通道,从而输送所产生的液滴。
在操作中,包含悬浮的珠粒512的水性流体508可以沿着多个通道区段502被输送到多个交汇部506中,以与储器504中的第二流体510相遇以产生液滴516、518。液滴可在与储器504的每个对应交汇部从每个通道区段形成。在水性流体508和第二流体510相遇的交汇部处,可以基于诸如在交汇部处的流体动力、两种流体508、510的流速、流体特性和通道结构的某些几何参数(例如,w、h0、α等)等因素形成液滴,如本文其他地方所述。通过从多个通道区段502通过多个交汇部506连续注入水性流体508,可以在储器504中收集多个液滴。产量可随着通道结构500的平行通道配置而显著增加。例如,具有五个包含水性流体508的入口通道区段的通道结构产生的液滴的频率可以是具有一个入口通道区段的通道结构的五倍,条件是通道区段中的流体流速基本相同。不同入口通道区段中的流体流速可以基本相同或基本不同。根据实践和储器大小所允许的,通道结构可以具有尽可能多的平行通道区段。例如,通道结构可具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、500、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本上平行的通道区段。
对于多个通道区段502中的每个通道区段,几何参数w、h0和α可以一致或可以不一致。例如,每个通道区段在其与储器504的相应通道交汇部或附近可具有相同或不同的宽度。例如,每个通道区段在其与储器504的相应通道交汇部或附近可具有相同或不同的高度。在另一个示例中,储器504在与多个通道区段502的不同通道交汇部处可以具有相同或不同的扩张角。当几何参数一致时,有益地,即使增加了产量,也可以将液滴尺寸控制为一致的。在一些情况下,当期望具有不同的液滴尺寸分布时,可以相应地改变用于多个通道区段502的几何参数。
在一些情况下,所产生的至少约50%的液滴可以具有一致的尺寸。在一些情况下,所产生的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有一致的尺寸。或者,所产生的小于约50%的液滴可以具有一致的尺寸。
图6示出了用于增加液滴产生产量的微流体通道结构的另一示例。微流体通道结构600可包括围绕储器604的周边大体上圆形地布置的多个通道区段602。多个通道区段602中的每一个可与储器604流体连通。通道结构600可包括在多个通道区段602和储器604之间的多个通道交汇部606。每个通道交汇部可以是液滴产生的点。来自图4中的通道结构400的通道区段402及对其部件的任何描述可对应于通道结构600中的多个通道区段602的给定通道区段及对其对应的部件的任何描述。来自通道结构400的储器404及对其部件的任何描述可以对应于来自通道结构600的储器604及对其相应部件的任何描述。
多个通道区段602中的每个通道区段可以包含水性流体608,该水性流体608包含悬浮的珠粒612。储器604可以包括与水性流体608不混溶的第二流体610。在一些情况下,第二流体610可以不经受和/或不被引导进入或流出储器604的任何流动。例如,第二流体610可以在储存器604中基本上静止。在一些情况下,第二流体610可例如通过向储器604施加压力和/或受交汇部处水性流体608的流入影响而在储器604内经受流动,但不流入或流出储器604。或者,第二流体610可以经受和/或被引导流入或流出储器604。例如,储器604可以是引导第二流体610从上游到下游的通道,从而输送所产生的液滴。
在操作中,包含悬浮的珠粒612的水性流体608可以沿着多个通道区段602被输送到多个交汇部606中,以与储器604中的第二流体610相遇以产生多个液滴616。液滴可从每个通道区段在与储器604的每个对应交汇部处形成。在水性流体608和第二流体610相遇的交汇部处,可以基于诸如在交汇部处的流体动力、两种流体608、610的流速、流体特性和通道结构600的某些几何参数(例如,通道区段602的宽度和高度,储器器604的扩张角等)等因素形成液滴,如本文其他地方所述。通过从多个通道区段602通过多个交汇部606连续注入水性流体608,可以在储器604中收集多个液滴。产量可随着通道结构600的基本上平行通道配置而显著增加。根据实践和储器的大小所允许的,通道结构可以具有尽可能多的基本上平行的通道区段。例如,通道结构可具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1500、5000或更多个平行或基本上平行的通道区段。多个通道区段可以例如在储器的边缘或周边周围基本上均匀地间隔开。替代地,多个通道区段的间隔可以是不均匀的。
储器604可以在每个通道交汇部处或附近具有扩张角α(图6中未示出)。多个通道区段602中的每个通道区段可以在通道交汇部处或附近具有宽度w和高度h0。对于多个通道区段602中的每个通道区段,几何参数w、h0和α可以一致或可以不一致。例如,每个通道区段在其与储器604的相应通道交汇部或附近具有相同或不同的宽度。例如,每个通道区段在其与储器604的相应通道交汇部或附近具有相同或不同的高度。
储器604在与多个通道区段602的不同通道交汇部处可以具有相同或不同的扩张角。例如,圆形储器(如图6所示)可以具有圆锥形、圆顶形或半球形的顶棚(例如,顶壁),以在多个通道交汇部606处或附近对于每个通道区段602提供相同或基本相同的扩张角。当几何参数一致时,有益地,即使增加了产量,也可以将所得的液滴尺寸控制为一致。在一些情况下,当期望具有不同的液滴尺寸分布时,可以相应地改变用于多个通道区段602的几何参数。
在一些情况下,所产生的至少约50%的液滴的可以具有一致的尺寸。在一些情况下,所产生的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有一致的尺寸。或者,所产生的小于约50%的液滴可以具有一致的尺寸。注入液滴中的珠粒和/或生物颗粒可以具有或可以不具有一致的尺寸。
图7A示出了具有用于受控的分区的几何特征的微流体通道结构的另一示例的横截面图。通道结构700可以包括通道区段702,该通道区段在通道交汇部706(或相交部)处与储器704连通。在一些情况下,通道结构700及其一个或多个部件可以对应于通道结构100及其一个或多个部件。图7B示出了图7A的通道结构700的透视图。
包含多个颗粒716的水性流体712可以沿着通道区段702被输送到交汇部706中,以与储器704中的与水性流体712不混溶的第二流体714(例如,油等)相遇,从而产生流入储器704的水性流体712的液滴720。在水性流体712和第二流体714相遇的交汇部706处,可以基于诸如在交汇部706处的流体动力、两种流体712、714的相对流速、流体特性和通道结构700的某些几何参数(例如,Δh等)等因素形成液滴。通过从通道区段702在交汇部706处连续注入水性流体712,可以在储器704中收集多个液滴。
所产生的离散液滴可包含多个颗粒716中的一个或多个颗粒。如本文其他地方所述,颗粒可以是任何颗粒,例如珠粒、细胞珠粒、凝胶珠粒、生物颗粒、生物颗粒的细胞内分析物或其他颗粒。或者,所产生的离散液滴可以不包含任何颗粒。
在一些情况下,水性流体712可以具有基本上均匀的颗粒716浓度或频率。如本文其他地方所述(例如,参考图4),可以将颗粒716(例如,珠粒)从单独通道(未在图7中示出)引入通道区段702中。通道区段702中的颗粒716的频率可以通过控制将珠粒716引入通道区段702的频率和/或通道区段702和单独通道中的流体的相对流速来控制。在一些情况下,颗粒716可以从多个不同的通道被引入通道区段702,并且相应地控制频率。在一些情况下,可以通过单独通道引入不同的颗粒。例如,第一单独通道可以将珠粒引入通道区段702,第二单独通道可以将生物颗粒引入通道区段702。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。
在一些情况下,第二流体714可以不经受和/或不被引导进入或流出储器704的任何流动。例如,第二流体714可以在储器704中基本上静止。在一些情况下,第二流体714可例如通过向储器704施加压力和/或受交汇部706处的水性流体712的流入影响而在储器704内经受流动,但不流入或流出储器704。或者,第二流体714可以经受和/或被引导流入或流出储器704。例如,储器704可以是引导第二流体714从上游到下游的通道,从而输送所产生的液滴。
通道结构700在交汇部706处或附近可以具有某些几何特征,其至少部分地确定由通道结构700形成的液滴的尺寸和/或形状。通道区段702可具有第一横截面高度h1,并且储器704可具有第二横截面高度h2。第一横截面高度h1和第二横截面高度h2可以不同,使得在交汇部706处存在高度差Δh。第二横截面高度h2可以大于第一横截面高度h1。在一些情况下,此后储器的横截面高度可以例如随着离交汇部706越远而逐渐增加。在一些情况下,储器的横截面高度可以根据在交汇部706处或附近的扩张角β而增加。高度差Δh和/或扩张角β可使得舌状部(水性流体712在交汇部706处离开通道区段702并在液滴形成之前进入储器704的部分)增加深度并有助于降低中间形成的液滴的曲率。例如,液滴尺寸可以随着高度差和/或扩张角的增加而减小。
高度差Δh可以为至少约1μm。或者,高度差可以为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500μm或更大。或者,高度差可以为至多约500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1μm或更小。在一些情况下,扩张角β可以在约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围内。例如,扩张角可以为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更大。在一些情况下,扩张角可以为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。
在一些情况下,进入交汇部706的水性流体712的流速可以在约0.04微升(μL)/分钟(min)至约40μL/min之间。在一些情况下,进入交汇部706的水性流体712的流速可以在约0.01微升(μL)/分钟(min)至约100μL/min之间。或者,进入交汇部706的水性流体712的流速可以小于约0.01μL/min。或者,进入交汇部706的水性流体712的流速可以大于约40μL/min,诸如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更高。在较低的流率下,例如约小于或等于10微升/分钟的流速,液滴半径可不取决于进入交汇部706的水性流体712的流速。第二流体714在储器704中可以是静止的或基本上静止的。或者,第二流体714可以以诸如针对水性流体712所述的上述流速流动。
在一些情况下,所产生的至少约50%的液滴可以具有一致的尺寸。在一些情况下,所产生的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有一致的尺寸。或者,所产生的小于约50%的液滴可以具有一致的尺寸。
尽管图7A和图7B示出了在交汇部706处突然变化(例如,步增)的高度差Δh,但是高度差可以逐渐增加(例如,从约0μm到最大高度差)。或者,高度差可以从最大高度差逐渐减小(例如,逐渐变细)。如本文所用,高度差的逐渐增加或减小可指高度差的连续递增或减小,其中高度轮廓的任何一个微分段与高度轮廓的紧邻的微分段之间的角度大于90°。例如,在交汇部706处,通道的底壁和储器的底壁可以以大于90°的角度相遇。替代地或附加地,通道的顶壁(例如,顶棚)和储器的顶壁(例如,顶棚)可以满足大于90°的角度。逐渐增加或减少可以是线性的或非线性的(例如,指数的、正弦的等)。替代地或附加地,高度差可以线性地或非线性地可变地增加和/或减小。尽管图7A和图7B将扩张的储器横截面高度图示为线性的(例如,恒定的扩张角β),但是横截面高度可以非线性地扩张。例如,储器可以至少部分地由具有可变扩张角的圆顶状(例如,半球形)形状限定。横截面高度可以以任何形状扩大。
通道网络,例如如上文或本文其他地方所述,可以与适当的流体部件流体联接。例如,入口通道区段流体地联接到将被递送到通道交汇部的材料的适当来源。这些来源可以包括多种不同的流体部件中的任何一种,从限定在微流体装置的主体结构中或连接到微流体装置的主体结构的简单储器,到从装置外部来源、歧管、流体流动单元(例如,致动器、泵、压缩机)递送流体的流体导管等。同样,出口通道区段(例如通道区段208,储器604等)可以流体地联接至用于分区细胞的接收储器或导管,以供后续处理。同样,这可以是限定在微流体装置的主体中的储器,或者它可以是用于将分区的细胞递送到随后的处理操作、仪器或部件的流体导管。
本文所述的方法和系统可以用于极大地提高单细胞应用和/或接收基于液滴的输入的其他应用的效率。例如,在分选占据的细胞和/或合适大小的细胞之后,可以执行的后续操作可以包括产生扩增产物、纯化(例如,经由固相可逆固定化(SPRI))、进一步的处理(例如,功能序列的剪切、连接以及随后的扩增(例如,经由PCR))。这些操作可成批发生(例如,在分区外部)。在分区是乳液中的液滴的情况下,乳液可被破坏并且液滴的内容物被合并以用于另外的操作。可以与带有条形码的珠粒一起共分配的另外的试剂可以包括用于封闭核糖体RNA(rRNA)的寡核苷酸和用于消化细胞中的基因组DNA的核酸酶。或者,可以在另外的处理操作过程中使用rRNA去除剂。通过这种方法产生构建体的配置可以帮助在对多核苷酸序列的5’末端进行测序和/或测序期间最小化(或避免)对聚-T序列的测序。可以对扩增产物,例如第一扩增产物和/或第二扩增产物进行测序以进行序列分析。在一些情况下,可以使用部分发夹式扩增测序(Partial Hairpin Amplification for Sequencing,PHASE)方法进行扩增。
多种应用需要评价生物颗粒群中不同生物颗粒或生物类型的存在和定量,包括例如微生物组分析和表征、环境测试、食品安全性测试、流行病学分析(例如在追踪污染物中)等。
计算机系统
本公开提供了被编程用于实现本公开的方法的计算机系统。图12显示了计算机系统1201,其被编程或以其他方式配置为维持和调节本文所述的组合条形码文库、处理细胞和/或细胞珠粒,以及控制微流体系统。计算机系统1201可以调节本公开的各个方面。计计算机系统1201可以是用户的电子设备或相对于电子设备远程定位的计算机系统。电子设备可以是移动电子设备。
计算机系统1201包括中央处理单元(CPU,本文也称为“处理器”和“计算机处理器”)1205,该中央处理单元1205可以是单核处理器或多核处理器,或者是用于并行处理的多个处理器。计算机系统1201还包括存储器或存储位置1210(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元1215(例如,硬盘)、用于与一个或多个其他系统通信的通信接口1220(例如,网络适配器)和外围设备1225(诸如高速缓存、其他存储器、数据存储和/或电子显示适配器)。存储器1210、存储单元1215、接口1220和外围设备1225通过诸如母板的通信总线(实线)与CPU 1205通信。存储单元1215可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统1201可以借助于通信接口1220而可操作地耦接到计算机网络(“网络”)1230。网络1230可以是因特网、互联网和/或外联网,或者与因特网通信的内联网和/或外联网。在一些情况下,网络1230是电信和/或数据网络。网络1230可以包括一个或多个计算机服务器,所述计算机服务器可以支持分布式计算,诸如云计算。在一些情况下,网络1230可借助于计算机系统1201实现点对点网络,这可以使得耦接到计算机系统1201的设备能够起到客户端或服务器的作用。
CPU 1205可以执行机器可读指令,所述机器可读指令可以体现为程序或软件。指令可以储存在诸如存储器1210的存储位置中。指令可以针对CPU 1205,其可以随后编程或以其他方式配置CPU 1205以实现本公开的方法。由CPU 1205执行的操作的示例可以包括取回、解码、执行和写回。
CPU 1205可以是诸如集成电路等电路的一部分。在该电路中可以包括系统1201的一个或多个其他部件。在一些情况下,该电路是专用集成电路(ASIC)。
存储单元1215可以存储文件,诸如驱动程序、文库和保存的程序。存储单元1215可以存储用户数据,例如,用户偏好和用户程序。在一些情况下,计算机系统1201可以包括计算机系统1201外部的,诸如位于通过内联网或因特网与计算机系统1201通信的远程服务器上的一个或多个附加数据存储单元。
计算机系统1201可以通过网络1230而与一个或多个远程计算机系统通信。例如,计算机系统1201可以与用户(例如,操作者)的远程计算机系统通信。远程计算机系统的示例包括个人计算机(例如,便携式PC)、平板个人计算机或平板PC(例如,
Figure BDA0003630416840001141
iPad、
Figure BDA0003630416840001142
Galaxy Tab)、电话、智能电话(例如,
Figure BDA0003630416840001143
iPhone、支持Android的设备、
Figure BDA0003630416840001144
)或个人数字助理。用户可以经由网络1230访问计算机系统1201。
本文所述的方法可通过存储在计算机系统1201的电子存储位置上(例如,存储器1210或电子存储单元1215上)的机器(例如,计算机处理器)可执行代码的方式来实现。机器可执行代码或机器可读代码能够以软件的形式提供。在使用中,该代码可以由处理器1205执行。在一些情况下,可以从存储单元1215中检索代码并将其储存在存储器1210上,以供处理器1205随时访问。在一些情况下,可以排除电子存储单元1215,并且将机器可执行指令存储在存储器1210上。
代码可被预编译并且配置用于与具有适于执行该代码的处理器的机器一起使用,或者可以在运行时期间被编译。代码能够以可被选择以使该代码能够以预编译或实时编译(as-compiled)的方式执行的编程语言来提供。
本文提供的系统和方法的方面,诸如计算机系统1201等,能够以编程来体现。该技术的各个方面可被认为是“产品”或“制品”,其通常为在一种类型的机器可读介质上携带或在该一种类型的机器可读介质中体现的机器(或处理器)可执行代码和/或相关联数据的形式。机器可执行代码可以储存在电子存储单元上,诸如存储器(例如,只读存储器、随机存取存储器、快闪存储器)或硬盘上。“存储”型介质可以包括任何或所有的计算机有形存储器、处理器等,或其相关联的模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以在任何时间为软件编程提供非暂时性存储。软件的全部或部分可以有时通过因特网或各种其他电信网络通信。这样的通信例如可以使软件能够从一个计算机或处理器加载到另一计算机或处理器中,例如,从管理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元件的另一类型的介质包括诸如跨本地设备之间的物理接口、通过有线和光学陆上通信线网络以及通过各种空中链路而使用的光波、电波和电磁波。携载这样的波的物理元件,诸如有线或无线链路、光学链路等,也可被认为是承载软件的介质。如本文所使用的,除非限制于非暂时性有形的“存储”介质,否则诸如计算机或机器“可读介质”等术语是指参与向处理器提供指令以供执行的任何介质。
因此,诸如计算机可执行代码等机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如附图中所示的可用于实现数据库。易失性存储介质包括动态存储器,诸如这样的计算机平台的主存储器。有形传输介质包括同轴电缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波,例如射频(RF)和红外(IR)数据通信期间产生的那些的形式。因此,计算机可读介质的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或匣盒、传送数据或指令的载波、传送这样的载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其他介质。这些计算机可读介质形式中的许多可涉及将一个或多个指令的一个或多个序列携载至处理器以供执行。
计算机系统1201可以包括电子显示器1235或与之通信,该电子显示器1235包括用户界面(UI)1240,其用于提供,例如,分区、条形码化和/或下游分析(例如测序分析)的结果或中间状态。UI的示例包括但不限于:图形用户界面(GUI)和基于web的用户界面。
本公开的方法和系统可以通过一个或多个算法的方式实现。算法可以在由中央处理单元1205执行时通过软件的方式实现。
本公开的装置、系统、组合物和方法可以用于各种应用,例如,处理来自单个细胞的单个分析物(例如,RNA、DNA或蛋白质)或多种分析物(例如,DNA和RNA,DNA和蛋白质,RNA和蛋白质,或RNA、DNA和蛋白质)。例如,将生物颗粒(例如,细胞或细胞珠粒)分配在分区(例如,液滴)中,并对来自该生物颗粒的多种分析物进行后续处理。多种分析物可以来自单个细胞。这可以使得能够例如对细胞同时进行蛋白质组学、转录组学和基因组分析。
尽管本文已经示出并描述了本发明优选的实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。并非意图通过说明书中提供的具体示例来限制本发明。尽管已经参考前述说明书描述了本发明,但是本文中的实施方案的描述和图示并不意味着以限制性的意义来解释。本领域技术人员在不脱离本发明的情况下此时将想到多种变化、改变和替代。此外,应当理解,本发明的所有方面不限于本文所阐述的具体描述、配置或相对比例,其取决于各种条件和变量。应当理解,本文中所述的本发明的实施方案的各种替代方案可用于实施本发明。因此,可以预期的是,本发明还将涵盖任何这样的替代、修改、变化或等同方案。所附权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同方案。

Claims (88)

1.一种处理细胞的方法,包括:
(a)将多个细胞和包含条形码序列的多个核酸条形码分子分区到多个分区中,其中所述多个分区中的一分区包含所述多个细胞中的第一细胞和所述多个核酸条形码分子中的第一条形码分子,其中所述第一条形码分子包含第一条形码序列,所述第一条形码序列对于所述多个分区中的所述分区是独特的;
(b)在所述分区中,将所述第一条形码分子附接到所述第一细胞的表面,其中所述第一条形码序列不同于在所述多个分区的其他分区中的其他条形码序列;
(c)从所述多个分区汇集来自所述多个细胞的细胞,所述第一细胞包括所述第一细胞;
(d)将所述多个细胞和附加的多个核酸条形码分子重新分区到附加的多个分区中,其中所述附加的多个分区中的一分区包含所述第一细胞和一附加的条形码分子,所述附加的条形码分子包含对于所述附加的多个分区中的所述分区独特的附加条形码序列;
(e)在(d)的所述分区中,将所述附加的条形码分子偶联到所述第一条形码分子,从而用核酸复合条形码分子索引所述第一细胞,所述核酸复合条形码分子包含复合条形码序列,所述复合条形码序列包含所述第一条形码序列和所述附加条形码序列,其中所述核酸复合条形码分子包含被配置为捕获分析物的捕获序列。
2.根据权利要求1所述的方法,其中,在(e)之后,将(c)-(e)重复N次,其中N是大于或等于1的整数,并且其中所述复合条形码序列包含所述第一条形码序列和N+1个附加条形码序列。
3.根据权利要求2所述的方法,其中第(N+1)个条形码分子被配置为偶联到第N个条形码核酸分子。
4.根据权利要求1-3中任一项所述的方法,还包括在(a)之前将细胞偶联剂偶联到所述第一细胞的所述表面,其中将所述细胞偶联剂偶联到寡核苷酸,所述寡核苷酸被配置为偶联到所述第一条形码分子。
5.根据权利要求4所述的方法,其中在(a)之前,将多个细胞偶联剂偶联到所述第一细胞的所述表面,其中所述多个细胞偶联剂包含所述细胞偶联剂。
6.根据权利要求1-5中任一项所述的方法,其中所述第一条形码分子被配置为偶联到第二条形码分子。
7.根据权利要求1-5中任一项所述的方法,其中所述第一条形码分子被配置为偶联到一个或多个夹板分子,其中所述一个或多个夹板分子被配置为偶联到所述第二条形码分子。
8.根据权利要求4-7中任一项所述的方法,其中所述细胞偶联剂包含肽或多肽。
9.根据权利要求8所述的方法,其中所述肽或多肽被配置为与所述第一细胞的所述细胞表面上的抗原偶联。
10.根据权利要求8所述的方法,其中所述肽或多肽被配置为与所述第一细胞的细胞膜上的碳水化合物基团偶联。
11.根据权利要求4-7中任一项所述的方法,其中所述细胞偶联剂包含脂质分子,其中所述脂质分子被配置为嵌入所述第一细胞的细胞膜中,且所述寡核苷酸被配置为与所述第一条形码分子偶联。
12.根据权利要求4-7中任一项所述的方法,其中所述细胞偶联剂包含二硫键。
13.根据权利要求1-12中任一项所述的方法,还包括,在用包含所述复合条形码序列的所述核酸复合条形码分子索引所述第一细胞之后,将所述第一细胞分区到第三分区中。
14.根据权利要求13所述的方法,还包括将包含所述复合条形码序列的所述核酸复合条形码分子偶联到所述分析物,其中所述分析物是所述第一细胞的细胞分析物,由此产生条形码化分析物。
15.根据权利要求14所述的方法,还包括确定所述条形码化分析物的序列,其中所述确定的所述条形码化分析物的序列包含所述复合条形码序列或其互补序列。
16.根据权利要求13-15所述的方法,还包括使用所述复合条形码序列或其互补序列将所述分析物识别为所述第一细胞的细胞分析物。
17.根据权利要求13-16中任一项所述的方法,还包括在所述第三分区中裂解所述细胞以释放所述分析物。
18.根据权利要求1-17中任一项所述的方法,其中所述分析物选自核糖核酸(RNA)分子、DNA分子、gDNA分子、蛋白质或其任何组合。
19.根据权利要求16所述的方法,其中所述RNA分子为信使RNA(mRNA)分子。
20.根据权利要求4-17中任一项所述的方法,还包括从所述细胞表面释放所述细胞偶联剂或从所述细胞偶联剂释放所述寡核苷酸。
21.根据权利要求20所述的方法,其中所述释放所述细胞偶联剂包括切割二硫键。
22.根据权利要求1-21中任一项所述的方法,其中所述分区是液滴。
23.根据权利要求1-21中任一项所述的方法,其中所述分区是孔。
24.根据权利要求23所述的方法,其中所述分区是微孔或纳米孔。
25.根据权利要求24所述的方法,其中所述分区是所述纳米孔,其中所述纳米孔来自纳米孔阵列。
26.根据权利要求24所述的方法,其中所述微孔来自96孔板或384孔板。
27.根据权利要求1-26中任一项所述的方法,其中在(a)之后,所述分区包含多于一个细胞。
28.根据权利要求1-27中任一项所述的方法,其中,在(e)之后,将(c)-(e)重复2次,并且其中在(d)中,所述附加的多个分区包括至少96个分区。
29.根据权利要求28所述的方法,其中在(e)之后,将(c)-(e)重复3次。
30.根据权利要求1-29中任一项所述的方法,其中对所述多个细胞中的每个细胞进行(a)-(e),并且其中在(e)之后,所述多个细胞中的相应细胞的至少99%各自包含对所述多个细胞中的所述相应细胞独特的相应复合条形码序列。
31.一种细胞处理方法,包括:
(a)使细胞与偶联至寡核苷酸分子的细胞偶联剂接触,由此产生偶联至所述偶联剂的细胞;
(b)将(i)偶联至所述偶联剂的所述细胞和(ii)包含第一条形码序列的第一条形码核酸分子分区到一分区中,并将所述第一条形码核酸分子附接到所述寡核苷酸分子;
(c)将偶联至所述偶联剂的所述细胞与多个细胞进行汇集;
(d)将(i)偶联至所述偶联剂的所述细胞和(ii)包含第二条形码序列的第二条形码核酸分子分区到第二分区中,并将所述第二核酸条形码分子附接到所述第一条形码核酸分子以生成包含所述第一条形码序列和所述第二条形码序列的核酸复合条形码分子,
其中,在(d)之后,所述核酸复合条形码分子包含被配置为捕获分析物的捕获序列。
32.根据权利要求31所述的方法,其中,在(d)之后,将(b)-(d)重复N次,其中N是大于或等于1的整数,并且其中所述核酸复合条形码分子包含所述第一条形码序列和N个附加条形码序列。
33.根据权利要求32所述的方法,其中第N个条形码序列被配置为附接到所述核酸复合条形码分子的第(N-1)个条形码序列。
34.根据权利要求31-33中任一项所述的方法,其中第N个条形码化核酸分子包含第N个条形码序列和所述捕获序列。
35.根据权利要求31-34中任一项所述的方法,其中所述分析物为基因组脱氧核糖核酸(gDNA)分子。
36.根据权利要求31-34中任一项所述的方法,其中所述分析物为核糖核酸(RNA)分子。
37.根据权利要求36所述的方法,其中所述RNA分子为信使RNA分子(mRNA)。
38.根据权利要求36所述的方法,其中所述RNA分子是(i)成簇的规律间隔的短回文(CRISPR)RNA分子(crRNA)或(ii)单个引导RNA(sgRNA)分子。
39.根据权利要求31-34中任一项所述的方法,其中所述分析物为蛋白质。
40.根据权利要求31-39中任一项所述的方法,其中所述分区是液滴。
41.根据权利要求31-39中任一项所述的方法,其中所述分区是孔。
42.根据权利要求31-41中任一项所述的方法,其中所述方法包括对所述多个细胞进行(a)-(d)。
43.根据权利要求31-42中任一项所述的方法,其中所述第一条形码核酸分子附接到第一珠粒和/或所述第二条形码核酸分子附接到第二珠粒。
44.根据权利要求31-43中任一项所述的方法,其中所述细胞偶联剂包含二硫键。
45.根据权利要求31-44中任一项所述的方法,还包括将所述细胞分区到第三分区中。
46.根据权利要求45所述的方法,还包括将所述核酸复合条形码分子偶联到所述分析物,其中所述分析物是所述细胞的细胞分析物。
47.根据权利要求31-46中任一项所述的方法,其中所述细胞偶联剂包含作为肽或多肽的部分基团。
48.根据权利要求47所述的方法,其中所述肽或多肽被配置为与所述细胞的所述细胞表面上的抗原偶联。
49.根据权利要求48所述的方法,其中所述肽或多肽被配置为与所述细胞的细胞膜上的碳水化合物基团偶联。
50.根据权利要求31-49中任一项所述的方法,其中所述细胞偶联剂包含脂质分子,其中所述脂质分子被配置为嵌入所述细胞的细胞膜中,且所述寡核苷酸被配置为与所述第一条形码分子偶联。
51.一种系统,包括:包含多个细胞的多个分区,其中所述多个细胞包含与其偶联的多个核酸条形码分子,其中所述多个分区中的一分区包含(i)所述多个细胞中的一细胞,其中,所述细胞包含偶联到所述细胞表面的所述多个核酸条形码分子中的一核酸条形码分子,其中所述条形码分子包含对于所述多个细胞中的所述细胞独特的条形码序列,(ii)核酸分子,所述核酸分子包含被配置成捕获分析物的捕获序列,以及(iii)试剂,所述试剂被配置成将所述核酸分子偶联到所述核酸条形码分子以生成包含所述条形码序列和所述捕获序列的复合条形码分子。
52.根据权利要求51所述的系统,其中所述试剂包括夹板分子,所述夹板分子被配置为与所述核酸条形码分子和所述核酸分子中的每一个偶联。
53.根据权利要求51-52中任一项所述的系统,其中所述多个分区是多个液滴。
54.根据权利要求51-52中任一项所述的系统,其中所述多个分区是多个孔。
55.根据权利要求54所述的系统,其中所述分区是微孔或纳米孔。
56.根据权利要求55所述的系统,其中所述分区是所述纳米孔,其中所述纳米孔来自纳米孔阵列。
57.根据权利要求55所述的系统,其中所述微孔来自96孔板或384孔板。
58.根据权利要求51-57中任一项所述的系统,其中所述分区包含多于一个细胞。
59.根据权利要求51-58中任一项所述的系统,其中所述核酸条形码分子通过细胞偶联剂偶联到所述细胞的所述表面。
60.根据权利要求59所述的系统,其中所述细胞偶联剂包含肽或多肽。
61.根据权利要求60所述的系统,其中所述肽或多肽与所述细胞的所述表面上的抗原偶联。
62.根据权利要求60所述的系统,其中所述肽或多肽与所述细胞的细胞膜上的碳水化合物基团偶联。
63.根据权利要求59所述的系统,其中所述细胞偶联剂包含脂质分子,其中所述脂质分子嵌入所述细胞的细胞膜中。
64.根据权利要求59所述的系统,其中所述细胞偶联剂包含二硫键。
65.根据权利要求51-64中任一项所述的系统,其中所述捕获序列包含聚-T序列。
66.根据权利要求51-64中任一项所述的系统,其中所述捕获序列包含模板转换寡核苷酸序列。
67.根据权利要求66所述的系统,其中所述捕获序列包含聚-G序列。
68.一种组合物,包含:多个细胞,所述多个细胞包含与其偶联的多个核酸条形码分子,其中所述多个细胞中的一细胞包含偶联到所述细胞表面的所述多个核酸条形码分子中的一核酸条形码分子,其中所述核酸条形码分子包含(i)对于所述多个细胞中的所述细胞独特的条形码序列,以及(ii)被配置为捕获分析物的捕获序列。
69.根据权利要求68所述的组合物,其中所述多个细胞以本体溶液提供。
70.根据权利要求68所述的组合物,其中所述多个细胞提供在多个分区中。
71.根据权利要求70所述的组合物,其中所述多个分区为多个液滴。
72.根据权利要求70所述的组合物,其中所述多个分区为多个孔。
73.根据权利要求72所述的组合物,其中所述多个分区为微孔或纳米孔。
74.根据权利要求73所述的组合物,其中所述多个分区为纳米孔阵列中的纳米孔。
75.根据权利要求73所述的组合物,其中所述多个分区为来自96孔板或384孔板的微孔。
76.根据权利要求68-75中任一项所述的组合物,其中所述多个分区中的分区包含所述细胞。
77.根据权利要求66-76中任一项所述的组合物,其中所述核酸条形码分子通过细胞偶联剂偶联到所述细胞的所述表面。
78.根据权利要求77所述的组合物,其中所述细胞偶联剂包含肽或多肽。
79.根据权利要求78所述的组合物,其中所述肽或多肽与所述细胞的所述表面上的抗原偶联。
80.根据权利要求79所述的组合物,其中所述肽或多肽与所述细胞的细胞膜上的碳水化合物基团偶联。
81.根据权利要求77所述的组合物,其中所述细胞偶联剂包含脂质分子,其中所述脂质分子嵌入所述细胞的细胞膜中。
82.根据权利要求77所述的组合物,其中所述细胞偶联剂包含二硫键。
83.根据权利要求66-82中任一项所述的组合物,其中所述捕获序列包含聚-T序列。
84.根据权利要求66-82中任一项所述的组合物,其中所述捕获序列包含模板转换寡核苷酸序列。
85.根据权利要求84所述的组合物,其中所述捕获序列包含聚-G序列。
86.根据权利要求1-30中任一项所述的方法,其中(a)的所述多个分区和(d)的所述附加的多个分区来自同一组的分区。
87.根据权利要求1-30中任一项所述的方法,其中(a)的所述多个分区和(d)的所述附加的多个分区来自不同组的分区。
88.一种细胞分析方法,包括:
(a)从多个细胞生成多个细胞珠粒,其中所述多个细胞珠粒被配置为在所述细胞珠粒中物理地保留衍生自细胞的分析物;
(b)将所述多个细胞珠粒和包含条形码序列的多个核酸条形码分子分区到多个分区中,其中所述多个分区中的分区包含两个或更多个细胞珠粒以及核酸条形码分子,所述两个或更多个细胞珠粒包括第一细胞珠粒,所述核酸条形码分子包含第一条形码序列,其中所述第一条形码序列不同于在所述多个分区的其他分区中的其他条形码序列;
(c)在所述分区中,将所述第一条形码序列附接到衍生自所述第一细胞珠粒的分析物上;
(d)从所述多个分区汇集来自所述多个细胞珠粒的细胞珠粒,所述多个细胞珠粒包括所述第一细胞珠粒;和
(e)执行(b)-(d)N次以将N个不同的条形码序列引入所述第一细胞珠粒,其中N是大于或等于2的整数,以生成复合条形码。
CN202080077458.0A 2019-09-06 2020-09-04 用于对细胞和细胞珠粒进行条形码化的系统和方法 Pending CN114729392A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962897181P 2019-09-06 2019-09-06
US62/897,181 2019-09-06
PCT/US2020/049575 WO2021046475A1 (en) 2019-09-06 2020-09-04 Systems and methods for barcoding cells and cell beads

Publications (1)

Publication Number Publication Date
CN114729392A true CN114729392A (zh) 2022-07-08

Family

ID=72562008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080077458.0A Pending CN114729392A (zh) 2019-09-06 2020-09-04 用于对细胞和细胞珠粒进行条形码化的系统和方法

Country Status (4)

Country Link
US (1) US20220403452A1 (zh)
EP (1) EP4025709A1 (zh)
CN (1) CN114729392A (zh)
WO (1) WO2021046475A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
CA2953374A1 (en) 2014-06-26 2015-12-30 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
EP3244992B1 (en) 2015-01-12 2023-03-08 10X Genomics, Inc. Processes for barcoding nucleic acids
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
CN110214186B (zh) 2017-01-30 2023-11-24 10X基因组学有限公司 用于基于微滴的单细胞条形编码的方法和系统
US10837047B2 (en) 2017-10-04 2020-11-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
EP4241882A3 (en) 2017-10-27 2023-12-06 10X Genomics, Inc. Methods for sample preparation and analysis
WO2019099751A1 (en) 2017-11-15 2019-05-23 10X Genomics, Inc. Functionalized gel beads
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
US11703427B2 (en) 2018-06-25 2023-07-18 10X Genomics, Inc. Methods and systems for cell and bead processing
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
WO2020168013A1 (en) 2019-02-12 2020-08-20 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11655499B1 (en) 2019-02-25 2023-05-23 10X Genomics, Inc. Detection of sequence elements in nucleic acid molecules
WO2020185791A1 (en) 2019-03-11 2020-09-17 10X Genomics, Inc. Systems and methods for processing optically tagged beads
US11851700B1 (en) 2020-05-13 2023-12-26 10X Genomics, Inc. Methods, kits, and compositions for processing extracellular molecules
EP4298244A1 (en) 2021-02-23 2024-01-03 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
WO2023060286A1 (en) * 2021-10-08 2023-04-13 University Of Maryland, College Park Thermally responsive partitions for devices and systems and methods of using same
US11753677B2 (en) 2021-11-10 2023-09-12 Encodia, Inc. Methods for barcoding macromolecules in individual cells
WO2023099662A2 (en) * 2021-12-01 2023-06-08 Vilnius University Barcoding nucleic acid molecules derived from individual cells
WO2023196526A1 (en) 2022-04-06 2023-10-12 10X Genomics, Inc. Methods for multiplex cell analysis
WO2023239733A1 (en) * 2022-06-06 2023-12-14 Genentech, Inc. Combinatorial indexing for single-cell nucleic acid sequencing
US20240102090A1 (en) * 2022-09-24 2024-03-28 WellSIM Biomedical Technologies, Inc. Method for multimodal profiling of individual extracellular vesicles

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015200893A2 (en) * 2014-06-26 2015-12-30 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
CN107075543A (zh) * 2014-04-21 2017-08-18 哈佛学院院长及董事 用于条形码化核酸的系统和方法
CN107250445A (zh) * 2015-02-27 2017-10-13 富鲁达公司 用于高通量研究的单个细胞核酸
CN107614700A (zh) * 2015-03-11 2018-01-19 布罗德研究所有限公司 基因型和表型偶联
WO2018119447A2 (en) * 2016-12-22 2018-06-28 10X Genomics, Inc. Methods and systems for processing polynucleotides
CN108603220A (zh) * 2015-12-08 2018-09-28 海菲生物公司 单细胞转录组的分析方法
WO2019113533A1 (en) * 2017-12-08 2019-06-13 10X Genomics, Inc. Methods and compositions for labeling cells
CN109983126A (zh) * 2016-10-19 2019-07-05 10X基因组学有限公司 用于条形码化单个细胞或细胞群的核酸分子的方法和系统
CN110114520A (zh) * 2016-10-01 2019-08-09 伯克利之光生命科技公司 Dna条形码组合物和在微流体装置中原位识别的方法
WO2019165318A1 (en) * 2018-02-22 2019-08-29 10X Genomics, Inc. Ligation mediated analysis of nucleic acids

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2916292A (en) 1991-10-24 1993-05-21 Isis Pharmaceuticals, Inc. Derivatized oligonucleotides having improved uptake and other properties
US6300319B1 (en) 1998-06-16 2001-10-09 Isis Pharmaceuticals, Inc. Targeted oligonucleotide conjugates
US9012390B2 (en) 2006-08-07 2015-04-21 Raindance Technologies, Inc. Fluorocarbon emulsion stabilizing surfactants
US20140378345A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
EP2885418A4 (en) 2012-08-14 2016-03-02 10X Genomics Inc MICROCAPSE COMPOSITIONS AND METHOD THEREFOR
JP6726659B2 (ja) 2014-04-10 2020-07-22 10エックス ジェノミクス, インコーポレイテッド 試薬をカプセル化およびパーティション化するための流体デバイス、システム、および方法、ならびにそれらの応用
WO2019099751A1 (en) 2017-11-15 2019-05-23 10X Genomics, Inc. Functionalized gel beads

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107075543A (zh) * 2014-04-21 2017-08-18 哈佛学院院长及董事 用于条形码化核酸的系统和方法
WO2015200893A2 (en) * 2014-06-26 2015-12-30 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
CN106795553A (zh) * 2014-06-26 2017-05-31 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
CN107250445A (zh) * 2015-02-27 2017-10-13 富鲁达公司 用于高通量研究的单个细胞核酸
CN107614700A (zh) * 2015-03-11 2018-01-19 布罗德研究所有限公司 基因型和表型偶联
CN108603220A (zh) * 2015-12-08 2018-09-28 海菲生物公司 单细胞转录组的分析方法
CN110114520A (zh) * 2016-10-01 2019-08-09 伯克利之光生命科技公司 Dna条形码组合物和在微流体装置中原位识别的方法
CN109983126A (zh) * 2016-10-19 2019-07-05 10X基因组学有限公司 用于条形码化单个细胞或细胞群的核酸分子的方法和系统
WO2018119447A2 (en) * 2016-12-22 2018-06-28 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2019113533A1 (en) * 2017-12-08 2019-06-13 10X Genomics, Inc. Methods and compositions for labeling cells
WO2019165318A1 (en) * 2018-02-22 2019-08-29 10X Genomics, Inc. Ligation mediated analysis of nucleic acids

Also Published As

Publication number Publication date
EP4025709A1 (en) 2022-07-13
WO2021046475A1 (en) 2021-03-11
US20220403452A1 (en) 2022-12-22

Similar Documents

Publication Publication Date Title
US20220403452A1 (en) Systems and methods for barcoding cells and cell beads
CN110462060B (zh) 用于标记细胞的方法和组合物
US20230167432A1 (en) Methods and systems for analysis and identification of barcode multiplets
US20240018589A1 (en) Method for transposase-mediated spatial tagging and analyzing genomic dna in a biological sample
US20220145370A1 (en) Systems and methods for processing rna from cells
CN113286893A (zh) 生成阵列的方法
US10400235B2 (en) Single cell analysis of transposase accessible chromatin
CN111051523A (zh) 功能化凝胶珠
CN113439124A (zh) 使用主/复制阵列进行空间检测的方法
WO2021222302A1 (en) Methods and systems for increasing cell recovery efficiency
US20200291481A1 (en) Methods and compositions for labeling cells
CN114127309A (zh) 使用空间阵列进行单细胞测序的方法
CN112703252A (zh) 用于最小化条形码交换的方法和系统
CN113874521A (zh) 用于富集条形码的方法和系统
CN112639985A (zh) 用于代谢组分析的系统和方法
CN111712579A (zh) 用于处理来自一个或多个细胞的核酸分子的系统和方法
CN111699388A (zh) 用于单细胞处理的系统和方法
EP3559272B1 (en) Methods and systems for associating physical and genetic properties of biological particles
EP4022309B1 (en) Methods for analyte detection and analysis
US20190329209A1 (en) Methods and compositions for emulsification of solid supports in deformable beads
US20230212648A1 (en) Method for analyzing target nucleic acid from cell
CN116964219A (zh) 用于分析抗原结合分子的方法和组合物
US20230295556A1 (en) Selective enzymatic gelation
US20230304020A1 (en) Lentiviral-free cytosolic delivery of payloads via aptamers
US20240209346A1 (en) Nucleic acid processing via circularization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination