CN116685850A - 单细胞分泌组分析 - Google Patents

单细胞分泌组分析 Download PDF

Info

Publication number
CN116685850A
CN116685850A CN202180084437.6A CN202180084437A CN116685850A CN 116685850 A CN116685850 A CN 116685850A CN 202180084437 A CN202180084437 A CN 202180084437A CN 116685850 A CN116685850 A CN 116685850A
Authority
CN
China
Prior art keywords
binding agent
sequence
factor binding
solid support
oligonucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180084437.6A
Other languages
English (en)
Inventor
宋慧媛
乔迪·马丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Publication of CN116685850A publication Critical patent/CN116685850A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54306Solid-phase reaction mechanisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5023Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/563Immunoassay; Biospecific binding assay; Materials therefor involving antibody fragments
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6863Cytokines, i.e. immune system proteins modifying a biological response such as cell growth proliferation or differentiation, e.g. TNF, CNF, GM-CSF, lymphotoxin, MIF or their receptors
    • G01N33/6866Interferon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6863Cytokines, i.e. immune system proteins modifying a biological response such as cell growth proliferation or differentiation, e.g. TNF, CNF, GM-CSF, lymphotoxin, MIF or their receptors
    • G01N33/6869Interleukin
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/74Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving hormones or other non-cytokine intercellular protein regulatory factors such as growth factors, including receptors to hormones and growth factors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/10Oligonucleotides as tagging agents for labelling antibodies

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Wood Science & Technology (AREA)
  • Endocrinology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文公开了用于测量来自细胞的分泌因子的系统、方法、组合物和试剂盒,包括能够同时确定单细胞分泌活性和蛋白表达和/或基因表达的系统、方法、组合物和试剂盒。本文的公开内容包括固体支持物,所述固体支持物包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针。本文的公开内容还包括能够与被捕获探针结合的分泌因子特异性结合的分泌因子结合试剂。分泌因子结合试剂可以包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。

Description

单细胞分泌组分析
相关申请
本申请根据35 U.S.C.§119(e)要求2020年12月15日提交的美国临时专利申请系列第63/125629号的权益,该相关申请的内容出于所有目的通过引用以其整体并入本文。
背景
领域
本公开内容总体上涉及分子生物学领域,例如使用分子条形码化确定细胞的分泌分子谱。
对相关技术的描述
当前的技术通过在单细胞中的每一个与条形码化试剂珠在隔室(compartment)中共定位时将细胞特异性寡核苷酸条形码附接至来自个体细胞的多(A)mRNA分子而允许以大规模并行的方式(例如,>10000个细胞)测量单细胞的基因表达。基因表达可能影响蛋白表达和分子的分泌。蛋白-蛋白相互作用可能影响细胞的基因表达和蛋白表达以及分子的分泌。细胞释放的细胞因子和其他分子是免疫学家和其他细胞生物学家非常感兴趣的。用于检测和测量分泌蛋白的传统方法通常是批量测量(而不是在单细胞水平)。例如,当前可用的方法包括用于批量研究分泌因子的基于珠的测定和ELISA。因此,数据中缺少单细胞定量和细胞表型分析。在流式细胞术与传统蛋白印迹的比较中,研究来自细胞异质性混合物的个体细胞有巨大的价值。越来越需要将特定的分泌活性与复杂的细胞表型关联。由于可用于显微镜或流式细胞术分析的荧光标志物的数目,目前可用的用于检测分泌蛋白的方法对可检测的蛋白的数目有限制。此外,由于测量荧光强度差异的限制,这样的方法的定量低于所需。对能够定量分析由单细胞分泌的分泌因子的拷贝数的系统和方法存在需求。对能够定量分析由单细胞分泌的分泌因子的拷贝数并同时测量蛋白表达和/或基因表达的系统和方法存在需求。
概述
本文的公开内容包括测量由单细胞分泌的分泌因子的拷贝数的方法。方法可以包括:使一个或更多个单细胞与第一多于一个第一固体支持物接触,一个或更多个单细胞能够分泌多于一种分泌因子,每一个第一固体支持物包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针。方法可以包括:使第一固体支持物与多于一种分泌因子结合试剂接触,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。方法可以包括:使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交,寡核苷酸条形码各自包含第一分子标记。方法可以包括:使与分泌因子结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,一个或更多个单细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
在一些实施方案中,使一个或更多个单细胞与第一多于一个第一固体支持物接触包括:将一个或更多个单细胞和第一多于一个第一固体支持物分区到多于一个第一分区,多于一个第一分区中的第一分区包含一个或更多个单细胞中的单细胞和第一多于一个第一固体支持物中的单个第一固体支持物。在一些实施方案中,方法包括在使第一固体支持物与多于一种分泌因子结合试剂接触之前:汇集来自多于一个第一分区中的每一个第一分区的单个第一固体支持物,以产生第二多于一个第一固体支持物。在一些实施方案中,使第一固体支持物与多于一种分泌因子结合试剂接触包括使第二多于一个第一固体支持物与多于一种分泌因子结合试剂接触。在一些实施方案中,方法包括在使第二多于一个第一固体支持物与多于一种分泌因子结合试剂接触之后,去除多于一种分泌因子结合试剂中未与第二多于一个第一固体支持物接触的一种或更多种分泌因子结合试剂,以产生第三多于一个第一固体支持物。在一些实施方案中,去除未与第二多于一个第一固体支持物接触的一种或更多种分泌因子结合试剂包括:去除未与分泌因子中被捕获探针结合的相应至少一种接触的一种或更多种分泌因子结合试剂。在一些实施方案中,使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交包括:将第三多于一个第一固体支持物分区到多于一个第二分区,多于一个第二分区中的第二分区包含来自第三多于一个第一固体支持物的单个第一固体支持物;以及在包含单个第一固体支持物的第二分区中,使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交。
本文的公开内容包括测量由单细胞分泌的分泌因子的拷贝数和单细胞中核酸靶的拷贝数的方法。方法可以包括:使一个或更多个单细胞与第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞,所述一个或更多个单细胞包含表面细胞靶和核酸靶的拷贝,所述一个或更多个单细胞能够分泌多于一种分泌因子,每一个第二固体支持物包含多于一种捕获探针和多于一种锚定探针,多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合。方法可以包括:使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触,所述多于一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。方法可以包括:使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交,所述寡核苷酸条形码各自包含第一分子标记。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,所述多于一个条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记。方法可以包括:使与分泌因子结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一个条形码化核酸分子或其产物的序列信息,以确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。方法可以包括:获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞(例如,T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物)中的每一个分泌的至少一种分泌因子的拷贝数。
在一些实施方案中,使一个或更多个单细胞与第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞包括:将一个或更多个单细胞和多于一个第二固体支持物分区到多于一个第一分区,多于一个第一分区中的第一分区包含一个或更多个单细胞中的单细胞和多于一个第二固体支持物中的单个第二固体支持物,单细胞能够通过与表面细胞靶结合的锚定探针与第二固体支持物进行关联。在一些实施方案中,方法包括,在使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触之前:汇集来自多于一个第一分区中的每一个第一分区的与第二固体支持物关联的单细胞,以产生与第二固体支持物关联的第一多于一个单细胞。
在一些实施方案中,使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触包括使与第二固体支持物关联的第一多于一个单细胞与多于一种分泌因子结合试剂接触。在一些实施方案中,方法包括在使与第二固体支持物关联的第一多于一个单细胞与多于一种分泌因子结合试剂接触之后,去除多于一种分泌因子结合试剂中未和与第二固体支持物关联的第一多于一个单细胞接触的一种或更多种分泌因子结合试剂,以产生与第二固体支持物关联的第二多于一个单细胞。在一些实施方案中,去除未和与第二固体支持物关联的第一多于一个单细胞接触的一种或更多种分泌因子结合试剂包括:去除未与分泌因子中被捕获探针结合的相应至少一种接触的一种或更多种分泌因子结合试剂。
方法可以包括:在使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交之前:将与第二固体支持物关联的第二多于一个单细胞分区到多于一个第二分区,多于一个第二分区中的第二分区包含来自与第二固体支持物关联的第二多于一个单细胞的单细胞和单个第二固体支持物;在包含单细胞和单个第二固体支持物的第二分区中,使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交。在一些实施方案中,方法包括裂解第二分区中的单细胞。裂解单细胞可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。
至少一种分泌因子可以包括淋巴因子、白细胞介素、趋化因子或其任何组合。例如,分泌因子可以是细胞因子、激素、分子毒素或其任何组合。在一些实施方案中,至少一种分泌因子包括神经生长因子、肝生长因子、成纤维细胞生长因子、血管内皮生长因子、血小板源生长因子、转化生长因子、骨诱导因子、干扰素、集落刺激因子或其任何组合。至少一种分泌因子可以包括血管生成素、血管生成蛋白-1、血管生成蛋白-2、bNGF、组织蛋白酶S、半乳凝素-7、GCP-2、G-CSF、GM-CSF、PAI-1、PDGF-AA、PDGF-BB、PDGF-AB、PlGF、PlGF-2、SDF-1、Tie2、VEGF-A、VEGF-C、VEGF-D、VEGF-R1、VEGF-R2、VEGF-R3、6Ckine、血管生成蛋白-1、血管生成蛋白-2、BLC、BRAK、CD186、ENA-78、嗜酸性粒细胞趋化因子-1、嗜酸性粒细胞趋化因子-2、嗜酸性粒细胞趋化因子-3、EpCAM、GDF-15、GM-CSF、GRO、HCC-4、I-309、IFN-γ、IL-1α、IL-1β、IL-1R4(ST2)、IL-2、IL-2R、IL-3、IL-3Rα、IL-5、IL-6、IL-6R、IL-7、IL-8、IL-8RB、IL-11、IL-12、IL-12p40、IL-12p70、IL-13、IL-13R1、IL-13R2、IL-15、IL-15Rα、IL-16、IL-17、IL-17C、IL-17E、IL-17F、IL-17R、IL-18、IL-18BPa、IL-18Rα、IL-20、IL-23、IL-27、IL-28、IL-31、IL-33、IP-10、I-TAC、LIF、LIX、LRP6、MadCAM-1、MCP-1、MCP-2、MCP-3、MCP-4、M-CSF、MIF、MIG、MIP-1γ、MIP-1α、MIP-1β、MIP-1δ、MIP-3α、MIP-3β、MPIF-1、PARC、PF4、RANTES、抵抗素、SCF、SCYB16、TACI、TARC、TSLP、TNF-α、TNF-R1、TRAIL-R4、TREM-1、激活蛋白A、双调蛋白、Axl、BDNF、BMP4、组织蛋白酶S、EGF、FGF-1、FGF-2、FGF-7、FGF-21、卵泡抑制素、半乳凝素-7、Gas6、GDF-15、HB-EGF、HGF、IGFBP-1、IGFBP-3、LAP、NGF R、NrCAM、NT-3、NT-4、PAI-1、TGF-α、TGF-β、TGF-β3、TRAIL-R4、ADAMTS1、组织蛋白酶S、FGF-2、卵泡抑制素、半乳凝素-7、GCP-2、GDF-15、IGFBP-6、LIF、MMP-9、pro-MMP9、RANK、RANKL、RANTES、SDF-1、CXCR4或其任何组合。
在一些实施方案中,分泌因子结合试剂和捕获探针能够与同一分泌因子的不同表位结合。在一些实施方案中,分泌因子结合试剂、捕获探针和锚定探针中的一种或更多种包括抗体或其片段。在一些实施方案中,抗体或其片段包括单克隆抗体。在一些实施方案中,抗体或其片段包括Fab、Fab’、F(ab’)2、Fv、scFv、dsFv、双特异抗体(diabody)、三特异抗体(triabody)、四特异抗体(tetrabody)、由抗体片段形成的多特异性抗体、单结构域抗体(sdAb)、包含互补的scFv(串联scFv)或双特异性串联scFv的单链、Fv构建体、二硫键连接的Fv(disulfide-linked Fv)、双可变结构域免疫球蛋白(DVD-Ig)结合蛋白或纳米抗体、适配体、亲和体、affilin、affitin、affimer、alphabody、anticalin、avimer、DARPin、Fynomer、Kunitz结构域肽、单特异抗体或其任何组合。在一些实施方案中,捕获探针和/或锚定探针通过以下与第一固体支持物和/或第二固体支持物缀合:1,3-偶极环加成反应、杂Diels-Alder反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合。
表面细胞靶可以包括糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。例如,表面细胞靶可以包括糖类、脂质、蛋白或其任何组合。在一些实施方案中,表面细胞靶包括CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3、CD3d、CD3e、CD3g、CD4、CD5、CD6、CD7、CD8a、CD8b、CD9、CD10、CD11a、CD11b、CD11c、CD11d、CDwl2、CD13、CD14、CD15、CD15u、CD15s、CD15su、CD16、CD16b、CD17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD45、CD45RA、CD45RB、CD45RC、CD45RO、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CD60a、CD60b、CD60c、CD61、CD62E、CD62L、CD62P、CD63、CD64、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CD75、CD75s、CD77、CD79a、CD79b、CD80、CD81、CD82、CD83、CD84、CD85a、CD85d、CD85j、CD85k、CD86、CD87、CD88、CD89、CD90、CD91、CD92、CD93、CD94、CD95、CD96、CD97、CD98、CD99、CD99R、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107a、CD107b、CD108、CD109、CD110、CD111、CD112、CD113、CD114、CD115、CD116、CD117、CD118、CD119、CD120a、CD120b、CD121a、CD121b、CD122、CD123、CD124、CD125、CD126、CD127、CD129、CD130、CD131、CD132、CD133、CD134、CD135、CD136、CD137、CD138、CD139、CD140a、CD140b、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CDw149、CD150、CD151、CD152、CD153、CD154、CD155、CD156a、CD156b、CD156c、CD157、CD158e、CD158i、CD158k、CD159a、CD159c、CD160、CD161、CD162、CD163、CD164、CD165、CD166、CD167a、CD167b、CD168、CD169、CD170、CD171、CD172a、CD172b、CD172g、CD173、CD174、CD175、CD175s、CD176、CD177、CD178、CD179a、CD179b、CD180、CD181、CD182、CD183、CD184、CD185、CD186、CD191、CD192、CD193、CD194、CD195、CD196、CD197、CDw198、CD199、CD200、CD201、CD202b、CD203c、CD204、CD205、CD206、CD207、CD208、CD209、CD210、CDw210b、CD212、CD213a1、CD213a2、CD215、CD217a、CD218a、CD218b、CD220、CD221、CD222、CD223、CD224、CD225、CD226、CD227、CD228、CD229、CD230、CD231、CD232、CD233、CD234、CD235a、CD235b、CD236、CD236R、CD238、CD239、CD240CE、CD240DCE、CD240D、CD241、CD242、CD243、CD244、CD245、CD246、CD247、CD248、CD249、CD252、CD253、CD254、CD256、CD266、CD267、CD268、CD269、CD270、CD271、CD272、CD273、CD274、CD275、CD276、CD277、CD278、CD279、CD280、CD281、CD282、CD283、CD284、CD286、CD289、CD290、CD292、CDw293、CD294、CD295、CD296、CD297、CD298、CD299、CD300a、CD300c、CD300e、CD301、CD302、CD303、CD304、CD305、CD306、CD307a、CD307b、CD307c、CD307d、CD307e、CD308、CD309、CD312、CD314、CD315、CD316、CD317、CD318、CD319、CD320、CD321、CD322、CD324、CD325、CD326、CD327、CD328、CD329、CD331、CD332、CD333、CD334、CD335、CD336、CD337、CD338、CD339、CD340、CD344、CD349、CD350、CD351、CD352、CD353、CD354、CD355、CD357、CD358、CD360、CD361、CD362、CD363、CD364、CD365、CD366、CD367、CD368、CD369、CD370、CD371、BCMA、HLA蛋白、β2-微球蛋白或其任何组合。
在一些实施方案中,多于一种寡核苷酸条形码与第三固体支持物关联,并且多于一个第二分区中的第二分区包含单个第三固体支持物。在一些实施方案中,第一分区和/或第二分区是孔或液滴。在一些实施方案中,每一种寡核苷酸条形码包含第一通用序列。在一些实施方案中,寡核苷酸条形码包含含有捕获序列的靶结合区。在一些实施方案中,靶结合区包含多(dT)区。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含与捕获序列互补的序列,所述捕获序列被配置为捕获分泌因子结合试剂特异性寡核苷酸。在一些实施方案中,与捕获序列互补的序列包含多(dA)区。在一些实施方案中,多于一个条形码化分泌因子结合试剂特异性寡核苷酸包含第一通用序列的互补物。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含第二通用序列。
在一些实施方案中,获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物,以产生多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸;以及获得多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸或其产物的测序数据。
分泌因子结合试剂特异性寡核苷酸可以包含第二分子标记。在一些实施方案中,多于一个分泌因子结合试剂特异性寡核苷酸中的至少10个包含不同的第二分子标记序列。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是相同的。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是不同的。
在一些实施方案中,测序数据中与用于分泌因子结合试剂的独特因子标识符序列关联的独特第一分子标记序列的数目指示由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数,所述分泌因子结合试剂能够与至少一种分泌因子特异性结合。在一些实施方案中,测序数据中与用于分泌因子结合试剂的独特因子标识符序列关联的独特第二分子标记序列的数目指示由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数,所述分泌因子结合试剂能够与至少一种分泌因子特异性结合。在一些实施方案中,方法包括基于与多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物关联的具有不同序列的第一分子标记和/或第二分子标记的数目来确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。
在一些实施方案中,方法包括基于与多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸或其产物关联的具有不同序列的第一分子标记和/或第二分子标记的数目来确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,获得序列信息包括将测序衔接子附接到多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含与多(dA)区相邻的对齐序列。对齐序列的长度可以为一个或更多个核苷酸,或长度可以为两个或更多个核苷酸。例如,对齐序列可以(a)包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合;(b)包含多(dT)序列、多(dG)序列、多(dC)序列、多(dU)序列或其组合;和/或(c)在多(dA)区的5’。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸通过接头与分泌因子结合试剂关联。在一些实施方案中,接头包含碳链。碳链可以包含2-30个碳原子(例如,12个碳原子)。在一些实施方案中,接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸被配置为可从分泌因子结合试剂脱离。例如,方法可以包括使分泌因子结合试剂特异性寡核苷酸与分泌因子结合试剂解离。
在一些实施方案中,确定一个或更多个单细胞中的每一个中核酸靶的拷贝数包括基于与多于一个条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、其互补物或其组合的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。
在一些实施方案中,方法包括:使随机引物与多于一个条形码化核酸分子接触,随机引物中的每一种包含第三通用序列或其互补物;以及使与多于一个条形码化核酸分子杂交的随机引物延伸以产生多于一个延伸产物。在一些实施方案中,方法包括使用能够与第一通用序列或其互补物杂交的引物和能够与第三通用序列或其互补物杂交的引物扩增多于一个延伸产物,从而产生第一多于一个条形码化扩增子。在一些实施方案中,扩增多于一个延伸产物包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一个延伸产物。在一些实施方案中,方法包括基于与第一多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。
在一些实施方案中,确定一个或更多个单细胞中的每一个中核酸靶的拷贝数包括基于与第一多于一个条形码化扩增子中的条形码化扩增子关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中多于一个核酸靶中的每一个的数目,所述第一多于一个条形码化扩增子包含多于一个核酸靶中的每一个的序列。在一些实施方案中,多于一个核酸靶中的每一个的序列包括多于一个核酸靶中的每一个的子序列。在一些实施方案中,第一多于一个条形码化扩增子中的核酸靶的序列包括核酸靶的子序列。
在一些实施方案中,方法包括使用能够与第一通用序列或其互补物杂交的引物和能够与第三通用序列或其互补物杂交的引物扩增第一多于一个条形码化扩增子,从而产生第二多于一个条形码化扩增子。在一些实施方案中,扩增第一多于一个条形码化扩增子包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到第一多于一个条形码化扩增子。在一些实施方案中,方法包括基于与第二多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。在一些实施方案中,第一多于一个条形码化扩增子和/或第二多于一个条形码化扩增子包括全转录组扩增(WTA)产物。
在一些实施方案中,方法包括使用多于一个条形码化核酸分子作为模板合成第三多于一个条形码化扩增子以产生第三多于一个条形码化扩增子。在一些实施方案中,合成第三多于一个条形码化扩增子包括进行(1)多于一个条形码化核酸分子的PCR扩增;(2)使用能够与第一通用序列或其互补物杂交的引物和靶特异性引物进行PCR扩增;或者两者都有。在一些实施方案中,方法包括获得第三多于一个条形码化扩增子或其产物的序列信息。获得序列信息可以包括将测序衔接子附接到第三多于一个条形码化扩增子或其产物。方法可以包括基于与第三多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。
在一些实施方案中,核酸靶包括核酸分子。在一些实施方案中,核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸、细胞组分结合试剂特异性寡核苷酸或其任何组合。在一些实施方案中,使多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶使多于一种寡核苷酸条形码延伸。在一些实施方案中,DNA聚合酶包括Klenow片段。在一些实施方案中,逆转录酶包括病毒逆转录酶(例如鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶)。
在一些实施方案中,第一通用序列、第二通用序列和/或第三通用序列是相同的。在一些实施方案中,第一通用序列、第二通用序列和/或第三通用序列是不同的。在一些实施方案中,第一通用序列、第二通用序列和/或第三通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分。在一些实施方案中,测序衔接子包括P5序列、P7序列、其互补序列和/或其部分。在一些实施方案中,测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。在一些实施方案中,多于一种寡核苷酸条形码中的至少10种包含不同的第一分子标记序列。在一些实施方案中,多于一种寡核苷酸条形码各自包含细胞标记。在一些实施方案中,多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸。在一些实施方案中,与同一第三固体支持物关联的寡核苷酸条形码包含相同的细胞标记。在一些实施方案中,与不同第三固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
在一些实施方案中,第一固体支持物、第二固体支持物和/或第三固体支持物包括合成颗粒或平坦表面。在一些实施方案中,多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在合成颗粒上,或者多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中。合成颗粒可以是可破坏的。合成颗粒可以包括珠。合成颗粒可以包括:琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或者可破坏的水凝胶颗粒。
在一些实施方案中,多于一种寡核苷酸条形码中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,多于一种锚定探针中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,多于一种捕获探针中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,第一固体支持物和/或第二固体支持物的尺寸和形状被确定为近似于细胞。在一些实施方案中,第一固体支持物和/或第二固体支持物具有细胞的尺寸。在一些实施方案中,细胞是哺乳动物细胞、酵母细胞、昆虫细胞、植物细胞、细菌细胞或其任何组合。
本文的公开内容包括组合物(例如,试剂盒)。组合物可以包含:第一固体支持物,其包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针;以及多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。
本文的公开内容包括组合物(例如,试剂盒)。组合物可以包含:第二固体支持物,其包含多于一种捕获探针和多于一种锚定探针,多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合;以及多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含第二分子标记序列(例如,长度为2-20个核苷酸)。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是相同的。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是不同的。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含第二通用序列。在一些实施方案中,第二通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分。在一些实施方案中,测序衔接子包括P5序列、P7序列、其互补序列和/或其部分。在一些实施方案中,测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含多(dA)区。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含与多(dA)区相邻的对齐序列。对齐序列的长度可以为一个或更多个核苷酸,或长度可以为两个或更多个核苷酸。对齐序列可以(a)包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合;(b)包含多(dT)序列、多(dG)序列、多(dC)序列、多(dU)序列或其组合;和/或(c)在多(dA)区的5’。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸通过接头与分泌因子结合试剂关联。在一些实施方案中,接头包含碳链。碳链可以包含2-30个碳原子(例如,12个碳原子)。在一些实施方案中,接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸被附接到分泌因子结合试剂。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸被共价附接到分泌因子结合试剂。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸被非共价附接到分泌因子结合试剂。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸与分泌因子结合试剂缀合。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸通过化学基团与分泌因子结合试剂缀合,所述化学基团诸如UV可光裂解基团、链霉抗生物素蛋白、生物素、胺或其组合。
分泌因子可以包括淋巴因子、白细胞介素、趋化因子或其任何组合。例如,分泌因子可以包括细胞因子、激素、分子毒素或其任何组合。在一些实施方案中,分泌因子包括神经生长因子、肝生长因子、成纤维细胞生长因子、血管内皮生长因子、血小板源生长因子、转化生长因子、骨诱导因子、干扰素、集落刺激因子或其任何组合。
在一些实施方案中,分泌因子结合试剂和捕获探针能够与同一分泌因子的不同表位结合。在一些实施方案中,分泌因子结合试剂、捕获探针和锚定探针中的一种或更多种包括抗体或其片段。在一些实施方案中,抗体或其片段包括单克隆抗体。在一些实施方案中,抗体或其片段包括Fab、Fab’、F(ab’)2、Fv、scFv、dsFv、双特异抗体(diabody)、三特异抗体(triabody)、四特异抗体(tetrabody)、由抗体片段形成的多特异性抗体、单结构域抗体(sdAb)、包含互补的scFv(串联scFv)或双特异性串联scFv的单链、Fv构建体、二硫键连接的Fv(disulfide-linked Fv)、双可变结构域免疫球蛋白(DVD-Ig)结合蛋白或纳米抗体、适配体、亲和体、affilin、affitin、affimer、alphabody、anticalin、avimer、DARPin、Fynomer、Kunitz结构域肽、单特异抗体或其任何组合。在一些实施方案中,捕获探针和/或锚定探针通过以下与第一固体支持物和/或第二固体支持物缀合:1,3-偶极环加成反应、杂Diels-Alder反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合。
在一些实施方案中,表面细胞靶包括糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。例如,表面细胞靶可以包括糖类、脂质、蛋白或其任何组合。
在一些实施方案中,组合物包含缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶(例如,Klenow片段)。在一些实施方案中,组合物包含逆转录酶,诸如病毒逆转录酶。组合物可以包含缓冲液、筒(cartridge)或两者。
在一些实施方案中,组合物包含多于一种寡核苷酸条形码,多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含靶结合区。靶结合区可以包含多(dA)区、多(dT)区、随机序列、基因特异性序列或其任何组合。在一些实施方案中,多于一种寡核苷酸条形码各自包含分子标记。分子标记可以包含至少6个核苷酸。在一些实施方案中,多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。在一些实施方案中,多于一种寡核苷酸条形码与第三固体支持物关联。在一些实施方案中,多于一种寡核苷酸条形码各自包含细胞标记。在一些实施方案中,多于一种寡核苷酸条形码中与同一第三固体支持物关联的寡核苷酸条形码包含相同的细胞标记。在一些实施方案中,多于一种寡核苷酸条形码中与不同第三固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
在一些实施方案中,第一固体支持物、第二固体支持物和/或第三固体支持物包括合成颗粒或平坦表面。多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在合成颗粒上,或者多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在合成颗粒中。合成颗粒可以是可破坏的,例如,可破坏的水凝胶颗粒。
在一些实施方案中,多于一种寡核苷酸条形码中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,多于一种锚定探针中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,多于一种捕获探针中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,第一固体支持物和/或第二固体支持物的尺寸和形状被确定为近似于细胞。在一些实施方案中,第一固体支持物和/或第二固体支持物具有细胞的尺寸。在一些实施方案中,细胞是哺乳动物细胞、酵母细胞、昆虫细胞、植物细胞、细菌细胞或其任何组合。
附图简述
图1图示了非限制性示例性条形码。
图2示出条形码化和数字计数的非限制性示例性工作流程。
图3是示出用于从多于一个靶产生在3’末端条形码化的靶的索引文库的非限制性示例性过程的示意图。
图4A-图4C示出了用于测量由单细胞分泌的一种或更多种分泌因子的拷贝数的非限制性示例性工作流程的示意图。
图5A-图5C示出了用于同时测量单细胞的分泌因子和基因表达的非限制性示例性工作流程的示意图。
图6示出了与分泌因子结合试剂(此处图示的抗体)关联的分泌因子结合试剂特异性寡核苷酸(此处图示的抗体寡核苷酸)的非限制性示例性设计。
图7A-图7D示出了用于同时测量分泌因子和核酸靶的拷贝数的非限制性示例性工作流程的示意图。
图8示出了对与结合试剂(此处图示的抗体)关联的结合试剂寡核苷酸(此处图示的抗体寡核苷酸)进行条形码化的非限制性示例性工作流程的示意图。
详述
以下详述中参考了形成本文的一部分的附图。在附图中,除非上下文另外指示,否则相似的符号通常标识相似的组成部分。在详述、附图和权利要求书中描述的说明性实施方案不意味着是限制性的。在不脱离本文呈现的主题的精神或范围的情况下,可以利用其他实施方案,并且可以做出其他改变。将容易理解的是,如本文一般描述的以及附图中图示的本公开内容的方面能够以各种不同的配置来布置、替换、组合、分离和设计,所有这些都在本文中明确设想并且构成本公开内容的一部分。
本文提及的所有专利、公开的专利申请、其他出版物和来自GenBank的序列,以及其他数据库关于相关技术通过引用以其整体并入。
对少量核酸(例如信使核糖核苷酸(mRNA)分子)进行定量对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因是临床上重要的。然而,确定核酸分子(例如,mRNA分子)的绝对数目也可以是非常具有挑战性的,尤其是当分子数目非常小时。确定样品中分子的绝对数目的一种方法是数字聚合酶链式反应(PCR)。理想地,PCR在每个循环中产生相同拷贝的分子。然而,PCR可具有缺点,使得每个分子以随机概率复制,且此概率根据PCR循环和基因序列而变化,这导致扩增偏倚和不准确的基因表达测量。具有独特分子标记(molecular labels,也称为分子索引(molecular indexes,MI))的随机条形码可以用于计数分子数目和校正扩增偏倚。诸如PreciseTM测定(Cellular Research,Inc.(Palo Alto,CA))和RhapsodyTM测定(Becton,Dickinson and Company(Franklin Lakes,NJ))的随机条形码化可以通过使用分子标记(ML)在逆转录(RT)期间标记mRNA来纠正由PCR和文库制备步骤引起的偏倚。
PreciseTM测定可以利用具有在多(T)寡核苷酸上的大量(例如6561种至65536种)独特分子标记序列的随机条形码的非耗尽性池(non-depleting pool),以在RT步骤期间与样品中的所有多(A)-mRNA杂交。随机条形码可以包含通用PCR引发位点。在RT期间,靶基因分子与随机条形码随机反应。每一种靶分子可以与随机条形码杂交,导致产生随机条形码化的互补核糖核苷酸(cDNA)分子。在标记后,可以将来自微孔板微孔的随机条形码化cDNA分子汇集到单个管中用于PCR扩增和测序。可以分析原始测序数据以产生读段的数目、具有独特分子标记序列的随机条形码的数目以及mRNA分子的数目。
本文的公开内容包括测量由单细胞分泌的分泌因子的拷贝数的方法。方法可以包括:使一个或更多个单细胞与第一多于一个第一固体支持物接触,一个或更多个单细胞能够分泌多于一种分泌因子,每一个第一固体支持物包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针。方法可以包括:使第一固体支持物与多于一种分泌因子结合试剂接触,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。方法可以包括:使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交,寡核苷酸条形码各自包含第一分子标记。方法可以包括:使与分泌因子结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,一个或更多个单细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
本文的公开内容包括测量由单细胞分泌的分泌因子的拷贝数和单细胞中核酸靶的拷贝数的方法。方法可以包括:使一个或更多个单细胞与第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞,所述一个或更多个单细胞包含表面细胞靶和核酸靶的拷贝,所述一个或更多个单细胞能够分泌多于一种分泌因子,每一个第二固体支持物包含多于一种捕获探针和多于一种锚定探针,多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合。方法可以包括:使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触,所述多于一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。方法可以包括:使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交,所述寡核苷酸条形码各自包含第一分子标记。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,所述多于一个条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记。方法可以包括:使与分泌因子结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一个条形码化核酸分子或其产物的序列信息,以确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。方法可以包括:获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,一个或更多个单细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
本文的公开内容包括组合物(例如,试剂盒)。组合物可以包含:第一固体支持物,其包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针;以及多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。
本文的公开内容包括组合物(例如,试剂盒)。组合物可以包含:第二固体支持物,其包含多于一种捕获探针和多于一种锚定探针,多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合;以及多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。
定义
除非另外定义,否则本文使用的技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同意义。参见,例如,Singleton等人,Dictionary ofMicrobiology and Molecular Biology,第2版,J.Wiley&Sons(New York,NY 1994);Sambrook等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press(Cold Spring Harbor,NY 1989)。为了本公开内容的目的,下文定义了以下术语。
如本文使用的,术语“衔接子”可以意指促进关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包括空间标记、靶标记、样品标记、索引标记或条形码序列(例如,分子标记)中的一种或更多种。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子(pre-adenylated adaptors)。衔接子可以是双链或单链的。一种或更多种衔接子可以位于核酸的5’末端或3’末端。当衔接子在5’末端和3’末端包含已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’末端和/或3’末端的衔接子可以能够与固定在表面上的一种或更多种寡核苷酸杂交。在一些实施方案中,衔接子可以包含通用序列。通用序列可以是两种或更多种核酸分子共有的核苷酸序列的区域。两种或更多种核酸分子也可以具有不同序列的区域。因此,例如,5’衔接子可以包含相同和/或通用核酸序列,并且3’衔接子可以包含相同和/或通用序列。可以存在于多于一种核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单种通用引物复制或扩增多于一种不同序列。类似地,可以存在于核酸分子的集合中的不同成员中的至少一种、两种(例如,一对)或更多种通用序列可以允许使用与通用序列互补的至少一种、两种(例如,一对)或更多种单一通用引物复制或扩增多于一种不同序列。因此,通用引物包含可与此类通用序列杂交的序列。可以修饰具有靶核酸序列的分子以将通用衔接子(例如,非靶核酸序列)附接到不同靶核酸序列的一个末端或两个末端。与靶核酸附接的一种或更多种通用引物可以提供通用引物杂交的位点。与靶核酸附接的一种或更多种通用引物可以彼此相同或不同。
如本文使用的,术语“关联”或“与...关联”可以意指两个或更多个物质可以被鉴定为在某个时间点共定位。关联可以意指,两个或更多个物质在或曾经在相似的容器内。关联可以是信息学关联。例如,关于两个或更多个物质的数字信息可以被存储并且可以用于确定一种或更多种物质在某个时间点共定位。关联也可以是物理关联。在一些实施方案中,两个或更多个关联的物质彼此“拴系”、“附接”或“固定”或与共同的固体或半固体表面“拴系”、“附接”或“固定”。关联可以指用于将标记与固体或半固体支持物(诸如珠)附接的共价或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(诸如靶分子和标记)之间的杂交。
如本文使用的,术语“互补”可以指两个核苷酸之间精确配对的能力。例如,如果核酸在给定位置处的核苷酸能够与另一个核酸的核苷酸形成氢键,则这两个核酸被认为在该位置处是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在全部互补性时它可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则第一核苷酸序列可以被称为第二序列的“互补物”。如果第一核苷酸序列和与第二序列相反的序列(即,核苷酸顺序相反)互补,则第一核苷酸序列可以被称为第二序列的“反向互补物”。如本文使用的,“互补”序列可以指序列的“互补物”或“反向互补物”。从本公开内容理解,如果一个分子可以与另一个分子杂交,则其可以与其所杂交的分子互补或部分互补。
如本文使用的,术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶关联的独特标记的数目的步骤。这种方法(其本质上可以是随机的)将计数分子的问题从相同分子的定位和鉴定之一转化为有关检测一组预定义标记的一系列是/否数字问题。
如本文使用的,术语“一个标记(label)”或“多于一个标记(labels)”可以指与样品中的靶关联的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包括核酸序列的连接处,例如天然和非天然序列的连接处。如本文使用的,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在多种实施方案中,可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶。
如本文使用的,术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的条形码(例如,随机条形码)的池。非耗尽性储库可以包括大量不同的条形码,使得当非耗尽性储库与靶池关联时,每种靶可能与独特条形码关联。每种标记的靶分子的独特性可以通过随机选择的统计来确定,并且取决于与标记的多样性相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子的集合的大小可以通过条形码化处理的随机性质来确定,并且然后对检测到的条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特条形码的数目的比例低时,标记的靶分子是高度独特的(即,多于一个靶分子被给定标记标记的概率非常低)。
如本文使用的,术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一种或更多种类似物(例如,改变的主链、糖或核酸碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、非天然核酸(xeno nucleic acid)、吗啉代核酸(morpholinos)、锁核酸、二醇核酸、苏糖核酸、二脱氧核苷酸、虫草菌素、7-脱氮-GTP、荧光团(例如,罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿苷、二氢尿苷、辫苷(queuosine)以及怀俄苷(wyosine)。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。
核酸可以包括一种或更多种修饰(例如,碱基修饰、主链修饰),以为核酸提供新的或增强的特征(例如,改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是还包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括呋喃戊糖的那些核苷,磷酸基团可以连接到糖的2’、3’或5’羟基部分。在形成核酸时,磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。继而,此线性聚合化合物的各端可以进一步连接而形成环状化合物;然而,线性化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中,磷酸基团通常可以称为形成核酸的核苷间主链。连键(linkage)或主链可以是3’到5’磷酸二酯连键。
核酸可以包括修饰的主链和/或修饰的核苷间连键。修饰的主链可以包括那些在主链中保留磷原子的主链和那些在主链中没有磷原子的主链。合适的其中含磷原子的修饰的核酸主链可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、亚膦酸酯、磷酰胺酯(phosphoramidate)(包括3’-氨基磷酰胺酯和氨基烷基磷酰胺酯、磷酸二酰胺酯(phosphorodiamidates)、硫代磷酰胺酯(thionophosphoramidates))、硫代烷基磷酸酯、硫代烷基磷酸三酯、硒代磷酸酯和硼磷酸酯,具有正常3’-5’连接、2’-5’连接的类似物以及具有反向极性的类似物(其中一个或更多个核苷酸间连接是3’至3’、5’至5’或2’至2’连接)。
核酸可以包括由短链烷基或环烷基核苷间连键,混合杂原子,和烷基或环烷基核苷间连键,或者一个或更多个短链杂原子的或杂环的核苷间连键形成的多核苷酸主链。这些可以包括具有吗啉代(morpholino)连键的那些(部分由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基(formacetyl)和硫代甲乙酰基主链;亚甲基甲乙酰基和硫代甲乙酰基主链;核糖乙酰基主链;含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;和具有混合的N、O、S和CH2组分部分的其他的那些。
核酸可以包括核酸模拟物。术语“模拟物”可以意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间连键二者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环的替代也可以称为糖替代物(surrogate)。可以维持杂环碱基部分或修饰的杂环碱基部分,以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖主链可以被含酰胺的主链替代,特别是被氨基乙基甘氨酸主链替代。核苷酸可以被保留,并且直接或间接与主链的酰胺部分的氮杂氮原子结合。PNA化合物中的主链可以包含两个或更多个连接的氨基乙基甘氨酸单元,这使得PNA具有含酰胺的主链。杂环碱基部分可以直接或间接与主链的酰胺部分的氮杂氮原子结合。
核酸可以包括吗啉代主链结构。例如,核酸可以包含替代核糖环的6元吗啉代环。在这些实施方案的一些中,磷酸二酰胺酯或其他非磷酸二酯核苷间连键可以替代磷酸二酯连键。
核酸可以包括具有附接至吗啉代环的杂环碱基的连接的吗啉代单元(例如,吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白可以具有较少的不期望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代类别内的各种化合物可以使用不同的连接基团来连接。另外类别的多核苷酸模拟物可以称为环己烯基核酸(CeNA)。核酸分子中通常存在的呋喃糖环可以被环己烯基环替代。使用亚磷酰胺化学可以制备CeNA DMT保护的亚磷酰胺单体并用于寡聚化合物合成。将CeNA单体掺入核酸链可以增加DNA/RNA杂合体的稳定性。CeNA寡腺苷酸酯可以与核酸互补物形成复合体,具有与天然复合体相似的稳定性。另外的修饰可以包括锁核酸(LNA),其中2’-羟基基团与糖环的4’碳原子连接,从而形成2’-C,4’-C-氧亚甲基连键,从而形成双环糖部分。连接可以是亚甲基(-CH2-),桥接2’氧原子和4’碳原子的基团,其中n是1或2。LNA和LNA类似物可以显示与互补核酸的非常高的双链体热稳定性(Tm=+3℃至+10℃)、对3’-外切核酸酶降解的稳定性和良好的溶解性。
核酸还可以包括核碱基(通常简称为“碱基”)修饰或取代。如本文使用的,“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如,腺嘌呤(A)和鸟嘌呤(G)),以及嘧啶碱基(例如,胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。经修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物,2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤素尿嘧啶(5-halouracil)和胞嘧啶、5-丙炔基(-C≡C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶,8-卤素、8-氨基、8-硫代、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤素特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-钳(G-clamps)诸如取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-钳诸如取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。
如本文使用的,术语“样品”可以指包含靶的组合物。用于通过所公开的方法、装置和系统进行分析的合适样品包括细胞、组织、器官或生物体。
如本文使用的,术语“采样装置”或“装置”可以指可以取样品的切片和/或将所述切片放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(FACS)机、细胞分选机、活检针、活检装置、组织切片装置、微流体装置、刀片格栅和/或超薄切片机。
如本文使用的,术语“固体支持物”可以指可以附接多于一个条形码(例如,随机条形码)的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座(bearing)、圆柱体或由塑料、陶瓷、金属或聚合材料(例如,水凝胶)构成的其他类似配置,其上可以固定核酸(例如,共价地或非共价地)。固体支持物可以包括可以是球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多于一个固体支持物可以不包括基底。固体支持物可以与术语“珠”互换使用。
如本文使用的,术语“随机条形码”可以指本公开内容的包含标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如本文使用的,术语“基因特异性随机条形码”可以指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如本文使用的,术语“随机条形码化”可以指核酸的随机标记(例如,条形码化)。随机条形码化可以利用递归泊松策略来关联并对与靶关联的标记进行定量。如本文使用的,术语“随机条形码化”可以与“随机进行标记”互换使用。
如本文使用的,术语“靶”可以指可与条形码(例如,随机条形码)关联的组合物。用于通过所公开的方法、装置和系统进行分析的示例性合适的靶包括寡核苷酸、DNA、RNA、mRNA、微RNA、tRNA等。靶可以是单链的或双链的。在一些实施方案中,靶可以是蛋白、肽或多肽。在一些实施方案中,靶是脂质。如本文使用的,“靶”可以与“物质(species)”互换使用。
如本文使用的,术语“逆转录酶”可以指具有逆转录酶活性(即,催化从RNA模板合成DNA)的一组酶。通常,这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒(retroplasmid)逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II组内含子衍生的逆转录酶,及它们的突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和II组内含子逆转录酶。II组内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、细长嗜热聚球藻(Thermosynechococcus elongatus)TeI4c内含子逆转录酶或嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)GsI-IIC内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即,尤其是逆转录子、II组内含子、以及多样性产生型逆转录元件)。
术语“通用衔接子引物”、“通用引物衔接子”或“通用衔接子序列”可互换地使用,以指可以用于与条形码(例如,随机条形码)杂交以产生基因特异性条形码的核苷酸序列。通用衔接子序列可以例如是在本公开内容的方法中使用的遍及所有条形码通用的已知序列。例如,当使用本文公开的方法标记多于一个靶时,每一种靶特异性序列可以连接到相同的通用衔接子序列。在一些实施方案中,多于一个通用衔接子序列可以用于本文公开的方法中。例如,当使用本文公开的方法标记多于一个靶时,至少两种靶特异性序列连接到不同的通用衔接子序列。通用衔接子引物及其互补物可以被包括在两种寡核苷酸中,其中的一种寡核苷酸包含靶特异性序列且另一种寡核苷酸包含条形码。例如,通用衔接子序列可以是包含靶特异性序列的寡核苷酸的一部分以产生与靶核酸互补的核苷酸序列。包含条形码和通用衔接子序列的互补序列的第二寡核苷酸可与核苷酸序列杂交并产生靶特异性条形码(例如,靶特异性随机条形码)。在一些实施方案中,通用衔接子引物具有与本公开内容的方法中使用的通用PCR引物不同的序列。
条形码
条形码化,诸如随机条形码化,已描述于以下中:例如,Fu等人,Proc Natl AcadSci U.S.A.,2011May 31;108(22):9026-31;美国专利申请公布第US2011/0160078号;Fan等人,Science,2015February 6,347(6222):1258367;美国专利申请公布第US2015/0299784号和PCT申请公布第WO2015/031691号;这些中的每一个的内容,包括任何支持或补充信息或材料,通过引用以其整体并入本文。在一些实施方案中,本文公开的条形码可以是随机条形码,所述随机条形码可以是可以用于对靶进行随机标记(例如,条形码化、加标签)的多核苷酸序列。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或这些值中的任何两个值之间的数字或范围,则条形码可以称为随机条形码。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1,则条形码可以称为随机条形码。随机条形码的条形码序列可以称为分子标记。
条形码(例如,随机条形码)可以包括一种或更多种标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如,分子标记)、样品标记、板标记、空间标记和/或前空间标记(pre-spatial label)。图1图示了具有空间标记的示例性条形码104。条形码104可以包含可以将条形码与固体支持物108连接的5’胺。条形码可以包含通用标记、维度标记、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维度标记、空间标记、细胞标记和分子标记)的顺序可以变化。例如,如图1中所示,通用标记可以是最5’侧的标记(5’-most label),且分子标记可以是最3’侧的标记(3’-most label)。空间标记、维度标记和细胞标记可以处于任何顺序。在一些实施方案中,通用标记、空间标记、维度标记、细胞标记和分子标记处于任何顺序。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如,靶核酸、RNA、mRNA、DNA)相互作用。例如,靶结合区可以包含可以与mRNA的多(A)尾相互作用的寡(dT)序列。在一些情况下,条形码的标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列)可以由1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸隔开。
标记(例如,细胞标记)可以包含一组独特的定义长度的核酸子序列,例如每一种七个核苷酸(相当于一些汉明错误校正代码中使用的比特数目),其可被设计成提供错误校正能力。可以设计包含七个核苷酸序列的错误校正子序列组,使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数),例如一组错误校正子序列可被设计成展现三个核苷酸的遗传距离。在这种情况下,对于标记的靶核酸分子的序列数据组中的错误校正序列的审查(在下文更详细地描述)可允许人们检测或校正扩增错误或测序错误。在一些实施方案中,用于产生错误校正代码的核酸子序列的长度可以变化,例如,它们的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、31个、40个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。在一些实施方案中,其他长度的核酸子序列可以用来产生错误校正代码。
条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是以下或包括以下:核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、各自含有多(A)尾的RNA或其任何组合。在一些实施方案中,多于一个靶可以包括脱氧核糖核酸(DNA)。
在一些实施方案中,靶结合区可以包括可以与mRNA的多(A)尾相互作用的寡(dT)序列。条形码的一种或更多种标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列(例如,分子标记))可以通过间隔区(spacer)与条形码的另一种或两种剩余标记隔开。间隔区可以是例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸。在一些实施方案中,条形码的标记中没有一个标记被间隔区隔开。
通用标记
条形码可以包含一种或更多种通用标记。在一些实施方案中,一种或更多种通用标记对于附接至给定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施方案中,一种或更多种通用标记对于附接至多于一个珠的所有条形码可以是相同的。在一些实施方案中,通用标记可以包括能够与测序引物杂交的核酸序列。测序引物可以用于对包括通用标记的条形码进行测序。测序引物(例如,通用测序引物)可以包括与高通量测序平台相关的测序引物。在一些实施方案中,通用标记可以包括能够与PCR引物杂交的核酸序列。在一些实施方案中,通用标记可以包括能够与测序引物和PCR引物杂交的核酸序列。能够与测序引物或PCR引物杂交的通用标记的核酸序列可以被称为引物结合位点。通用标记可以包括可以用于引发条形码转录的序列。通用标记可以包括可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。例如,通用标记可以包括至少约10个核苷酸。通用标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。在一些实施方案中,可裂解接头或修饰的核苷酸可以是通用标记序列的一部分,以使条形码能够从支持物上被裂解下来。
维度标记
条形码可以包含一种或更多种维度标记。在一些实施方案中,维度标记可以包括提供关于标记(例如,随机标记)发生的维度的信息的核酸序列。例如,维度标记可以提供关于靶被条形码化的时间的信息。维度标记可以与样品中条形码化(例如,随机条形码化)的时间关联。维度标记可以在标记的时间被激活。不同的维度标记可以在不同的时间被激活。维度标记提供关于靶、靶的组和/或样品被条形码化的顺序的信息。例如,在细胞周期的G0期可以将细胞的群体条形码化。在细胞周期的G1期,可以用条形码(例如,随机条形码)对细胞再次进行脉冲处理。在细胞周期的S期,可以用条形码对细胞再次进行脉冲处理,等等。每次脉冲(例如,细胞周期的每个时期)时的条形码可以包含不同的维度标记。以这种方式,维度标记提供关于哪些靶在细胞周期的哪个时期被标记的信息。维度标记可以探询许多不同的生物学时间。示例性的生物学时间可以包括但不限于细胞周期、转录(例如,转录起始)和转录物降解。在另一个实例中,样品(例如,细胞、细胞的群体)可以在用药物和/或疗法治疗之前和/或之后标记。不同靶的拷贝数的变化可以指示样品对药物和/或疗法的响应。
维度标记可以是可激活的。可激活的维度标记可以在特定时间点被激活。可激活的标记可以被例如组成性地激活(例如,不关闭)。可激活的维度标记可以被例如可逆地激活(例如,可激活的维度标记可以被打开和关闭)。维度标记可以被例如可逆地激活至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。维度标记可以被可逆地激活例如至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。在一些实施方案中,可以用荧光、光、化学事件(例如,裂解,连接另一种分子,添加修饰(例如,聚乙二醇化、类泛素化(sumoylate)、乙酰化、甲基化、去乙酰化、去甲基化)、光化学事件(例如,光罩(photocaging))以及引入非天然的核苷酸将维度标记激活。
在一些实施方案中,维度标记对于附接至给定固体支持物(例如,珠)的所有条形码(例如,随机条形码)可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上至少60%、70%、80%、85%、90%、95%、97%、99%或100%的条形码可以包含相同的维度标记。在一些实施方案中,同一固体支持物上至少60%的条形码可以包含相同的维度标记。在一些实施方案中,同一固体支持物上至少95%的条形码可以包含相同的维度标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特的维度标记序列。维度标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸,或这些值中的任何两个值之间的数字或范围的核苷酸。维度标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。维度标记可以包含约5个至约200个之间的核苷酸。维度标记可以包含约10个至约150个之间的核苷酸。维度标记可以包含长度在约20个至约125个之间的核苷酸。
空间标记
条形码可以包含一种或更多种空间标记。在一些实施方案中,空间标记可以包含提供关于与条形码关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品中的坐标关联。坐标可以是固定的坐标。例如,坐标可以相对于基底固定。空间标记可以参考二维或三维网格。坐标可以相对于界标(landmark)固定。界标可在空间中被鉴定。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标,诸如具有可鉴定标识(identifiable identifier)(诸如色码、条形码、磁特性(magnetic property)、荧光、放射性或独特尺寸或形状)的结构。空间标记可以与物理分区(例如,孔、容器或液滴)关联。在一些实施方案中,将多于一个空间标记一起用于编码空间中的一个或更多个位置。
空间标记对于附接至给定固体支持物(例如,珠)的所有条形码可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,同一固体支持物上包含相同空间标记的条形码的百分比可以是至少或至多60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,同一固体支持物上至少60%的条形码可以包含相同的空间标记。在一些实施方案中,同一固体支持物上至少95%的条形码可以包含相同的空间标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特的空间标记序列。空间标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。空间标记的长度可以是至少以下或至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。空间标记可以包含约5个至约200个之间的核苷酸。空间标记可以包含约10个至约150个之间的核苷酸。空间标记可以包含长度在约20个至约125个之间的核苷酸。
细胞标记
条形码(例如,随机条形码)可以包含一种或更多种细胞标记。在一些实施方案中,细胞标记可以包含提供用于确定哪种靶核酸来源于哪种细胞的信息的核酸序列。在一些实施方案中,细胞标记对于附接至给定固体支持物(例如,珠)的所有条形码是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,同一固体支持物上包含相同细胞标记的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。例如,同一固体支持物上至少60%的条形码可以包含相同的细胞标记。作为另一个实例,同一固体支持物上至少95%的条形码可以包含相同的细胞标记。
多于一个固体支持物(例如,珠)中可以呈现多达106种或更多种独特的细胞标记序列。细胞标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。例如,细胞标记可以包含约5个至约200个之间的核苷酸。作为另一个实例,细胞标记可以包含约10个至约150个之间的核苷酸。作为又另一个实例,细胞标记可以包含长度在约20个至约125个之间的核苷酸。
条形码序列
条形码可以包含一种或更多种条形码序列。在一些实施方案中,条形码序列可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器(例如,提供粗略估计)的核酸序列。
在一些实施方案中,将一组相异的(diverse)条形码序列附接至给定固体支持物(例如,珠)。在一些实施方案中,可以有以下或可以有约以下的独特分子标记序列:102种、103种、104种、105种、106种、107种、108种、109种或这些值中的任何两个值之间的数字或范围。例如,多于一个条形码可以包括约6561种具有不同序列的条形码序列。作为另一个实例,多于一个条形码可以包括约65536种具有不同序列的条形码序列。在一些实施方案中,可以有至少以下或可以有至多以下的独特条形码序列:102种、103种、104种、105种、106种、107种、108种或109种。独特分子标记序列可以附接至给定固体支持物(例如,珠)。在一些实施方案中,独特分子标记序列被颗粒(例如水凝胶珠)部分或全部包含。
在不同实施方式中,条形码的长度可以是不同的。例如,条形码的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。作为另一个实例,条形码的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。
分子标记
条形码(例如,随机条形码)可以包含一种或更多种分子标记。分子标记可以包含条形码序列。在一些实施方案中,分子标记可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。分子标记可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器的核酸序列。
在一些实施方案中,将一组相异的分子标记附接至给定固体支持物(例如,珠)。在一些实施方案中,可以有以下或可以有约以下的独特分子标记序列:102种、103种、104种、105种、106种、107种、108种、109种或这些值中的任何两个值之间的数字或范围。例如,多于一个条形码可以包括约6561种具有不同序列的分子标记。作为另一个实例,多于一个条形码可以包括约65536种具有不同序列的分子标记。在一些实施方案中,可以有至少以下或可以有至多以下的独特分子标记序列:102种、103种、104种、105种、106种、107种、108种或109种。具有独特分子标记序列的条形码可以附接至给定固体支持物(例如,珠)。
对于使用多于一个随机条形码进行的条形码化(例如,随机条形码化),不同分子标记序列的数目与任何靶的出现次数的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1,或这些值中的任何两个值之间的数字或范围。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。在一些实施方案中,不同分子标记序列的数目与任何靶的出现次数的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1。
分子标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或这些值中的任何两个值之间的数字或范围的核苷酸。分子标记的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。
靶结合区
条形码可以包含一个或更多个靶结合区,诸如捕获探针。在一些实施方案中,靶结合区可以与感兴趣的靶杂交。在一些实施方案中,靶结合区可以包含与靶(例如,靶核酸、靶分子,例如待分析的细胞核酸)特异性杂交(例如,与特定基因序列特异性杂交)的核酸序列。在一些实施方案中,靶结合区可以包含可以附接(例如,杂交)至特定靶核酸的特定位置的核酸序列。在一些实施方案中,靶结合区可以包含能够与限制性酶位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。
在一些实施方案中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以指可以独立于靶核酸的特定序列结合多于一个靶核酸的序列。例如,靶结合区可以包含随机多聚体序列、多(dA)序列、多(dT)序列、多(dG)序列、多(dC)序列或其组合。例如,靶结合区可以是与mRNA分子上的多(A)尾杂交的寡(dT)序列。随机多聚体序列可以是,例如,随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施方案中,对于附接至给定珠的所有条形码,靶结合区是相同的。在一些实施方案中,对于附接至给定珠的多于一个条形码,靶结合区可以包括两种或更多种不同的靶结合序列。靶结合区的长度可以是以下或可以是约以下:5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。例如,可以使用逆转录酶诸如Moloney鼠白血病病毒(MMLV)逆转录酶逆转录mRNA分子,以产生具有多(dC)尾的cDNA分子。条形码可以包括具有多(dG)尾的靶结合区。在条形码的多(dG)尾和cDNA分子的多(dC)尾之间碱基配对后,逆转录酶将模板链从细胞RNA分子转换到条形码,并继续向条形码的5’末端复制。通过这样做,得到的cDNA分子在该cDNA分子3’末端上含有条形码序列(诸如分子标记)。
在一些实施方案中,靶结合区可以包含寡(dT),所述寡(dT)可以与包含多腺苷酸化末端的mRNA杂交。靶结合区可以是基因特异性的。例如,可以将靶结合区配置为与靶的特定区域杂交。靶结合区的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸。靶结合区的长度可以是约5-30个核苷酸。当条形码包含基因特异性靶结合区时,条形码在本文中可以称为基因特异性条形码。
定向特性(Orientation Property)
随机条形码(例如,随机条形码)可以包含一种或更多种可以用于定向(例如,比对)条形码的定向特性。条形码可以包含用于等电聚焦的部分。不同的条形码可以包含不同的等电聚焦点。当将这些条形码引入样品中时,样品可以经历等电聚焦,以便于将条形码定向成已知的方式。以这种方式,定向特性可以用于开发样品中条形码的已知的映射。示例性定向特性可以包括电泳迁移率(例如,基于条形码的尺寸)、等电点、自旋、电导率和/或自组装。例如,具有自组装的定向特性的条形码激活时可以自组装成特定的定向(例如,核酸纳米结构)。
亲和特性(Affinity Property)
条形码(例如,随机条形码)可以包含一种或更多种亲和特性。例如,空间标记可以包含亲和特性。亲和特性可以包括可以促进条形码与另一种实体(例如,细胞受体)结合的化学部分和/或生物部分。例如,亲和特性可以包括抗体,例如,对样品上的特定部分(例如,受体)特异性的抗体。在一些实施方案中,抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或特定细胞类型或分子附近的靶可以被标记(例如,被随机标记)。在一些实施方案中,亲和特性可以提供空间标记的核苷酸序列之外的空间信息,因为抗体可以将条形码引导至特定位置。抗体可以是治疗性抗体,例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。抗体可以是裸抗体或融合抗体。
抗体可以是全长(即,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,IgG抗体)或免疫球蛋白分子的免疫活性(即,特异性结合性)部分(如抗体片段)。
抗体片段可以是例如抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。在一些实施方案中,抗体片段可以与由全长抗体识别的相同抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段,诸如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、与细胞表面受体(CD8、CD34、CD45)结合的抗体和治疗性抗体。
通用衔接子引物
条形码可以包含一种或更多种通用衔接子引物。例如,基因特异性条形码(诸如基因特异性随机条形码)可以包含通用衔接子引物。通用衔接子引物可以指遍及所有条形码的通用的核苷酸序列。通用衔接子引物可以用于构建基因特异性条形码。通用衔接子引物的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或这些值中的任何两个值之间的数字或范围的核苷酸。通用衔接子引物的长度可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸。通用衔接子引物的长度可以是5-30个核苷酸。
接头
当条形码包含多于一个类型的标记(例如,多于一个细胞标记或多于一个条形码序列,诸如一个分子标记)时,标记之间可以散布有接头标记序列。接头标记序列的长度可以是至少约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。接头标记序列的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。在一些情况下,接头标记序列的长度是12个核苷酸。接头标记序列可以用于促进条形码的合成。接头标记可以包括错误校正(例如,汉明)码。
固体支持物
在一些实施方案中,本文公开的条形码(诸如随机条形码)可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施方案中,固体支持物上的多于一个条形码(例如,第一多于一个条形码)的一些或所有条形码序列(诸如,随机条形码(例如,第一条形码序列)的分子标记)相差至少一个核苷酸。同一固体支持物上的条形码的细胞标记可以是相同的。不同的固体支持物上的条形码的细胞标记可以相差至少一个核苷酸。例如,第一固体支持物上的第一多于一个条形码的第一细胞标记可以具有相同的序列,且第二固体支持物上的第二多于一个条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多于一个条形码的第一细胞标记和第二固体支持物上的第二多于一个条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5-20个核苷酸长。条形码序列可以是例如约5-20个核苷酸长。合成颗粒可以是例如珠。
珠可以是例如硅胶珠、可控孔径玻璃珠、磁珠、Dynabead、Sephadex/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。珠可以包括材料诸如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮或其任何组合。
在一些实施方案中,珠可以是用条形码或随机条形码官能化的聚合物珠(例如可变形珠或凝胶珠)(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(TEMED))后,可以产生凝胶珠。
在一些实施方案中,颗粒可以是可破坏的(例如,可溶解的、可降解的)。例如,聚合物珠可以例如在期望的条件下溶解、熔化或降解。所期望的条件可以包括环境条件。所期望的条件可以导致聚合物珠以受控方式溶解、熔化或降解。凝胶珠可以由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。
例如,分析物和/或试剂(诸如寡核苷酸条形码)可以偶联/固定至凝胶珠的内表面(例如,经由寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散而可及的内部)和/或凝胶珠的外表面或本文描述的任何其他微胶囊。偶联/固定可以经由任何形式的化学键合(例如,共价键、离子键)或物理现象(例如,范德华力、偶极-偶极相互作用等)。在一些实施方案中,本文描述的试剂与凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的,诸如,例如经由不稳定型部分(例如,经由化学交联物,包括本文描述的化学交联物)。在施加刺激后,不稳定型部分可以被裂解并释放所固定的试剂。在一些实施方案中,不稳定型部分是二硫键。例如,在经由二硫键将寡核苷酸条形码固定至凝胶珠的情况下,使二硫键暴露于还原剂可以裂解二硫键并从珠释放寡核苷酸条形码。不稳定型部分可以作为凝胶珠或微胶囊的一部分、作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分被包括。在一些实施方案中,多于一个条形码中的至少一个条形码可以被固定在颗粒上、被部分固定在颗粒上、被包封在颗粒中、被部分包封在颗粒中或其任何组合。
在一些实施方案中,凝胶珠可以包括宽范围的不同的聚合物,包括但不限于:聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白和/或塑料。聚合物可以包括但不限于以下材料:诸如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸酯)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(双烯丙基二甲基-氯化铵)(PDADMAC)、聚(吡咯)(poly(pyrolle),PPy)、聚(乙烯基吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PPA)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-羟基乙酸)(PLGA)。
许多化学刺激可以用于触发珠的破坏、溶解或降解。这些化学改变的实例可以包括但不限于pH介导的珠壁改变、经由交联键的化学裂解使珠壁崩解、珠壁的触发解聚和珠壁转换反应。批量(bulk)改变也可以用于触发珠的破坏。
通过各种刺激对微胶囊的批量或物理改变在设计胶囊以释放试剂方面也提供了许多优点。在宏观尺度上发生批量或物理改变,其中珠破裂是由刺激引起的机械-物理力的结果。这些过程可以包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率的改变。
生物刺激也可以用于触发珠的破坏、溶解或降解。通常,生物触发物类似于化学触发物,但是许多实例使用生物分子或生命系统中常见的分子,诸如酶、肽、糖、脂肪酸、核酸等。例如,珠可以包含具有对特定蛋白酶的裂解敏感的肽交联的聚合物。更特别地,一个实例可以包括包含GFLGK肽交联的微胶囊。在添加生物触发物(诸如蛋白酶组织蛋白酶B)后,壳壁的肽交联被裂解并且珠的内容物被释放。在其他情况下,蛋白酶可以是热激活的。在另一个实例中,珠包括包含纤维素的壳壁。壳聚糖水解酶的添加用作纤维素键裂解、壳壁解聚及其内部内容物释放的生物触发物。
还可以在施加热刺激后诱导珠释放其内容物。温度的改变可以引起珠的各种改变。热量的变化可以引起珠熔化,使得珠壁崩解。在其他情况下,热量可以增加珠的内部组分的内部压力,使得珠破裂或爆炸。在又其他的情况下,热量可以使珠转化成收缩的脱水状态。热量还可以作用于珠壁内的热敏聚合物,从而引起珠的破坏。
将磁性纳米颗粒包括在微胶囊的珠壁中可以允许珠的触发破裂以及将珠引导成阵列。本公开内容的装置可以包括用于任一目的的磁珠。在一个实例中,将Fe3O4纳米颗粒掺入含聚电解质的珠中在存在振荡磁场刺激的情况下触发破裂。
珠也可以由于电刺激的结果被破坏、溶解或降解。与先前部分中描述的磁性颗粒类似,电敏珠可以允许珠的触发破裂以及其他功能,诸如电场中的对齐、电导率或氧化还原反应。在一个实例中,含电敏材料的珠在电场中对齐,从而可以控制内部试剂的释放。在其他实例中,电场可以在珠壁本身内引起氧化还原反应,这可以增加孔隙率。
也可以使用光刺激来破坏珠。许多光触发物是可能的,并且可以包括使用各种分子(诸如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如,金属氧化物涂层可以用作胶囊触发物。涂覆有SiO2的聚电解质胶囊的UV照射可以导致珠壁的崩解。在又另一个实例中,可以将可光切换材料(诸如偶氮苯基团)掺入珠壁中。在施加UV或可见光后,诸如这些的化学物质在吸收光子后经历可逆的顺式至反式异构化。在此方面,掺入光子开关(photon switch)产生在施加光触发物后可以崩解或变得更多孔的珠壁。
例如,在图2中图示的条形码化(例如,随机条形码化)的非限制性实例中,在框208处将细胞(诸如单细胞)引入微孔阵列的多于一个微孔上之后,在框212处可以将珠引入微孔阵列的多于一个微孔上。每个微孔可以包含一个珠。珠可以包含多于一个条形码。条形码可以包含附接至珠的5’胺区域。条形码可以包含通用标记、条形码序列(例如,分子标记)、靶结合区或其任何组合。
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。与固体支持物关联的条形码可各自包含选自以下组的条形码序列,该组包括至少100种或1000种具有独特序列的条形码序列。在一些实施方案中,与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施方案中,与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如,所述百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%,或这些值中的任何两个值之间的数字或范围。作为另一个实例,所述百分比可以是至少以下或可以是至多以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,与固体支持物关联的条形码可以具有相同的细胞标记。与不同固体支持物关联的条形码可以具有选自以下组的不同的细胞标记,该组包括至少100种或1000种具有独特序列的细胞标记。
本文公开的条形码可以与固体支持物(例如,珠)关联(例如,附接)。在一些实施方案中,可以用包括与多于一个条形码关联的多于一个合成颗粒的固体支持物将样品中的多于一个靶条形码化。在一些实施方案中,固体支持物可以包括与多于一个条形码关联的多于一个合成颗粒。不同固体支持物上的多于一个条形码的空间标记可以相差至少一个核苷酸。固体支持物可以例如在二维或三维包括多于一个条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔径玻璃珠、磁珠、Dynabead、Sephadex/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体或其任何组合。在一些实施方案中,固体支持物可以自由浮动。在一些实施方案中,固体支持物可以包埋到半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单独的核苷酸。条形码可以与基底关联。
如本文使用的,术语“拴系的”、“附接的”和“固定的”可以互换使用,并且可以指用于将条形码附接至固体支持物的共价或非共价方式。可以将各种不同的固体支持物中的任何一种用作固体支持物,以用于附接预先合成的条形码或用于条形码的原位固相合成。
在一些实施方案中,固体支持物是珠。珠可以包括一种或更多种类型的实心的、多孔的或空心的球体、球、承座、圆柱体或可以固定核酸(例如,共价地或非共价地)的其他类似配置。珠可以由例如塑料、陶瓷、金属、聚合物材料或其任何组合构成。珠可以是或包括球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。在一些实施方案中,珠的形状可以是非球形的。
珠可以包括各种材料,包括但不限于顺磁性材料(例如,镁、钼、锂和钽)、超顺磁性材料(例如,铁氧体(Fe3O4;磁铁矿)纳米颗粒)、铁磁材料(例如,铁、镍、钴,它们的一些合金,以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。
在一些实施方案中,珠(例如,标记所附接的珠)是水凝胶珠。在一些实施方案中,珠包括水凝胶。
本文公开的一些实施方案包括一个或更多个颗粒(例如,珠)。每个颗粒可以包含多于一个寡核苷酸(例如,条形码)。多于一个寡核苷酸中的每一个可以包含条形码序列(例如,分子标记序列)、细胞标记和靶结合区(例如,寡(dT)序列、基因特异性序列、随机多聚体或其组合)。多于一个寡核苷酸的每一个的细胞标记序列可以是相同的。不同颗粒上的寡核苷酸的细胞标记序列可以是不同的,使得可以鉴定不同颗粒上的寡核苷酸。在不同实施方式中,不同细胞标记序列的数目可以是不同的。在一些实施方案中,细胞标记序列的数目可以是以下或可以是约以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108、109、这些值中的任何两个值之间的数字或范围或更多。在一些实施方案中,细胞标记序列的数目可以是至少以下或可以是至多以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108或109。在一些实施方案中,多于一个颗粒中的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个颗粒包括具有相同细胞序列的寡核苷酸。在一些实施方案中,包括具有相同细胞序列的寡核苷酸的多于一个颗粒可以是至多0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更多。在一些实施方案中,多于一个颗粒全都不具有相同的细胞标记序列。
在每个颗粒上的多于一个寡核苷酸可以包含不同的条形码序列(例如,分子标记)。在一些实施方案中,条形码序列的数目可以是以下或可以是约以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108、109或这些值中的任何两个值之间的数字或范围。在一些实施方案中,条形码序列的数目可以是至少以下或可以是至多以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108或109。例如,多于一个寡核苷酸中的至少100种包含不同的条形码序列。作为另一个实例,在单个颗粒中,多于一个寡核苷酸中的至少100种、500种、1000种、5000种、10000种、15000种、20000种、50000种、这些值中的任何两个值之间的数字或范围或更多种包含不同的条形码序列。一些实施方案提供了多于一个包含条形码的颗粒。在一些实施方案中,待标记的靶和不同条形码序列的出现(或拷贝或数目)的比例可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更高。在一些实施方案中,多于一个寡核苷酸的每一个还包含样品标记、通用标记或二者。颗粒可以是例如纳米颗粒或微米颗粒。
珠的尺寸可以不同。例如,珠的直径范围可以为从0.1微米至50微米。在一些实施方案中,珠的直径可以是以下或可以是约以下:0.1微米、0.5微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米、50微米或这些值中的任何两个值之间的数字或范围。
珠的直径可以与基底的孔的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短以下或者约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或这些值中的任何两个值之间的数字或范围。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞(例如,被基底的孔捕获的单细胞)的直径相关。在一些实施方案中,珠的直径可以比细胞的直径长或短以下或约以下:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,珠的直径可以比细胞的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%。
珠可以附接至基底和/或包埋到基底中。珠可以附接至凝胶、水凝胶、聚合物和/或基质和/或包埋到凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上的条形码上存在的空间标记来鉴定,该空间标记可以用作位置地址。
珠的实例可以包括但不限于链霉抗生物素蛋白珠、琼脂糖珠、磁珠、微珠、抗体缀合的珠(例如,抗免疫球蛋白微珠)、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基封端磁珠。
珠可以与量子点或荧光染料关联(例如,用量子点或荧光染料浸渍),以使其在一个荧光光学通道或多于一个光学通道中发荧光。珠可以与氧化铁或氧化铬关联,使其成为顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠成像。珠可以具有与珠关联的可检测代码。例如,珠可以包含条形码。珠可以改变尺寸,例如由于在有机溶液或无机溶液中溶胀。珠可以是疏水的。珠可以是亲水的。珠可以是生物相容的。
固体支持物(例如,珠)可以被可视化。固体支持物可以包含可视化标签(例如,荧光染料)。固体支持物(例如,珠)可以蚀刻有标识符(例如,数字)。标识符可以通过对珠成像来可视化。
固体支持物可以包括可溶性、半溶性或不溶性材料。当固体支持物包括接头、支架、构建模块(building block)或其他与其附接的反应性部分时,固体支持物可以被称为“官能化的”,而当固体支持物缺少这种与其附接的反应性部分时,固体支持物可以被称为“非官能化的”。固体支持物可以以溶液中游离,诸如在微量滴定孔中的形式;以流通形式,诸如在柱中;或以浸量尺(dipstick)使用。
固体支持物可以包括膜、纸(paper)、塑料、涂覆表面、平坦表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以采取树脂、凝胶、微球或其他几何配置的形式。固体支持物可以包括二氧化硅芯片、微米颗粒、纳米颗粒、板、阵列、毛细管、平坦支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢、金、银、铝、硅和铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如,由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成),和/或晶片、梳、针或针头(例如,适于组合合成或分析的针阵列)或珠,平坦表面诸如晶片(例如,硅晶片)的凹陷或纳升孔阵列,具有凹陷的晶片(具有或不具有过滤器底部)。
固体支持物可以包括聚合物基质(例如,凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如,细胞器周围)。聚合物基质可以能够被泵送到整个循环系统。
基底和微孔阵列
如本文使用的,基底可以指固体支持物类型。基底可以指可以包含本公开内容的条形码或随机条形码的固体支持物。基底可以例如包括多于一个微孔。基底可以例如是包括两个或更多个微孔的孔阵列。在一些实施方案中,微孔可以包括定义体积的小的反应室。在一些实施方案中,微孔可以捕获一个或更多个细胞。在一些实施方案中,微孔可以仅捕获一个细胞。在一些实施方案中,微孔可以捕获一个或更多个固体支持物。在一些实施方案中,微孔可以仅捕获一个固体支持物。在一些实施方案中,微孔捕获单细胞和单个固体支持物(例如,珠)。微孔可以包含本公开内容的条形码试剂。
条形码化的方法
本公开内容提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中不同位置处的不同靶的数目的方法。该方法可以包括将条形码(例如,随机条形码)紧密接近样品放置,裂解样品,将不同的靶与条形码关联,对靶进行扩增和/或对靶进行数字计数。该方法还可以包括对从条形码上的空间标记获得的信息进行分析和/或将所述信息可视化。在一些实施方案中,该方法包括使样品中的多于一个靶可视化。将多于一个靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一个靶条形码化(例如,随机条形码化)之前或之后产生二维映射图和三维映射图。将样品中的多于一个靶可视化可以包括将多于一个靶映射到样品的映射图上。将多于一个靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在对样品中的多于一个靶进行条形码化之前或之后产生二维映射图和三维映射图。在一些实施方案中,可以在裂解样品之前或之后产生二维映射图和三维映射图。在产生二维映射图或三维映射图之前或之后裂解样品可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。
在一些实施方案中,将多于一个靶条形码化包括将多于一个条形码与多于一个靶杂交以产生条形码化靶(例如,随机条形码化靶)。将多于一个靶条形码化可以包括产生条形码化靶的索引文库。产生条形码化靶的索引文库可以用包含多于一个条形码(例如,随机条形码)的固体支持物来进行。
使样品和条形码接触
本公开内容提供了用于使样品(例如,细胞)与本公开内容的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如,随机条形码)接触。细胞可以例如通过重力流来接触,其中可以使细胞沉降并且产生单层。样品可以是组织薄切片。可以将薄切片放置于基底上。样品可以是一维的(例如,形成平坦表面)。可以使样品(例如,细胞)分散遍及基底,例如,通过在基底上生长/培养细胞。
当条形码紧密接近靶时,靶可以与条形码杂交。条形码可以按不可耗尽的比例接触,使得每一种不同的靶可以与本公开内容的不同条形码关联。为了确保靶与条形码之间的有效关联,可以将靶与条形码交联。
细胞裂解
在细胞和条形码的分配之后,可以将细胞裂解以释放靶分子。细胞裂解可以通过各种手段中的任何一种来完成,例如通过化学或生化手段,通过渗透冲击,或通过热裂解、机械裂解或光学裂解的手段。可以通过添加包含去污剂(例如,SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。为了增加靶与条形码的关联,可以通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。
在一些实施方案中,可以使用滤纸来裂解样品。可以在滤纸上部用裂解缓冲液浸泡滤纸。可以将滤纸用压力施加至样品,这可以促进样品的裂解以及样品的靶与基底的杂交。
在一些实施方案中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解来进行。化学裂解可以包括使用消化酶,诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过将裂解缓冲液添加至基底来进行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可以包含至少约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含至多约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含约0.1M Tris HCl。裂解缓冲液的pH可以是至少约1、2、3、4、5、6、7、8、9、10或更高。裂解缓冲液的pH可以是至多约1、2、3、4、5、6、7、8、9、10或更高。在一些实施方案中,裂解缓冲液的pH是约7.5。裂解缓冲液可以包含盐(例如,LiCl)。裂解缓冲液中的盐浓度可以是至少约0.1M、0.5M或1M或更高。裂解缓冲液中的盐浓度可以是至多约0.1M、0.5M或1M或更高。在一些实施方案中,裂解缓冲液中的盐浓度是约0.5M。裂解缓冲液可以包含去污剂(例如,SDS、十二烷基硫酸锂、triton X、tween、NP-40)。裂解缓冲液中的去污剂浓度可以是至少约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。裂解缓冲液中的去污剂浓度可以是至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施方案中,裂解缓冲液中的去污剂浓度是约1%的十二烷基硫酸锂。裂解方法中使用的时间可以取决于所使用的去污剂的量。在一些实施方案中,使用的去污剂越多,裂解所需的时间越少。裂解缓冲液可以包含螯合剂(例如,EDTA和EGTA)。裂解缓冲液中的螯合剂浓度可以是至少约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。裂解缓冲液中的螯合剂浓度可以是至多约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。在一些实施方案中,裂解缓冲液中的螯合剂浓度是约10mM。裂解缓冲液可以包含还原剂(例如,β-巯基乙醇、DTT)。裂解缓冲液中的还原剂浓度可以是至少约1mM、5mM、10mM、15mM或20mM或更高。裂解缓冲液中的还原剂浓度可以是至多约1mM、5mM、10mM、15mM或20mM或更高。在一些实施方案中,裂解缓冲液中的还原剂浓度是约5mM。在一些实施方案中,裂解缓冲液可以包含约0.1M Tris HCl,约pH 7.5,约0.5M LiCl,约1%十二烷基硫酸锂,约10mM EDTA和约5mM DTT。
裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度进行。裂解可以进行约1分钟、5分钟、10分钟、15分钟或20分钟或更多分钟。裂解的细胞可以包括至少约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。裂解的细胞可以包括至多约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。
将条形码附接至靶核酸分子
在细胞裂解和核酸分子从细胞释放之后,核酸分子可以与共定位的固体支持物的条形码随机关联。关联可以包括使条形码的靶识别区与靶核酸分子的互补部分杂交(例如,条形码的寡(dT)可以与靶的多(A)尾相互作用)。可以选择用于杂交的测定条件(例如,缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂交体。在一些实施方案中,可以将从裂解的细胞释放的核酸分子与基底上的多于一个探针关联(例如,与基底上的探针杂交)。当探针包含寡(dT)时,可以将mRNA分子与探针杂交并且逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如,在图2中图示的条形码化的非限制性实例中,在框216处,mRNA分子可以与珠上的条形码杂交。例如,单链的核苷酸片段可以与条形码的靶结合区杂交。
附接还可以包括将条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如,EcoRI)处理靶核酸以产生限制性位点突出端。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如,T4 DNA连接酶)可以用于连接两个片段。
例如,在图2中图示的条形码化的非限制性实例中,在框220处,随后可以将来自多于一个细胞(或多于一个样品)的标记的靶(例如,靶-条形码分子)汇集至例如管中。标记的靶可以通过例如回收(retrieving)条形码和/或附接靶-条形码分子的珠来汇集。
可以通过使用磁珠和外部施加的磁场来实现附接的靶-条形码分子的基于固体支持物的集合的回收。汇集靶-条形码分子后,所有进一步的处理可以在单个反应容器中进行。进一步的处理可以包括,例如,逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。进一步的处理反应可以在微孔内进行,即,不先汇集来自多于一个细胞的标记的靶核酸分子。
逆转录或核酸延伸
本公开内容提供了使用逆转录(例如,在图2的框224处)或核酸延伸来产生靶-条形码缀合物的方法。靶-条形码缀合物可以包含条形码以及靶核酸的全部或一部分的互补序列(即,条形码化的cDNA分子,诸如随机条形码化的cDNA分子)。关联的RNA分子的逆转录可以通过添加逆转录引物连同逆转录酶而发生。逆转录引物可以是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物的长度可以是12-18个核苷酸或可以是约12-18个核苷酸,并且与哺乳动物mRNA的3’末端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
在一些实施方案中,mRNA分子向标记的RNA分子的逆转录可以通过添加逆转录引物而发生。在一些实施方案中,逆转录引物是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。通常,寡(dT)引物的长度是12-18个核苷酸,并且与哺乳动物mRNA的3’末端的内源多(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
在一些实施方案中,靶是cDNA分子。例如,可以使用逆转录酶诸如Moloney鼠白血病病毒(MMLV)逆转录酶逆转录mRNA分子,以产生具有多(dC)尾的cDNA分子。条形码可以包括具有多(dG)尾的靶结合区。在条形码的多(dG)尾和cDNA分子的多(dC)尾之间碱基配对后,逆转录酶将模板链从细胞RNA分子转换到条形码,并继续向条形码的5’末端复制。通过这样做,得到的cDNA分子在该cDNA分子3’末端上含有条形码序列(诸如分子标记)。
逆转录可以重复地发生以产生多于一个标记的cDNA分子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次逆转录反应。该方法可以包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次逆转录反应。
扩增
可以进行一个或更多个核酸扩增反应(例如,在图2的框228处)以产生标记的靶核酸分子的多于一个拷贝。扩增可以以多重化方式进行,其中多于一个靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如,分子标记)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、条形码序列(例如,分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多于一个核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或这些值中的任何两个值之间的范围或数字。该方法还可以包括进行一个或更多个cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如,分子标记)的靶-条形码分子的一个或更多个cDNA拷贝。
在一些实施方案中,扩增可以使用聚合酶链式反应(PCR)来进行。如本文使用的,PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。如本文使用的,PCR可以涵盖反应的衍生形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR以及组装PCR。
标记的核酸的扩增可以包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)、和Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。在一些实施方案中,扩增不产生环化转录物。
在一些实施方案中,本文公开的方法还包括对标记的核酸(例如,标记的RNA、标记的DNA、标记的cDNA)进行聚合酶链式反应以产生标记的扩增子(例如,随机标记的扩增子)。标记的扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如,分子标记)。标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本公开内容的核酸可以包括合成的或改变的核酸。
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一种或更多种引物可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一个标记的靶(例如,随机标记的靶)的至少一部分。一种或更多种引物可以退火至多于一个标记的靶的3’末端或5’末端。一种或更多种引物可以退火至多于一个标记的靶的内部区域。内部区域可以与多于一个标记的靶的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种基因特异性引物。
一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如,分子标记)、靶或其任何组合。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶。靶可以包括一个或更多个样品中总核酸的子集。靶可以包括一个或更多个样品中总标记靶的子集。一种或更多种引物可以包括至少96种或更多种定制引物。一种或更多种引物可以包括至少960种或更多种定制引物。一种或更多种引物可以包括至少9600种或更多种定制引物。一种或更多种定制引物可以退火至两种或更多种不同的标记的核酸。两种或更多种不同的标记的核酸可以对应于一种或更多种基因。
可以在本公开内容的方法中使用任何扩增方案。例如,在一种方案中,第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物来扩增附接至珠的分子。第二轮PCR可以使用侧翼为Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引,以使PCR产物变成Illumina测序文库。使用150bp×2测序的测序可以揭示读段1上的细胞标记和条形码序列(例如,分子标记)、读段2上的基因以及索引1读段上的样品索引。
在一些实施方案中,可以使用化学裂解将核酸从基底去除。例如,存在于核酸中的化学基团或经修饰的碱基可以用于促进将核酸从固体支持物去除。例如,酶可以用于将核酸从基底去除。例如,通过限制性内切核酸酶消化可以将核酸从基底去除。例如,用尿嘧啶-d-糖苷酶(UDG)处理含dUTP或ddUTP的核酸可以用于将核酸从基底去除。例如,可以使用进行核苷酸切除的酶(诸如,碱基切除修复酶,诸如无嘌呤/无嘧啶(apurinic/apyrimidinic,AP)内切核酸酶)将核酸从基底去除。在一些实施方案中,可以使用可光裂解基团以及光将核酸从基底去除。在一些实施方案中,可以使用可裂解接头将核酸从基底去除。例如,可裂解接头可以包括以下中的至少一种:生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、生物素/中性抗生物素蛋白、Ig蛋白A、光不稳定型接头、酸或碱不稳定型接头基团或适配体。
当探针是基因特异性时,可以将分子与探针杂交,并且逆转录和/或扩增。在一些实施方案中,在核酸已经合成(例如,逆转录)之后,核酸可以被扩增。扩增可以以多重方式进行,其中多种靶核酸序列同时扩增。扩增可以将测序衔接子添加至核酸。
在一些实施方案中,可以例如用桥接扩增在基底上进行扩增。cDNA可以加同聚物尾,以便产生相容末端,用于使用基底上的寡(dT)探针进行桥接扩增。在桥接扩增中,与模板核酸的3’末端互补的引物可以是共价地附接至固体颗粒的每对引物中的第一引物。当包含模板核酸的样品与颗粒接触并进行单个热循环时,可以将模板分子退火至第一引物,并且第一引物通过添加核苷酸而向前延长以形成双链体分子,所述双链体分子由模板分子和与模板互补的新形成的DNA链构成。在下一循环的加热步骤中,双链体分子可以变性,从颗粒释放模板分子并且留下通过第一引物附接至颗粒的互补DNA链。在随后的退火和延长步骤的退火阶段中,互补链可以与第二引物杂交,第二引物在从第一引物去除的位置处与互补链的区段互补。这种杂交可导致互补链在第一引物和第二引物之间形成桥,通过共价键连接第一引物并通过杂交连接第二引物。在延长阶段,通过在同一反应混合物中添加核苷酸,第二引物可以在反向方向上延长,从而将桥转化为双链桥。然后开始下一个循环,并且双链桥可以变性以产生两个单链核酸分子,每个单链核酸分子具有的一个末端分别经由第一引物和第二引物附接至颗粒表面,其中每个单链核酸分子的另一个末端是未附接的。在这第二个循环的退火和延长步骤中,每条链可以与同一颗粒上先前未使用的另外的互补引物杂交,以形成新的单链桥。现在杂交的两个先前未使用的引物延长从而将两个新的桥转换成双链桥。
扩增反应可以包括扩增多于一个核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。
标记的核酸的扩增可以包括基于PCR的方法或非基于PCR的方法。标记的核酸的扩增可以包括对标记的核酸的指数式扩增。标记的核酸的扩增可以包括对标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(PCR)来进行。PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。PCR可以涵盖反应的衍生形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重化PCR、数字PCR、抑制PCR、半抑制PCR以及组装PCR。
在一些实施方案中,标记的核酸的扩增包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)、Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或分支延伸扩增(RAM)。
在一些实施方案中,本文公开的方法还包括对扩增的扩增子(例如,靶)进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可选地,扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本发明的核酸可以包括合成的或改变的核酸。
在一些实施方案中,方法包括反复扩增标记的核酸以产生多于一个扩增子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次扩增反应。可选地,方法包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次扩增反应。
扩增还可以包括将一种或更多种对照核酸添加至一个或更多个包含多于一个核酸的样品中。扩增还可以包括将一种或更多种对照核酸添加至多于一个核酸。对照核酸可以包含对照标记。
扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定型和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。添加非天然核苷酸可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一个或更多个扩增反应可以包括使用一种或更多种引物。一种或更多种引物可以包括一种或更多种寡核苷酸。一种或更多种寡核苷酸可以包含至少约7-9个核苷酸。一种或更多种寡核苷酸可以包含少于12-15个核苷酸。一种或更多种引物可以退火至多于一个标记的核酸的至少一部分。一种或更多种引物可以退火至多于一个标记的核酸的3’末端和/或5’末端。一种或更多种引物可以退火至多于一个标记的核酸的内部区域。内部区域可以与多于一个标记的核酸的3’末端距离至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一种或更多种引物可以包括一组固定的引物。一种或更多种引物可以包括至少一种或更多种定制引物。一种或更多种引物可以包括至少一种或更多种对照引物。一种或更多种引物可以包括至少一种或更多种管家基因引物。一种或更多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或更多种定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或其产物。一种或更多种引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一种或更多种靶核酸。靶核酸可以包括一个或更多个样品中总核酸的子集。在一些实施方案中,引物是与本公开内容的阵列附接的探针。
在一些实施方案中,将样品中的多于一个靶条形码化(例如,随机条形码化)还包括产生条形码化靶(例如,随机条形码化靶)或靶的条形码化片段的索引文库。不同的条形码的条形码序列(例如,不同的随机条形码的分子标记)可以彼此不同。产生条形码化靶的索引文库包括从样品中的多于一个靶产生多于一个索引多核苷酸。例如,对于包括第一索引靶和第二索引靶的条形码化靶的索引文库,第一索引多核苷酸的标记区与第二索引多核苷酸的标记区可以相差以下、相差约以下、相差至少以下或相差至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。在一些实施方案中,产生条形码化靶的索引文库包括使多于一个靶(例如mRNA分子)与包含多(T)区和标记区的多于一个寡核苷酸接触;以及使用逆转录酶进行第一链合成以产生单链标记的cDNA分子(每一种包含cDNA区和标记区),其中多于一个靶包括至少两种不同序列的mRNA分子,且多于一个寡核苷酸包括至少两种不同序列的寡核苷酸。产生条形码化靶的索引文库还可以包括扩增单链标记的cDNA分子以产生双链标记的cDNA分子;以及对双链标记的cDNA分子进行巢式PCR以产生标记的扩增子。在一些实施方案中,方法可以包括产生衔接子标记的扩增子。
条形码化(例如,随机条形码化)可以包括使用核酸条形码或标签以标记个体核酸(例如,DNA或RNA)分子。在一些实施方案中,其包括在从mRNA产生cDNA分子时将DNA条形码或标签添加至cDNA分子。可以进行巢式PCR以使PCR扩增偏倚最小化。可以添加用于测序(例如下一代测序(NGS))使用的衔接子。例如在图2的框232处,可以使用测序结果来确定靶的一个或更多个拷贝的细胞标记、分子标记和核苷酸片段的序列。
图3是示出了产生条形码化靶(例如,随机条形码化靶)的索引文库,诸如条形码化的mRNA或其片段的索引文库的非限制性示例性过程的示意图。如步骤1中示出的,逆转录过程可以用独特分子标记序列、细胞标记序列和通用PCR位点对每个mRNA分子进行编码。具体地,通过将一组条形码(例如,随机条形码)310与RNA分子302的多(A)尾区308杂交(例如,随机杂交),可以将RNA分子302逆转录以产生标记的cDNA分子304(包括cDNA区306)。条形码310中的每一个可以包括靶结合区,例如多(dT)区312、标记区314(例如,条形码序列或分子)和通用PCR区316。
在一些实施方案中,细胞标记序列可以包含3个至20个核苷酸。在一些实施方案中,分子标记序列可以包含3个至20个核苷酸。在一些实施方案中,多于一个随机条形码中的每一个还包括通用标记和细胞标记中的一种或更多种,其中通用标记对于固体支持物上的多于一个随机条形码是相同的,并且细胞标记对于固体支持物上的多于一个随机条形码是相同的。在一些实施方案中,通用标记可以包含3个至20个核苷酸。在一些实施方案中,细胞标记包含3个至20个核苷酸。
在一些实施方案中,标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施方案中,标记区314可以包括通用标记、维度标记和细胞标记中的一种或更多种。条形码序列或分子标记318的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记320的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。通用标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。通用标记对于固体支持物上的多于一个随机条形码可以是相同的,并且细胞标记对于固体支持物上的多于一个随机条形码是相同的。维度标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或这些值中的任何两个值之间的数字或范围的核苷酸。
在一些实施方案中,标记区314可以包括以下、可以包括约以下、可以包括至少以下或可以包括至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或这些值中的任何两个值之间的数字或范围的不同标记,诸如条形码序列或分子标记318和细胞标记320。每一种标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或这些值中的任何两个值之间的数字或范围的核苷酸。一组条形码或随机条形码310可以含有以下、可以含有约以下、可以含有至少以下或可以是至多以下:10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、1010种、1011种、1012种、1013种、1014种、1015种、1020种或这些值中的任何两个值之间的数字或范围的条形码或随机条形码310。并且条形码或随机条形码310的组可以例如,各自包含独特标记区314。标记的cDNA分子304可以进行纯化以去除过量的条形码或随机条形码310。纯化可以包括Ampure珠纯化。
如步骤2中示出的,来自步骤1中的逆转录过程的产物可以汇集至1支管中,并且用第1PCR引物池和第1通用PCR引物进行PCR扩增。因为独特标记区314,汇集是可能的。特别地,可以将标记的cDNA分子304扩增以产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括以单一反应体积用96种多重引物进行的多重PCR扩增。在一些实施方案中,在单一反应体积中,多重PCR扩增可以利用、利用约、利用至少或利用至多10种、20种、40种、50种、70种、80种、90种、102种、103种、104种、105种、106种、107种、108种、109种、1010种、1011种、1012种、1013种、1014种、1015种、1020种或这些值中的任何两个值之间的数字或范围的多重引物。扩增可以包括使用包括靶向特定基因的定制引物326A-C的第1PCR引物池324和通用引物328。定制引物326可以与标记的cDNA分子304的cDNA部分306’内的区域杂交。通用引物328可以与标记的cDNA分子304的通用PCR区域316杂交。
如图3的步骤3中示出的,来自步骤2中的PCR扩增的产物可以用巢式PCR引物池和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏倚最小化。特别地,巢式PCR标记的扩增子322可通过巢式PCR进行进一步扩增。巢式PCR可以包括在单个反应体积中用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行的多重PCR。巢式PCR引物池330可以包含以下、可以包含约以下、可以包含至少以下或可以包含至多以下:1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种或这些值中的任何两个值之间的数字或范围的不同的巢式PCR引物332。巢式PCR引物332可以包含衔接子334,并与标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以包含衔接子336,并与标记的扩增子322的通用PCR区域316杂交。由此,步骤3产生衔接子标记的扩增子338。在一些实施方案中,巢式PCR引物332和第2通用PCR引物328’可以不包含衔接子334和衔接子336。而是,衔接子334和衔接子336可以连接至巢式PCR的产物以产生衔接子标记的扩增子338。
如步骤4中示出的,可以使用文库扩增引物将来自步骤3的PCR产物进行PCR扩增用于测序。特别地,可以使用衔接子334和衔接子336对衔接子标记的扩增子338进行一个或更多个另外的测定。衔接子334和衔接子336可以与引物340和引物342杂交。一种或更多种引物340和引物342可以是PCR扩增引物。一种或更多种引物340和引物342可以是测序引物。一种或更多种衔接子334和衔接子336可以用于衔接子标记的扩增子338的进一步扩增。一种或更多种衔接子334和衔接子336可以用于对衔接子标记的扩增子338测序。引物342可以包含板索引344,使得使用同一组条形码或随机条形码310产生的扩增子可以使用下一代测序(NGS)在一个测序反应中测序。
用于单细胞分泌组学的方法和组合物
在一些实施方案中,提供了用于单细胞分泌组学的系统、方法、组合物和试剂盒。本文公开的方法和组合物可以确定由单细胞分泌的一种或更多种分泌因子的拷贝数(例如,分泌组学、分泌因子谱分析(profiling))。在一些实施方案中,提供了用于单细胞分泌组分析的组合物和方法。本文描述的一些实施方案采用能够结合分泌因子的抗体,并且所述抗体可以与寡核苷酸关联。在一些实施方案中,本文提供的方法和组合物与单细胞分析系统、工作流程和平台(例如,BD Rhapsody)相容。对用于分析个体细胞的分泌组谱的组合物和方法存在需求。目前可用的分泌组谱分析方法(例如,基于荧光或微阵列芯片的方法)成本高且通量低,并且比本文提供的分泌组谱分析方法和组合物定量程度低。在一些实施方案中,单细胞的分泌蛋白被合成珠(细胞模拟物)捕获,所述合成珠具有与其缀合的多于一个抗体(对所述分泌蛋白特异性的)。在一些实施方案中,然后可以用本文描述的分泌因子结合试剂探测所述珠。所述分泌因子结合试剂可以包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。对如本文描述的所述分泌因子结合试剂特异性寡核苷酸进行条形码化和序列分析可以实现高通量单细胞分泌组分析。
在一些实施方案中,提供了固体支持物(例如,珠、第一固体支持物、第二固体支持物),其尺寸可以按细胞确定。所述固体支持物可以包含用于抗体缀合(例如,抗体相比于分泌蛋白的缀合)的功能表面。方法可以包括用所述抗体包被的固体支持物孵育单细胞。孵育可以在分区(例如,孔)中进行。可以优化分区尺寸以捕获大多数分泌蛋白。孵育的时间、介质和/或温度可以根据用户的需要而变化。根据实施方案,细胞可以在孵育期间死亡;然而,在一些这样的实施方案中,分泌组信息仍然是有价值的。因此,即使在细胞死亡的情况下,本文提供的组合物和方法仍然可以获得有用的分泌组信息。可以从所述分区收集固体支持物,并用本文提供的分泌因子结合试剂染色。染色可以是多重的。在本文提供的一些实施方案中,也可以添加流动Ab以进行分选,来富集某些分泌组学类型。在一些实施方案中,用包含可检测部分的抗体对固体支持物进行染色,所述可检测部分使得能够针对一种或更多种期望性质通过流式细胞术对固体支持物进行分选。方法可以包括洗掉未结合的分泌因子结合试剂。可以将固体支持物装载到多于一个分区(例如,孔、液滴、单细胞分析平台(诸如BDRhapsody)的分区)中。多于一个分区中的单个分区可以包含单个固体支持物。多于一个分区中的单个分区可以包含多于一种寡核苷酸条形码。多于一个分区中的单个分区可以包含条形码化颗粒(例如,如本文描述的单个第三固体支持物)。用所述寡核苷酸条形码对条形码化分泌因子结合试剂特异性寡核苷酸进行条形码化可以如本文描述的进行。文库生成和获得序列信息可以产生分泌组数据。
在一些实施方案中,提供了用于同时进行高通量单细胞分泌组和转录组分析的组合物和方法。在一些这样的实施方案中,固体支持物(例如第二固体支持物)包含多于一种捕获探针和多于一种锚定探针。多于一种锚定探针中的每一种可以能够与表面细胞靶特异性结合以形成与第二固体支持物关联的单细胞。对如本文描述的所述分泌因子结合试剂特异性寡核苷酸以及所关联的单细胞的核酸靶进行条形码化和序列分析可以实现高通量单细胞分泌组和转录组分析。在一些实施方案中,单细胞分泌组分析与单细胞蛋白谱分析可以使用本文提供的组合物和方法进行。在一些实施方案中,描述了用于同时进行单细胞分泌组分析、转录组分析和蛋白谱分析的组合物和方法。使用AbO来确定单细胞中的蛋白表达谱和追踪样品来源的实施方案已在美国专利申请第15/715,028号(公布为美国专利申请公布第2018/0088112号)和美国专利申请第15/937,713号中描述;每项专利申请的内容通过引用以其整体并入本文。
在一些实施方案中,包含多于一种捕获探针(例如,用于分泌蛋白的多于一种不同抗体)的固体支持物(例如,珠、第一固体支持物、第二固体支持物)是细胞模拟物。单细胞和所述固体支持物中的一个可以位于具有介质的多于一个分区(例如,培养板)中的分区(例如,孔)中,因此将通过固体支持物上的捕获探针从给定细胞捕获分泌蛋白。然后可以用能够检测捕获的蛋白的分泌因子结合试剂对固体支持物进行染色,并且可以将这些固体支持物装载到多于一个分区(例如,孔、液滴、单细胞分析平台诸如BD Rhapsody的分区)以用于文库生成。所述分泌因子结合试剂可以包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。可以对分泌因子结合试剂特异性寡核苷酸文库进行测序,并生成单细胞的分泌组信息。由于可用于显微镜或流式细胞术分析的荧光标志物的数目,目前可用的用于检测分泌蛋白的方法对可检测的蛋白的数目有限制。本文提供的组合物和方法去除了该限制,并且可以实现使用用户所需的多对捕获探针/分泌因子结合试剂检测分泌蛋白。此外,如其中描述的,公开的方法可以包括捕获分泌蛋白和单细胞两者以用于分析单细胞的转录组和分泌组。在2020年1月17日提交的题为“METHODS AND COMPOSITIONS FOR SINGLE CELL SECRETOMICS”的美国专利申请第62/962,927号(其内容通过引用以其整体并入本文)中描述了采用以下来测量来自细胞的分泌因子的系统、方法、组合物和试剂盒:(i)双特异性探针,其包含能够与细胞的表面细胞靶特异性结合的锚定探针和能够与由细胞分泌的分泌因子特异性结合的捕获探针,所述细胞与捕获探针关联,和/或(ii)分泌因子结合试剂,其能够与被捕获探针结合的分泌因子特异性结合。
目前可用的单细胞分泌组谱分析方法,诸如在微阵列芯片上使用荧光检测的方法,由于荧光强度差异和捕获给定细胞转录组的潜力低,存在定量程度较低的缺陷。在一些实施方案中,通过利用分泌因子结合试剂特异性寡核苷酸的序列分析,本文提供的方法和组合物解决了基于荧光强度差异的方法的局限性和可从给定细胞中检测到的分泌蛋白的低数目,本文提供的方法和组合物不受荧光标志物的限制,并且由于对分子数目(而不是荧光强度)进行计数的能力而有较高的定量程度。
由细胞释放的细胞因子和其他蛋白是免疫学家和其他细胞生物学家非常感兴趣的。用于检测和测量分泌蛋白的传统方法通常是批量测量(而不是在单细胞水平)。例如,当前可用的方法包括用于批量研究分泌因子的基于珠的测定和ELISA。因此,数据中缺少单细胞定量和细胞表型分析。在流式细胞术与传统蛋白印迹的比较中,研究来自细胞异质性混合物的个体细胞有巨大的价值。本文提供的方法和组合物实现了对异质性混合物中个体细胞的分泌蛋白的检测和相对定量。寡核苷酸条形码化检测探针(例如,分泌因子结合试剂特异性寡核苷酸)可以针对单细胞基因组分析进行优化。本文提供的分泌因子分析方法可以与用于单细胞多组学平台的其他分析技术相容。本文的公开内容包括实现在不需要专用仪器的情况下快速采用对灵活的靶组合的单细胞分泌组测定的方法和组合物。在一些实施方案中,本文公开的方法可以提供测定分泌蛋白而不损害细胞生存力的能力,并且因此可以实现基于活细胞的蛋白分泌谱对活细胞进行分选。另外,本文提供的方法在细胞制备的下游实现更广泛的单细胞组学数据。
使用如本文提供的寡核苷酸条形码化检测探针(例如,分泌因子结合试剂)首次实现同时评估来自个体细胞的分泌因子与表面蛋白(例如,细胞组分靶)和细胞内转录物(mRNA)的能力。本文提供的方法和组合物首次实现单细胞基因组平台上的单细胞分泌分析。
在本文提供的方法和组合物的一些实施方案中,使DNA细胞组分结合试剂特异性寡核苷酸(例如,抗体寡核苷酸)与寡核苷酸条形码杂交,并延伸以实现用于来自相同珠的蛋白定量和mRNA定量的分开但并行的工作流程,如美国申请第17147272号中描述的,该美国申请内容通过引用以其整体并入本文。本文提供的方法和组合物的一些实施方案采用美国申请第17147272号中描述的分开但并行的工作流程概念;例如,在一些实施方案中,使分泌因子结合试剂特异性寡核苷酸(例如,抗体寡核苷酸)与寡核苷酸条形码杂交,并延伸以实现用于来自相同珠的分泌因子定量和mRNA定量的分开但并行的工作流程。
在本文提供的方法和组合物的一些实施方案中,寡核苷酸条形码包含裂解区(包含,例如,一个或更多个裂解位点,诸如非典型核苷酸(例如,脱氧尿苷)或限制性酶识别序列),如美国申请第17147283号中描述的,该美国申请的内容通过引用以其整体并入本文。
图6示出了与分泌因子结合试剂(此处图示的抗体)关联的分泌因子结合试剂特异性寡核苷酸(此处图示的抗体寡核苷酸)的非限制性示例性设计。分泌因子结合试剂特异性寡核苷酸604可以通过接头616与分泌因子结合试剂602关联。分泌因子结合试剂特异性寡核苷酸604可以使用化学、光学或其他手段从分泌因子结合试剂602脱离。分泌因子结合试剂特异性寡核苷酸604可以是mRNA模拟物。分泌因子结合试剂特异性寡核苷酸604可以包含第二通用序列606(例如,引物衔接子)、第二分子标记608(例如,独特分子标记序列)、抗体条形码610(例如,独特因子标识符序列)、对齐序列612和多(A)尾614。
图4A-图4C示出了用于测量由单细胞分泌的一种或更多种分泌因子的拷贝数的非限制性示例性工作流程的示意图。工作流程可以包括对细胞404(例如,T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物)和第一多于一个第一固体支持物410(例如,珠)的分析。工作流程可以包括使细胞404与第一固体支持物410接触。工作流程可以包括将细胞404和第一固体支持物410分区400a到多于一个第一分区402。多于一个第一分区中的第一分区402(例如,孔、液滴)可以包含单细胞404和单个第一固体支持物410。细胞404可以包含分泌囊泡406,分泌囊泡406包含未释放的分泌因子408。细胞404可以能够分泌多于一种分泌因子408。第一固体支持物410可以包含捕获探针412,捕获探针412能够与由单细胞404分泌的多于一种分泌因子408中的至少一种特异性结合。工作流程可以包括孵育400b,孵育400b包括分泌因子的分泌和其与捕获探针的结合。工作流程可以包括从每一个第一分区402汇集400c单个第一固体支持物410(以产生第二多于一个第一固体支持物)。工作流程可以包括使第一固体支持物410与多于一种分泌因子结合试剂414接触400d,每一种分泌因子结合试剂414能够与被捕获探针结合的分泌因子特异性结合。多于一种分泌因子结合试剂中的每一种可以包含分泌因子结合试剂特异性寡核苷酸416,分泌因子结合试剂特异性寡核苷酸416包含用于分泌因子结合试剂的独特因子标识符序列。工作流程可以包括孵育400e,孵育400e包括分泌因子结合试剂414与被捕获探针412结合的分泌因子408的结合。工作流程可以包括一次或更多次洗涤400f,洗涤400f包括去除未与被捕获探针412结合的分泌因子408结合的分泌因子结合试剂414(以产生第三多于一个第一固体支持物)。工作流程可以包括将第一固体支持物410分区400g到多于一个第二分区418。多于一个第二分区中的第二分区418(例如,孔、液滴)可以包含单个第一固体支持物410和单个第三固体支持物420。第三固体支持物420可以包含多于一种寡核苷酸条形码422。寡核苷酸条形码422可以包含第一分子标记和/或细胞标记。工作流程可以包括使寡核苷酸条形码422与分泌因子结合试剂特异性寡核苷酸416接触以进行杂交。工作流程可以包括条形码化、文库制备和/或测序400h,如本文描述的。例如,工作流程可以包括使与分泌因子结合试剂特异性寡核苷酸416杂交的寡核苷酸条形码422延伸,以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,每一个条形码化分泌因子结合试剂特异性寡核苷酸包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括获得条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞404中的每一个分泌的分泌因子408的拷贝数。工作流程可以包括对多于一个细胞(例如,大量细胞)进行所述步骤。
图5A-图5C示出了用于测量由单细胞分泌的分泌因子的拷贝数和单细胞中核酸靶的拷贝数的非限制性示例性工作流程的示意图。工作流程可以包括对细胞504(例如,T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物)和第一多于一个第二固体支持物510(例如,珠)的分析。工作流程可以包括使细胞504与第二固体支持物510接触。工作流程可以包括将细胞504和第二固体支持物510分区500a到多于一个第一分区502。多于一个第一分区中的第一分区502(例如,孔、液滴)可以包含单细胞504和单个第二固体支持物510。细胞504可以包含分泌囊泡506,分泌囊泡506包含未释放的分泌因子508。细胞504可以能够分泌多于一种分泌因子508。第二固体支持物510可以包含捕获探针512,捕获探针512能够与由单细胞504分泌的多于一种分泌因子508中的至少一种特异性结合。细胞504可以包含表面细胞靶524和核酸靶526的拷贝。第二固体支持物510可以包含锚定探针528,锚定探针528能够与表面细胞靶524特异性结合。单细胞504可以能够通过与表面细胞靶524结合的锚定探针528与第二固体支持物510进行关联。工作流程可以包括孵育500b,孵育500b包括分泌因子的分泌和其与捕获探针的结合,并且单细胞504通过与表面细胞靶524结合的锚定探针528与第二固体支持物510进行关联。工作流程可以包括汇集500c来自每一个第一分区502的与第二固体支持物关联的单细胞(以产生与第二固体支持物关联的第一多于一个单细胞)。工作流程可以包括使与第二固体支持物关联的单细胞与多于一种分泌因子结合试剂514接触500d,每一种分泌因子结合试剂514能够与被捕获探针结合的分泌因子特异性结合。多于一种分泌因子结合试剂中的每一种可以包含分泌因子结合试剂特异性寡核苷酸516,分泌因子结合试剂特异性寡核苷酸516包含用于分泌因子结合试剂的独特因子标识符序列。工作流程可以包括孵育500e,孵育500e包括分泌因子结合试剂514与被捕获探针512结合的分泌因子508的结合。工作流程可以包括一次或更多次洗涤500f,洗涤500f包括去除未与被捕获探针512结合的分泌因子508结合的分泌因子结合试剂514(以产生与第二固体支持物关联的第二多于一个单细胞)。工作流程可以包括将与第二固体支持物关联的单细胞分区500g到多于一个第二分区518。多于一个第二分区中的第二分区518(例如,孔、液滴)可以包含与第二固体支持物关联的单细胞和单个第三固体支持物520。第三固体支持物520可以包含多于一种寡核苷酸条形码522。寡核苷酸条形码522可以包含第一分子标记和/或细胞标记。工作流程可以包括使寡核苷酸条形码522与分泌因子结合试剂特异性寡核苷酸516接触以进行杂交。工作流程可以包括细胞裂解条形码化、文库制备和/或测序500h,如本文描述的。例如,工作流程可以包括使与分泌因子结合试剂特异性寡核苷酸516杂交的寡核苷酸条形码522延伸,以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,每一个条形码化分泌因子结合试剂特异性寡核苷酸包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。工作流程可以包括裂解单细胞504以释放包含在其中的核酸靶526的拷贝。工作流程可以包括使寡核苷酸条形码522与核酸靶526的拷贝接触以进行杂交。工作流程可以包括使与核酸靶526的拷贝杂交的多于一种寡核苷酸条形码522延伸以产生多于一个条形码化核酸分子,所述多于一个条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记。方法可以包括获得条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞504中的每一个分泌的分泌因子508的拷贝数。工作流程可以包括获得多于一个条形码化核酸分子或其产物的序列信息,以确定一个或更多个单细胞504中的每一个中核酸靶526的拷贝数。工作流程可以包括对多于一个细胞(例如,大量细胞)进行所述步骤。
本文公开的一些实施方案提供多于一种组合物,每一种组合物包含分泌因子结合试剂(诸如蛋白结合试剂)。分泌因子结合试剂可以与寡核苷酸缀合,其中所述寡核苷酸包含用于与之缀合的分泌因子结合试剂的独特因子标识符。独特因子标识符可以是,例如,具有任何合适长度例如约4个核苷酸至约200个核苷酸的核苷酸序列。在一些实施方案中,独特因子标识符是长度为25个核苷酸至约45个核苷酸的核苷酸序列。在一些实施方案中,独特因子标识符可以具有是以下、是约以下、小于以下、大于以下的长度:4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、70个、80个、90个、100个、200个核苷酸或以上值中的任何两个值之间的范围。
在一些实施方案中,独特因子标识符选自一组相异的独特因子标识符。一组相异的独特因子标识符可以包括以下或可以包括约以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种或这些值中的任何两个值之间的数字或范围的不同的独特因子标识符。一组相异的独特因子标识符可以包括至少以下或可以包括至多以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种或5000种不同的独特因子标识符。在一些实施方案中,一组独特因子标识符被设计成与待分析样品的DNA或RNA序列具有最小的序列同源性。在一些实施方案中,一组独特因子标识符的序列彼此或与其互补物相差以下或相差约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个或10个核苷酸,或这些值中的任何两个值之间的数字或范围。在一些实施方案中,一组独特因子标识符的序列彼此或与其互补物相差至少以下或相差至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个或10个核苷酸。在一些实施方案中,一组独特因子标识符的序列彼此或与其互补物相差至少3%、至少5%、至少8%、至少10%、至少15%、至少20%或更多。
本公开内容中设想了任何合适的分泌因子结合试剂、锚定探针和捕获探针,诸如蛋白结合试剂、抗体或其片段、适配体、小分子、配体、肽、寡核苷酸等,或其任何组合。分泌因子结合试剂、锚定探针和/或捕获探针可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(sc-Ab)或其片段,诸如Fab、Fv等。在一些实施方案中,多于一种分泌因子结合试剂可以包括以下或可以包括约以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种或这些值中的任何两个值之间的数字或范围的不同分泌因子结合试剂。在一些实施方案中,多于一种分泌因子结合试剂可以包括至少以下或可以包括至多以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种或5000种不同的分泌因子结合试剂。在一些实施方案中,多于一种锚定探针可以包括以下或可以包括约以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种或这些值中的任何两个值之间的数字或范围的不同的锚定探针。在一些实施方案中,多于一种锚定探针可以包括至少以下或可以包括至多以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种或5000种不同的锚定探针。在一些实施方案中,多于一种捕获探针可以包括以下或可以包括约以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种,或这些值中的任何两个之间的数字或范围的不同的捕获探针。在一些实施方案中,多于一种捕获探针可以包括至少以下或可以包括至多以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种或5000种不同的捕获探针。
寡核苷酸可以通过各种机制与分泌因子结合试剂缀合。在一些实施方案中,寡核苷酸可以与分泌因子结合试剂共价地缀合。在一些实施方案中,寡核苷酸可以与分泌因子结合试剂非共价地缀合。在一些实施方案中,寡核苷酸通过接头与分泌因子结合试剂缀合。接头可以是例如可从分泌因子结合试剂和/或寡核苷酸裂解或脱离的。在一些实施方案中,接头可以包含将寡核苷酸可逆地附接至分泌因子结合试剂的化学基团。化学基团可以例如通过胺基团与接头缀合。在一些实施方案中,接头可以包含与另一个缀合至分泌因子结合试剂的化学基团形成稳定键的化学基团。例如,化学基团可以是UV光可裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺等。在一些实施方案中,化学基团可以通过氨基酸诸如赖氨酸上的伯胺或N-末端与分泌因子结合试剂缀合。可以使用商购可得的缀合试剂盒,诸如Protein-Oligo缀合试剂盒(Solulink,Inc.,San Diego,California)、oligo缀合系统(Innova Biosciences,Cambridge,United Kingdom)等将寡核苷酸与分泌因子结合试剂缀合。
寡核苷酸可以与分泌因子结合试剂(例如,蛋白结合试剂)的任何合适的位点缀合,只要它不干扰分泌因子结合试剂与其分泌因子之间的特异性结合。在一些实施方案中,分泌因子结合试剂是蛋白,诸如抗体。在一些实施方案中,分泌因子结合试剂不是抗体。在一些实施方案中,寡核苷酸可以与抗体在除了抗原结合位点之外的任何地方(例如Fc区、CH1结构域、CH2结构域、CH3结构域、CL结构域等)缀合。将寡核苷酸与结合试剂(例如,抗体)缀合的方法先前已经在例如美国专利第6,531,283号中公开,该美国专利的内容特此通过引用以其整体明确并入。寡核苷酸与分泌因子结合试剂的化学计量可以变化。为了增加测序中检测分泌因子结合试剂特异性寡核苷酸的灵敏度,在缀合期间增加寡核苷酸与分泌因子结合试剂的比例可以是有利的。在一些实施方案中,每种分泌因子结合试剂可以与单一寡核苷酸分子缀合。在一些实施方案中,每种分泌因子结合试剂可以与多于一个寡核苷酸分子缀合,例如,与至少以下或至多以下的寡核苷酸分子缀合:2个、3个、4个、5个、10个、20个、30个、40个、50个、100个、1000个或这些值中的任何两个值之间的数字或范围,其中每个寡核苷酸分子包含相同或不同的独特因子标识符。在一些实施方案中,每种分泌因子结合试剂可以与多于一个寡核苷酸分子缀合,例如,与至少以下或至多以下的寡核苷酸分子缀合:2个、3个、4个、5个、10个、20个、30个、40个、50个、100个、1000个寡核苷酸分子,其中每个寡核苷酸分子包含相同或不同的独特因子标识符。
在一些实施方案中,多于一种分泌因子结合试剂能够与样品中的多于一种分泌因子特异性结合,所述样品诸如单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,多于一种分泌因子可以包括以下或可以包括约以下:2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种、10000种,或这些值中的任何两个值之间的数字或范围的不同的分泌因子。在一些实施方案中,多于一种分泌因子可以包括至少以下或可以包括至多以下:2种、3种、4种、5种、10种、20种、30种、40种、50种、100种、1000种、10000种不同的分泌因子。
在一些实施方案中,分泌因子结合试剂特异性寡核苷酸可以包含长度是以下的核苷酸序列或长度是约以下的核苷酸序列:6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、110个、120个、128个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、610个、620个、630个、640个、650个、660个、670个、680个、690个、700个、710个、720个、730个、740个、750个、760个、770个、780个、790个、800个、810个、820个、830个、840个、850个、860个、870个、880个、890个、900个、910个、920个、930个、940个、950个、960个、970个、980个、990个、1000个,或这些值中的任何两个值之间的数字或范围的核苷酸。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸包含长度是至少以下或至多以下的核苷酸序列:6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、110个、120个、128个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、610个、620个、630个、640个、650个、660个、670个、680个、690个、700个、710个、720个、730个、740个、750个、760个、770个、780个、790个、800个、810个、820个、830个、840个、850个、860个、870个、880个、890个、900个、910个、920个、930个、940个、950个、960个、970个、980个、990个或1000个核苷酸。
寡核苷酸缀合的抗体
本文公开的一些实施方案提供了多于一种组合物,每种组合物包含与寡核苷酸缀合的细胞组分结合试剂(诸如蛋白结合试剂),其中寡核苷酸包含用于与其缀合的细胞组分结合试剂的独特标识符。已在美国专利申请公布第US2018/0088112号和美国专利申请公布第US2018/0346970号中描述了细胞组分结合试剂(诸如条形码化抗体)及其用途(诸如细胞的样品索引);这些中的每一项的内容通过引用以其整体并入本文。在本文提供的一些实施方案中,提供了能够与分泌因子特异性结合的分泌因子结合试剂。分泌因子结合试剂可以包含分泌因子结合试剂特异性寡核苷酸。在一些实施方案中,提供了用于同时定量分析多于一种细胞组分靶(例如,蛋白靶)和由单细胞分泌的分泌因子的拷贝的方法。本文描述的方法和系统可以与使用与寡核苷酸关联(例如,与寡核苷酸附接或缀合)的抗体(本文也称为AbO或AbOligo)的方法和系统一起使用。使用AbO来确定单细胞中的蛋白表达谱和追踪样品来源的实施方案已在美国专利申请第15/715,028号(公布为美国专利申请公布第2018/0088112号)和美国专利申请第15/937,713号中描述;每项专利申请的内容通过引用以其整体并入本文。
独特分子标记序列
在一些实施方案中,本文提供的方法和组合物包括与细胞组分结合试剂关联的寡核苷酸(例如,抗体寡核苷酸(“AbOligo”或“AbO”)、结合试剂寡核苷酸、细胞组分结合试剂特异性寡核苷酸、样品索引寡核苷酸),如2020年1月21日提交的美国申请第16/747,737号中描述的,该美国申请的内容通过引用以其整体并入本文。在一些实施方案中,与细胞组分结合试剂关联的寡核苷酸(例如,抗体寡核苷酸(“AbOligo”或“AbO”)、结合试剂寡核苷酸、分泌因子结合试剂特异性寡核苷酸、细胞组分结合试剂特异性寡核苷酸、样品索引寡核苷酸)包含独特分子标记序列(也称为分子索引(MI)、“分子条形码”或独特分子标识符(UMI))。在一些实施方案中,包含如本文描述的分子条形码的结合试剂寡核苷酸物质通过增加灵敏度、降低相对标准误差或增加灵敏度和/或减少标准误差来减少偏倚。分子条形码可以包含独特序列,使得当多于一个样品核酸(可以彼此相同和/或不同)与分子条形码一一关联时,不同的样品核酸可以通过分子条形码彼此区分。这样,即使样品包含具有相同序列的两种核酸,这两种核酸中的每一种可以用不同的分子条形码标记,使得群体中的核酸可以被定量,甚至在扩增之后被定量。分子条形码可以包含以下的核酸序列:至少5个核苷酸,例如至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸,包括在所列值中的任何两个值之间的范围,例如5-50个、5-45个、5-40个、5-35个、5-30个、5-25个、5-20个、5-15个、5-14个、5-13个、5-12个、5-11个、5-10个、5-9个、5-8个、5-7个、5-6个、6-50个、6-45个、6-40个、6-35个、6-30个、6-25个、6-20个、6-15个、6-14个、6-13个、6-12个、6-11个、6-10个、6-9个、6-8个、6-7个、7-50个、7-45个、7-40个、7-35个、7-30个、7-25个、7-20个、7-15个、7-14个、7-13个、7-12个、7-11个、7-10个、7-9个、7-8个、8-50个、8-45个、8-40个、8-35个、8-30个、8-25个、8-20个、8-15个、8-14个、8-13个、8-12个、8-11个、8-10个、8-9个、9-50个、9-45个、9-40个、9-35个、9-30个、9-25个、9-20个、9-15个、9-14个、9-13个、9-12个、9-11个、9-10个、10-50个、10-45个、10-40个、10-35个、10-30个、10-25个、10-20个、10-15个、10-14个、10-13个、10-12个或10-11个核苷酸。在一些实施方案中,分子条形码的核酸序列包含例如独特序列,使得组合物中的每种独特寡核苷酸物质包含不同的分子条形码。在一些实施方案中,两种或更多种独特寡核苷酸物质可以包含相同的分子条形码,但是仍然彼此不同。例如,如果独特寡核苷酸物质包含样品条形码,则具有特定样品条形码的每种独特寡核苷酸物质可以包含不同的分子条形码。在一些实施方案中,包含独特寡核苷酸物质的组合物包含至少1000种不同分子条形码的分子条形码多样性,并且因此包含至少1000种独特寡核苷酸物质。在一些实施方案中,包含独特寡核苷酸物质的组合物包含至少6,500种不同分子条形码的分子条形码多样性,并且因此包含至少6,500种独特寡核苷酸物质。在一些实施方案中,包含独特寡核苷酸物质的组合物包含至少65,000种不同分子条形码的分子条形码多样性,并且因此包含至少65,000种独特寡核苷酸物质。
在一些实施方案中,独特分子标记序列位于独特标识符序列的5’,在独特分子标记序列与独特标识符序列之间没有任何间插序列。在一些实施方案中,独特分子标记序列位于间隔区的5’,所述间隔区位于独特标识符序列的5’,使得间隔区位于独特分子标记序列与独特标识符序列之间。在一些实施方案中,独特标识符序列位于独特分子标记序列的5’,在独特标识符序列与独特分子标记序列之间没有任何间插序列。在一些实施方案中,独特标识符序列位于间隔区的5’,所述间隔区位于独特分子标记序列的5’,使得间隔区位于独特标识符序列与独特分子标记序列之间。
独特分子标记序列可以包含以下的核酸序列:至少3个核苷酸,例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个核苷酸,包括在所列值中的任何两个值之间的范围,例如3-50个、3-45个、3-40个、3-35个、3-30个、3-25个、3-20个、3-15个、3-14个、3-13个、3-12个、3-11个、3-10个、3-9个、3-8个、3-7个、3-6个、3-5个、3-4个、4-50个、4-45个、4-40个、4-35个、4-30个、4-25个、4-20个、4-15个、4-14个、4-13个、4-12个、4-11个、4-10个、4-9个、4-8个、4-7个、4-6个、4-5个、5-50个、5-45个、5-40个、5-35个、5-30个、5-25个、5-20个、5-15个、5-14个、5-13个、5-12个、5-11个、5-10个、5-9个、5-8个、5-7个、5-6个、6-50个、6-45个、6-40个、6-35个、6-30个、6-25个、6-20个、6-15个、6-14个、6-13个、6-12个、6-11个、6-10个、6-9个、6-8个、6-7个、7-50个、7-45个、7-40个、7-35个、7-30个、7-25个、7-20个、7-15个、7-14个、7-13个、7-12个、7-11个、7-10个、7-9个、7-8个、8-50个、8-45个、8-40个、8-35个、8-30个、8-25个、8-20个、8-15个、8-14个、8-13个、8-12个、8-11个、8-10个、8-9个、9-50个、9-45个、9-40个、9-35个、9-30个、9-25个、9-20个、9-15个、9-14个、9-13个、9-12个、9-11个、9-10个、10-50个、10-45个、10-40个、10-35个、10-30个、10-25个、10-20个、10-15个、10-14个、10-13个、10-12个或10-11个核苷酸。在一些实施方案中,独特分子标记序列的长度是2-20个核苷酸。
在一些实施方案中,结合试剂寡核苷酸的独特分子标记序列包含双重体“VN”和/或“NV”的至少三个重复的序列(其中每个“V”是A、C或G中的任何一个,并且其中“N”是A、G、C或T中的任何一个),至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。双重体“VN”的多个重复的实例包括VN、VNVN、VNVNVN和VNVNVNVN。要注意的是,虽然式“VN”和“NV”描述了对基本内容的约束,但不是每个V或每个N都必须相同或不同。例如,如果组合物中独特寡核苷酸物质的分子条形码包含VNVNVN,一种分子条形码可以包含序列ACGGCA,而另一种分子条形码可以包含序列ATACAT,而另一种分子条形码可以包含序列ATACAC。要注意的是,任何数目的重复的双重体“VN”将具有不多于50%的T含量。在一些实施方案中,包含至少1000种独特寡核苷酸物质的组合物的至少95%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少1000种独特寡核苷酸物质的组合物的至少99%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少1000种独特寡核苷酸物质的组合物的至少99.9%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少6500种独特寡核苷酸物质的组合物的至少95%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少6500种独特寡核苷酸物质的组合物的至少99%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少6500种独特寡核苷酸物质的组合物的至少99.9%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少65,000种独特寡核苷酸物质的组合物的至少95%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少65,000种独特寡核苷酸物质的组合物的至少99%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,包含至少65,000种独特寡核苷酸物质的组合物的至少99.9%的独特寡核苷酸物质包含含有双重体“VN”和/或“NV”的至少三个重复的分子条形码,至少三个重复例如至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个重复,包括在所列值中的任何两个值之间的范围。在一些实施方案中,组合物由或基本上由至少1000、6500或65,000种独特的寡核苷酸物质组成,每种寡核苷酸物质具有包含序列VNVNVN的分子条形码。在一些实施方案中,组合物由或基本上由至少1000、6500或65,000种独特的寡核苷酸物质组成,每种寡核苷酸物质具有包含序列VNVNVNVN的分子条形码。在一些实施方案中,如本文描述的组合物的至少95%、99%或99.9%的条形码区域包含如本文描述的双重体“VN”和/或“NV”的至少三个重复。在一些实施方案中,包含重复的双重体“VN”和/或“NV”的独特分子标记序列可以产生低偏倚,同时在减少偏倚与维持相对大量的可用核苷酸序列之间提供折中,使得可以在相对短的序列中获得相对高的多样性,同时仍然使偏倚最小化。在一些实施方案中,包含重复的双重体“VN”和/或“NV”的独特分子标记序列可以通过增加灵敏度、降低相对标准误差或增加灵敏度和减少标准误差来减少偏倚。在一些实施方案中,包含重复的双重体“VN”和/或“NV”的独特分子标记序列通过充当地理标志物(geomarker)来改进信息学分析。在一些实施方案中,本文描述的重复的双重体“VN”和/或“NV”减少了独特分子标记序列内均聚物的发生率。在一些实施方案中,本文描述的重复的双重体“VN”和/或“NV”中断均聚物。
在一些实施方案中,样品索引寡核苷酸包含第一分子标记序列。在一些实施方案中,至少两种样品索引寡核苷酸的第一分子标记序列是不同的,并且至少两种样品索引寡核苷酸的样品索引序列是相同的。在一些实施方案中,至少两种样品索引寡核苷酸的第一分子标记序列是不同的,并且至少两种样品索引寡核苷酸的样品索引序列是不同的。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸包含第二分子标记序列。在一些实施方案中,至少两种细胞组分结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两种细胞组分结合试剂特异性寡核苷酸的独特标识符序列是相同的。在一些实施方案中,至少两种细胞组分结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两种细胞组分结合试剂特异性寡核苷酸的独特标识符序列是不同的。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的独特第二分子标记序列的数目指示多于一个细胞中的一个或更多个中至少一种细胞组分靶的拷贝数,所述细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。在一些实施方案中,以下(1)和(2)的组合(例如,最小值、平均值和最大值)指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数:(1)测序数据中与用于细胞组分结合试剂的独特标识符序列关联的独特第一分子标记序列的数目,所述细胞组分结合试剂能够与至少一种细胞组分靶特异性结合;和(2)测序数据中与用于细胞组分结合试剂的独特标识符序列关联的独特第二分子标记序列的数目,所述细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。
对齐序列
在一些实施方案中,结合试剂寡核苷酸包含与多(dA)区相邻的对齐序列(例如,对齐序列825bb)。对齐序列的长度可以是1个或更多个核苷酸。对齐序列的长度可以是2个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含多(dT)区、多(dG)区、多(dC)区、多(dU)区或其组合。在一些实施方案中,对齐序列在多(dA)区的5’。有利地,在一些实施方案中,对齐序列的存在使得结合试剂寡核苷酸中的每一个的多(A)尾具有相同的长度,导致更大的性能均匀性。在一些实施方案中,在多于一个结合试剂寡核苷酸(其中的每一个结合试剂寡核苷酸包含对齐序列)中具有相同多(dA)区长度的结合试剂寡核苷酸的百分比可以是以下或可以是约以下:80%、90%、91%、93%、95%、97%、99.9%、99.9%、99.99%或100%或这些值中的任何两个值之间的数字或范围。在一些实施方案中,在多于一个结合试剂寡核苷酸(其中的每一个结合试剂寡核苷酸包含对齐序列)中具有相同多(dA)区长度的结合试剂寡核苷酸的百分比可以是至少以下或可以是至多以下:80%、90%、91%、93%、95%、97%、99.9%、99.9%、99.99%或100%。
在不同实施方式中,对齐序列的长度可以是不同的。在一些实施方案中,对齐序列的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或这些值中的任何两个值之间的数字或范围。在一些实施方案中,对齐序列的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。在不同实施方式中,对齐序列中鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是不同的。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个或这些值中的任何两个值之间的数字或范围。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个或100个。在一些实施方案中,样品索引寡核苷酸包含对齐序列。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸和/或分泌因子结合试剂特异性寡核苷酸包含对齐序列。
接头
结合试剂寡核苷酸(例如,分泌因子结合试剂特异性寡核苷酸)可以通过各种机制与细胞组分结合试剂缀合。在一些实施方案中,结合试剂寡核苷酸可以与细胞组分结合试剂共价缀合。在一些实施方案中,结合试剂寡核苷酸可以与细胞组分结合试剂非共价缀合。在一些实施方案中,结合试剂寡核苷酸通过接头与细胞组分结合试剂缀合。在一些实施方案中,结合试剂寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂的分子。化学基团可以选自由以下组成的组:UV光可裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺及其任何组合。接头可以包含碳链。碳链可以包含例如5-50个碳原子。在不同实施方案中,碳链可以具有不同数目的碳原子。在一些实施方案中,碳链中碳原子的数目可以是以下或可以是约以下:3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个或这些值中的任何两个值之间的数字或范围。在一些实施方案中,碳链中碳原子的数目可以是至少以下或可以是至多以下:3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个。在一些实施方案中,碳链包含2-30个碳原子。在一些实施方案中,碳链包含12个碳原子。在一些实施方案中,用于结合试剂寡核苷酸的氨基修饰物可以与细胞组分结合试剂缀合。在一些实施方案中,接头包含5’氨基修饰物C6(5AmMC6)。在一些实施方案中,接头包含5’氨基修饰物C12(5AmMC12)。在一些实施方案中,接头包含5AmMC12的衍生物。在一些实施方案中,较长的接头实现了更高的缀合效率。在一些实施方案中,较长的接头在缀合之前实现了更高的修饰效率。在一些实施方案中,增加功能性胺与DNA序列之间的距离产生更高的缀合效率。在一些实施方案中,增加功能性胺与DNA序列之间的距离在缀合之前产生更高的修饰效率。在一些实施方案中,使用5AmMC12作为接头比使用5AmMC6作为接头产生更高的修饰效率(在缀合之前)。在一些实施方案中,使用5AmMC12作为接头比使用5AmMC6作为接头产生更高的缀合效率。在一些实施方案中,样品索引寡核苷酸通过接头与细胞组分结合试剂关联。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸和/或分泌因子结合试剂特异性寡核苷酸通过接头与细胞组分结合试剂关联。
抗体特异性条形码序列
在数种实施方案中,本文公开了对结合试剂寡核苷酸(例如,分泌因子结合试剂特异性寡核苷酸)的独特标识符序列(例如,抗体特异性条形码序列)的设计的改进。在一些实施方案中,独特标识符序列(例如,样品索引序列、独特因子标识符序列、细胞组分结合试剂特异性寡核苷酸的独特标识符序列)被设计成具有大于3的汉明距离。在一些实施方案中,独特标识符序列的汉明距离可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10或这些值中的任何两个值之间的数字或范围。在一些实施方案中,独特标识符序列具有在40%至60%范围内的GC含量,并且不具有预测的二级结构(例如,发夹)。在一些实施方案中,独特标识符序列不包含计算机模拟预测与小鼠和/或人类转录物结合的任何序列。在一些实施方案中,独特标识符序列不包含计算机模拟预测与RhapsodyTM和/或SCMK系统引物结合的任何序列。在一些实施方案中,独特标识符序列不包含均聚物。
引物衔接子
在一些实施方案中,结合试剂寡核苷酸(例如,分泌因子结合试剂特异性寡核苷酸)包含引物衔接子。在一些实施方案中,引物衔接子包含以下的序列:第一通用引物、其互补序列、其部分序列或其组合。在一些实施方案中,第一通用引物包括扩增引物、其互补序列、其部分序列或其组合。在一些实施方案中,第一通用引物包括测序引物、其互补序列、其部分序列或其组合。在一些实施方案中,测序引物包括Illumina测序引物。在一些实施方案中,测序引物包括Illumina测序引物的一部分。在一些实施方案中,测序引物包括P7测序引物或P7测序引物的一部分。在一些实施方案中,引物衔接子包括用于Illumina P7的衔接子或用于Illumina P7的部分衔接子。在一些实施方案中,扩增引物是Illumina P7序列或其子序列。在一些实施方案中,测序引物是Illumina R2序列或其子序列。在一些实施方案中,第一通用引物的长度是5-50个核苷酸。在一些实施方案中,引物衔接子可以包含以下的核酸序列:至少5个核苷酸,例如至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸,包括在所列值中的任何两个值之间的范围,例如5-50个、5-45个、5-40个、5-35个、5-30个、5-25个、5-20个、5-15个、5-14个、5-13个、5-12个、5-11个、5-10个、5-9个、5-8个、5-7个、5-6个、6-50个、6-45个、6-40个、6-35个、6-30个、6-25个、6-20个、6-15个、6-14个、6-13个、6-12个、6-11个、6-10个、6-9个、6-8个、6-7个、7-50个、7-45个、7-40个、7-35个、7-30个、7-25个、7-20个、7-15个、7-14个、7-13个、7-12个、7-11个、7-10个、7-9个、7-8个、8-50个、8-45个、8-40个、8-35个、8-30个、8-25个、8-20个、8-15个、8-14个、8-13个、8-12个、8-11个、8-10个、8-9个、9-50个、9-45个、9-40个、9-35个、9-30个、9-25个、9-20个、9-15个、9-14个、9-13个、9-12个、9-11个、9-10个、10-50个、10-45个、10-40个、10-35个、10-30个、10-25个、10-20个、10-15个、10-14个、10-13个、10-12个或10-11个核苷酸。引物衔接子可以包含以下的核酸序列:第一通用引物、扩增引物、测序引物,其互补序列、其部分序列,或其组合的序列的至少5个核苷酸,例如至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸,包括在所列值中的任何两个值之间的范围,例如第一通用引物、扩增引物、测序引物,其互补序列、其部分序列,或其组合的序列的5-50个、5-45个、5-40个、5-35个、5-30个、5-25个、5-20个、5-15个、5-14个、5-13个、5-12个、5-11个、5-10个、5-9个、5-8个、5-7个、5-6个、6-50个、6-45个、6-40个、6-35个、6-30个、6-25个、6-20个、6-15个、6-14个、6-13个、6-12个、6-11个、6-10个、6-9个、6-8个、6-7个、7-50个、7-45个、7-40个、7-35个、7-30个、7-25个、7-20个、7-15个、7-14个、7-13个、7-12个、7-11个、7-10个、7-9个、7-8个、8-50个、8-45个、8-40个、8-35个、8-30个、8-25个、8-20个、8-15个、8-14个、8-13个、8-12个、8-11个、8-10个、8-9个、9-50个、9-45个、9-40个、9-35个、9-30个、9-25个、9-20个、9-15个、9-14个、9-13个、9-12个、9-11个、9-10个、10-50个、10-45个、10-40个、10-35个、10-30个、10-25个、10-20个、10-15个、10-14个、10-13个、10-12个或10-11个核苷酸。
用于测序文库制备的常规扩增工作流程可以采用三轮PCR,诸如,例如:第一轮(“PCR 1”)采用靶特异性引物和针对通用Illumina测序引物1序列的引物;第二轮(“PCR2”)使用侧翼为Illumina测序引物2序列的巢式靶特异性引物和针对通用Illumina测序引物1序列的引物;和第三轮(“PCR 3”)添加Illumina P5和P7和样品索引。有利地,在一些实施方案中,与如果起始模板(例如,附接至珠的样品索引寡核苷酸)不具有引物衔接子相比,本文公开的引物衔接子能够在文库制备中实现更短且更简单的工作流程。在一些实施方案中,引物衔接子将模板的测序前PCR扩增减少一轮(与如果不包含引物衔接子的模板相比)。在一些实施方案中,引物衔接子将模板的测序前PCR扩增减少至一轮(与如果不包含引物衔接子的模板相比)。在一些实施方案中,包含引物衔接子的模板不需要用于附接Illumina测序衔接子的PCR扩增步骤,如果模板不包含引物衔接子,则需要预测序。在一些实施方案中,引物衔接子序列(或其子序列)不是包含引物衔接子序列的测序模板的测序读出的一部分,并且因此不影响包含引物衔接子的模板的读段质量。在一些实施方案中,与如果不包含引物衔接子的模板相比,包含引物衔接子的模板具有减少的测序多样性。
在一些实施方案中,样品索引寡核苷酸包含引物衔接子。在一些实施方案中,复制样品索引寡核苷酸、条形码化样品索引寡核苷酸或其产物包括使用第一通用引物、包含第一通用引物的序列的第一引物或其组合,来产生多于一个复制的样品索引寡核苷酸。在一些实施方案中,复制样品索引寡核苷酸、条形码化样品索引寡核苷酸或其产物包括使用第一通用引物、包含第一通用引物的序列的第一引物、第二通用引物、包含第二通用引物的序列的第二引物或其组合,来产生多于一个复制的样品索引寡核苷酸。在一些实施方案中,细胞组分结合试剂特异性寡核苷酸和/或分泌因子结合试剂特异性寡核苷酸包含引物衔接子、第一通用引物、其互补序列、其部分序列或其组合的序列。
结合试剂寡核苷酸条形码化
图8示出了对与结合试剂805(此处图示的抗体,诸如例如分泌因子结合试剂)关联的结合试剂寡核苷酸825(此处图示的抗体寡核苷酸,例如分泌因子结合试剂特异性寡核苷酸)进行条形码化的非限制性示例性工作流程的示意图。结合试剂寡核苷酸825可以通过接头825l与结合试剂805关联。结合试剂寡核苷酸825可以使用化学、光学或其他手段从结合试剂脱离。结合试剂寡核苷酸825可以是mRNA模拟物。结合试剂寡核苷酸825可以包含引物衔接子825pa、抗体分子标记825am(例如,独特分子标记序列)、抗体条形码825ab(例如,独特标识符序列)、对齐序列825bb和多(A)尾825a。在一些实施方案中,引物衔接子825pa包含以下的序列:第一通用引物、其互补序列、其部分序列或其组合。在一些实施方案中,引物衔接子825pa对于所有或一些结合试剂寡核苷酸825可以是相同的。在一些实施方案中,抗体条形码825ab对于所有或一些结合试剂寡核苷酸825可以是相同的。在一些实施方案中,不同结合试剂寡核苷酸825的抗体条形码825ab是不同的。在一些实施方案中,不同结合试剂寡核苷酸825的抗体分子标记825am是不同的。
结合试剂寡核苷酸825可以使用多于一个条形码815(例如,与颗粒诸如珠810关联的条形码815)进行条形码化,以产生多于一个条形码化结合试剂寡核苷酸840。在一些实施方案中,条形码815可以包含用于与结合试剂寡核苷酸825,任选地分子标记815m(例如,用于确定结合试剂寡核苷酸的出现数目)、细胞标记815c和通用标记815u结合的多(dT)区815t。在一些实施方案中,条形码815与结合试剂寡核苷酸825的多(dT)区815t杂交。在一些实施方案中,条形码化结合试剂寡核苷酸840通过使与结合试剂寡核苷酸825杂交的条形码815延伸(例如,通过逆转录)而产生。在一些实施方案中,条形码化结合试剂寡核苷酸840包含引物衔接子825pa、抗体分子标记825am(例如,独特分子标记序列)、抗体条形码825ab(例如,独特标识符序列)、对齐序列825bb、多(dT)区815t、分子标记815m、细胞标记815c和通用标记815u。
在一些实施方案中,本文公开的条形码化结合试剂寡核苷酸包含两种独特分子标记序列:来源于条形码的分子标记序列(例如,分子标记815m)和来源于结合试剂寡核苷酸的分子标记序列(例如,抗体分子标记825am、样品索引寡核苷酸的第一分子标记序列、细胞组分结合试剂特异性寡核苷酸的第二分子标记序列、分泌因子结合试剂特异性寡核苷酸的分子标记)。如本文使用的,“双重分子索引”是指采用包含第一独特分子标记序列和第二独特分子标记序列(或其互补序列)的条形码化结合试剂寡核苷酸(或其产物)的本文公开的方法和组合物。在一些实施方案中,本文公开的样品鉴定和细胞组分靶的定量分析的方法可以包括获得条形码分子标记序列和/或结合试剂寡核苷酸分子标记序列的信息序列。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的条形码分子标记序列的数目指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数,所述细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的结合试剂寡核苷酸分子标记序列的数目指示多于一个细胞中的一个或更多个细胞中至少一种细胞组分靶的拷贝数,所述细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。在一些实施方案中,测序数据中与用于细胞组分结合试剂的独特标识符序列关联的结合试剂寡核苷酸分子标记序列和条形码分子标记序列两者的数目指示多于一个细胞中的一个或更多个中的至少一种细胞组分靶的拷贝数,所述细胞组分结合试剂能够与至少一种细胞组分靶特异性结合。
在开始测序方案之前使用PCR来扩增物质的量增加了伪影(artifacts)的可能性,诸如当过早终止产物引发随后轮合成时,在扩增期间发生人为重组。在一些实施方案中,本文提供的双重分子索引的方法允许在给定足够测序深度的情况下鉴定PCR嵌合体。另外地,在一些实施方案中,向结合试剂寡核苷酸添加独特分子标记序列增加了随机标记的复杂性。因此,在一些实施方案中,结合试剂寡核苷酸中独特分子标记序列的存在可以克服UMI多样性的限制。在一些实施方案中,与如果不使用该方法和组合物相比,本文提供的双重分子索引方法将测序后分子覆盖计算期间标记为“饱和”的细胞组分靶的数量降低了至少约2%(例如,2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、40%、50%、75%、100%、150%、200%、250%、500%、1000%或更高,以及其中的重叠范围)。
探针、结合试剂和固体支持物
第一固体支持物和/或第二固体支持物的尺寸和形状可以被确定近似于细胞。在一些实施方案中,第一固体支持物和/或第二固体支持物具有细胞(例如,哺乳动物细胞、酵母细胞、昆虫细胞、植物细胞、细菌细胞或其任何组合)的维度。第一固体支持物、第二固体支持物和/或第三固体支持物可以包括合成颗粒或平坦表面。多于一种寡核苷酸条形码中的至少一种可以被固定或部分地固定在合成颗粒上。多于一种寡核苷酸条形码中的至少一种可以被包封或部分地包封在合成颗粒中。合成颗粒可以是可破坏的。合成颗粒可以包括珠。珠可以包括:琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或者可破坏的水凝胶颗粒。
在一些实施方案中,多于一种寡核苷酸条形码中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,多于一种锚定探针中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
在一些实施方案中,多于一种捕获探针中的每一种包含接头官能团,合成颗粒包含固体支持物官能团,并且支持物官能团和接头官能团彼此关联。接头官能团和支持物官能团可以单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
分泌因子结合试剂和捕获探针可以能够与同一分泌因子的不同表位结合。在一些实施方案中,分泌因子结合试剂、捕获探针和锚定探针中的一种或更多种包括抗体或其片段。抗体或其片段可以包括单克隆抗体。抗体或其片段可以包括Fab、Fab’、F(ab’)2、Fv、scFv、dsFv、双特异抗体、三特异抗体、四特异抗体、由抗体片段形成的多特异性抗体、单结构域抗体(sdAb)、包含互补的scFv(串联scFv)或双特异性串联scFv的单链、Fv构建体、二硫键连接的Fv、双可变结构域免疫球蛋白(DVD-Ig)结合蛋白或纳米抗体、适配体、亲和体、affilin、affitin、affimer、alphabody、anticalin、avimer、DARPin、Fynomer、Kunitz结构域肽、单特异抗体或其任何组合。捕获探针和/或锚定探针可以通过以下与第一固体支持物和/或第二固体支持物缀合:1,3-偶极环加成反应、杂Diels-Alder反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合。
至少一种分泌因子可以包括淋巴因子、白细胞介素、趋化因子或其任何组合。至少一种分泌因子可以包括细胞因子、激素、分子毒素或其任何组合。至少一种分泌因子可以包括神经生长因子、肝生长因子、成纤维细胞生长因子、血管内皮生长因子、血小板源生长因子、转化生长因子、骨诱导因子、干扰素、集落刺激因子或其任何组合。至少一种分泌因子可以包括血管生成素、血管生成蛋白-1、血管生成蛋白-2、bNGF、组织蛋白酶S、半乳凝素-7、GCP-2、G-CSF、GM-CSF、PAI-1、PDGF-AA、PDGF-BB、PDGF-AB、PlGF、PlGF-2、SDF-1、Tie2、VEGF-A、VEGF-C、VEGF-D、VEGF-R1、VEGF-R2、VEGF-R3、6Ckine、血管生成蛋白-1、血管生成蛋白-2、BLC、BRAK、CD186、ENA-78、嗜酸性粒细胞趋化因子-1、嗜酸性粒细胞趋化因子-2、嗜酸性粒细胞趋化因子-3、EpCAM、GDF-15、GM-CSF、GRO、HCC-4、I-309、IFN-γ、IL-1α、IL-1β、IL-1R4(ST2)、IL-2、IL-2R、IL-3、IL-3Rα、IL-5、IL-6、IL-6R、IL-7、IL-8、IL-8RB、IL-11、IL-12、IL-12p40、IL-12p70、IL-13、IL-13R1、IL-13R2、IL-15、IL-15Rα、IL-16、IL-17、IL-17C、IL-17E、IL-17F、IL-17R、IL-18、IL-18BPa、IL-18Rα、IL-20、IL-23、IL-27、IL-28、IL-31、IL-33、IP-10、I-TAC、LIF、LIX、LRP6、MadCAM-1、MCP-1、MCP-2、MCP-3、MCP-4、M-CSF、MIF、MIG、MIP-1γ、MIP-1α、MIP-1β、MIP-1δ、MIP-3α、MIP-3β、MPIF-1、PARC、PF4、RANTES、抵抗素、SCF、SCYB16、TACI、TARC、TSLP、TNF-α、TNF-R1、TRAIL-R4、TREM-1、激活蛋白A、双调蛋白、Axl、BDNF、BMP4、组织蛋白酶S、EGF、FGF-1、FGF-2、FGF-7、FGF-21、卵泡抑制素、半乳凝素-7、Gas6、GDF-15、HB-EGF、HGF、IGFBP-1、IGFBP-3、LAP、NGF R、NrCAM、NT-3、NT-4、PAI-1、TGF-α、TGF-β、TGF-β3、TRAIL-R4、ADAMTS1、组织蛋白酶S、FGF-2、卵泡抑制素、半乳凝素-7、GCP-2、GDF-15、IGFBP-6、LIF、MMP-9、pro-MMP9、RANK、RANKL、RANTES、SDF-1、CXCR4或其任何组合。
表面细胞靶可以包括糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。表面细胞靶可以包括糖类、脂质、蛋白或其任何组合。表面细胞靶可以包括CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3、CD3d、CD3e、CD3g、CD4、CD5、CD6、CD7、CD8a、CD8b、CD9、CD10、CD11a、CD11b、CD11c、CD11d、CDwl2、CD13、CD14、CD15、CD15u、CD15s、CD15su、CD16、CD16b、CD17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD45、CD45RA、CD45RB、CD45RC、CD45RO、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CD60a、CD60b、CD60c、CD61、CD62E、CD62L、CD62P、CD63、CD64、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CD75、CD75s、CD77、CD79a、CD79b、CD80、CD81、CD82、CD83、CD84、CD85a、CD85d、CD85j、CD85k、CD86、CD87、CD88、CD89、CD90、CD91、CD92、CD93、CD94、CD95、CD96、CD97、CD98、CD99、CD99R、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107a、CD107b、CD108、CD109、CD110、CD111、CD112、CD113、CD114、CD115、CD116、CD117、CD118、CD119、CD120a、CD120b、CD121a、CD121b、CD122、CD123、CD124、CD125、CD126、CD127、CD129、CD130、CD131、CD132、CD133、CD134、CD135、CD136、CD137、CD138、CD139、CD140a、CD140b、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CDw149、CD150、CD151、CD152、CD153、CD154、CD155、CD156a、CD156b、CD156c、CD157、CD158e、CD158i、CD158k、CD159a、CD159c、CD160、CD161、CD162、CD163、CD164、CD165、CD166、CD167a、CD167b、CD168、CD169、CD170、CD171、CD172a、CD172b、CD172g、CD173、CD174、CD175、CD175s、CD176、CD177、CD178、CD179a、CD179b、CD180、CD181、CD182、CD183、CD184、CD185、CD186、CD191、CD192、CD193、CD194、CD195、CD196、CD197、CDw198、CD199、CD200、CD201、CD202b、CD203c、CD204、CD205、CD206、CD207、CD208、CD209、CD210、CDw210b、CD212、CD213a1、CD213a2、CD215、CD217a、CD218a、CD218b、CD220、CD221、CD222、CD223、CD224、CD225、CD226、CD227、CD228、CD229、CD230、CD231、CD232、CD233、CD234、CD235a、CD235b、CD236、CD236R、CD238、CD239、CD240CE、CD240DCE、CD240D、CD241、CD242、CD243、CD244、CD245、CD246、CD247、CD248、CD249、CD252、CD253、CD254、CD256、CD266、CD267、CD268、CD269、CD270、CD271、CD272、CD273、CD274、CD275、CD276、CD277、CD278、CD279、CD280、CD281、CD282、CD283、CD284、CD286、CD289、CD290、CD292、CDw293、CD294、CD295、CD296、CD297、CD298、CD299、CD300a、CD300c、CD300e、CD301、CD302、CD303、CD304、CD305、CD306、CD307a、CD307b、CD307c、CD307d、CD307e、CD308、CD309、CD312、CD314、CD315、CD316、CD317、CD318、CD319、CD320、CD321、CD322、CD324、CD325、CD326、CD327、CD328、CD329、CD331、CD332、CD333、CD334、CD335、CD336、CD337、CD338、CD339、CD340、CD344、CD349、CD350、CD351、CD352、CD353、CD354、CD355、CD357、CD358、CD360、CD361、CD362、CD363、CD364、CD365、CD366、CD367、CD368、CD369、CD370、CD371、BCMA、HLA蛋白、β2-微球蛋白或其任何组合。
同时进行单细胞分泌组和转录组分析的方法
本文的公开内容包括测量由单细胞分泌的分泌因子的拷贝数的方法。方法可以包括:使一个或更多个单细胞与第一多于一个第一固体支持物接触,所述一个或更多个单细胞能够分泌多于一种分泌因子,每一个第一固体支持物包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针。方法可以包括:使第一固体支持物与多于一种分泌因子结合试剂接触,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。方法可以包括:使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交,寡核苷酸条形码各自包含第一分子标记。方法可以包括:使与分泌因子结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,一个或更多个单细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
在一些实施方案中,使一个或更多个单细胞与第一多于一个第一固体支持物接触包括:将一个或更多个单细胞和第一多于一个第一固体支持物分区到多于一个第一分区,多于一个第一分区中的第一分区包含一个或更多个单细胞中的单细胞和第一多于一个第一固体支持物中的单个第一固体支持物。
在一些实施方案中,方法包括在使第一固体支持物与多于一种分泌因子结合试剂接触之前:汇集来自多于一个第一分区中的每一个第一分区的单个第一固体支持物,以产生第二多于一个第一固体支持物。在一些实施方案中,使第一固体支持物与多于一种分泌因子结合试剂接触包括使第二多于一个第一固体支持物与多于一种分泌因子结合试剂接触。
在一些实施方案中,方法包括在使第二多于一个第一固体支持物与多于一种分泌因子结合试剂接触之后,去除多于一种分泌因子结合试剂中未与第二多于一个第一固体支持物接触的一种或更多种分泌因子结合试剂,以产生第三多于一个第一固体支持物。在一些实施方案中,去除未与第二多于一个第一固体支持物接触的一种或更多种分泌因子结合试剂包括:去除未与分泌因子中被捕获探针结合的相应至少一种接触的一种或更多种分泌因子结合试剂。
在一些实施方案中,使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交包括:将第三多于一个第一固体支持物分区到多于一个第二分区,多于一个第二分区中的第二分区包含来自第三多于一个第一固体支持物的单个第一固体支持物;以及在包含单个第一固体支持物的第二分区中,使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸接触以进行杂交。
本文的公开内容包括测量由单细胞分泌的分泌因子的拷贝数和单细胞中核酸靶的拷贝数的方法。方法可以包括:使一个或更多个单细胞与第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞,所述一个或更多个单细胞包含表面细胞靶和核酸靶的拷贝,所述一个或更多个单细胞能够分泌多于一种分泌因子,每一个第二固体支持物包含多于一种捕获探针和多于一种锚定探针,多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合。方法可以包括:使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触,所述多于一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。方法可以包括:使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交,所述寡核苷酸条形码各自包含第一分子标记。方法可以包括:使与核酸靶的拷贝杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,所述多于一个条形码化核酸分子各自包含与核酸靶的至少一部分互补的序列和第一分子标记。方法可以包括:使与分泌因子结合试剂特异性寡核苷酸杂交的多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与独特因子标识符序列的至少一部分互补的序列和第一分子标记。方法可以包括:获得多于一个条形码化核酸分子或其产物的序列信息,以确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。方法可以包括:获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,一个或更多个单细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
在一些实施方案中,使一个或更多个单细胞与第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞包括:将一个或更多个单细胞和多于一个第二固体支持物分区到多于一个第一分区,多于一个第一分区中的第一分区包含一个或更多个单细胞中的单细胞和多于一个第二固体支持物中的单个第二固体支持物,单细胞能够通过与表面细胞靶结合的锚定探针与第二固体支持物进行关联。
在一些实施方案中,方法包括,在使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触之前:汇集来自多于一个第一分区中的每一个第一分区的与第二固体支持物关联的单细胞,以产生与第二固体支持物关联的第一多于一个单细胞。在一些实施方案中,使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触包括使与第二固体支持物关联的第一多于一个单细胞与多于一种分泌因子结合试剂接触。
在一些实施方案中,方法包括在使与第二固体支持物关联的第一多于一个单细胞与多于一种分泌因子结合试剂接触之后,去除多于一种分泌因子结合试剂中未和与第二固体支持物关联的第一多于一个单细胞接触的一种或更多种分泌因子结合试剂,以产生与第二固体支持物关联的第二多于一个单细胞。在一些实施方案中,去除未和与第二固体支持物关联的第一多于一个单细胞接触的一种或更多种分泌因子结合试剂包括:去除未与分泌因子中被捕获探针结合的相应至少一种接触的一种或更多种分泌因子结合试剂。
方法可以包括:在使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交之前:将与第二固体支持物关联的第二多于一个单细胞分区到多于一个第二分区,多于一个第二分区中的第二分区包含来自与第二固体支持物关联的第二多于一个单细胞的单细胞和单个第二固体支持物;在包含单细胞和单个第二固体支持物的第二分区中,使多于一种寡核苷酸条形码与分泌因子结合试剂特异性寡核苷酸和核酸靶的拷贝接触以进行杂交。方法可以包括裂解第二分区中的单细胞。裂解单细胞可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。
图7A-图7D示出了用于同时测量分泌因子和核酸靶的拷贝数的非限制性示例性工作流程的示意图。条形码(例如,随机条形码、寡核苷酸条形码702)可以包含靶结合区(例如,多(dT)710),所述靶结合区可以经由多(dA)尾718结合到核酸靶(例如,多腺苷酸化RNA转录物714或其他核酸靶,诸如例如,分泌因子结合试剂特异性寡核苷酸720,无论是与抗体关联还是已与抗体解离的),或其他核酸靶,用于标记或条形码化(例如,独特标记)。靶结合区可以包含基因特异性序列、寡(dT)序列、随机多聚体或其任何组合。寡核苷酸条形码702还可以包含多个标记。寡核苷酸条形码702可以包含用于分别标记转录物和/或追踪RNA转录物(或核酸靶,诸如例如,抗体寡核苷酸,无论与抗体关联或已与抗体解离)的样品来源的第一分子标记(ML)708和样品标记(例如,分区标记、细胞标记(CL)706),以及用于后续反应的每个条形码702的第一分子标记708/细胞标记706区域侧翼的一个或更多个另外的序列,诸如例如,第一通用序列704(例如,读段1序列)。每个样品的寡核苷酸条形码中分子标记的序列的组库可以足够大以对RNA转录物进行随机标记。样品标记可以是例如分区标记和/或细胞标记。在一些实施方案中,条形码与固体支持物(例如,颗粒712)关联。多于一个条形码702可以与颗粒712关联。在一些实施方案中,颗粒是珠。珠可以是用条形码或随机条形码官能化的聚合珠,例如可变形的珠或凝胶珠(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(TEMED))后,可以产生凝胶珠。多腺苷酸化RNA转录物714可以包含RNA序列716r和多(dA)尾718。分泌因子结合试剂特异性寡核苷酸720可以包含第二通用序列722、分子标记(例如,第二分子标记724)、独特因子标识符序列726、与靶结合区互补的序列(例如,多(A)尾728),或其互补物。在一些实施方案中,分泌因子结合试剂特异性寡核苷酸720与分泌因子结合试剂(例如,抗体730)关联。
工作流程可以包括使分泌因子结合试剂特异性寡核苷酸720和寡核苷酸条形码702杂交700a。工作流程可以包括使多腺苷酸化RNA转录物714和寡核苷酸条形码702杂交700a。工作流程可以包括使与分泌因子结合试剂特异性寡核苷酸720杂交的寡核苷酸条形码702延伸700b,以产生条形码化分泌因子结合试剂特异性寡核苷酸734,所述条形码化分泌因子结合试剂特异性寡核苷酸734包含独特因子标识符序列的互补物726rc、第二分子标记的互补物724rc和第二通用序列的互补物722rc。在一些实施方案中,延伸反应700b可以包括使与多腺苷酸化RNA转录物714杂交的寡核苷酸条形码702延伸,以产生条形码化核酸分子736,所述条形码化核酸分子736包含cDNA 716c(RNA序列716r的反向互补序列)。工作流程可以包括变性700c(例如,使用加热和/或化学品)。工作流程可以包括如本文描述的条形码化分泌因子结合试剂特异性寡核苷酸的下游700d引物延伸、扩增和/或测序。工作流程可以包括如本文描述的条形码化cDNA的下游700e引物延伸、扩增和/或测序。
条形码化分泌因子结合试剂特异性寡核苷酸734可以用作用于一个或更多个延伸反应(例如,随机引发和延伸)和/或扩增反应(例如,PCR)的模板。例如,条形码化分泌因子结合试剂特异性寡核苷酸734可以经历采用可以分别与第一通用序列和第二通用序列(或其互补物)退火的扩增引物738和740的第一轮扩增(“PCR1”)700f。PCR1 700f可以产生第一扩增的条形码化分泌因子结合试剂特异性寡核苷酸742。PCR1 700f可以包括1-30个循环(例如,15个循环)。第一扩增的条形码化分泌因子结合试剂特异性寡核苷酸742可以经历采用可以分别与第一通用序列和第二通用序列(或其互补物)退火的扩增引物744和746的第二轮扩增(“PCR2”)700g。PCR2700g可以产生第二扩增的条形码化分泌因子结合试剂特异性寡核苷酸748。PCR2 700g可以经由引物746中的突出端添加测序衔接子750。PCR2 700g可以包括1-30个循环(例如,15个循环)。工作流程可以包括文库扩增(“索引PCR”)700h。索引PCR700h可以包括用测序文库扩增引物752和754对第二扩增的条形码化分泌因子结合试剂特异性寡核苷酸748进行文库扩增。测序文库扩增引物752和754可以与第一通用序列和第二通用序列(或其互补物)和/或测序衔接子750退火。文库PCR 700h可以经由测序文库扩增引物752和754中的突出端添加测序衔接子(例如,P5 758和P7 764)和样品索引760和/或762(例如i5、i7)。文库PCR扩增子756可以被测序并经历本公开内容的下游方法。使用150bp×2测序的测序700i可以揭示读段1上的细胞标记、第一分子标记和/或独特因子标识符序列(或独特因子标识符序列的部分序列)、读段2上的独特因子标识符序列(或独特因子标识符序列的部分序列)和/或第二分子标记,以及索引1读段和/或索引2读段上的样品索引。
在一些实施方案中,条形码化分泌因子结合试剂特异性寡核苷酸734可以经历采用可以分别与第一通用序列和第二通用序列(或其互补物)退火的扩增引物758和760的第一轮扩增(“PCR1”)700j。PCR1 700j可以产生第一扩增的条形码化分泌因子结合试剂特异性寡核苷酸762。PCR1 700j可以包括1-30个循环(例如,15个循环)。PCR1 700j可以经由引物760中的突出端添加测序衔接子750。工作流程可以包括文库扩增(“索引PCR”)700k。索引PCR 700k可以包括用测序文库扩增引物764和766对第一扩增的条形码化分泌因子结合试剂特异性寡核苷酸762进行文库扩增。测序文库扩增引物764和766可以与第一通用序列和第二通用序列(或其互补物)和/或测序衔接子750退火。文库PCR 700k可以经由测序文库扩增引物764和766中的突出端添加测序衔接子(例如,P5 758和P7 764)和样品索引760和/或762(例如i5、i7)。文库PCR扩增子768可以被测序并经历本公开内容的下游方法。使用150bp×2测序的测序700l可以揭示读段1上的细胞标记、第一分子标记和/或独特因子标识符序列(或独特因子标识符序列的部分序列)、读段2上的独特因子标识符序列(或独特因子标识符序列的部分序列)和/或第二分子标记,以及索引1读段和/或索引2读段上的样品索引。
在一些实施方案中,多于一种寡核苷酸条形码与第三固体支持物关联。多于一个第二分区中的第二分区可以包含单个第三固体支持物。第一分区和/或第二分区可以是孔或液滴。每一种寡核苷酸条形码可以包含第一通用序列。寡核苷酸条形码可以包含含有捕获序列的靶结合区。靶结合区可以包含多(dT)区。分泌因子结合试剂特异性寡核苷酸可以包含与捕获序列互补的序列,所述捕获序列被配置为捕获分泌因子结合试剂特异性寡核苷酸。与捕获序列互补的序列可以包含多(dA)区。在一些实施方案中,多于一个条形码化分泌因子结合试剂特异性寡核苷酸包含第一通用序列的互补物。分泌因子结合试剂特异性寡核苷酸可以包含第二通用序列。
在一些实施方案中,获得多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息包括:使用能够与第一通用序列或其互补物杂交的引物和能够与第二通用序列或其互补物杂交的引物扩增多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物,以产生多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸;以及获得多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸或其产物的测序数据。
分泌因子结合试剂特异性寡核苷酸可以包含第二分子标记。在一些实施方案中,多于一个分泌因子结合试剂特异性寡核苷酸中的至少10个包含不同的第二分子标记序列。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是相同的。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是不同的。在一些实施方案中,测序数据中与用于分泌因子结合试剂的独特因子标识符序列关联的独特第一分子标记序列的数目指示由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数,所述分泌因子结合试剂能够与至少一种分泌因子特异性结合。在一些实施方案中,测序数据中与用于分泌因子结合试剂的独特因子标识符序列关联的独特第二分子标记序列的数目指示由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数,所述分泌因子结合试剂能够与至少一种分泌因子特异性结合。在一些实施方案中,方法包括基于与多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物关联的具有不同序列的第一分子标记和/或第二分子标记的数目来确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,方法包括基于与多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸或其产物关联的具有不同序列的第一分子标记和/或第二分子标记的数目来确定由一个或更多个单细胞中的每一个分泌的至少一种分泌因子的拷贝数。在一些实施方案中,获得序列信息包括将测序衔接子附接到多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物。分泌因子结合试剂特异性寡核苷酸可以被配置为可从分泌因子结合试剂脱离。方法可以包括使分泌因子结合试剂特异性寡核苷酸从分泌因子结合试剂解离。
确定一个或更多个单细胞中的每一个中核酸靶的拷贝数可以包括基于与多于一个条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、其互补物或其组合的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。方法可以包括:使随机引物与多于一个条形码化核酸分子接触,所述随机引物中的每一种包含第三通用序列或其互补物;以及使与多于一个条形码化核酸分子杂交的随机引物延伸以产生多于一个延伸产物。方法可以包括使用能够与第一通用序列或其互补物杂交的引物和能够与第三通用序列或其互补物杂交的引物扩增多于一个延伸产物,从而产生第一多于一个条形码化扩增子。扩增多于一个延伸产物可以包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到多于一个延伸产物。方法可以包括基于与第一多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。确定一个或更多个单细胞中的每一个中核酸靶的拷贝数可以包括基于与第一多于一个条形码化扩增子中的条形码化扩增子关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中多于一个核酸靶中的每一个的数目,所述第一多于一个条形码化扩增子包含多于一个核酸靶中的每一个的序列。多于一个核酸靶中的每一个的序列可以包括多于一个核酸靶中的每一个的子序列。第一多于一个条形码化扩增子中的核酸靶的序列可以包括核酸靶的子序列。
方法可以包括使用能够与第一通用序列或其互补物杂交的引物和能够与第三通用序列或其互补物杂交的引物扩增第一多于一个条形码化扩增子,从而产生第二多于一个条形码化扩增子。扩增第一多于一个条形码化扩增子可以包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到第一多于一个条形码化扩增子。方法可以包括基于与第二多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。在一些实施方案中,第一多于一个条形码化扩增子和/或第二多于一个条形码化扩增子包括全转录组扩增(WTA)产物。
方法可以包括使用多于一个条形码化核酸分子作为模板合成第三多于一个条形码化扩增子以产生第三多于一个条形码化扩增子。合成第三多于一个条形码化扩增子可以包括对多于一个条形码化核酸分子进行聚合酶链式反应(PCR)扩增。合成第三多于一个条形码化扩增子可以包括使用能够与第一通用序列或其互补物杂交的引物以及靶特异性引物进行的PCR扩增。方法可以包括获得第三多于一个条形码化扩增子或其产物的序列信息。获得序列信息可以包括将测序衔接子附接到第三多于一个条形码化扩增子或其产物。方法可以包括基于与第三多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定一个或更多个单细胞中的每一个中核酸靶的拷贝数。
核酸靶可以包括核酸分子。核酸分子可以包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸、细胞组分结合试剂特异性寡核苷酸或其任何组合。在一些实施方案中,使多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶使多于一种寡核苷酸条形码延伸。DNA聚合酶可以包括Klenow片段。逆转录酶可以包括病毒逆转录酶(例如,鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶)。在一些实施方案中,第一通用序列、第二通用序列和/或第三通用序列是相同的。在一些实施方案中,第一通用序列、第二通用序列和/或第三通用序列是不同的。在一些实施方案中,第一通用序列、第二通用序列和/或第三通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分。在一些实施方案中,测序衔接子包括P5序列、P7序列、其互补序列和/或其部分。在一些实施方案中,测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。在一些实施方案中,多于一种寡核苷酸条形码中的至少10种包含不同的第一分子标记序列。在一些实施方案中,多于一种寡核苷酸条形码各自包含细胞标记。多于一种寡核苷酸条形码的每一种细胞标记可以包含至少6个核苷酸。在一些实施方案中,与同一第三固体支持物关联的寡核苷酸条形码包含相同的细胞标记。在一些实施方案中,与不同第三固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
组合物和试剂盒
本文的公开内容包括组合物(例如,试剂盒)。组合物可以包含:第一固体支持物,其包含能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针;以及多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被探针结合的分泌因子特异性结合,所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。
本文的公开内容包括组合物(例如,试剂盒)。组合物可以包含:第二固体支持物,其包含多于一种捕获探针和多于一种锚定探针,多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合;以及多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于分泌因子结合试剂的独特因子标识符序列。
分泌因子结合试剂特异性寡核苷酸可以包含第二分子标记序列。第二分子标记序列的长度可以是2-20个核苷酸。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是相同的。在一些实施方案中,至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是不同的。
分泌因子结合试剂特异性寡核苷酸可以包含第二通用序列。第二通用序列可以包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分。测序衔接子可以包括P5序列、P7序列、其互补序列和/或其部分。测序引物可以包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
细胞组分结合试剂特异性寡核苷酸可以包含多(dA)区。分泌因子结合试剂特异性寡核苷酸可以包含与多(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含多(dT)序列、多(dG)序列、多(dC)序列、多(dU)序列或其组合。对齐序列可以在多(dA)区的5’。
分泌因子结合试剂特异性寡核苷酸可以通过接头与分泌因子结合试剂关联。接头可以包含碳链。碳链可以包含2-30个碳原子。碳链可以包含12个碳原子。接头可以包括5’氨基修饰物C12(5AmMC12)或其衍生物。分泌因子结合试剂特异性寡核苷酸可以被附接到分泌因子结合试剂。分泌因子结合试剂特异性寡核苷酸可以被共价附接到分泌因子结合试剂。分泌因子结合试剂特异性寡核苷酸可以被非共价附接到分泌因子结合试剂。分泌因子结合试剂特异性寡核苷酸可以与分泌因子结合试剂缀合。分泌因子结合试剂特异性寡核苷酸可以通过选自由以下组成的组的化学基团与分泌因子结合试剂缀合:UV光可裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。
组合物可以包含缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶(例如,Klenow片段)。组合物可以包含逆转录酶,诸如病毒逆转录酶(例如,鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶)。组合物可以包含缓冲液、筒或两者。组合物可以包含多于一种寡核苷酸条形码。多于一种寡核苷酸条形码与第三固体支持物关联。组合物可以包含第三固体支持物。
术语
在至少一些先前描述的实施方案中,一种实施方案中使用的一个或更多个要素可以互换地用于另一种实施方案中,除非这种替换在技术上不可行。本领域技术人员将理解,在不脱离所要求保护的主题的范围的情况下,可以对上述方法和结构进行各种其他的省略、添加和修改。所有此类修改和改变都旨在落在由所附权利要求书限定的主题的范围内。
本领域的技术人员将理解,对于本文公开的这个和其他过程和方法,在该过程和方法中执行的功能可以以不同的顺序实现。此外,所概述的步骤和操作仅作为示例提供,并且该步骤和操作中的一些可以是任选的,组合成较少的步骤和操作,或者扩展成另外的步骤和操作,而不偏离所公开的实施方案的本质。
关于本文中基本上任何复数和/或单数术语的使用,在对于上下文和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。如本说明书和所附权利要求书中使用的,单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指代物,除非上下文另外明确指示。除非另外说明,否则在本文中对“或”的任何提及旨在涵盖“和/或”。
本领域技术人员将理解,一般来说,本文使用的术语,并且尤其是所附权利要求(例如,所附权利要求的主体)中的术语,通常意在作为“开放式”术语(例如,术语“包括(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括(includes)”应解释为“包括但不限于(includes but is not limited to)”,等等)。本领域技术人员将进一步理解,如果意图所介绍的权利要求陈述的特定数字,则这样的意图将明确地陈述于权利要求中,并且在这种陈述不存在的情况下,不存在这种意图。例如,作为对理解的帮助,以下所附权利要求书可以包含介绍性措辞“至少一种”和“一种或更多种”的使用,以介绍权利要求陈述。然而,此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含此类介绍的权利要求陈述的具体权利要求限制为包含仅一种此类陈述的实施方案,甚至当同一权利要求包括介绍性措辞“一种或更多种”或“至少一种”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如,“一(a)”和/或“一(an)”应解释为意指“至少一种”或“一种或更多种”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数字,本领域技术人员将认识到,此类陈述应解释为意指至少所陈述的数字(例如,仅陈述“两种陈述”而没有其他修饰词意指至少两种陈述或两种或更多种陈述)。此外,在使用类似于“A、B和C等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有A、B和C中的至少一种的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。在使用类似于“A、B或C等中的至少一种”的惯例的那些情况下,通常这种句法结构意在为本领域技术人员将理解该惯例的意义(例如,“具有A、B或C中的至少一种的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。
此外,当本公开内容的特征或方面以马库什组(Markush group)描述时,本领域技术人员将意识到,本公开内容还由此以马库什组的任何个体成员或成员子组描述。
如本领域技术人员将理解的,为了任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还包括该范围的任何和所有可能的子范围和子范围的组合。任何列出的范围都可以很容易地被识别为充分描述并使相同的范围能被分解为至少相等的一半、三分之一、四分之一、五分之一、十分之一等。作为非限制性实例,本文讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言,诸如“多达”、“至少”、“大于”、“小于”等包括所陈述的数字,并且指可以随后分解为如上文讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个个体的成员。因此,例如,具有1-3个物品的组是指具有1个、2个或3个物品的组。类似地,具有1-5个物品的组是指具有1个、2个、3个、4个或5个物品的组,等等。
从前述内容,应当理解,本文出于说明的目的已经描述了本公开内容的各种实施方案,并且可以在不脱离本公开内容的范围和精神的情况下进行各种修改。因此,本文公开的各种实施方案并不旨在进行限制,真正的范围和精神由以下权利要求来指示。

Claims (99)

1.一种用于测量由单细胞分泌的分泌因子的拷贝数的方法,所述方法包括:
使一个或更多个单细胞与第一多于一个第一固体支持物接触,其中所述一个或更多个单细胞能够分泌多于一种分泌因子,其中每一个第一固体支持物包含能够与由单细胞分泌的所述多于一种分泌因子中的至少一种特异性结合的多于一种捕获探针;
使所述第一固体支持物与多于一种分泌因子结合试剂接触,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,其中所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于所述分泌因子结合试剂的独特因子标识符序列;
使多于一种寡核苷酸条形码与所述分泌因子结合试剂特异性寡核苷酸接触以进行杂交,其中所述寡核苷酸条形码各自包含第一分子标记;
使与所述分泌因子结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与所述独特因子标识符序列的至少一部分互补的序列和所述第一分子标记;以及
获得所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由所述一个或更多个单细胞中的每一个分泌的所述至少一种分泌因子的拷贝数。
2.根据权利要求1所述的方法,其中使一个或更多个单细胞与第一多于一个第一固体支持物接触包括将所述一个或更多个单细胞和所述第一多于一个第一固体支持物分区到多于一个第一分区,其中所述多于一个第一分区中的第一分区包含所述一个或更多个单细胞中的单细胞和所述第一多于一个第一固体支持物中的单个第一固体支持物。
3.根据权利要求2所述的方法,所述方法包括在使所述第一固体支持物与多于一种分泌因子结合试剂接触之前:
汇集来自所述多于一个第一分区中的每一个第一分区的所述单个第一固体支持物以产生第二多于一个第一固体支持物。
4.根据权利要求3所述的方法,其中使所述第一固体支持物与多于一种分泌因子结合试剂接触包括使所述第二多于一个第一固体支持物与所述多于一种分泌因子结合试剂接触。
5.根据权利要求4所述的方法,所述方法包括在使所述第二多于一个第一固体支持物与所述多于一种分泌因子结合试剂接触之后,去除所述多于一种分泌因子结合试剂中未与所述第二多于一个第一固体支持物接触的一种或更多种分泌因子结合试剂以产生第三多于一个第一固体支持物。
6.根据权利要求5所述的方法,其中去除未与所述第二多于一个第一固体支持物接触的所述一种或更多种分泌因子结合试剂包括:去除未与所述分泌因子中被捕获探针结合的相应至少一种分泌因子接触的所述一种或更多种分泌因子结合试剂。
7.根据权利要求1-6中任一项所述的方法,其中使多于一种寡核苷酸条形码与所述分泌因子结合试剂特异性寡核苷酸接触以进行杂交包括:
将所述第三多于一个第一固体支持物分区到多于一个第二分区,其中所述多于一个第二分区中的第二分区包含来自所述第三多于一个第一固体支持物的单个第一固体支持物;以及
在包含所述单个第一固体支持物的所述第二分区中,使多于一种寡核苷酸条形码与所述分泌因子结合试剂特异性寡核苷酸接触以进行杂交。
8.一种用于测量由单细胞分泌的分泌因子的拷贝数和单细胞中核酸靶的拷贝数的方法,所述方法包括:
使一个或更多个单细胞与第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞,其中所述一个或更多个单细胞包含表面细胞靶和核酸靶的拷贝,其中所述一个或更多个单细胞能够分泌多于一种分泌因子,其中每一个第二固体支持物包含多于一种捕获探针和多于一种锚定探针,其中所述多于一种锚定探针中的每一种能够与所述表面细胞靶特异性结合,并且其中所述捕获探针能够与由单细胞分泌的所述多于一种分泌因子中的至少一种特异性结合;
使与第二固体支持物关联的一个或更多个单细胞与多于一种分泌因子结合试剂接触,所述多于一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,其中所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于所述分泌因子结合试剂的独特因子标识符序列;
使多于一种寡核苷酸条形码与所述分泌因子结合试剂特异性寡核苷酸和所述核酸靶的拷贝接触以进行杂交,其中所述寡核苷酸条形码各自包含第一分子标记;
使与所述核酸靶的拷贝杂交的所述多于一种寡核苷酸条形码延伸以产生多于一个条形码化核酸分子,所述多于一个条形码化核酸分子各自包含与所述核酸靶的至少一部分互补的序列和所述第一分子标记;
使与所述分泌因子结合试剂特异性寡核苷酸杂交的所述多于一种寡核苷酸条形码延伸以产生多于一个条形码化分泌因子结合试剂特异性寡核苷酸,所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸各自包含与所述独特因子标识符序列的至少一部分互补的序列和所述第一分子标记;
获得所述多于一个条形码化核酸分子或其产物的序列信息,以确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数;以及
获得所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息,以确定由所述一个或更多个单细胞中的每一个分泌的所述至少一种分泌因子的拷贝数。
9.根据权利要求8所述的方法,其中使一个或更多个单细胞与所述第一多于一个第二固体支持物接触以形成与第二固体支持物关联的一个或更多个单细胞包括:
将所述一个或更多个单细胞和所述多于一个第二固体支持物分区到多于一个第一分区,其中所述多于一个第一分区中的第一分区包含所述一个或更多个单细胞中的单细胞和所述多于一个第二固体支持物中的单个第二固体支持物,其中所述单细胞能够通过与所述表面细胞靶结合的锚定探针与第二固体支持物进行关联。
10.根据权利要求9所述的方法,所述方法包括在使与第二固体支持物关联的所述一个或更多个单细胞与多于一种分泌因子结合试剂接触之前:汇集来自所述多于一个第一分区中的每一个第一分区的与第二固体支持物关联的单细胞,以产生与第二固体支持物关联的第一多于一个单细胞。
11.根据权利要求10所述的方法,其中使与第二固体支持物关联的所述一个或更多个单细胞与多于一种分泌因子结合试剂接触包括使与第二固体支持物关联的所述第一多于一个单细胞与所述多于一种分泌因子结合试剂接触。
12.根据权利要求11所述的方法,所述方法包括在使与第二固体支持物关联的所述第一多于一个单细胞与所述多于一种分泌因子结合试剂接触之后,去除所述多于一种分泌因子结合试剂中未和与第二固体支持物关联的所述第一多于一个单细胞接触的一种或更多种分泌因子结合试剂以产生与第二固体支持物关联的第二多于一个单细胞,任选地去除未和与第二固体支持物关联的所述第一多于一个单细胞接触的所述一种或更多种分泌因子结合试剂包括:去除未与所述分泌因子中被捕获探针结合的相应至少一种分泌因子接触的所述一种或更多种分泌因子结合试剂。
13.根据权利要求8-12中任一项所述的方法,所述方法包括在使多于一种寡核苷酸条形码与所述分泌因子结合试剂特异性寡核苷酸和所述核酸靶的拷贝接触以进行杂交之前:
将与第二固体支持物关联的所述第二多于一个单细胞分区到多于一个第二分区,其中所述多于一个第二分区中的第二分区包含来自与第二固体支持物关联的所述第二多于一个单细胞的单细胞和单个第二固体支持物;
在包含所述单细胞和所述单个第二固体支持物的所述第二分区中,使多于一种寡核苷酸条形码与所述分泌因子结合试剂特异性寡核苷酸和所述核酸靶的拷贝接触以进行杂交。
14.根据权利要求13所述的方法,所述方法包括裂解所述第二分区中的所述单细胞,并且任选地裂解所述单细胞包括加热所述样品、使所述样品与去污剂接触、改变所述样品的pH或其任何组合。
15.根据权利要求1-14中任一项所述的方法,其中所述一个或更多个单细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
16.根据权利要求1-15中任一项所述的方法,其中所述至少一种分泌因子包括:(i)淋巴因子、白细胞介素、趋化因子或其任何组合;(ii)细胞因子、激素、分子毒素或其任何组合;和/或(iii)神经生长因子、肝生长因子、成纤维细胞生长因子、血管内皮生长因子、血小板源生长因子、转化生长因子、骨诱导因子、干扰素、集落刺激因子或其任何组合,任选地所述至少一种分泌因子包括血管生成素、血管生成蛋白-1、血管生成蛋白-2、bNGF、组织蛋白酶S、半乳凝素-7、GCP-2、G-CSF、GM-CSF、PAI-1、PDGF-AA、PDGF-BB、PDGF-AB、PlGF、PlGF-2、SDF-1、Tie2、VEGF-A、VEGF-C、VEGF-D、VEGF-R1、VEGF-R2、VEGF-R3、6Ckine、血管生成蛋白-1、血管生成蛋白-2、BLC、BRAK、CD186、ENA-78、嗜酸性粒细胞趋化因子-1、嗜酸性粒细胞趋化因子-2、嗜酸性粒细胞趋化因子-3、EpCAM、GDF-15、GM-CSF、GRO、HCC-4、I-309、IFN-γ、IL-1α、IL-1β、IL-1R4(ST2)、IL-2、IL-2R、IL-3、IL-3Rα、IL-5、IL-6、IL-6R、IL-7、IL-8、IL-8RB、IL-11、IL-12、IL-12p40、IL-12p70、IL-13、IL-13R1、IL-13R2、IL-15、IL-15Rα、IL-16、IL-17、IL-17C、IL-17E、IL-17F、IL-17R、IL-18、IL-18BPa、IL-18Rα、IL-20、IL-23、IL-27、IL-28、IL-31、IL-33、IP-10、I-TAC、LIF、LIX、LRP6、MadCAM-1、MCP-1、MCP-2、MCP-3、MCP-4、M-CSF、MIF、MIG、MIP-1γ、MIP-1α、MIP-1β、MIP-1δ、MIP-3α、MIP-3β、MPIF-1、PARC、PF4、RANTES、抵抗素、SCF、SCYB16、TACI、TARC、TSLP、TNF-α、TNF-R1、TRAIL-R4、TREM-1、激活蛋白A、双调蛋白、Axl、BDNF、BMP4、组织蛋白酶S、EGF、FGF-1、FGF-2、FGF-7、FGF-21、卵泡抑制素、半乳凝素-7、Gas6、GDF-15、HB-EGF、HGF、IGFBP-1、IGFBP-3、LAP、NGF R、NrCAM、NT-3、NT-4、PAI-1、TGF-α、TGF-β、TGF-β3、TRAIL-R4、ADAMTS1、组织蛋白酶S、FGF-2、卵泡抑制素、半乳凝素-7、GCP-2、GDF-15、IGFBP-6、LIF、MMP-9、pro-MMP9、RANK、RANKL、RANTES、SDF-1、CXCR4或其任何组合。
17.根据权利要求1-16中任一项所述的方法,其中所述分泌因子结合试剂和所述捕获探针能够与同一分泌因子的不同表位结合。
18.根据权利要求1-17中任一项所述的方法,其中所述分泌因子结合试剂、所述捕获探针和所述锚定探针中的一种或更多种包括抗体或其片段,任选地所述抗体或其片段包括单克隆抗体,还任选地所述抗体或其片段包括Fab、Fab’、F(ab’)2、Fv、scFv、dsFv、双特异抗体、三特异抗体、四特异抗体、由抗体片段形成的多特异性抗体、单结构域抗体(sdAb)、包含互补的scFv(串联scFv)或双特异性串联scFv的单链、Fv构建体、二硫键连接的Fv、双可变结构域免疫球蛋白(DVD-Ig)结合蛋白或纳米抗体、适配体、亲和体、affilin、affitin、affimer、alphabody、anticalin、avimer、DARPin、Fynomer、Kunitz结构域肽、单特异抗体或其任何组合。
19.根据权利要求1-18中任一项所述的方法,其中所述捕获探针和/或所述锚定探针通过以下与所述第一固体支持物和/或所述第二固体支持物缀合:1,3-偶极环加成反应、杂Diels-Alder反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合。
20.根据权利要求1-19中任一项所述的方法,其中所述表面细胞靶包括糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。
21.根据权利要求1-20中任一项所述的方法,其中所述表面细胞靶包括CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3、CD3d、CD3e、CD3g、CD4、CD5、CD6、CD7、CD8a、CD8b、CD9、CD10、CD11a、CD11b、CD11c、CD11d、CDwl2、CD13、CD14、CD15、CD15u、CD15s、CD15su、CD16、CD16b、CD17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD45、CD45RA、CD45RB、CD45RC、CD45RO、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CD60a、CD60b、CD60c、CD61、CD62E、CD62L、CD62P、CD63、CD64、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CD75、CD75s、CD77、CD79a、CD79b、CD80、CD81、CD82、CD83、CD84、CD85a、CD85d、CD85j、CD85k、CD86、CD87、CD88、CD89、CD90、CD91、CD92、CD93、CD94、CD95、CD96、CD97、CD98、CD99、CD99R、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107a、CD107b、CD108、CD109、CD110、CD111、CD112、CD113、CD114、CD115、CD116、CD117、CD118、CD119、CD120a、CD120b、CD121a、CD121b、CD122、CD123、CD124、CD125、CD126、CD127、CD129、CD130、CD131、CD132、CD133、CD134、CD135、CD136、CD137、CD138、CD139、CD140a、CD140b、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CDw149、CD150、CD151、CD152、CD153、CD154、CD155、CD156a、CD156b、CD156c、CD157、CD158e、CD158i、CD158k、CD159a、CD159c、CD160、CD161、CD162、CD163、CD164、CD165、CD166、CD167a、CD167b、CD168、CD169、CD170、CD171、CD172a、CD172b、CD172g、CD173、CD174、CD175、CD175s、CD176、CD177、CD178、CD179a、CD179b、CD180、CD181、CD182、CD183、CD184、CD185、CD186、CD191、CD192、CD193、CD194、CD195、CD196、CD197、CDw198、CD199、CD200、CD201、CD202b、CD203c、CD204、CD205、CD206、CD207、CD208、CD209、CD210、CDw210b、CD212、CD213a1、CD213a2、CD215、CD217a、CD218a、CD218b、CD220、CD221、CD222、CD223、CD224、CD225、CD226、CD227、CD228、CD229、CD230、CD231、CD232、CD233、CD234、CD235a、CD235b、CD236、CD236R、CD238、CD239、CD240CE、CD240DCE、CD240D、CD241、CD242、CD243、CD244、CD245、CD246、CD247、CD248、CD249、CD252、CD253、CD254、CD256、CD266、CD267、CD268、CD269、CD270、CD271、CD272、CD273、CD274、CD275、CD276、CD277、CD278、CD279、CD280、CD281、CD282、CD283、CD284、CD286、CD289、CD290、CD292、CDw293、CD294、CD295、CD296、CD297、CD298、CD299、CD300a、CD300c、CD300e、CD301、CD302、CD303、CD304、CD305、CD306、CD307a、CD307b、CD307c、CD307d、CD307e、CD308、CD309、CD312、CD314、CD315、CD316、CD317、CD318、CD319、CD320、CD321、CD322、CD324、CD325、CD326、CD327、CD328、CD329、CD331、CD332、CD333、CD334、CD335、CD336、CD337、CD338、CD339、CD340、CD344、CD349、CD350、CD351、CD352、CD353、CD354、CD355、CD357、CD358、CD360、CD361、CD362、CD363、CD364、CD365、CD366、CD367、CD368、CD369、CD370、CD371、BCMA、HLA蛋白、β2-微球蛋白或其任何组合。
22.根据权利要求1-21中任一项所述的方法,其中所述多于一种寡核苷酸条形码与第三固体支持物关联,并且其中所述多于一个第二分区中的第二分区包含单个第三固体支持物。
23.根据权利要求1-22中任一项所述的方法,其中所述第一分区和/或第二分区是孔或液滴。
24.根据权利要求1-23中任一项所述的方法,其中每一种寡核苷酸条形码包含第一通用序列。
25.根据权利要求1-24中任一项所述的方法,其中所述寡核苷酸条形码包含靶结合区,所述靶结合区包含捕获序列,任选地所述靶结合区包含多(dT)区。
26.根据权利要求25所述的方法,其中所述分泌因子结合试剂特异性寡核苷酸包含与所述捕获序列互补的序列,所述捕获序列被配置为捕获所述分泌因子结合试剂特异性寡核苷酸,任选地与所述捕获序列互补的序列包含多(dA)区。
27.根据权利要求1-26中任一项所述的方法,其中所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸包含所述第一通用序列的互补物。
28.根据权利要求1-27中任一项所述的方法,其中所述分泌因子结合试剂特异性寡核苷酸包含第二通用序列。
29.根据权利要求1-28中任一项所述的方法,其中获得所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物的序列信息包括:
使用能够与所述第一通用序列或其互补物杂交的引物和能够与所述第二通用序列或其互补物杂交的引物扩增所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物,以产生多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸;以及
获得所述多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸或其产物的测序数据。
30.根据权利要求1-29中任一项所述的方法,其中所述分泌因子结合试剂特异性寡核苷酸包含第二分子标记。
31.根据权利要求1-30中任一项所述的方法,其中所述多于一个分泌因子结合试剂特异性寡核苷酸中的至少10个包含不同的第二分子标记序列,任选地:(i)至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中所述至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是相同的;或者(ii)至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中所述至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是不同的。
32.根据权利要求1-31中任一项所述的方法,其中所述测序数据中与用于所述分泌因子结合试剂的独特因子标识符序列关联的独特第一分子标记序列的数目指示由所述一个或更多个单细胞中的每一个分泌的所述至少一种分泌因子的拷贝数,所述分泌因子结合试剂能够与所述至少一种分泌因子特异性结合。
33.根据权利要求30-32中任一项所述的方法,其中所述测序数据中与用于所述分泌因子结合试剂的独特因子标识符序列关联的独特第二分子标记序列的数目指示由所述一个或更多个单细胞中的每一个分泌的所述至少一种分泌因子的拷贝数,所述分泌因子结合试剂能够与所述至少一种分泌因子特异性结合。
34.根据权利要求1-33中任一项所述的方法,所述方法包括基于与所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物关联的具有不同序列的第一分子标记和/或第二分子标记的数目来确定由所述一个或更多个单细胞中的每一个分泌的所述至少一种分泌因子的拷贝数。
35.根据权利要求29-34中任一项所述的方法,所述方法包括基于与所述多于一个扩增的条形码化分泌因子结合试剂特异性寡核苷酸或其产物关联的具有不同序列的第一分子标记和/或第二分子标记的数目来确定由所述一个或更多个单细胞中的每一个分泌的所述至少一种分泌因子的拷贝数。
36.根据权利要求1-35中任一项所述的方法,其中获得所述序列信息包括将测序衔接子附接到所述多于一个条形码化分泌因子结合试剂特异性寡核苷酸或其产物。
37.根据权利要求1-36中任一项所述的方法,其中所述分泌因子结合试剂特异性寡核苷酸包含与所述多(dA)区相邻的对齐序列。
38.根据权利要求37所述的方法,其中
(a)所述对齐序列包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合;
(b)所述对齐序列包含多(dT)序列、多(dG)序列、多(dC)序列、多(dU)序列或其组合;
(c)所述对齐序列在所述多(dA)区的5’;和/或
(d)所述对齐序列的长度为一个或更多个核苷酸,或长度为两个或更多个核苷酸。
39.根据权利要求1-38中任一项所述的方法,其中所述分泌因子结合试剂特异性寡核苷酸通过接头与所述分泌因子结合试剂关联。
40.根据权利要求39所述的方法,其中所述接头包含碳链,任选地所述碳链包含2-30个碳原子,并且还任选地所述碳链包含12个碳原子,任选地所述接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。
41.根据权利要求1-40中任一项所述的方法,其中所述分泌因子结合试剂特异性寡核苷酸被配置为可从所述分泌因子结合试剂脱离。
42.根据权利要求1-41中任一项所述的方法,所述方法包括使所述分泌因子结合试剂特异性寡核苷酸与所述分泌因子结合试剂解离。
43.根据权利要求8-42中任一项所述的方法,其中确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数包括基于与所述多于一个条形码化核酸分子或其产物关联的具有不同序列的第一分子标记、其互补物或其组合的数目来确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数。
44.根据权利要求8-43中任一项所述的方法,所述方法包括:
使随机引物与所述多于一个条形码化核酸分子接触,其中所述随机引物中的每一种包含第三通用序列或其互补物;以及
使与所述多于一个条形码化核酸分子杂交的所述随机引物延伸以产生多于一个延伸产物。
45.根据权利要求44所述的方法,所述方法包括使用能够与所述第一通用序列或其互补物杂交的引物和能够与所述第三通用序列或其互补物杂交的引物扩增所述多于一个延伸产物,从而产生第一多于一个条形码化扩增子,任选地扩增所述多于一个延伸产物包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到所述多于一个延伸产物。
46.根据权利要求45所述的方法,所述方法包括基于与所述第一多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数。
47.根据权利要求45-46中任一项所述的方法,其中确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数包括基于与所述第一多于一个条形码化扩增子中的条形码化扩增子关联的具有不同序列的所述第一分子标记的数目来确定所述一个或更多个单细胞中的每一个中所述多于一个核酸靶中的每一个的数目,所述第一多于一个条形码化扩增子包含所述多于一个核酸靶中的每一个的序列,任选地所述多于一个核酸靶中的每一个的序列包括所述多于一个核酸靶中的每一个的子序列。
48.根据权利要求45-47中任一项所述的方法,其中所述第一多于一个条形码化扩增子中所述核酸靶的序列包括所述核酸靶的子序列。
49.根据权利要求45-48中任一项所述的方法,所述方法包括使用能够与所述第一通用序列或其互补物杂交的引物和能够与所述第三通用序列或其互补物杂交的引物来扩增所述第一多于一个条形码化扩增子,从而产生第二多于一个条形码化扩增子;任选地扩增所述第一多于一个条形码化扩增子包括将测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分的序列添加到所述第一多于一个条形码化扩增子。
50.根据权利要求49所述的方法,所述方法包括基于与所述第二多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数。
51.根据权利要求45-50中任一项所述的方法,其中所述第一多于一个条形码化扩增子和/或所述第二多于一个条形码化扩增子包含全转录组扩增(WTA)产物。
52.根据权利要求8-51中任一项所述的方法,所述方法包括使用所述多于一个条形码化核酸分子作为模板合成第三多于一个条形码化扩增子以产生第三多于一个条形码化扩增子,任选地合成第三多于一个条形码化扩增子包括对所述多于一个条形码化核酸分子进行聚合酶链式反应(PCR)扩增。
53.根据权利要求52所述的方法,其中合成第三多于一个条形码化扩增子包括使用能够与所述第一通用序列或其互补物杂交的引物和靶特异性引物进行的PCR扩增。
54.根据权利要求52-53中任一项所述的方法,所述方法包括获得所述第三多于一个条形码化扩增子或其产物的序列信息,并且任选地获得所述序列信息包括将测序衔接子附接到所述第三多于一个条形码化扩增子或其产物。
55.根据权利要求52-54中任一项所述的方法,所述方法包括基于与所述第三多于一个条形码化扩增子或其产物关联的具有不同序列的第一分子标记的数目来确定所述一个或更多个单细胞中的每一个中所述核酸靶的拷贝数。
56.根据权利要求8-55中任一项所述的方法,其中所述核酸靶包括核酸分子,任选地所述核酸分子包括核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、包含多(A)尾的RNA、样品索引寡核苷酸、细胞组分结合试剂特异性寡核苷酸或其任何组合。
57.根据权利要求1-56中任一项所述的方法,其中使所述多于一种寡核苷酸条形码延伸包括使用逆转录酶和/或缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶使所述多于一种寡核苷酸条形码延伸,任选地所述DNA聚合酶包括Klenow片段,还任选地所述逆转录酶包括病毒逆转录酶,任选地其中所述病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶。
58.根据权利要求1-57中任一项所述的方法,其中:(i)所述第一通用序列、所述第二通用序列和/或所述第三通用序列是相同的;和/或(ii)所述第一通用序列、所述第二通用序列和/或所述第三通用序列是不同的。
59.根据权利要求1-58中任一项所述的方法,其中所述第一通用序列、所述第二通用序列和/或所述第三通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分,任选地所述测序衔接子包括P5序列、P7序列、其互补序列和/或其部分,还任选地所述测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
60.根据权利要求1-59中任一项所述的方法,其中所述多于一种寡核苷酸条形码中的至少10种包含不同的第一分子标记序列。
61.根据权利要求1-60中任一项所述的方法,其中所述多于一种寡核苷酸条形码各自包含细胞标记,任选地所述多于一种寡核苷酸条形码的每一种细胞标记包含至少6个核苷酸,还任选地与同一第三固体支持物关联的寡核苷酸条形码包含相同的细胞标记,任选地与不同第三固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
62.根据权利要求1-61中任一项所述的方法,其中所述第一固体支持物、第二固体支持物和/或第三固体支持物包括合成颗粒或平坦表面。
63.根据权利要求62所述的方法,其中所述多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在所述合成颗粒上;或者所述多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在所述合成颗粒中,任选地所述合成颗粒是可破坏的。
64.根据权利要求62-63中任一项所述的方法,其中所述合成颗粒包括珠,并且任选地所述珠包括
琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;
选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或
可破坏的水凝胶颗粒。
65.根据权利要求62-64中任一项所述的方法,
其中所述多于一种寡核苷酸条形码中的每一种包含接头官能团,
其中所述合成颗粒包含固体支持物官能团,并且
其中所述支持物官能团和所述接头官能团彼此关联,
并且任选地所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
66.根据权利要求62-64中任一项所述的方法,
其中所述多于一种锚定探针中的每一种包含接头官能团,
其中所述合成颗粒包含固体支持物官能团,并且
其中所述支持物官能团和所述接头官能团彼此关联,
并且任选地所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
67.根据权利要求62-64中任一项所述的方法,
其中所述多于一种捕获探针中的每一种包含接头官能团,
其中所述合成颗粒包含固体支持物官能团,并且
其中所述支持物官能团和所述接头官能团彼此关联,
并且任选地所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
68.根据权利要求1-67中任一项所述的方法,其中所述第一固体支持物和/或所述第二固体支持物具有细胞的尺寸,任选地所述细胞是哺乳动物细胞、酵母细胞、昆虫细胞、植物细胞、细菌细胞或其任何组合。
69.一种组合物,所述组合物包含:
第一固体支持物,所述第一固体支持物包含多于一种捕获探针,所述多于一种捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合;以及
多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,其中所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于所述分泌因子结合试剂的独特因子标识符序列。
70.一种组合物,所述组合物包含:
第二固体支持物,所述第二固体支持物包含多于一种捕获探针和多于一种锚定探针,其中所述多于一种锚定探针中的每一种能够与表面细胞靶特异性结合,并且其中所述捕获探针能够与由单细胞分泌的多于一种分泌因子中的至少一种特异性结合;以及
多于一种分泌因子结合试剂,每一种分泌因子结合试剂能够与被捕获探针结合的分泌因子特异性结合,其中所述多于一种分泌因子结合试剂中的每一种包含分泌因子结合试剂特异性寡核苷酸,所述分泌因子结合试剂特异性寡核苷酸包含用于所述分泌因子结合试剂的独特因子标识符序列。
71.根据权利要求69-70中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸包含第二分子标记序列,任选地所述第二分子标记序列的长度为2-20个核苷酸,还任选地:(i)至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中所述至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是相同的;或者(ii)至少两个分泌因子结合试剂特异性寡核苷酸的第二分子标记序列是不同的,并且其中所述至少两个分泌因子结合试剂特异性寡核苷酸的独特标识符序列是不同的。
72.根据权利要求69-71中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸包含第二通用序列。
73.根据权利要求72所述的组合物,其中所述第二通用序列包含测序引物的结合位点和/或测序衔接子、其互补序列和/或其部分,任选地所述测序衔接子包括P5序列、P7序列、其互补序列和/或其部分,还任选地所述测序引物包括读段1测序引物、读段2测序引物、其互补序列和/或其部分。
74.根据权利要求69-73中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸包含多(dA)区。
75.根据权利要求69-74中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸包含与所述多(dA)区相邻的对齐序列。
76.根据权利要求75所述的组合物,其中所述对齐序列的长度为一个或更多个核苷酸,任选地,所述对齐序列的长度为两个或更多个核苷酸。
77.根据权利要求75-76中任一项所述的组合物,其中
(a)所述对齐序列包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合;
(b)所述对齐序列包含多(dT)序列、多(dG)序列、多(dC)序列、多(dU)序列或其组合;和/或
(c)所述对齐序列在所述多(dA)区的5’。
78.根据权利要求69-77中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸通过接头与所述分泌因子结合试剂关联。
79.根据权利要求78所述的组合物,其中所述接头包含碳链,任选地所述碳链包含2-30个碳原子,并且还任选地所述碳链包含12个碳原子,任选地所述接头包含5’氨基修饰物C12(5AmMC12)或其衍生物。
80.根据权利要求69-79中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸被附接到所述分泌因子结合试剂,任选地所述分泌因子结合试剂特异性寡核苷酸(i)被共价附接到所述分泌因子结合试剂,和/或(ii)被非共价附接到所述分泌因子结合试剂。
81.根据权利要求69-80中任一项所述的组合物,其中所述分泌因子结合试剂特异性寡核苷酸与所述细胞因子结合试剂缀合,任选地所述分泌因子结合试剂特异性寡核苷酸与所述分泌因子结合试剂通过选自由以下组成的组的化学基团缀合:UV光可裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。
82.根据权利要求69-81中任一项所述的组合物,其中所述分泌因子包括:(i)淋巴因子、白细胞介素、趋化因子或其任何组合;(ii)细胞因子、激素、分子毒素或其任何组合;和/或(iii)神经生长因子、肝生长因子、成纤维细胞生长因子、血管内皮生长因子、血小板源生长因子、转化生长因子、骨诱导因子、干扰素、集落刺激因子或其任何组合,任选地分泌因子包括血管生成素、血管生成蛋白-1、血管生成蛋白-2、bNGF、组织蛋白酶S、半乳凝素-7、GCP-2、G-CSF、GM-CSF、PAI-1、PDGF-AA、PDGF-BB、PDGF-AB、PlGF、PlGF-2、SDF-1、Tie2、VEGF-A、VEGF-C、VEGF-D、VEGF-R1、VEGF-R2、VEGF-R3、6Ckine、血管生成蛋白-1、血管生成蛋白-2、BLC、BRAK、CD186、ENA-78、嗜酸性粒细胞趋化因子-1、嗜酸性粒细胞趋化因子-2、嗜酸性粒细胞趋化因子-3、EpCAM、GDF-15、GM-CSF、GRO、HCC-4、I-309、IFN-γ、IL-1α、IL-1β、IL-1R4(ST2)、IL-2、IL-2R、IL-3、IL-3Rα、IL-5、IL-6、IL-6R、IL-7、IL-8、IL-8RB、IL-11、IL-12、IL-12p40、IL-12p70、IL-13、IL-13R1、IL-13R2、IL-15、IL-15Rα、IL-16、IL-17、IL-17C、IL-17E、IL-17F、IL-17R、IL-18、IL-18BPa、IL-18Rα、IL-20、IL-23、IL-27、IL-28、IL-31、IL-33、IP-10、I-TAC、LIF、LIX、LRP6、MadCAM-1、MCP-1、MCP-2、MCP-3、MCP-4、M-CSF、MIF、MIG、MIP-1γ、MIP-1α、MIP-1β、MIP-1δ、MIP-3α、MIP-3β、MPIF-1、PARC、PF4、RANTES、抵抗素、SCF、SCYB16、TACI、TARC、TSLP、TNF-α、TNF-R1、TRAIL-R4、TREM-1、激活蛋白A、双调蛋白、Axl、BDNF、BMP4、组织蛋白酶S、EGF、FGF-1、FGF-2、FGF-7、FGF-21、卵泡抑制素、半乳凝素-7、Gas6、GDF-15、HB-EGF、HGF、IGFBP-1、IGFBP-3、LAP、NGF R、NrCAM、NT-3、NT-4、PAI-1、TGF-α、TGF-β、TGF-β3、TRAIL-R4、ADAMTS1、组织蛋白酶S、FGF-2、卵泡抑制素、半乳凝素-7、GCP-2、GDF-15、IGFBP-6、LIF、MMP-9、pro-MMP9、RANK、RANKL、RANTES、SDF-1、CXCR4或其任何组合。
83.根据权利要求69-82中任一项所述的组合物,其中所述分泌因子结合试剂和所述捕获探针能够与同一分泌因子的不同表位结合。
84.根据权利要求69-83中任一项所述的组合物,其中所述分泌因子结合试剂、所述捕获探针和所述锚定探针中的一种或更多种包括抗体或其片段,任选地所述抗体或其片段包括单克隆抗体,还任选地所述抗体或其片段包括Fab、Fab’、F(ab’)2、Fv、scFv、dsFv、双特异抗体、三特异抗体、四特异抗体、由抗体片段形成的多特异性抗体、单结构域抗体(sdAb)、包含互补的scFv(串联scFv)或双特异性串联scFv的单链、Fv构建体、二硫键连接的Fv、双可变结构域免疫球蛋白(DVD-Ig)结合蛋白或纳米抗体、适配体、亲和体、affilin、affitin、affimer、alphabody、anticalin、avimer、DARPin、Fynomer、Kunitz结构域肽、单特异抗体或其任何组合。
85.根据权利要求69-84中任一项所述的组合物,其中所述捕获探针和/或所述锚定探针通过以下与所述第一固体支持物和/或所述第二固体支持物缀合:1,3-偶极环加成反应、杂Diels-Alder反应、亲核取代反应、非羟醛型羰基反应、碳-碳多重键加成、氧化反应、点击反应或其任何组合。
86.根据权利要求70-85中任一项所述的组合物,其中所述表面细胞靶包括糖类、脂质、蛋白、细胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白或其任何组合。
87.根据权利要求70-86中任一项所述的组合物,其中所述表面细胞靶包括CD1a、CD1b、CD1c、CD1d、CD1e、CD2、CD3、CD3d、CD3e、CD3g、CD4、CD5、CD6、CD7、CD8a、CD8b、CD9、CD10、CD11a、CD11b、CD11c、CD11d、CDwl2、CD13、CD14、CD15、CD15u、CD15s、CD15su、CD16、CD16b、CD17、CD18、CD19、CD20、CD21、CD22、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD30、CD31、CD32、CD33、CD34、CD35、CD36、CD37、CD38、CD39、CD40、CD41、CD42a、CD42b、CD42c、CD42d、CD43、CD44、CD45、CD45RA、CD45RB、CD45RC、CD45RO、CD46、CD47、CD48、CD49a、CD49b、CD49c、CD49d、CD49e、CD49f、CD50、CD51、CD52、CD53、CD54、CD55、CD56、CD57、CD58、CD59、CD60a、CD60b、CD60c、CD61、CD62E、CD62L、CD62P、CD63、CD64、CD65、CD65s、CD66a、CD66b、CD66c、CD66d、CD66e、CD66f、CD68、CD69、CD70、CD71、CD72、CD73、CD74、CD75、CD75s、CD77、CD79a、CD79b、CD80、CD81、CD82、CD83、CD84、CD85a、CD85d、CD85j、CD85k、CD86、CD87、CD88、CD89、CD90、CD91、CD92、CD93、CD94、CD95、CD96、CD97、CD98、CD99、CD99R、CD100、CD101、CD102、CD103、CD104、CD105、CD106、CD107a、CD107b、CD108、CD109、CD110、CD111、CD112、CD113、CD114、CD115、CD116、CD117、CD118、CD119、CD120a、CD120b、CD121a、CD121b、CD122、CD123、CD124、CD125、CD126、CD127、CD129、CD130、CD131、CD132、CD133、CD134、CD135、CD136、CD137、CD138、CD139、CD140a、CD140b、CD141、CD142、CD143、CD144、CDw145、CD146、CD147、CD148、CDw149、CD150、CD151、CD152、CD153、CD154、CD155、CD156a、CD156b、CD156c、CD157、CD158e、CD158i、CD158k、CD159a、CD159c、CD160、CD161、CD162、CD163、CD164、CD165、CD166、CD167a、CD167b、CD168、CD169、CD170、CD171、CD172a、CD172b、CD172g、CD173、CD174、CD175、CD175s、CD176、CD177、CD178、CD179a、CD179b、CD180、CD181、CD182、CD183、CD184、CD185、CD186、CD191、CD192、CD193、CD194、CD195、CD196、CD197、CDw198、CD199、CD200、CD201、CD202b、CD203c、CD204、CD205、CD206、CD207、CD208、CD209、CD210、CDw210b、CD212、CD213a1、CD213a2、CD215、CD217a、CD218a、CD218b、CD220、CD221、CD222、CD223、CD224、CD225、CD226、CD227、CD228、CD229、CD230、CD231、CD232、CD233、CD234、CD235a、CD235b、CD236、CD236R、CD238、CD239、CD240CE、CD240DCE、CD240D、CD241、CD242、CD243、CD244、CD245、CD246、CD247、CD248、CD249、CD252、CD253、CD254、CD256、CD266、CD267、CD268、CD269、CD270、CD271、CD272、CD273、CD274、CD275、CD276、CD277、CD278、CD279、CD280、CD281、CD282、CD283、CD284、CD286、CD289、CD290、CD292、CDw293、CD294、CD295、CD296、CD297、CD298、CD299、CD300a、CD300c、CD300e、CD301、CD302、CD303、CD304、CD305、CD306、CD307a、CD307b、CD307c、CD307d、CD307e、CD308、CD309、CD312、CD314、CD315、CD316、CD317、CD318、CD319、CD320、CD321、CD322、CD324、CD325、CD326、CD327、CD328、CD329、CD331、CD332、CD333、CD334、CD335、CD336、CD337、CD338、CD339、CD340、CD344、CD349、CD350、CD351、CD352、CD353、CD354、CD355、CD357、CD358、CD360、CD361、CD362、CD363、CD364、CD365、CD366、CD367、CD368、CD369、CD370、CD371、BCMA、HLA蛋白、β2-微球蛋白或其任何组合。
88.根据权利要求69-87中任一项所述的组合物,所述组合物包含:(i)缺乏5’至3’核酸外切酶活性和3’至5’核酸外切酶活性中的至少一种的DNA聚合酶,任选地其中所述DNA聚合酶包括Klenow片段;(ii)逆转录酶,任选地其中所述逆转录酶包括病毒逆转录酶,并且任选地所述病毒逆转录酶是鼠白血病病毒(MLV)逆转录酶或Moloney鼠白血病病毒(MMLV)逆转录酶;和/或(iii)缓冲液、筒或两者。
89.根据权利要求69-88中任一项所述的组合物,所述组合物包含多于一种寡核苷酸条形码,其中所述多于一种寡核苷酸条形码中的每一种寡核苷酸条形码包含靶结合区,任选地所述靶结合区包含多(dA)区、多(dT)区、随机序列、基因特异性序列或其任何组合。
90.根据权利要求89所述的组合物,其中所述多于一种寡核苷酸条形码各自包含分子标记,任选地所述分子标记包含至少6个核苷酸,任选地所述多于一种寡核苷酸条形码中的至少10种包含不同的分子标记序列。
91.根据权利要求89-90中任一项所述的组合物,其中所述多于一种寡核苷酸条形码与第三固体支持物关联。
92.根据权利要求89-91中任一项所述的组合物,其中所述多于一种寡核苷酸条形码各自包含细胞标记,任选地所述多于一种寡核苷酸条形码中与同一第三固体支持物关联的寡核苷酸条形码包含相同的细胞标记,还任选地所述多于一种寡核苷酸条形码中与不同第三固体支持物关联的寡核苷酸条形码包含不同的细胞标记。
93.根据权利要求69-92中任一项所述的组合物,其中所述第一固体支持物、第二固体支持物和/或第三固体支持物包括合成颗粒或平坦表面。
94.根据权利要求93所述的组合物,其中所述多于一种寡核苷酸条形码中的至少一种被固定或部分地固定在所述合成颗粒上;或者所述多于一种寡核苷酸条形码中的至少一种被包封或部分地包封在所述合成颗粒中,任选地所述合成颗粒是可破坏的。
95.根据权利要求93-94中任一项所述的组合物,其中所述合成颗粒包括珠,并且任选地所述珠包括
琼脂糖凝胶珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合;
选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、纤维素、尼龙、硅酮及其任何组合;或
可破坏的水凝胶颗粒。
96.根据权利要求93-95中任一项所述的组合物,
其中所述多于一种寡核苷酸条形码中的每一种包含接头官能团,
其中所述合成颗粒包含固体支持物官能团,并且
其中所述支持物官能团和所述接头官能团彼此关联,
并且任选地所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
97.根据权利要求93-96中任一项所述的组合物,
其中所述多于一种锚定探针中的每一种包含接头官能团,
其中所述合成颗粒包含固体支持物官能团,并且
其中所述支持物官能团和所述接头官能团彼此关联,
并且任选地所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
98.根据权利要求93-97中任一项所述的组合物,
其中所述多于一种捕获探针中的每一个包含接头官能团,
其中所述合成颗粒包含固体支持物官能团,并且
其中所述支持物官能团和所述接头官能团彼此关联,
并且任选地所述接头官能团和所述支持物官能团单独地选自由C6、生物素、链霉抗生物素蛋白、一种或更多种伯胺、一种或更多种醛、一种或更多种酮,以及其任何组合组成的组。
99.根据权利要求69-98中任一项所述的组合物,其中所述第一固体支持物和/或所述第二固体支持物具有细胞的尺寸,任选地所述细胞是哺乳动物细胞、酵母细胞、昆虫细胞、植物细胞、细菌细胞或其任何组合。
CN202180084437.6A 2020-12-15 2021-01-15 单细胞分泌组分析 Pending CN116685850A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063125629P 2020-12-15 2020-12-15
US63/125,629 2020-12-15
PCT/US2021/013747 WO2022132206A1 (en) 2020-12-15 2021-01-15 Single cell secretome analysis

Publications (1)

Publication Number Publication Date
CN116685850A true CN116685850A (zh) 2023-09-01

Family

ID=74572877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180084437.6A Pending CN116685850A (zh) 2020-12-15 2021-01-15 单细胞分泌组分析

Country Status (4)

Country Link
US (1) US20220187286A1 (zh)
EP (1) EP4263859A1 (zh)
CN (1) CN116685850A (zh)
WO (1) WO2022132206A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US12071617B2 (en) 2019-02-14 2024-08-27 Becton, Dickinson And Company Hybrid targeted and whole transcriptome amplification
WO2024097263A1 (en) * 2022-11-01 2024-05-10 Becton, Dickinson And Company Bead-based single cell secretome analysis

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6531283B1 (en) 2000-06-20 2003-03-11 Molecular Staging, Inc. Protein expression profiling
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
CN104884605B (zh) * 2012-08-24 2018-05-18 耶鲁大学 用于高通量多重检测的系统、装置和方法
WO2014204939A2 (en) * 2013-06-17 2014-12-24 Kim Lewis Methods for quantitative determination of protein-nucleic acid interactions in complex mixtures
GB2525104B (en) 2013-08-28 2016-09-28 Cellular Res Inc Massively Parallel Single Cell Nucleic Acid Analysis
US20170205404A1 (en) * 2016-01-19 2017-07-20 General Electric Company Multifunctional beads and methods of use for capturing rare cells
CA3034924A1 (en) * 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
AU2018281745B2 (en) 2017-06-05 2022-05-19 Becton, Dickinson And Company Sample indexing for single cells
EP4090762A1 (en) * 2020-01-17 2022-11-23 Becton, Dickinson and Company Methods and compositions for single cell secretomics
CN115087746A (zh) * 2020-02-12 2022-09-20 贝克顿迪金森公司 细胞内AbSeq

Also Published As

Publication number Publication date
EP4263859A1 (en) 2023-10-25
US20220187286A1 (en) 2022-06-16
WO2022132206A1 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
US11739443B2 (en) Profiling of highly expressed and lowly expressed proteins
US20220178909A1 (en) Multiplexed single cell immunoassay
US11661631B2 (en) Oligonucleotides associated with antibodies
US11649497B2 (en) Methods and compositions for quantitation of proteins and RNA
EP4097228B1 (en) Barcoded wells for spatial mapping of single cells through sequencing
EP3837378B1 (en) Aptamer barcoding
US20210222244A1 (en) Methods and compositions for single cell secretomics
US20210246492A1 (en) Intracellular abseq
EP4345172A2 (en) Sample indexing for single cells
JP2022506546A (ja) ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
CN113454234A (zh) 杂合体靶向和全转录物组扩增
US20220187286A1 (en) Single cell secretome analysis
CN116157534A (zh) 用于单细胞分析的cDNA加标对照
US20240287591A1 (en) Use of decoy polynucleotides in single cell multiomics
WO2023034794A1 (en) Rna preservation and recovery from fixed cells
CN118176306A (zh) 用于mRNA 5’分析的模板转换寡核苷酸(TSO)
WO2020150356A1 (en) Polymerase chain reaction normalization through primer titration
WO2024097263A1 (en) Bead-based single cell secretome analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination