CN113366117A - 用于生物样品中转座酶介导的空间标记和分析基因组dna的方法 - Google Patents

用于生物样品中转座酶介导的空间标记和分析基因组dna的方法 Download PDF

Info

Publication number
CN113366117A
CN113366117A CN201980071274.0A CN201980071274A CN113366117A CN 113366117 A CN113366117 A CN 113366117A CN 201980071274 A CN201980071274 A CN 201980071274A CN 113366117 A CN113366117 A CN 113366117A
Authority
CN
China
Prior art keywords
capture
sequence
domain
biological sample
capture probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980071274.0A
Other languages
English (en)
Inventor
M·施那尔-拉文
M·Y·鲁希罗
T·S·米克尔森
P·斯托尔
J·弗里森
M·马克伦德
E·罗棱斯波巴迪拉
E·P·拉马察朱安伊也
L·弗兰茨
A·M·滕托利
R·巴得瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
10X Genomics Inc
Original Assignee
10X Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 10X Genomics Inc filed Critical 10X Genomics Inc
Publication of CN113366117A publication Critical patent/CN113366117A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Lubricants (AREA)
  • Compositions Of Macromolecular Compounds (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及用于单独对已经用转座酶片段化的核酸进行空间分析或与其他类型的分析物组合对已经用转座酶片段化的核酸进行空间分析的方法和材料。

Description

用于生物样品中转座酶介导的空间标记和分析基因组DNA的 方法
相关申请的交叉引用
本申请要求于2018年8月29日提交的美国临时专利申请第62/724,483号,于2018年12月13日提交的美国临时专利申请第62/779,342号,于2018年8月28日提交的美国临时专利申请第62/723,950号,于2018年8月28日提交的美国临时专利申请第62/723,957号,于2018年8月28日提交的美国临时专利申请第62/723,960号,于2018年8月28日提交的美国临时专利申请第62/723,964号,于2018年8月28日提交的美国临时专利申请第62/723,970号,于2018年8月29日提交的美国临时专利申请第62/724,483号,于2018年8月29日提交的美国临时专利申请第62/723,972号,于2018年8月28日提交的美国临时专利申请第62/724,489号,于2018年8月29日提交的美国临时专利申请第62/724,561号,于2019年1月6日提交的美国临时专利申请第62/788,905号,于2019年1月6日提交的美国临时专利申请第62/788,867号,于2019年1月6日提交的美国临时专利申请第62/788,871号,于2019年1月6日提交的美国临时专利申请第62/788,897号,于2019年1月6日提交的美国临时专利申请第62/788,885号,于2019年3月22日提交的美国临时专利申请第62/822,565号,于2019年3月15日提交的美国临时专利申请第62/819,496号,于2019年3月15日提交的美国临时专利申请第62/819,486号,于2019年3月15日提交的美国临时专利申请第62/819,467号,于2019年3月22日提交的美国临时专利申请第62/822,632号,于2019年3月22日提交的美国临时专利申请第62/822,618号,于2019年3月22日提交的美国临时专利申请第62/822,592号,于2019年3月15日提交的美国临时专利申请第62/819,468号,于2019年3月22日提交的美国临时专利申请第62/822,627号,于2019年3月15日提交的美国临时专利申请第62/819,448号,于2019年3月22日提交的美国临时专利申请第62/822,649号,于2019年3月15日提交的美国临时专利申请第62/819,456号,于2019年3月15日提交的美国临时专利申请第62/819,478号,于2019年3月15日提交的美国临时专利申请第62/819,449号,于2019年3月22日提交的美国临时专利申请第62/822,554号,于2019年3月22日提交的美国临时专利申请第62/822,575号,于2019年3月22日提交的美国临时专利申请第62/822,605号,于2019年2月28日提交的美国临时专利申请第62/812,219号,于2019年3月15日提交的美国临时专利申请第62/819,458号,于2019年4月26日提交的美国临时专利申请第62/839,223号,于2019年4月26日提交的美国临时专利申请第62/839,320号,于2019年4月26日提交的美国临时专利申请第62/839,346号,于2019年5月2日提交的美国临时专利申请第62/842,463号,于2019年6月13日提交的美国临时专利申请第62/860,993号,于2019年4月26日提交的美国临时专利申请第62/839,526号和于2019年6月7日提交的美国临时专利申请第62/858,331号的优先权。这些申请各自的内容通过引用全文纳入本文。
背景技术
对象组织内的细胞由于不同细胞内的不同分析物水平(例如,基因和/或蛋白质表达)而在细胞形态和/或功能上存在差异。细胞在组织内的特定位置(例如,细胞相对于邻近细胞的位置或细胞相对于组织微环境的位置)可以影响,例如,细胞的形态、分化、命运、活力、增殖、行为以及与组织中其他细胞的信号传导和串扰。
空间异质性先前已被研究过,所述研究使用的技术仅提供完整组织或部分组织接触中的少量分析物的数据,或提供单细胞的大量分析物数据,但无法提供有关单细胞在母体生物样品(例如,组织样品)中位置的信息。
染色质结构在生物样品中的细胞之间或来自同一组织的生物样品之间可能不同。分析可及染色质中的差异可以指示特定细胞中转录活性序列,例如基因。进一步了解染色质内的转录活性区域将有助于鉴定哪些基因对细胞的功能和/或表型有贡献。
发明内容
本发明一般描述用于在空间上分析存在于生物样品中的基因组DNA的方法。在一个方面,所述方法包括提供具有多个捕获探针的阵列,使得所述多个捕获探针包括空间条形码和捕获域;在足以使所述生物样品中的基因组DNA可被转座子插入的条件下透化所述生物样品;在其中转座子序列被插入基因组DNA的条件下,向生物样品提供转座子序列和转座酶;允许转座酶从基因组DNA中切除插入的转座子序列,从而产生片段化的基因组DNA;使包含片段化的基因组DNA的生物样品与阵列在其中捕获探针与片段化的基因组DNA相互作用的条件下接触;并且将捕获探针在阵列上的位置与生物样品中的位置相关联,从而在空间上分析片段化的基因组DNA。
在一些实施方式中,在基材上提供包含多个捕获探针的阵列。在一些实施方式中,在特征上提供包含多个捕获探针的阵列。在一些实施方式中,捕获探针直接或间接附接。在一些实施方式中,在基材上的特征上提供包含多个捕获探针的阵列。在一些实施方式中,基材包括微流体通道。在一些实施方式中,捕获探针还包括裂解域、功能域和独特标识符中的一个或多个,或其组合。
在一些实施方式中,另一迁移步骤包括其中使片段化的基因组DNA迁移到基材的步骤。在一些实施方式中,迁移步骤是主动迁移步骤,包括向片段化的基因组DNA施加电场。在一些实施方式中,迁移步骤是包括扩散的被动迁移步骤。在一些实施方式中,来自生物样品的片段化的基因组DNA的迁移包括将生物样品和特征暴露于热中。在一些实施方式中,生物样品固定在基材上。
在一些实施方式中,转座酶是二聚体,其包含第一单体,所述第一单体与第一衔接子(包括转座子末端序列和与捕获域互补的序列)复合,其中第二单体与第二衔接子(包括转座子末端序列和第二衔接子序列)复合,其中转座酶将第一衔接子和第二衔接子连接到片段化的基因组DNA。在一些实施方式中,第一衔接子和第二衔接子具有5′端和3′端,其中5′端原位磷酸化。在一些实施方式中,在片段化DNA之前,与第一单体复合的第一衔接子的5′端和与第二单体复合的第二衔接子的5′端被磷酸化。在一些实施方式中,磷酸化与第一单体复合的第一衔接子和与第二单体复合的第二衔接子的5′端的步骤包括在ATP存在下使第一单体:第一衔接子复合物和第二单体:第二衔接子复合物与多核苷酸激酶接触。
在一些实施方式中,捕获探针的捕获域包括与和第一衔接子的捕获域互补的序列杂交的序列。在一些实施方式中,捕获探针是部分双链分子,其包含第一链,所述第一链包含杂交到第二链的捕获域,并且其中所述第一链作为将所述第一衔接子连接到所述第二链的模板。在一些实施方式中,与捕获探针杂交的与捕获域或其部分互补的第一衔接子序列作为连接并将第一衔接子的5′端连接到捕获探针的3′端的模板。在一些实施方式中,捕获探针包括表面探针和夹板寡核苷酸,夹板寡核苷酸包括与表面探针的杂交域互补的序列。在一些实施方式中,夹板寡核苷酸包含具有与第一衔接子或其部分互补的序列的捕获域。在一些实施方式中,夹板寡核苷酸与第一衔接子或其部分杂交并且与表面探针的杂交域或其部分杂交。在一些实施方式中,在夹板寡核苷酸存在下进行连接,从而连接捕获探针的表面探针和第一衔接子。
在一些实施方式中,通过第一衔接子与捕获探针杂交的片段化的基因组DNA是用于产生延伸的捕获探针的延伸模板,该延伸的捕获探针包括空间条形码的序列和与片段化的基因组DNA互补的序列。在一些实施方式中,用DNA聚合酶延伸与片段化的基因组DNA杂交的捕获探针。在一些实施方式中,DNA聚合酶具有链置换活性。在一些实施方式中,对片段化的基因组DNA中的单链断裂进行间隙修复的进一步步骤。
在一些实施方式中,与捕获域互补的序列是独特序列。在一些实施方式中,捕获探针通过DNA连接酶连接到片段化的基因组DNA。在一些实施方式中,转座酶是Tn5转座酶或其功能性衍生物。在一些实施方式中,Tn5转座酶包含与SEQ ID NO:1具有至少80%相同性的序列。在一些实施方式中,转座酶是Mu转座酶或其功能性衍生物。在一些实施方式中,Mu转座酶包含与SEQ ID NO:2具有至少80%相同性的序列。在一些实施方式中,转座子末端序列包含与SEQ ID NO:8具有至少80%相同性的序列。在一些实施方式中,转座子末端序列包括与SEQ ID NO:9到14中的任何一个具有至少80%相同性的序列。
在一些实施方式中,在化学透化条件、酶透化条件或两者下进行生物样品透化。在一些实施方式中,化学透化条件包括将生物样品与碱性溶液接触。在一些实施方式中,酶透化条件包括将生物样品与包含蛋白酶的酸性溶液接触。在一些实施方式中,蛋白酶是天冬氨酰蛋白酶、优选胃蛋白酶、胃蛋白酶样酶(pepsin-like enzyme)或其功能等效物。在一些实施方式中,胃蛋白酶、胃蛋白酶样酶或其功能等效物包含与SEQ ID NO:3或4具有至少80%相同性的序列。
在一些实施方式中,酶透化条件包括将生物样品与锌内肽酶、胶原酶、胶原酶样酶或其功能等效物接触;与丝氨酸蛋白酶、蛋白酶K酶、蛋白酶K样酶或其功能等效物接触;或与两者都接触。在一些实施方式中,胶原酶、胶原酶样酶或其功能等效物包含与SEQ ID NO:5或6具有至少80%相同性的序列。在一些实施方式中,蛋白酶K酶、蛋白酶K样酶或其功能等效物包含与SEQ ID NO:7具有至少80%相同性的序列。
在一些实施方式中,作为延伸模板与捕获探针杂交的片段化的基因组DNA产生DNA分子。在一些实施方式中,与捕获探针杂交的片段化的基因组DNA用作连接模板以产生DNA分子。在一些实施方式中,所述步骤包括分析生成的DNA分子的步骤。在一些实施方式中,分析DNA分子的步骤包括测序。在一些实施方式中,将捕获探针的空间条形码和与捕获探针相关联的片段化的基因组DNA相关联的步骤在空间上分析片段化的基因组DNA。在一些实施方式中,生物样品在生物样品与基材接触之前或之后成像。
在另一方面中,本发明一般描述用于在空间上检测生物样品的核酸的方法中使用的试剂盒,其中该试剂盒包括存在多个捕获探针的阵列中的任意两个或多个;一种或多种生物样品透化试剂;一种或多种转座酶;一种或多种逆转录酶;以及一种或多种裂解酶。
在不同方面中,本发明一般描述用于对生物样品中存在的基因组DNA和RNA进行空间分析的方法,其中提供阵列并且阵列包括多个捕获探针,其中,所述多个捕获探针中的第一捕获探针包括空间条形码和第一捕获域,并且其中所述多个捕获探针中的第二捕获探针包括空间条形码和第二捕获域;在足以使生物样品中的基因组DNA发生转座子插入的条件下透化生物样品;在其中转座子序列被插入基因组DNA的条件下向生物样品提供转座子序列和转座酶;
允许转座酶从基因组DNA中切除插入的转座子序列,从而产生片段化的基因组DNA;在其中第一捕获域与片段化的基因组DNA相互作用并且第二捕获域与RNA相互作用的条件下,将包含片段化的基因组DNA和RNA的生物样品与阵列接触;并且将阵列上的第一捕获探针的位置与生物样品中的位置相关联,并且将阵列上的第二捕获探针的位置与生物样品中的位置相关联,从而在空间上分析生物样品中位置处的片段化的基因组DNA和RNA。
在一些实施方式中,RNA是mRNA。在一些实施方式中,第一捕获域和第二捕获域是相同的。在一些实施方式中,第一捕获域和第二捕获域包含均聚多聚(T)序列。在一些实施方式中,第一捕获域和第二捕获域是不同的。在一些实施方式中,第一捕获域包括随机序列,第二捕获域包括多聚(T)序列。在一些实施方式中,在基材上提供包含多个捕获探针的阵列。在一些实施方式中,在特征上提供包含多个捕获探针的阵列。在一些实施方式中,该特征包括第一捕获探针、第二捕获探针或两者。在一些实施方式中,直接或间接地附接第一捕获探针、第二捕获探针或两者。在一些实施方式中,在基材上的特征上提供包含多个捕获探针的阵列。在一些实施方式中,基材包括微流体通道。在一些实施方式中,第一捕获探针、第二捕获探针或两者包括以下的一个或多个:裂解域、功能域和独特标识符,或其组合。
在一些实施方式中,存在迁移步骤,其中片段化的基因组DNA和RNA迁移到基材。在一些实施方式中,迁移步骤是主动迁移步骤。在一些实施方式中,迁移步骤是被动迁移步骤。在一些实施方式中,来自生物样品的片段化的基因组DNA和RNA的迁移包括将生物样品暴露于热中。在一些实施方式中,生物样品固定在基材上。
在一些实施方式中,通过用连接酶连接断裂来修复片段化的基因组DNA。在一些实施方式中,片段化的基因组DNA中的单链断裂经历间隙修复。在一些实施方式中,将与第一捕获探针的第一捕获域互补的序列引至片段化的基因组DNA。在一些实施方式中,第一捕获探针的第一捕获域和与引至片段化的基因组DNA的捕获域互补的序列杂交。在一些实施方式中,第一捕获域的随机序列与片段化的基因组DNA杂交。在一些实施方式中,第二捕获探针的第二捕获结构域与mRNA中的互补序列杂交。在一些实施方式中,与第一捕获域互补的序列和mRNA中的互补序列是均聚序列。在一些实施方式中,均聚物序列是多聚(A)序列。
在一些实施方式中,使用片段化的基因组DNA作为延伸模板来延伸第一捕获探针,并且使用RNA作为延伸模板来延伸第二捕获探针。在一些实施方式中,用DNA聚合酶延伸第一捕获探针。在一些实施方式中,用逆转录酶延伸第二捕获探针。
在一些实施方式中,转座酶是Tn5转座酶或其功能性衍生物。在一些实施方式中,Tn5转座酶包含与SEQ ID NO:1具有至少80%相同性的序列。在一些实施方式中,转座酶是Mu转座酶或其功能性衍生物。在一些实施方式中,Mu转座酶包含与SEQ ID NO:2具有至少80%相同性的序列。在一些实施方式中,转座酶与包含转座子末端序列的衔接子复合。在一些实施方式中,转座子末端序列包含与SEQ ID NO:8具有至少80%相同性的序列。在一些实施方式中,转座子末端序列包括与SEQ ID NO:9到14中的任何一个具有至少80%相同性的序列。
在一些实施方式中,进行透化生物样品的步骤。在一些实施方式中,7。根据权利要求51至86中任一权利要求所述的方法,其中在化学透化条件、酶透化条件或两者下进行生物样品透化。在一些实施方式中,化学透化条件包括将生物样品与碱性溶液接触。在一些实施方式中,酶透化条件包括将生物样品与包含蛋白酶的酸性溶液接触。在一些实施方式中,蛋白酶是天冬氨酰蛋白酶、优选胃蛋白酶、胃蛋白酶样酶或其功能等效物。在一些实施方式中,胃蛋白酶、胃蛋白酶样酶或其功能等效物包含与SEQ ID NO:3或4具有至少80%相同性的序列。在一些实施方式中,酶透化条件包括将生物样品与锌内肽酶、胶原酶、胶原酶样酶或其功能等效物接触;与丝氨酸蛋白酶、蛋白酶K酶、蛋白酶K样酶或其功能等效物接触;或与两者都接触。在一些实施方式中,胶原酶、胶原酶样酶或其功能等效物包含与SEQ ID NO:5或6具有至少80%相同性的序列。在一些实施方式中,蛋白酶K酶、蛋白酶K样酶或其功能等效物包含与SEQ ID NO:7具有至少80%相同性的序列。
在一些实施方式中,分析DNA分子的步骤包括测序。在一些实施方式中,将第一捕获探针的空间条形码和与第一捕获探针相关联的片段化的基因组DNA相关联在空间上分析片段化的基因组DNA。在一些实施方式中,将第二捕获探针的空间条形码和与第二捕获探针相关联的mRNA相关联在空间上分析mRNA。在一些实施方式中,生物样品在生物样品与基材接触之前或之后成像。
本说明书中提到的可在因特网上获得的所有发表物、专利和专利申请通过引用纳入本文,就好像将各篇单独的发表物、专利、专利申请和信息项目专门和单独地通过引用纳入本文那样。对于通过引用纳入的出版物、专利、专利申请和信息项目与本说明书中所含公开内容相矛盾的内容,均意于以本说明书为准和/或本说明书优先于任何相矛盾的材料。
在以范围来描述值的情况下,应当理解的是,该描述包括在该范围内的所有可能的子范围的公开,以及在该范围内的特定数值的公开,而不管是否明确地说明了特定数值或特定子范围。
术语“每个”提及一组物品时,意在识别该集合中的一个单独物品,但不一定指该集合中的每一项物品,除非另有明确说明,或除非用法的上下文另有明确说明。
本文描述了本发明的特征的各种实施方式。然而,应当理解,这些实施方式仅作为示例提供,并且在不脱离本公开的范围的情况下,本领域技术人员可以作出许多变化、改变和替换。还应理解,本文所描述的特定实施方式的各种替代方案也在本公开的范围内。
附图说明
以下附图说明了本发明的特征和优点的某些实施方式。这些实施方式无意以任何方式限制所附权利要求的范围。附图中的相同附图标记表示相同的元素。
图1示出了示例性空间分析工作流。
图2示出了示例性空间分析工作流。
图3示出了示例性空间分析工作流。
图4示出了示例性空间分析工作流。
图5示出了示例性空间分析工作流。
图6是示出如本文所述的条码化捕获探针的示例的示意图。
图7是说明可裂解捕获探针的示意图,其中裂解的捕获探针可进入非透化细胞并结合到样品内的目标分析物。
图8是示例性多重空间标记特征的示意图。
图9是示例性分析物捕获剂的示意图。
图10是描绘特征固定(feature-immobilized)的捕获探针1024和分析物捕获剂1026之间的示例性相互作用的示意图。
图11A、11B和11C是图示如何在基于阵列的系统中利用链霉亲和素细胞标签来产生空间条码化的细胞或细胞内容物的示意图。
图12是示出阵列内条码化特征的布置的示意图。
图13是示出抗扩散介质(例如盖)的侧视图的示意图。
图14A和14B是图示电泳转移系统的展开图14A和侧视图14B的示意图,所述电泳转移系统被配置成将转录物分析物导向空间条码化捕获探针阵列。
图15是示出利用电泳转移系统的示例性工作流方案的示意图。
图16示出用于划分解离样品(例如来自样品的生物颗粒或个体细胞)的微流体通道结构1600的示例。
图17A示出了微流体通道结构1700的示例,该微流体通道结构1700用于将携带空间条形码的珠递送到液滴。
图17B示出了具有用于受控划分的几何特征的微流体通道结构1750的另一示例的横截面图。
图17C示出了工作流示意图。
图18是使用分析物结合部分与细胞表面的共价偶联或与细胞膜元件的非共价相互作用来描绘细胞标记的示意图。
图19是描绘使用细胞穿透肽或递送系统进行细胞标记的示意图。
图20A是说明用于“像素化”样品的示范性、非限制性、非穷尽性步骤的工作流示意图,其中样品通过空心针或微针切割、压印、显微解剖或转移,将样品的小部分移动到个体分区或孔中。
图20B是描绘多针像素化的示意图,其中一组针头穿过支架上的样品并穿入下面含有凝胶珠和试剂的纳米孔中。一旦针处于纳米孔中,细胞就会弹出。
图21示出了用于解离空间条码化样品以通过液滴或流动池分析方法进行分析的示例性、非限制性、非穷举步骤的工作流示意图。
图22A-D是一个示意图,显示了空间处理来自生物样品的DNA的示例。
图23A-C是一个示意图,显示了空间ATAC-seq方法的示例。
图24A-C是显示生物样品中分析物多重化检测示例的示意图。
图25是示出本发明的代表性工作流程的示意图。
图26是一个示意图,显示了用于研究Tn5转座酶/转座体效率的程序的代表性工作流程。
图27是一个示意图,显示了用于研究固定化组织切片中标签化条件的程序的代表性工作流程。
图28是一个示意图,显示了用于研究磷酸化DNA标签化物的杂交和连接条件的程序的代表性工作流程。
图29显示在细胞悬浮液中进行的参考标签化反应的DNA片段分析,如所述(Corces,M.R.等,谱系特异性和单细胞染色质可及性记录人类造血和白血病进化(Lineage-specific and single-cell chromatin accessibility charts humanhematopoiesis and leukemia evolution),Nat Genetic.卷48(10):第1193-1203页(2016))。片段分布分析用于确定开放染色质标签化的成功,其中可及染色质的成功标签化反应揭示了PCR扩增的核小体保护的DNA片段大小的周期性(约170-180bp;核小体包裹DNA和PCR柄)。
图30显示了根据图27中的工作流程进行的标签化反应的DNA片段分析,比较了在25℃进行10分钟的透化步骤中的不同洗涤剂:a)无洗涤剂;b)0.1%Triton-X-100;C)IGEPAL 0.1%;d)吐温0.1%,洋地黄素0.01%和NP-400.1%。在e)中,对用IGEBAL 0.1%透化并按(Chen 2016 Nat Meth)处理的组织切片进行插入大小分布分析,未能发现显著的核小体周期性。
图31显示了根据图27中的工作流程进行的标签化反应的DNA片段分析,比较了固定的组织切片上的不同蛋白酶处理(3分钟):a)胃蛋白酶(0.1mg/m1),存在100mM HCL;b)胃蛋白酶(0.5mg/ml),存在0.5M乙酸;c)胃蛋白酶(0.1mg/ml),存在0.5M乙酸;和d)蛋白酶K。
图32显示了根据图27中的工作流程进行的标签化反应的DNA片段分析,比较了固定的组织切片上的不同透化处理:a)胃蛋白酶(0.1mg/ml),存在0.5乙酸;b)使用1X核酸外切酶-I缓冲液(67mM甘氨酸KOH,6.7mM MgCl2,10mM β-ME)的化学透化;和c)胶原酶。
图33显示了根据图27中的工作流程进行的标签化反应的DNA片段分析,比较了固定的组织切片上的不同Tn5组装方法:a)在柱上组装的MEDS-Tn5,如(Picelli,S.等,大规模测序项目的Tn5转座酶和标签化操作(Tn5 transposase and tagmentation proceduresfor massively scaled sequencing projects);Genome Res.,卷24,2033-2040(2014));b)溶液中组装的MEDS-Tn5(Picelli等,2014,同上);c)溶液中组装的5′磷酸化寡核苷酸的MEDS-Tn5组装。
图34是一个示意图,显示了评估组装后T4-PNK磷酸化和反应条件对MEDS-Tn5复合物的作用的测试。
图35显示了根据图26中的工作流程进行的标签化反应的DNA片段分析,研究了组装后5′磷酸化与DNA标签化的相容性:a)在柱上组装的MEDS-AB-Tn5,如(Picelli等,2014,同上):b)如a),但在37℃下暴露于T4-PNK反应条件下30分钟;c)如b)但包括T4-PNK酶;和d)条形图,显示在a)-c)中回收的核小体保护的片段的相对比例的定量。
图36显示了根据图28中的工作流程生成的阵列的照片,描绘了DNA标签化物(tagment)连接到捕获探针寡核苷酸上的连接效率,(a)没有组装后磷酸化和(b)有组装后磷酸化。
图37是一个示意图,描绘了本发明的一个代表性实施方式,其中标签化物用具有滑动活性(slippery activity)(例如打滑(stuttering))的聚合酶进行间隙填充,用末端转移酶在3′端(模拟mRNA多聚(A)-尾)产生多聚-A-粘性末端(3′突出端),随后杂交到捕获探针的捕获域(此实施方式将允许mRNA转录本的同时杂交)。或者,可以使用聚合酶在捕获前延伸标签化物。
图38是本发明的代表性实施方式的示意图,其中使用捕获探针的捕获域链(例如,捕获域寡核苷酸)作为连接模板将标签化物连接到部分双链捕获探针。
图39是一个示意图,显示了用于研究全人类基因组磷酸化DNA标签化物连接和下游qPCR分析的操作的代表性工作流程。
图40显示示例性寡核苷酸捕获策略和相应序列的示意图。通过使用对成功连接到表面的标签化物(例如A-short和Nextera反向)或对所有标签化物(例如Nextera正向和Nextera反向)具有特异性的寡核苷酸用qPCR进行读出。
图41A是在各种实验条件下,按照图39所示的工作流程(来自全人类基因组的磷酸化DNA片段的连接)的基础概况的示意图。
图41B显示了根据图39所示的工作流程进行的标签化反应的DNA片段分析。PCR引物对“Ashort Next”覆盖了表面探针和标签化物。该引物对仅在杂交和连接发生时产生PCR产物。样品1和2代表添加了磷酸基团以便于连接的标签化物。样品3和4含有不含磷酸基团的标签化物,作为阴性对照,样品5和6含有MQ水而不是标记。此外,一对Nextera引物(“仅NEXT”,样品7-11)在连接和杂交都发生时显示PCR产物,从而产生来自D和E孔的信号。
图41C显示了PCR产物的比对。图中显示了“Ashort-Next”引物的连接(连接的qPCR产物),而在所有四个阴性对照中发生了最小的连接。
图42是一个示意图,显示了用于研究固定的组织切片中DNA标签化物的透化和标签化条件的操作的代表性工作流程。显示了在预透化过程中用胰蛋白酶或蛋白酶K部分消化蛋白质的结果。
图43根据图42所示的工作流程,显示胶原酶处理后进行蛋白酶-K(图43A)或胰蛋白酶(图43B)预透化对标签化效率的影响的图表。实验设双重复进行。与胰蛋白酶预透化处理或(图43C)阴性对照(磷酸盐阴性标记物)相比,蛋白酶-K预透化处理导致扩增标签化物的均一高信号。
图44是一个示意图,显示了用于研究从固定的组织切片捕获DNA标签化物的操作的代表性工作流程。
图45显示了根据图44所示的工作流程,通过胶原酶和蛋白酶-K预透化处理,从固定的组织切片成功捕获DNA标签化物的图表和照片。各实验设双重复进行:一次用于PCR下游分析,另一次用于使用荧光标记的(Cy5)寡核苷酸(与连接的标签化物互补)进行杂交。磷酸盐阳性样品产生可检测信号(图45A和B),而磷酸盐阴性样品没有(图45C)。图45D显示了苏木精-伊红图像(左)和相应的连接的DNA标签化物空间模式(右),显示了从组织切片成功捕获DNA物。
图46A是示出可用于实现本文所述的各种步骤和方法的示例性样品处理装置的示意图。
图46B是示出可用于获得生物样品、分析物和特征阵列的图像的示例成像设备的示意图。
图46C是图46A和图46B的设备的控制单元的示例的示意图。
具体实施方式
I.引言
本发明描述用于生物样品的空间分析的设备、系统、方法和组合物。本节特别描述了某些通用术语、分析物、样品类型和制备步骤,这些将在本发明的后面部分中提及。
(a)空间分析
组织和细胞可以从任何来源获得。例如,组织和细胞可以从单细胞或多细胞生物体(例如哺乳动物)获得。从哺乳动物(例如,人)获得的组织和细胞通常具有不同的分析物水平(例如,基因和/或蛋白质表达),这可导致细胞形态和/或功能的差异。细胞在组织中的位置可以影响细胞的命运、行为、形态以及与组织中其他细胞的信号传导和串扰。关于哺乳动物组织中不同细胞内分析物水平(基因和/或蛋白质表达)的差异的信息也可以帮助医生基于检测到的组织中不同细胞内分析物水平的差异来选择或给予对单细胞或多细胞生物体(例如哺乳动物)有效的治疗。哺乳动物组织中不同细胞内分析物水平的差异也可以提供组织(例如,健康和患病组织)如何发挥功能和/或发展的信息。哺乳动物组织中不同细胞内分析物水平的差异也可以提供组织中疾病发病机制的不同信息以及组织内治疗作用机制的信息。哺乳动物组织中不同细胞内分析物水平的差异也可以提供有关耐药机制以及哺乳动物组织中耐药机制发展的信息。多细胞生物体(例如哺乳动物)组织中不同细胞内存在或不存在分析物的差异可提供多细胞生物体组织中耐药性机制及其发展的信息。
空间分析方法用于检测哺乳动物组织中的不同细胞内或哺乳动物的单个细胞内的分析物水平(例如,基因和/或蛋白质表达)的差异。例如,空间分析方法可用于检测组织切片样品中不同细胞内分析物水平(例如,基因和/或蛋白质表达)的差异,来自其中的数据可重组以生成从哺乳动物获得的组织样品的分析物水平(例如,基因和/或蛋白质表达)的三维图,例如以一定程度的空间分辨率(例如单细胞分辨率)。
发育系统中的空间异质性通常是通过RNA杂交、免疫组织化学、荧光报告物、预定义的亚群的纯化或诱导以及随后的基因组概况分析(例如RNA-seq)来研究的。然而,这类方法依赖于一组相对较小的预定义标志物,因此引入了限制发现的选择偏差。这些先前的方法也依赖于先验知识。传统上,空间RNA分析依赖于有限数量的RNA物质的染色。相比之下,单细胞RNA测序允许对细胞基因表达(包括非编码RNA)进行深度概况分析,但已建立的方法将细胞从其天然空间环境(native spatial context)中分离出来。
当前的空间分析方法以高空间分辨率为样品中的多种分析物提供大量分析物水平和/或表达数据,例如,同时保留天然空间环境。空间分析方法包括,例如,使用捕获探针,该捕获探针包括空间条形码(例如,提供关于捕获探针在细胞或组织样品(例如,哺乳动物细胞或哺乳动物组织样品)内的位置的信息的核酸序列)和能够结合到由细胞产生或存在于细胞中的分析物(例如,蛋白质和/或核酸)的捕获域。如本文所述,空间条形码可以是具有独特序列、独特荧光团或荧光团的独特组合、独特氨基酸序列、独特重金属或重金属的独特组合,或任何其他独特可检测试剂的核酸。捕获域可以是能够结合到由细胞产生和/或存在于细胞中的分析物的任何试剂(例如,能够与来自细胞的核酸(例如,mRNA、基因组DNA、线粒体DNA或miRNA)杂交的核酸)、分析物的基材或结合伴侣,或与分析物特异性结合的抗体)。捕获探针还可以包括与通用正向和/或通用反向引物序列互补的核酸序列。捕获探针还可包括裂解位点(例如,限制性核酸内切酶的裂解识别位点)、光不稳定键、热敏键或化学敏感键。
可使用多种不同方法检测分析物与捕获探针的结合,例如,核酸测序、荧光团检测、核酸扩增、核酸连接检测和/或核酸裂解产物检测。在一些示例中,检测用于将特定空间条形码与由细胞(例如哺乳动物细胞)产生和/或存在于细胞中的特定分析物相关联。
捕获探针可以例如附接在表面上,例如固体阵列、珠或盖玻片。在某些示例中,捕获探针未附接到表面。在一些实例中,捕获探针可封装于可透化组合物(例如,本文所述的任一基材)的表面内、嵌入该表面内或分层于该表面上。例如,捕获探针可被封装或布置在可透化珠(例如,凝胶珠)内。在一些实例中,捕获探针可封装于基材(例如,本文所述的任一示例性基材,例如水凝胶或多孔膜)的表面内、嵌入该表面内或分层于该表面上。
在一些实施方式中,使细胞或包括细胞的组织样品与附接于基材(例如,基材的表面)的捕获探针接触,并且细胞或组织样品被透化以使分析物从细胞释放并结合到附接于基材的捕获探针。在一些示例中,可使用多种方法(例如,电泳、化学梯度、压力梯度、流体流或磁场)将从细胞释放的分析物主动引导至附接于基材的捕获探针。
在其它示例中,可使用多种方法引导捕获探针与细胞或组织样品相互作用,例如,包括捕获探针中的脂质锚定剂、包括与捕获探针中膜蛋白特异性结合或与膜蛋白形成共价键的试剂、流体流、压力梯度、化学梯度、或磁场。
空间分析方法的非限制性方面在WO 2011/127099、WO 2014/210233、WO 2014/210225、WO 2016/162309、WO 2018/091676、WO 2012/140224、WO 2014/060483、美国专利号10,002,316、美国专利号9,727,810、美国专利申请公开号2017/0016053、Rodriques等,Science 363(6434):1463-1467,2019;WO 2018/045186、Lee等,Nat.Protoc.10(3):442-458,2015;WO 2016/007839、WO 2018/045181、WO 2014/163886、Trejo等,PLoS ONE 14(2):e0212031,2019、美国专利申请公开号2018/0245142、Chen等,Science 348(6233):aaa6090,2015、Gao等,BMC Biol.15:50,2017、WO 2017/144338、WO 2018/107054、WO 2017/222453、WO 2019/068880、WO 2011/094669、美国专利号7,709,198、美国专利号8,604,182、美国专利号8,951,726、美国专利号9,783,841、美国专利号10,041,949、WO 2016/057552、WO 2017/147483、WO 2018/022809、WO 2016/166128、WO 2017/027367、WO 2017/027368、WO2018/136856、WO 2019/075091、美国专利号10,059,990、WO 2018/057999、WO 2015/161173、和Gupta等,Nature Biotechnol.36:1197-1202,2018中描述,并可在本文中以任何组合使用。本文描述了空间分析方法的进一步非限制性方面。
(b)通用术语
在本发明中使用特定术语来解释所描述的设备、系统、方法和组合物的各个方面。本小节包括对本发明后面章节中出现的某些术语的解释。如果本节中的描述与本发明其他章节中的用法明显冲突,则以本节中的定义为准。
(i)条形码
“条形码”是一种标签或标识符,它传递或能够传递信息(例如,关于样品中分析物、珠和/或捕获探针的信息)。条形码可以是分析物的部分,也可以独立于分析物。条形码可以附接于分析物。特定条形码相对于其他条形码可能是独特的。
条形码可以有多种不同的格式。例如,条形码可以包括多核苷酸条形码、随机核酸和/或氨基酸序列以及合成核酸和/或氨基酸序列。条形码可以以可逆或不可逆的方式附接到分析物或另一部分或结构上。例如,在对样品进行测序之前或期间,可以将条形码添加到脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段中。条形码可以允许识别和/或定量个体测序读取结果(例如,条形码可以是或可以包括独特分子标识符或“UMI”)。
条形码可以在空间上解析在生物样品中发现的分子组分,例如,以单细胞分辨率(例如,条形码可以是或可以包括“空间条形码”)。在一些实施方式中,条形码同时包括UMI和空间条形码。在一些实施方式中,条形码包括两个或更多个子条形码,它们一起用作单个条形码。例如,多核苷酸条形码可以包括由一个或多个非条形码序列分隔的两个或更多个多核苷酸序列(例如,子条形码)。
(ii)核酸和核苷酸
术语“核酸”和“核苷酸”旨在与其在本领域中的用途一致,并包括天然存在的物质或其功能类似物。特别有用的核酸功能类似物能够以序列特异性方式与核酸杂交(例如,能够与两种核酸杂交,使得两种杂交的核酸之间可以发生连接),或者能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有含有磷酸二酯键的主链。类似物结构可以具有其他主链连接,包括本领域已知的各种连接中的任何一种。天然存在的核酸通常具有脱氧核糖(例如,存在于脱氧核糖核酸(DNA)中)或核糖(例如,存在于核糖核酸(RNA)中)。
核酸可包含具有本领域已知的这些糖部分的各种类似物中的任何一种的核苷酸。核酸可以包括天然或非天然核苷酸。就此而言,天然脱氧核糖核酸可以具有选自腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G)的一个或多个碱基,并且核糖核酸可以具有选自尿嘧啶(U),腺嘌呤(A),胞嘧啶(C)或鸟嘌呤(G)的一个或多个碱基。本领域已知可包含在核酸或核苷酸中的有用非天然碱基。
(iii)探针和靶标
“探针”或“靶标”,当用于核酸或核酸序列时,意指在方法或组合物的上下文中作为核酸或序列的语义标识符,并且不限制核酸或序列的结构或功能超出明确指示的范围。
(iv)寡核苷酸和多核苷酸
术语“寡核苷酸”和“多核苷酸”可互换地用于指长度为约2至约500个核苷酸的核苷酸单链多聚体。寡核苷酸可以合成的,酶法(例如通过聚合)制备的,或使用“拆分-汇集”方法制备。寡核苷酸可以包括核糖核苷酸单体(即,可以是寡核糖核苷酸)和/或脱氧核糖核苷酸单体(即,寡脱氧核糖核苷酸)。在一些示例中,寡核苷酸可包括寡核苷酸中脱氧核糖核苷酸单体及核糖核苷酸单体的组合(例如,脱氧核糖核苷酸单体及核糖核苷酸单体的随机或有序组合)。例如,寡核苷酸的长度可以是4到10、10到20、21到30、31到40、41到50、51到60、61到70、71到80、80到100、100到150、150到200、200到250、250到300、300到350、350到400、或400到500个核苷酸。寡核苷酸可包括(例如,共价或非共价)附接到多聚体结构的一个或多个功能部分。例如,寡核苷酸可以包括一个或多个可检测的标记(例如,放射性同位素或荧光团)。
(v)对象
“对象”是一种动物,如哺乳动物(如人或非人猿),或禽类(如鸟),或其他生物体,如植物。对象的实例包括但不限于哺乳动物,例如啮齿类动物、小鼠、大鼠、兔、豚鼠、有蹄类动物、马、绵羊、猪、山羊、牛、猫、狗、灵长类动物(即人类或非人灵长类动物);植物,例如拟南芥(Arabidopsis thaliana)、玉米、高粱、燕麦、小麦、水稻、油菜或大豆;藻类,例如莱茵衣藻(Chlamydomonas reinhardtii);线虫,如秀丽隐杆线虫(Caenorhabditis elegans);昆虫,如黑腹果蝇(Drosophila melanogaster)、蚊子、果蝇或蜜蜂;蛛形纲动物,如蜘蛛;鱼类,如斑马鱼;爬行动物;两栖动物,如青蛙或非洲爪蟾(Xenopus laevis);盘基网柄菌(Dictyostelium discoideum);真菌,如卡氏肺孢子虫(Pneumocystis carinii)、红鳍东方纯(Takifugu rubripes)、酵母,酿酒酵母(Saccharamoyces cerevisiae)或庞贝裂殖酵母(Schizosaccharomyces pombe);或恶性疟原虫(Plasmodium falciparum)。
(vi)基因组
“基因组”通常指来自对象的基因组信息,例如,可以是对象基因编码的遗传信息的至少部分或全部。基因组可以包括编码区(例如,编码蛋白质的区域)以及非编码区。基因组可以包括对象部分或全部染色体的序列。例如,人类基因组通常总共有46条染色体。这些的部分或全部序列可以构成基因组。
(vii)衔接子(adaptor),接合物(adapter)和标签
“衔接子”、“接合物”和“标签”是在本公开中可以互换使用的术语,并且是指可以使用包括(但不限于)连接、杂交和标签化的许多不同技术中的任一种来(在称为“标签化”的过程中)耦合到多核苷酸序列的物质。衔接子也可以是添加功能的核酸序列,例如间隔子序列、引物序列/位点、条形码序列、独特分子标识符序列。
(viii)杂合、杂交、退火(annealing)和链重组(anneal)
术语“杂合”、“杂交”、“退火”和“链重组”在本公开中可交换地使用,并指两个不同分子内基本互补或互补核酸序列的配对。配对可以通过任何过程实现,其中核酸序列通过碱基配对与基本互补或完全互补的序列连接以形成杂交复合物。为了杂交的目的,如果两个核酸序列中至少60%(例如,至少70%、至少80%或至少90%)的个体碱基彼此互补,则两个核酸序列是“基本互补的”。
(ix)引物
“引物”是具有3′末端的单链核酸序列,可在核酸延伸反应中用作核酸聚合酶的底物。RNA引物由RNA核苷酸形成,用于RNA合成,而DNA引物由DNA核苷酸组成,用于DNA合成。引物还可以包括RNA核苷酸和DNA核苷酸(例如,以随机或设计的模式)。引物还可以包括本文所述的具有其它功能性的其他天然或合成核苷酸。在一些示例中,DNA引物可用于引发RNA合成,反之亦然(例如,RNA引物可用于引发DNA合成)。引物的长度可以不同。例如,引物可以是约6个碱基到约120个碱基。例如,引物可包括多达约25个碱基。
(x)引物延伸
“引物延伸”是指其中两个核酸序列(例如,来自两个不同捕获探针中每一个的恒定区域)通过其各自末端互补核酸序列(例如,3′末端)的重叠而连接(例如,杂交)的任何方法。在这种连接之后,可以使用另一个核酸序列作为延伸模板来进行一个或两个末端的核酸延伸(例如,酶延伸)。酶延伸可由包括但不限于聚合酶和/或逆转录酶的酶来进行。
(xi)邻近连接
“邻近连接”是通过酶手段(例如连接酶)连接彼此邻近的两个(或更多)核酸序列的方法。在一些实施方式中,邻近连接可包括“间隙填充”步骤,该步骤涉及基于模板核酸分子的核酸序列通过聚合酶在跨越两个感兴趣核酸分子之间的距离上纳入一个或多个核酸(参见,例如,美国专利号7264929,其全部内容通过引用纳入本文)。
各种不同的方法可用于邻近连接核酸分子,包括(但不限于)“粘端”和“钝端”连接。此外,单链连接可用于对单链核酸分子进行邻近连接。粘端邻近连接是在连接事件发生之前,将待连接的两个核酸分子之间的互补单链序列杂交。钝端邻近连接通常不包括来自每个核酸分子的互补区域的杂交,因为两个核酸分子在连接位点都缺乏单链突出端。
(xii)核酸延伸
“核酸延伸”通常涉及以模板依赖的方式将一个或多个核酸(例如,A、g、C、T、U、核苷酸类似物或其衍生物)纳入分子(例如但不限于核酸序列)中,使得连续的核酸被酶(例如聚合酶或逆转录酶)纳入,从而生成新合成的核酸分子。例如,通过使用互补核酸序列作为核酸合成的模板,可以使用与互补核酸序列杂交的引物来合成新的核酸分子。类似地,与多聚(dT)序列(例如,捕获域)杂交的mRNA转录物的3′多聚腺苷酸化尾可以用作相应cDNA分子的单链合成的模板。
(xiii)PCR扩增
“PCR扩增”是指利用聚合酶链反应(PCR)生成遗传物质的拷贝,包括DNA和RNA序列。例如,在美国专利号4683202、4683195、4800159、4965188和5512462中描述了实施PCR的合适试剂和条件,其全部内容通过引用纳入本文中。在典型的PCR扩增中,反应混合物包括待扩增的遗传物质、酶、用于引物延伸反应的一个或多个引物以及用于反应的试剂。寡核苷酸引物的长度足以在退火条件下与互补遗传物质杂交。引物的长度通常取决于扩增结构域的长度,但通常为至少4个碱基、至少5个碱基、至少6个碱基、至少8个碱基、至少9个碱基、至少10个碱基对(bp)、至少11bp、至少12bp、至少13bp、至少14bp、至少15bp、至少16bp、至少17bp、至少18bp,至少19bp,至少20bp,至少25bp,至少30bp,至少35bp,可以长达40bp或更长,其中引物的长度一般在18-50bp之间。遗传物质可与单个引物或一组两个引物(正向和反向引物)接触,这取决于是否需要对遗传物质进行引物延伸、线性或指数扩增。
在一些实施方式中,PCR扩增过程使用DNA聚合酶。DNA聚合酶活性可由一种或多种不同的DNA聚合酶提供。在某些实施方式中,DNA聚合酶来自细菌,例如,DNA聚合酶是细菌DNA聚合酶。例如,DNA聚合酶可以来自大肠杆菌属、芽孢杆菌属、嗜热杆菌属或热球菌属的细菌。
可使用的DNA聚合酶的合适实例包括但不限于:大肠杆菌DNA聚合酶I、Bsu DNA聚合酶、Bst DNA聚合酶、Taq DNA聚合酶、VENTTM DNA聚合酶,DEEPVENTTM DNA聚合酶,
Figure BDA0003042696400000221
Taq DNA聚合酶,
Figure BDA0003042696400000222
热启动Taq DNA聚合酶,Crimson
Figure BDA0003042696400000223
TaqDNA聚合酶,Crimson Taq DNA聚合酶,
Figure BDA0003042696400000224
DNA聚合酶,
Figure BDA0003042696400000225
Quick
Figure BDA0003042696400000226
DNA聚合酶,Hemo
Figure BDA0003042696400000227
DNA聚合酶,
Figure BDA0003042696400000228
DNA聚合酶,
Figure BDA0003042696400000229
DNA聚合酶,
Figure BDA00030426964000002210
高保真DNA聚合酶,铂PfxDNA聚合酶、AccuPrime Pfx DNA聚合酶、Phi29 DNA聚合酶、Klenow片段、Pwo DNA聚合酶、Pfu DNA聚合酶、T4 DNA聚合酶和T7 DNA聚合酶。
术语“DNA聚合酶”不仅包括天然存在的酶,还包括其所有修饰衍生物,还包括天然存在的DNA聚合酶的衍生物。例如,在一些实施方式中,DNA聚合酶可经修饰以去除5′-3′核酸外切酶活性。可使用的DNA聚合酶的序列修饰衍生物或突变体包括但不限于保留至少部分功能的突变体,例如野生型序列的DNA聚合酶活性。在不同的反应条件下,如温度、模板浓度、引物浓度等,突变可影响酶的活性概况,如提高或降低聚合速率。突变或序列修饰也可能影响酶的核酸外切酶活性和/或热稳定性。
在一些实施方式中,PCR扩增可包括诸如但不限于链置换扩增反应、滚环扩增反应、连接酶链反应、转录介导的扩增反应、等温扩增反应和/或环介导的扩增反应的反应。
在一些实施方式中,PCR扩增使用与靶DNA片段的3′标签互补的单个引物。在一些实施方式中,PCR扩增使用第一和第二引物,其中第一引物的至少3′末端部分与目标核酸片段的3′标签的至少部分互补,以及其中所述第二引物的至少3′末端部分展示所述靶核酸片段的5′标签的至少部分的序列。在一些实施方式中,第一引物的5′末端部分与目标核酸片段的3′标签不互补,并且第二引物的5′末端部分不展示目标核酸片段的5′标签的至少部分的序列。在一些实施方式中,第一引物包括第一通用序列和/或第二引物包括第二通用序列。
在一些实施方式中(例如,当PCR扩增对捕获的DNA进行扩增时),可以使用DNA连接酶将PCR扩增产物连接到其它序列。DNA连接酶活性可由一种或多种不同的DNA连接酶提供。在一些实施方式中,DNA连接酶来自细菌,例如,DNA连接酶是细菌DNA连接酶。在一些实施方式中,DNA连接酶来自病毒(例如,噬菌体)。例如,DNA连接酶可以是T4 DNA连接酶。适用于连接步骤的其他酶包括但不限于Tth DNA连接酶、Taq DNA连接酶、热球菌属(菌株9oN)DNA连接酶(9oNTM DNA连接酶,可从马萨诸塞州伊普斯维奇的新英格兰生物实验室(New EnglandBiolabs)获得)和AmpligaseTM(可从威斯康星州麦迪逊的艾匹森特生物技术公司(Epicentre Biotechnologies)获得)。也可以使用衍生物,例如序列修饰的衍生物和/或其突变体。
在一些实施方式中,通过逆转录聚合酶链反应(RT-PCR)扩增遗传物质。期望的逆转录酶活性可由一种或多种不同的逆转录酶提供,其合适实例包括但不限于:M-MLV、MuLV、AMV、HIV、ArrayScriptTM、MultiScribeTM、ThermoScriptTM、和
Figure BDA0003042696400000231
I、II、III和IV酶。“逆转录酶”不仅包括天然存在的酶,而且包括其所有此类修饰衍生物,还包括天然存在的逆转录酶的衍生物。
此外,可以使用M-MLV、MuLV、AMV和HIV逆转录酶的序列修饰衍生物或突变体来进行逆转录,包括保留野生型序列的至少一些功能性(例如逆转录酶)活性的突变体。所述逆转录酶可作为包含其他组分的组合物的部分提供,例如增强或改善所述逆转录酶活性的稳定组分,例如RNA酶抑制剂、DNA依赖性DNA合成的抑制剂,例如,放线菌素D。许多逆转录酶的序列修饰衍生物或突变体,例如M-MLV,以及包括未修饰和修饰酶的组合物,例如ArrayScriptTM、MultiScribeTM、ThermoScriptTM、和
Figure BDA0003042696400000232
I、II、III和IV酶是市售可得的。
某些逆转录酶(例如禽成髓细胞增多症病毒(AMV)逆转录酶和莫罗尼鼠白血病病毒(M-MuLV,MMLV)逆转录酶)可以使用RNA(cDNA合成)和单链DNA(ssDNA)作为模板来合成互补DNA链。因此,在一些实施方式中,逆转录反应可使用能够使用RNA和ssDNA两者作为延伸反应模板的酶(逆转录酶),例如AMV或MMLV逆转录酶。
在一些实施方式中,RNA和/或DNA的定量通过实时PCR(也称为定量PCR或qPCR),使用本领域众所周知的技术进行,例如但不限于“TAQMANTM”或
Figure BDA0003042696400000241
或在毛细管上(“
Figure BDA0003042696400000242
毛细管”)。在一些实施方式中,通过光吸收率和实时PCR来确定遗传物质的定量。在一些实施方式中,通过数字PCR来确定遗传物质的定量。在一些实施方式中,所分析的基因可对应于表达(mRNA)和数量(DNA)与参考核酸提取物(DNA和RNA)进行比较,以便比较靶核酸的表达水平。
(xiv)抗体
“抗体”是一种多肽分子,其识别并结合互补的靶抗原。抗体通常具有类似Y形的分子结构形状。自然产生的抗体,被称为免疫球蛋白,属于免疫球蛋白类IgG、IgM、IgA、IgD和IgE之一。抗体也可以人工合成。例如,作为单克隆抗体的重组抗体可以通过从源细胞中回收抗体基因、扩增到适当的载体中并将载体引入宿主以使宿主表达重组抗体来使用合成基因来合成。一般来说,可以使用合适的寡核苷酸引物和/或杂交探针从任何抗体产生动物物种中克隆重组抗体。重组技术可用于生成抗体和抗体片段,包括非内源性物质。
合成抗体可以从非免疫球蛋白来源获得。例如,抗体可由核酸(例如适配子)和非免疫球蛋白支架(例如肽适配子)产生,其中插入高变环以形成抗原结合位点。基于核酸或肽结构的合成抗体可以比免疫球蛋白衍生的抗体小,从而导致更大的组织透化。
抗体还可以包括亲和体蛋白(affimer protein),亲和体蛋白是通常具有约12-14kDa分子量的亲和试剂。亲和体蛋白通常以高亲和力和特异性结合靶标(例如,靶蛋白)。此类靶标的实例包括但不限于泛素链、免疫球蛋白和C-反应蛋白。在一些实施方式中,亲和体蛋白衍生自半胱氨酸蛋白酶抑制剂,并且包括肽环和提供结合位点的可变N-末端序列。
抗体还可以包括单域抗体(VHH结构域和VNAR结构域)、scFv和Fab片段。
(xv)亲和基团
“亲和基团”是具有与另一特定或具体分子或部分缔合或结合的高亲和性或偏好的分子或分子部分。与另一特定或具体分子或部分的缔合或结合可以通过非共价相互作用,例如氢键、离子力和范德华相互作用。例如,亲和基团可以是生物素,其具有与蛋白亲和素或链霉亲和素缔合或结合的高亲和性或偏好。例如,亲和基团也可指与生物素具有亲和性的亲和素或链霉亲和素。亲和基团及其结合或缔合的特定或具体分子或部分的其它实例包括但不限于抗体或抗体片段及其各自的抗原,例如地高辛和抗地高辛抗体、凝集素和碳水化合物(例如,糖、单糖、双糖或多糖),以及受体和受体配体。
任何一对亲和基团及其与之结合或缔合的特定或具体分子或部分可使其作用逆转,例如,在第一分子和第二分子之间,在第一实例中,第一分子被表征为第二分子的亲和基团,在第二实例中,第二分子被表征为第一分子的亲和基团。
(xvi)标记物,可检测标记物和光学标记物
术语“可检测标记物”、“光学标记物”和“标记物”在本文中可互换使用以指与待检测分子(例如,捕获探针或分析物)相关联(例如,偶联)的直接或间接可检测部分。可检测标记物可由其自身而可直接检测(例如,放射性同位素标记物或荧光标记物),或者,在酶标记物的情况下,可以是可间接检测的,例如,通过催化底物化合物或组合物的化学改变,该底物化合物或组合物可直接检测。可检测标记物可适于小规模检测和/或适于高通量筛选。因此,合适的可检测标记物包括但不限于放射性同位素、荧光团、化学发光化合物、生物发光化合物和染料。
可检测标记物可被定性检测(例如,光学或光谱),或可被定量。定性检测通常包括确认可检测标记物的存在或出现的检测方法,而可定量检测通常包括具有可定量(例如,数字可报告)值的检测方法,例如强度、持续时间、偏振和/或其他性质。在一些实施方式中,可检测标记物被结合到特征或与特征相关联的捕获探针。例如,被可检测标记的特征可包括附接于珠的荧光、比色或化学发光标记物(参见例如,Rajeswari等,J.Microbiol Methods139:22-28,2017,和Forcucci等,J.Biomed Opt.10:105010,2015,其全部内容通过引用纳入本文)。
在一些实施方式中,可将多个可检测标记物附接到待检测的特征、捕获探针或组合物。例如,可检测标记物可在核酸聚合或扩增期间纳入(例如,
Figure BDA0003042696400000261
-标记核苷酸,例如
Figure BDA0003042696400000262
)。可以使用任何合适的可检测标记物。在一些实施方式中,可检测标记物是荧光团。例如,荧光团可来自以下组:7-AAD(7-氨基放线菌素D)、吖啶橙(+DNA)、吖啶橙(+RNA)、
Figure BDA0003042696400000263
Figure BDA0003042696400000264
别藻蓝蛋白(APC)、AMCA/AMCA-X、7-氨基放线菌素D(7-AAD)、7-氨基-4-甲基香豆素、6-氨基喹啉、苯胺蓝、ANS、APC-Cy7、ATTO-TAGTMCBQCA,ATTO-TAGTM FQ、金胺O-Feulgen、BCECF(高pH)、BFP(蓝色荧光蛋白)、BFP/GFP FRET、BOBOTM-1/BO-PROTM-1、BOBOTM-3/BO-PROTM-3、
Figure BDA0003042696400000265
Figure BDA0003042696400000266
Figure BDA0003042696400000267
BTC、钙黄绿素、钙黄绿素蓝、Calcium CrimsonTM,Calcium Green-1TM,Calcium OrangeTM
Figure BDA0003042696400000268
白,5-羧基荧光素(5-FAM),5-羧基萘荧光素,6-羧基罗丹明6G,5-羧基四甲基罗丹明(5-TAMRA),羧基-X-罗丹明(5-ROX),Cascade
Figure BDA0003042696400000269
CascadeYellowTM,CCF2(GeneBLAzerTM)、CFP(青色荧光蛋白)、CFP/YFP FRET、色霉素A3、C1-NERF(低pH)、CPM、6-CR 6G、CTC-甲
Figure BDA00030426964000002611
Figure BDA00030426964000002610
Figure BDA0003042696400000271
Cychrome(PE-Cy5)、丹磺酰胺、丹磺酰尸胺、丹氨酰氯、DAPI、达考氧基(Dapoxyl)、DCFH、DHR、DiA(4-Di-16-ASP)、DiD(DilC18(5))、DIDS、Di1(DilC18(3))、DiO(DiOC18(3))、DiR(DilC18(7))、Di-4ANEPPS、Di-8ANEPPS、DM-NERF(4.5-6.5pH)、DsRed(红色荧光蛋白)、EBFP、ECFP、EGFP、
Figure BDA0003042696400000272
醇、曙红、红霉素、溴化乙锭、乙锭同二聚体-1(EthD-1)、氯化铕(III)、5-FAM(5-羧基荧光素)、快蓝、荧光素dT磷酰胺、FITC、Fluo-3、Fluo-4、
Figure BDA0003042696400000273
Fluoro-GoldTM(高pH),Fluoro-GoldTM(低pH)、Fluoro-Jade、
Figure BDA0003042696400000274
Fura-2(高钙)、Fura-2/BCECF、FuraRedTM(高钙),Fura RedTM/Fluo-3,GeneBLAzerTM(CCF2),GFP红移(rsGFP),GFP野生型,GFP/BFP-FRET,GFP/DsRed-FRET,Hoechst 33342&33258,7-羟基-4-甲基香豆素(pH9),1,5-吲哚乙酸,Indo-1(高钙),Indo-1(低钙),吲哚二碳菁,吲哚三碳菁,JC-1,6-JOE,JOJOTM-1/JO-PROTM-1,LDS 751(+DNA),LDS 751(+RNA),LOLOTM-1/LO-PROTM-1,路西法黄,LysoSensorTM蓝(pH5),LysoSensorTM绿(pH5),LysoSensorTM黄/蓝(pH 4.2)、
Figure BDA0003042696400000275
绿、
Figure BDA0003042696400000276
红、
Figure BDA0003042696400000277
黄、Mag-Fura-2、Mag-Indo-1、Magnesium GreenTM,Marina
Figure BDA0003042696400000278
4-甲基伞形酮,米特拉霉素,
Figure BDA0003042696400000279
绿,
Figure BDA00030426964000002710
橙,
Figure BDA00030426964000002711
红,NBD(胺),尼罗红,Oregon
Figure BDA00030426964000002712
Oregon
Figure BDA00030426964000002713
Oregon
Figure BDA00030426964000002714
太平洋蓝,PBF1,PE(R-藻红蛋白),PE-Cy5,PE-Cy7,PE-德州红,PerCP(多甲藻黄素叶绿素蛋白质),PerCP-Cy5.5(TruRed),PharRed(APC-Cy7),C-藻蓝蛋白、R-藻蓝蛋白、R-藻红蛋白(PE)、PI(碘化丙啶)、PKH26、PKH67、POPOTM-1/PO-PROTM-1,POPOTM-3/PO-PROTM-3,碘化丙啶(PI),PyMPO,芘,吡咯啉Y,量子红(PE-Cy5),喹吖因氮芥,R670(PE-Cy5),Red 613(PE-德州红),红色荧光蛋白(DsRed),试卤灵,RH 414,Rhod-2,罗丹明B,RhodamineGreenTM,Rhodamine RedTM,罗丹明鬼笔环肽,罗丹明110,罗丹明123,5-ROX(羧基-X-罗丹明),S65A,S65C,S65L,S65T,SBFI,SITS,
Figure BDA00030426964000002715
(高pH),
Figure BDA0003042696400000281
(高pH),
Figure BDA0003042696400000282
(低pH),Sodium GreenTM
Figure BDA0003042696400000283
Figure BDA0003042696400000284
Figure BDA0003042696400000285
蓝,
Figure BDA0003042696400000286
绿,
Figure BDA0003042696400000287
橙,5-TAMRA(5-羧基四甲基罗丹明),四甲基罗丹明(TRITC),Texas
Figure BDA0003042696400000288
Texas
Figure BDA0003042696400000289
(NHS酯),硫杂二羰花青,噻唑橙,
Figure BDA00030426964000002810
Figure BDA00030426964000002811
三色(PE-Cy5)、TRITC(四甲基罗丹明)、TruRed(PerCP-Cy5.5)、WW 781、X-罗丹明(XRITC)、Y66F、Y66H、Y66W、YFP(黄色荧光蛋白)、
Figure BDA00030426964000002812
Figure BDA00030426964000002813
6-FAM(荧光素)、6-FAM(NHS酯)、6-FAM(叠氮化物)、HEX、TAMRA(NHS酯),Yakima黄,MAX,TET,TEX615,ATTO 488,ATTO 532,ATTO 550,ATTO 565,ATTO Rho101,ATTO 590,ATTO 633,ATTO647N,TYE 563,TYE 665,TYE 705,
Figure BDA00030426964000002814
Figure BDA00030426964000002815
(NHS酯),WellRED D4染料,WellRED D3染料,WellRED D2染料,
Figure BDA00030426964000002816
(NHS酯)和Dy 750(NHS酯)。
如上所述,在一些实施方式中,可检测标记物是或包括发光或化学发光部分。常见的发光/化学发光部分包括但不限于过氧化物酶,例如辣根过氧化物酶(HRP)、大豆过氧化物酶(SP)、碱性磷酸酶和荧光素酶。这些蛋白质部分可在给定适当底物(例如氧化试剂加化学发光化合物)的情况下催化化学发光反应。许多化合物家族已知在各种条件下提供化学发光。化学发光化合物家族的非限制性实例包括2,3-二氢-1,4-酞嗪二酮鲁米那,5-氨基-6,7,8-三甲氧基-和二甲氨基[ca]苯类似物。这些化合物在碱性过氧化氢或次氯酸钙和碱存在下能发光。化学发光化合物家族的其它实例包括(例如)2,4,5-三苯基咪唑、对二甲氨基和-甲氧基取代基、草酸盐(例如草酰基活性酯)、对硝基苯基、N-烷基吖啶酯、荧光素、光泽精或吖啶酯。
(xvii)模板转换寡核苷酸
“模板转换寡核苷酸”是一种寡核苷酸,在逆转录过程中与通过逆转录酶(例如,具有末端转移酶活性的酶)添加的未模板化的核苷酸杂交。在一些实施方式中,模板转换寡核苷酸与通过逆转录酶添加的未模板化的多聚(C)核苷酸杂交。在一些实施方式中,模板转换寡核苷酸向用于cDNA扩增的全长cDNA添加共同5′序列。
在一些实施方式中,模板转换寡核苷酸将共同序列添加到正被逆转录的RNA的5′端。例如,模板转换寡核苷酸可与添加到cDNA分子末端的未模板化的多聚(C)核苷酸杂交,并为逆转录酶提供模板以继续复制到模板转换寡核苷酸的5′末端,从而生成能够进行进一步扩增的全长cDNA。在一些实施方式中,一旦生成全长eDNA分子,模板转换寡核苷酸可作为eDNA扩增反应中的引物。
在一些实施方式中,在逆转录或其他基于末端转移酶的反应之前、同时或之后添加模板转换寡核苷酸。在一些实施方式中,捕获探针中包括模板转换寡核苷酸。在某些实施方式中,使用模板转换寡核苷酸的样品分析方法可涉及从组织样品的分析物生成核酸产物,随后使用模板转换寡核苷酸进一步处理核酸产物。
模板转换寡核苷酸可以包括杂交区和模板区。杂交区可以包括能够与靶标杂交的任何序列。在一些实施方式中,杂交区例如可包括连续G碱基以与eDNA分子3′端的突出端C碱基互补。连续G碱基可包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或超过5个G碱基。模板序列可以包括待纳入eDNA的任何序列。在其它实施方式中,除了至少一个G碱基之外,杂交区可包括至少一个碱基。在其它实施方式中,杂交可包括非G碱基的碱基。在一些实施方式中,模板区包括至少1个(例如,至少2个、3个、4个、5个或更多)标签序列和/或功能序列。在一些实施方式中,模板区和杂交区由间隔子分开。
在一些实施方式中,模板区包括条形码序列。条形码序列可以作为空间条形码和/或作为独特分子标识符发挥作用。模板转换寡核苷酸可包括脱氧核糖核酸;核糖核酸;修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2′-脱氧肌苷、超T(5-羟基丁基-2′-脱氧尿苷)、超G(8-氮杂-7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如,UNA-A、UNA-U、UNA-C、UNA-g)、Iso-dG、Iso-dC、2′氟碱基(例如,氟C、氟U、氟A和氟G)或上述的任何组合。
在一些实施方式中,模板转换寡核苷酸的长度可至少为约1、2、10、20、50、75、100、150、200或250个核苷酸或更长。在一些实施方式中,模板转换寡核苷酸的长度最多可为约2、10、20、50、100、150、200或250个核苷酸或更长。
(xviii)夹板寡核苷酸
“夹板寡核苷酸”是一种寡核苷酸,当与其他多核苷酸杂交时,它起到“夹板”的作用,使多核苷酸彼此相邻,以便它们可以连接在一起。在一些实施方式中,夹板寡核苷酸是DNA或RNA。夹板寡核苷酸可以包括与来自两个或更多个不同寡核苷酸的核苷酸序列部分互补的核苷酸序列。在一些实施方式中,夹板寡核苷酸协助连接“供体”寡核苷酸和“受体”寡核苷酸。一般来说,RNA连接酶、DNA连接酶或其他种类的连接酶用于将两个核苷酸序列连接在一起。
在一些实施方式中,夹板寡核苷酸的长度在10到50个寡核苷酸之间,例如,长度在10到45个、10到40个、10到35个、10到30个、10到25个或10到20个寡核苷酸之间。在一些实施方式中,夹板寡核苷酸的长度介于15和50、15和45、15和40、15和35、15和30、15和30或15和25个核苷酸之间。
(c)分析物
本公开中描述的设备、系统、方法和组合物可用于检测和分析多种不同的分析物。就本发明而言,“分析物”可包括任何待分析的生物物质、结构、部分或组分。术语“靶标”可以类似地指感兴趣的分析物。
分析物可大致分为两类:核酸分析物和非核酸分析物。非核酸分析物的实例包括但不限于脂质、碳水化合物、肽、蛋白质、糖蛋白(N-连接或O-连接)、脂蛋白、磷蛋白、蛋白质的特定磷酸化或乙酰化变体、蛋白质的酰胺化变体、蛋白质的羟基化变体、蛋白质的甲基化变体,蛋白质泛素化变体、蛋白质硫酸化变体、病毒外壳蛋白、胞外和胞内蛋白质、抗体和抗原结合片段。在一些实施方式中,分析物可以是细胞器(例如,细胞核或线粒体)。
对应于分析物的细胞表面特征可包括但不限于受体、抗原、表面蛋白、跨膜蛋白、分化蛋白簇、蛋白通道、蛋白泵、载体蛋白、磷脂、糖蛋白、糖脂、细胞-细胞相互作用蛋白复合物,抗原呈递复合物、主要组织相容性复合物、工程化T细胞受体、T细胞受体、B细胞受体、嵌合抗原受体、胞外基质蛋白、细胞表面蛋白的翻译后修饰(例如,磷酸化、糖基化、泛素化、亚硝化、甲基化、乙酰化或脂质化)状态、间隙连接和粘附连接。
分析物可来自特定类型的细胞和/或特定的亚细胞区域。例如,分析物可以来自细胞质、细胞核、线粒体、微粒体,更一般地说,来自细胞的任何其他隔室、细胞器或部分。特定靶向某些细胞室和细胞器的透化剂可用于选择性地从细胞释放分析物以进行分析。
核酸分析物的实例包括DNA分析物,例如基因组DNA、甲基化DNA、特定甲基化DNA序列、片段化DNA、线粒体DNA、原位合成PCR产物和RNA/DNA杂合体。
核酸分析物的实例还包括RNA分析物,例如各种类型的编码和非编码RNA。不同类型的RNA分析物包括信使RNA(mRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、小RNA(miRNA)和病毒RNA。RNA可以是转录物(例如,存在于组织切片中)。RNA可以是小的(例如,长度小于200个核酸碱基)或大的(例如,长度大于200个核酸碱基的RNA)。小RNA主要包括5.8S核糖体RNA(rRNA)、5S rRNA、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snRNA)、Piwi相互作用RNA(piRNA)、tRNA衍生的小RNA(tsRNA)和小rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。RNA可以是细菌rRNA(例如,16srRNA或23s rRNA)。
分析物的其他实例包括mRNA和细胞表面特征(例如,使用本文所述的标记剂)、mRNA和胞内蛋白质(例如,转录因子)、mRNA和细胞甲基化状态、mRNA和可获得的染色质(例如,ATAC-seq、DNA酶-seq和/或微球菌酶-seq)、mRNA和代谢物(例如,使用本文所述的标记剂)、条码化的标记剂(例如,本文所述的寡核苷酸标记抗体)和免疫细胞受体(例如,T细胞受体)的V(D)J序列、mRNA和扰动剂(例如,CRISPR crRNA/sgRNA、TALEN、锌指核酸酶、和/或如本文所述的反义寡核苷酸)。
分析物可包括具有编码免疫细胞受体(例如TCR或BCR)的V(D)J序列的至少部分的核酸序列的核酸分子。在一些实施方式中,核酸分子是首先使用含多聚(T)的引物从相应mRNA的逆转录生成的cDNA。然后可以使用捕获探针对生成的cDNA进行条码化,该捕获探针具有与所生成的cDNA的至少部分杂交的条形码序列(和可选的UMI序列)。在一些实施方式中,模板转换寡核苷酸与通过逆转录酶添加到cDNA 3′端的多聚(C)尾杂交。原始的mRNA模板和模板转换寡核苷酸可以从cDNA中变性,然后条码化捕获探针可以与cDNA杂交并生成cDNA的互补物。在2017年10月18日提交的PCT专利申请PCT/US2017/057269和2017年11月29日提交的美国专利申请序列号15/825,740中描述了适用于对从mRNA转录物生成的cDNA进行条码化的其他方法和组合物,所述mRNA转录物包括编码免疫细胞受体的V(D)J区域的那些,和/或包括模板转换寡核苷酸的组合物和条码化方法,二者均通过引用全文纳入本文。V(D)J分析也可以通过使用一种或多种与免疫细胞特定表面特征结合并与条形码序列相关联的标记剂来完成。一种或多种标记剂可包括MHC或MHC多聚体。
如上所述,所述分析物可包括能够作为基因编辑反应的组分发挥作用的核酸,例如,基于规律成簇的间隔短回文重复序列(CRISPR)的基因编辑。因此,捕获探针可包括与分析物互补的核酸序列(例如,可与CRISPR RNA(crRNA)、单向导RNA(sgRNA)杂交的序列,或工程化到crRNA或sgRNA中的衔接子序列)。
在某些实施方式中,可从活细胞中提取分析物。可以调整加工条件,以确保生物样品在分析过程中保持活性,并从样品的活细胞中提取(或释放)分析物。活细胞衍生的分析物只能从样品中获得一次,或者可以从继续保持存活状态的样品中每隔一段时间获得。
一般而言,所述系统、设备、方法和组合物可用于分析任意数量的分析物。例如,所分析的分析物的数量可为至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约20,至少约25、至少约30、至少约40、至少约50、至少约100、至少约1000、至少约10000、至少约100000或更多种不同分析物存在于样品区域中或基材的个体特征内。用于进行多重分析以分析两个或更多不同分析物的方法将在本发明的后续部分中讨论。
(d)生物样品
(i)生物样品的类型
从对象处获取“生物样品”,以使用各种技术中的任一种进行分析,包括但不限于活检、手术和激光捕获显微镜(LCM),并且通常包括来自对象的细胞和/或其他生物材料。除上述对象外,还可从原核生物,例如细菌,例如大肠杆菌、葡萄球菌或肺炎支原体;古细菌;病毒,例如丙型肝炎病毒或人类免疫缺陷病毒;或类病毒获得生物样品。生物样品可以从非哺乳动物生物体(如植物、昆虫、蛛形纲动物、线虫、真菌或两栖动物)获得。生物样品也可以从真核生物中获得,例如患者来源的类器官(PDO)或患者来源的异种移植物(PDX)。可从中获得生物样品的对象可以是健康或无症状的个体、患有或怀疑患有疾病的个体(例如,患有癌症等疾病的患者)或对疾病有预处置的个体,和/或需要治疗或怀疑需要治疗的个体。
生物样品可以包括任何数量的大分子,例如细胞大分子和细胞器(例如线粒体和细胞核)。生物样品可以是核酸样品和/或蛋白质样品。生物样品可以是碳水化合物样品或脂质样品。生物样品可以作为组织样品获得,例如组织切片、活检、核心活检、针吸或细针吸。样品可以是液体样品,例如血液样品、尿液样品或唾液样品。样品可以是皮肤样品、结肠样品、颊拭子、组织学样品、组织病理学样品、血浆或血清样品、肿瘤样品、活细胞、培养细胞、临床样品,例如全血或血液衍生产品、血细胞或培养组织或细胞,包括细胞悬浮液。
无细胞生物样品可包括胞外多核苷酸。胞外多核苷酸可以从身体样品,例如血液、血浆、血清、尿液、唾液、粘膜排泄物、痰、粪便和眼泪中分离出来。
生物样品可来自本文所述的对象或生物体的同质培养物或群体,或可替代地来自例如群落或生态系统中的若干不同生物体的集合。
生物样品可以包括一个或多个病变细胞。病变细胞可以具有改变代谢特性、基因表达、蛋白质表达和/或形态特征。疾病的例子包括炎症紊乱、代谢紊乱、神经系统紊乱和癌症。癌细胞可以来源于实体瘤、血液系统恶性肿瘤、细胞系,也可以以循环肿瘤细胞形式获得。
生物样品也可以包括胎儿细胞。例如,可以进行诸如羊膜穿刺术之类的操作以从母体循环获得胎儿细胞样品。胎儿细胞测序可用于鉴定许多遗传疾病中的任何一种,包括例如非整倍体,例如唐氏综合征、爱德华兹综合征和帕陶综合征。此外,胎儿细胞的细胞表面特征可用于识别多种疾病或病症中的任一种。
生物样品也可以包括免疫细胞。对这类细胞的免疫功能进行序列分析,包括基因组学、蛋白质组学和细胞表面特征,可以提供丰富的信息,有助于了解免疫系统的状态和功能。举例来说,在自体干细胞移植后确定多发性骨髓瘤(MM)患者中最小残留病(MRD)的状态(例如阴性或阳性)被认为是MM患者中MRD的预测因素(参见,例如,美国专利申请公开号2018/0156784,其通过引用全文纳入本文)。
生物样品中的免疫细胞的实例包括但不限于B细胞、T细胞(例如,细胞毒性T细胞、自然杀伤性T细胞、调节性T细胞和辅助性T细胞)、自然杀伤细胞、细胞因子诱导的杀伤(CIK)细胞、髓样细胞,例如粒细胞(嗜碱性粒细胞、嗜酸性粒细胞、中性粒细胞/多节核中性粒细胞)、单核细胞/巨噬细胞、肥大细胞、血小板/巨核细胞和树突状细胞。
如上所述,生物样品可包括单个感兴趣的分析物或多个感兴趣的分析物。将在本发明的后续部分中讨论用于进行多重分析以分析单个生物样品中的两个或更多个不同分析物的方法。
(ii)生物样品的制备
可以进行各种步骤来制备用于分析的生物样品。除非另有说明,以下描述的制备步骤通常可以以任何方式组合以适当地制备用于分析的特定样品。
(1)组织切片
生物样品可以从对象身上获取(例如,通过外科活检、整个对象切片)或作为细胞群在生长基材或培养皿上体外生长,并作为组织截面或组织切片制备以供分析。生长的样品可以足够薄,无需进一步的处理步骤即可进行分析。或者,生长的样品和通过活检或切片获得的样品可以使用机械切割设备(例如振动刀片切片机)制备为薄组织切片。作为另一替代方案,在一些实施方式中,可以通过向合适的基材材料施用生物样品印片(toughimprint)来制备薄组织切片。
组织切片的厚度可以是细胞最大横截面尺寸的分数(例如,小于0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2或0.1)。然而,也可以使用厚度大于最大横截面细胞尺寸的组织切片。例如,可以使用例如10-20微米厚的低温恒温切片。
更一般地,组织切片的厚度通常取决于用于制备切片的方法和组织的物理特性,因此可以制备和使用具有多种不同厚度的切片。例如,组织切片的厚度可以为至少0.1、0.2、0.3、0.4、0.5、0.7、1.0、1.5、2、3、4、5、6、7、8、9、10、12、13、14、15、20、30、40或50微米。如果需要或方便,也可以使用更厚的切片,例如,至少70、80、90或100微米或更大。通常,组织切片的厚度在1-100微米、1-50微米、1-30微米、1-25微米、1-20微米、1-15微米、1-10微米、2-8微米、3-7微米或4-6微米之间,但是如上所述,也可以分析厚度大于或小于这些范围的切片。
也可以从单个生物样品中获得多个切片。例如,通过使用切片刀片对活检样品进行连续切片,可以从外科活检样品获得多个组织切片。以这种方式可以保存连续切片之间的空间信息,并且可以连续分析切片以获得关于生物样品的三维信息。
(2)冷冻
在一些实施方式中,生物样品(例如,如上所述的组织切片)可通过在适合于维持或保持组织结构的完整性(例如,物理特性)的温度下的深度冷冻来制备。例如,该温度可低于-20℃,或低于-25℃、-30℃、-40℃、-50℃、-60℃、-70℃、-80℃、-90℃、-100℃、-110℃、-120℃、-130℃、-140℃、-150℃、-160℃、-170℃、-180℃、-190℃或-200℃。冷冻组织样品可使用任何数量的合适方法切(例如,薄切)到基材表面上。例如,可使用冷冻切片机(例如,低温恒温器)制备组织样品,所述冷冻切片机设置在适于维持组织样品的结构完整性和样品中核酸的化学性质的温度。例如,这种温度可以低于-15℃、低于-20℃或低于-25℃。
(3)甲醛固定和石蜡包埋
在一些实施方式中,可以使用甲醛固定和石蜡包埋(FFPE)来制备生物样品,这是已确立的方法。在一些实施方式中,可以使用甲醛固定和石蜡包埋制备细胞悬浮液和其他非组织样品。固定样品并将其包埋在石蜡或树脂块中后,样品可按上述方法进行切片。在分析之前,石蜡包埋材料可通过在适当溶剂(例如二甲苯)中孵育组织切片并随后冲洗(例如99.5%乙醇2分钟、96%乙醇2分钟和70%乙醇2分钟)从组织切片中去除(例如,脱石蜡)。
(4)固定
作为上述甲醛固定的替代方法,可以将生物样品固定在各种其他固定剂中的任一种中,以在分析之前保持样品的生物结构。例如,可以通过将样品浸入乙醇、甲醇、丙酮、多聚甲醛-曲通及其组合中来固定样品。
在一些实施方式中,丙酮固定与新鲜冷冻样品一起使用,新鲜冷冻样品可包括但不限于皮质组织、小鼠嗅球、人脑肿瘤、人死后大脑和乳腺癌样品。当进行丙酮固定时,可以不进行预透化步骤(如下所述)。或者,丙酮固定可结合透化步骤进行。
(5)包埋
作为上述石蜡包埋的替代方法,生物样品可以包埋在各种其他包埋材料中的任一种中,以便在切片和其他处理步骤之前为样品提供结构基材。一般来说,在分析从样品中获得的组织切片之前,先去除包埋材料。合适的包埋材料包括但不限于蜡、树脂(例如甲基丙烯酸树脂)、环氧树脂和琼脂。
(6)染色
为了便于可视化,生物样品可以使用多种染色剂和染色技术进行染色。在一些实施方式中,例如,可使用任意数量的染色剂对样品进行染色,包括但不限于吖啶橙、俾斯麦棕、胭脂红、考马斯蓝、甲酚紫、DAPI、曙红、溴化乙锭、酸性品红、苏木精、霍氏染色剂、碘、甲基绿、亚甲基蓝、中性红、尼罗蓝、尼罗红、四氧化锇、碘化丙啶、罗丹明或藏红。
样品可采用苏木精-伊红(H&E)染色技术、巴氏染色技术、马森三色染色技术、银染色技术、苏丹红染色技术和/或高碘酸希夫(PAS)染色技术进行染色。PAS染色通常在甲醛或丙酮固定后进行。在一些实施方式中,样品可使用罗曼诺夫斯基染色法,包括莱特染色法、詹纳染色法、坎格伦瓦尔德染色法、利什曼染色法和吉姆萨染色法染色。
在一些实施方式中,生物样品可以脱色。生物样品的去污或脱色方法在本领域是已知的,并且通常取决于应用于样品的染色剂的性质。例如,在一些实施方式中,通过抗体耦合将一种或多种免疫荧光染色剂施加到样品。这些染色剂可以使用诸如通过还原剂和洗涤剂洗涤处理的二硫键的裂解、潮变性盐处理、抗原回收溶液处理和酸性甘氨酸缓冲液处理等技术去除。例如,Bolognesi等,J.Histochem.Cytochem.2017;65(8):431-444,Lin等,Nat Commun.2015;6:8390,Pirici等,J.Histochem.Cytochem.2009;57:567-75,和Glass等,J.Histochem.Cytochem.2009;57:899-905中描述了多重染色和脱色的方法,其全部内容通过引用纳入本文。
(7)水凝胶包埋
在一些实施方式中,生物样品可包埋在水凝胶基材中。以这种方式包埋样品通常涉及将生物样品与水凝胶接触,使得生物样品被水凝胶包围。例如,可以通过将样品与合适的聚合物材料接触并激活聚合物材料以形成水凝胶来包埋样品。在一些实施方式中,形成水凝胶,使得水凝胶在生物样品内被内化。
在一些实施方式中,通过形成水凝胶的聚合物材料的交联将生物样品固定在水凝胶中。交联可以通过化学和/或光化学方式进行,或者通过本领域已知的任何其他水凝胶形成方法进行。
水凝胶基材对生物样品的组成和应用通常取决于生物样品的性质和制备(例如,切片、非切片、固定类型)。作为一个示例,其中生物样品是组织切片,水凝胶基材可包括单体溶液和过硫酸铵(APS)引发剂/四甲基乙二胺(TEMED)促进剂溶液。作为另一个例子,当生物样品由细胞(例如,培养细胞或与组织样品分离的细胞)组成时,细胞可与单体溶液和APS/TEMED溶液一起孵育。对于细胞,水凝胶基材凝胶形成于隔室中,包括但不限于用于培养、维持或运输细胞的装置。例如,水凝胶基材可以使用单体溶液加上APS/TEMED形成,其添加到隔室中的深度在约0.1μm到约2mm之间。
生物样品的水凝胶包埋的其他方法和方面例如在Chen等,Science 347(6221):543-548,2015中描述,其全部内容通过引用纳入本文。
(8)等距扩展(Isometric Expansion)
在一些实施方式中,包埋在水凝胶中的生物样品可以等距扩展。可使用的等距扩展方法包括水合作用,这是扩展显微镜中的一个准备步骤,如Chen等,Science 347(6221):543-5482015所述。
等距扩展可以通过将生物样品的一个或多个组分锚定到凝胶上,然后进行凝胶形成、蛋白质水解和溶胀来实现。生物样品的等距扩展可以在生物样品固定在基材上之前发生,或者在生物样品固定在基材上之后发生。在一些实施方式中,等距扩展的生物样品可以在用捕获探针接触基材之前从基材移出,这将在随后的部分中更详细地讨论。
一般而言,用于进行生物样品等距扩展的步骤可取决于样品的特性(例如,组织切片的厚度、固定、交联)和/或感兴趣的分析物(例如,将RNA、DNA和蛋白质锚定到凝胶的不同条件)。
在一些实施方式中,生物样品中的蛋白质锚定在可溶胀凝胶(例如聚电解质凝胶)上。抗体可在锚定到可溶胀凝胶之前、之后或结合锚定到可溶胀凝胶时定向到蛋白质。生物样品中的DNA和/或RNA也可以通过合适的接头锚定在可溶胀凝胶上。此类接头的实例包括但不限于6-((丙烯酰基)氨基)己酸(丙烯酰基-X-SE)(可从马萨诸塞州沃尔瑟姆的赛默飞(ThermoFisher)获得)、Label IT胺(可从威斯康辛州麦迪逊的MirusBio获得)和Label X(例如在Chen等,Nat.Methods 13:679-684,2016中描述,其全部内容通过引用纳入本文)。
样品的等距扩展可以提高样品后续分析的空间分辨率。在空间剖面图中增加的分辨率可以通过比较等距扩展的样品和未等距扩展的样品来确定。
在一些实施方式中,生物样品等距扩展至至少2x、2.1x、2.2x、2.3x、2.4x、2.5x、2.6x、2.7x、2.8x、2.9x、3x、3.1x、3.2x、3.3x、3.4x、3.5x、3.6x、3.7x、3.8x、3.9x、4x、4.1x、4.2x、4.4x、4.5x、4.6x、4.7x、4.8x或4.9x其非扩展尺寸。在一些实施方式中,样品等距扩展至其非扩展尺寸的至少2倍且小于20倍。
(9)基材附接
在一些实施方式中,生物样品可附接至水凝胶基材。下面详细描述适用于此目的的基材的实例。生物样品的附接可以是不可逆的或可逆的,这取决于样品的性质和分析方法中的后续步骤。
在某些实施方式中,可通过将适当的聚合物涂层施加到基材上并使样品与聚合物涂层接触,将样品可逆地附接到基材上。然后可以使用至少部分溶解聚合物涂层的有机溶剂将样品从基材上分离。水凝胶是适用于此目的的聚合物的例子。
更一般地,在一些实施方式中,可以用一种或多种物质涂覆或官能化基材以促进样品附接到基材上。可用于涂覆基材或使基材功能化的合适物质包括但不限于凝集素、聚赖氨酸、抗体和多糖。
(10)细胞解聚
在一些实施方式中,生物样品对应于细胞(例如,来自细胞培养物或组织样品)。在具有多个细胞的细胞样品中,多个个体细胞可以自然地不聚集的。例如,所述细胞可来自细胞悬浮液和/或来自组织或组织切片的分离或解聚的细胞。
或者,样品中的细胞可以聚集,并且可以使用例如酶或机械技术解聚成多个个体细胞。用于酶解聚的酶的实例包括但不限于分散酶、胶原酶、胰蛋白酶及其组合。例如,可以使用组织匀浆器来进行机械解聚。
(11)悬浮和贴壁细胞
在一些实施方式中,生物样品可从体外生长的细胞培养物中获得。来自细胞培养物的样品可包括一个或多个悬浮细胞,其在细胞培养物内是锚定独立的。此类细胞的实例包括但不限于衍生自造血细胞及衍生自以下细胞系的细胞系:Colo205、CCRF-CEM、HL-60、K562、MOLT-4、RPMI-8226、SR、HOP-92、NCI-H322M及MALME-3M。
来自细胞培养物的样品可以包括生长在含有培养基的容器表面上的一个或多个贴壁细胞。贴壁细胞的非限制性实例包括DU145(前列腺癌)细胞、H295R(肾上腺皮质癌)细胞、HeLa(宫颈癌)细胞、KBM-7(慢性粒细胞白血病)细胞、LNCaP(前列腺癌)细胞、MCF-7(乳腺癌)细胞、MDA-MB-468(乳腺癌)细胞、PC3(前列腺癌)细胞、SaOS-2(骨癌)细胞、SH-SY5Y(神经母细胞瘤,克隆自骨髓瘤)细胞、T-47D(乳腺癌)细胞、THP-1(急性髓系白血病)细胞、U87(胶质母细胞瘤)细胞、国家癌症研究所60癌细胞系小组(NCI60)、vero(非洲绿猴肾上皮细胞系)细胞、MC3T3(胚胎颅骨)细胞、GH3(垂体瘤)细胞,PC12(嗜铬细胞瘤)细胞、狗MDCK肾上皮细胞、爪蟾A6肾上皮细胞、斑马鱼AB9细胞和Sf9昆虫上皮细胞。
贴壁细胞的其他示例如表1所示,并在例如“体外细胞系、可移植动物和人类肿瘤及酵母目录(A Catalog of in Vitro Cell Lines,Transplantable Animal and HumanTumors and Yeast)”,美国国家癌症研究所癌症治疗与诊断司(DCTD)(2013年)和Abaan等的“NCI-60小组的外显子组:一种用于研究的基因组资源(The exomes of the NCI-60panel:a genomic resource for cancer biology and systems pharmacology)”,Cancer Research 73(14):4372-82,2013中进行了分类,其全部内容通过引用纳入本文。
表1:贴壁细胞的示例
Figure BDA0003042696400000411
Figure BDA0003042696400000421
Figure BDA0003042696400000431
在一些实施方式中,贴壁细胞是对应于以下一个或多个细胞系的细胞:BT549、HS578T、MCF7、MDA-MB-231、MDA-MB-468、T-47D、SF268、SF295、SF539、SNB-19、SNB-75、U251、Colo205、HCC 2998、HCT-116、HCT-15、HT29、KM12、SW620、786-O、A498、ACHN、CAKI、RXF 393、SN12C、TK-10、UO-31、A549、EKVX、HOP-62、HOP-92,NCI-H226、NCI-H23、NCI-H460、NCI-H522、LOX IMVI、M14、MALME-3M、MDA-MB-435、SK-、EL-2、SK-MEL-28、SK-MEL-5、UACC-257、UACC-62、IGROV1、OVCAR-3、OVCAR-4、OVCAR-5、OVCAR-8、SK-OV-3、NCI-ADR-RES、DU145、PC-3、DU145、H295R、HeLa、KBM-7、LNCaP、MCF-7、MDA-MB-468、PC3、SaOS-2、SH-SY5Y、T-47D、THP-1、U87、vero、MC3T3、GH3、PC12、狗MDCK肾上皮、爪蟾A6肾上皮、斑马鱼AB9和Sf9昆虫上皮细胞系。
(12)组织透化
在一些实施方式中,生物样品可被透化以促进分析物从样品转移出去,和/或促进物质(例如捕获探针)转移到样品中。如果样品透化不够,则从样品中捕获的分析物量可能过低,无法进行充分的分析。相反,如果组织样品透化性太强,则组织样品内分析物的相对空间关系可能会丢失。因此,在充分透化组织样品以获得良好信号强度同时仍保持样品中分析物分布的空间分辨率之间的平衡是理想的。
一般来说,生物样品可通过将样品暴露于一种或多种透化剂来透化。用于此目的的合适试剂包括但不限于有机溶剂(例如丙酮、乙醇和甲醇)、交联剂(例如多聚甲醛)、洗涤剂(例如皂甙、Triton X-100TM或Tween-20TM)和酶(如胰蛋白酶、蛋白酶)。在一些实施方式中,生物样品可与细胞透化剂一起孵育以促进样品的透化。例如,在Jamur等,MethodMol.Biol.588:63-66,2010中描述了样品透化的其他方法,其全部内容通过引用纳入本文。用于样品透化的任何合适方法通常可结合本文所述样品使用。
在一些实施方式中,在分析程序期间使用抗扩散介质限制分析物或其他物质的迁移的情况下,抗扩散介质可包括至少一种透化试剂。例如,抗扩散介质可包括含有透化缓冲液或试剂的孔(例如,微孔、纳米孔或皮孔)。在一些实施方式中,其中抗扩散介质是水凝胶,水凝胶可包括透化缓冲液。在一些实施方式中,在水凝胶与样品接触之前,将水凝胶浸泡在透化缓冲液中。在一些实施方式中,当抗扩散介质应用于生物样品时,水凝胶或其他抗扩散介质可包含干燥试剂或单体以递送透化试剂。在一些实施方式中,抗扩散介质(即水凝胶)共价地附接到固体基材(即丙烯酸玻璃载玻片)上。在一些实施方式中,水凝胶可改性为既包含捕获探针又递送透化试剂。例如,水凝胶膜可经改性以包括空间条码化捕获探针。然后在将空间条码化水凝胶膜与样品接触之前,将空间条码化水凝胶膜浸泡在透化缓冲液中。因此,空间条码化水凝胶膜将透化试剂输送到与空间条码化水凝胶接触的样品表面,增强分析物迁移和捕获。在一些实施方式中,将空间条码化水凝胶应用于样品并放置在大量透化溶液中。在一些实施方式中,浸泡在透化试剂中的水凝胶膜夹在样品和空间条码化阵列之间。在一些实施方式中,目标分析物能够扩散穿过透化试剂浸泡的水凝胶,并在水凝胶的另一侧杂交或结合捕获探针。在一些实施方式中,水凝胶的厚度与分辨率损失成比例。在一些实施方式中,孔(例如,微米孔、纳米孔或皮米孔)可包含空间条码化捕获探针和透化试剂和/或缓冲液。在一些实施方式中,空间条码化捕获探针和透化试剂保持在间隔物之间。在一些实施方式中,样品被打孔、切割或转移到孔中,其中目标分析物通过透化试剂/缓冲液扩散到空间条形化捕获探针。在一些实施方式中,分辨率损失可与间隙厚度成比例(例如,样品和捕获探针之间的透化缓冲液的量)。在一些实施方式中,抗扩散介质(例如水凝胶)的厚度在约50-500微米之间,包括500、450、400、350、300、250、200、150、100或50微米的厚度,或在50和500微米内的任何厚度。
在一些实施方式中,透化溶液可通过多孔膜输送至样品。在一些实施方式中,多孔膜用于限制扩散分析物损失,同时使透化试剂到达样品。膜化学和孔径可以控制,以尽量减少分析物损失。在一些实施方式中,多孔膜可由玻璃、硅、纸、水凝胶、聚合物整体或其他材料制成。在一些实施方式中,材料可以是天然多孔的。在一些实施方式中,该材料可具有蚀刻到固体材料中的孔或洞。在一些实施方式中,透化试剂流过多孔膜上的微流体腔室或通道。在一些实施方式中,流控制样品对透化试剂的可及性。在一些实施方式中,多孔膜夹在空间条码化阵列和样品之间,其中透化溶液施加在多孔膜上。透化试剂通过膜孔扩散到组织中。
在一些实施方式中,可通过向样品中添加一种或多种裂解剂使生物样品透化。合适的裂解剂的实例包括但不限于生物活性试剂,例如用于裂解不同细胞类型的裂解酶,例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物,例如溶菌酶、无色肽酶、溶葡萄球菌素、Labiase酶、基他酶(kitalase)、溶细胞酶和多种其它市售的裂解酶。
其他裂解剂可另外或替代地添加到生物样品中以促进透化。例如,基于表面活性剂的裂解溶液可用于裂解样品细胞。裂解溶液可包括离子表面活性剂,例如肌氨酰和十二烷基硫酸钠(SDS)。更一般而言,化学裂解剂可包括但不限于有机溶剂、螯合剂、洗涤剂、表面活性剂和离液剂。
在一些实施方式中,生物样品可通过非化学透化方法进行透化。本领域已知非化学透化方法。例如,可使用的非化学透化方法包括但不限于物理溶解技术,例如电穿孔、机械透化方法(例如,使用均质器和研磨球机械破坏样品组织结构的珠磨)、声学透化(例如,超声)和热分解技术,例如加热以诱导样品的热透化。
(13)RNA物质的选择性富集
在其中RNA是分析物的一些实施方式中,可以选择性地富集一种或多种感兴趣的RNA分析物。例如,可以通过向样品中添加一个或多个寡核苷酸来选择一种或多种感兴趣的RNA。在一些实施方式中,其它寡核苷酸是用于通过聚合酶引发反应的序列。例如,与一种或多种感兴趣的RNA具有序列互补性的一种或多种引物序列可用于扩增一种或多种感兴趣的RNA,从而选择性地富集这些RNA。在一些实施方式中,与捕获的RNA(例如cDNA)的互补链具有序列互补性的寡核苷酸可结合到cDNA。例如,具有与一种或多种感兴趣的cDNA互补的序列的生物素化寡核苷酸能够结合到cDNA并且可以利用生物素化-链霉亲和素亲和力,使用本领域已知的各种方法中的任何一种(例如,链霉亲和素珠)来选择。
或者,可以使用多种方法中的任何一种来向下选择(例如,去除)一种或多种RNA。例如,可以将探针给予样品,所述探针选择性地与核糖体RNA(rRNA)杂交,从而减少样品中rRNA的汇集和浓度。随后将捕获探针应用于样品可导致由于样品中存在的非特异性RNA的减少所得到的对其他类型RNA的捕获的改善。另外或者,双链特异性核酸酶(DSN)处理可去除rRNA(参见,例如,Archer等,在cDNA阶段从RNA-seq文库选择性和灵活去除有问题的序列(Selective and flexible depletion of problematic sequencesw from RNA-seqlibraries at the cDNA stage),BMC Genomics,15401,(2014),其全部内容通过引用纳入本文)。此外,羟基磷灰石色谱法可去除丰富的物质(例如,rRNA)(参见,例如,Vandernoot,V.A.,羟基磷灰石色谱法cDNA标准化以丰富RNA-seq应用中的转录组多样性(cDNAnormalization by hydroxyapatite chromatography to enrich transcriptomediversity in RNA-seq applications),Biotechniques,53(6)373-80,(2012),其全部内容通过引用纳入本文)。
(14)其他试剂
在分析样品之前,可以向生物样品中添加其它试剂以进行各种功能。在一些实施方式中,DNA酶和RNA酶失活剂或抑制剂(例如蛋白酶K)和/或螯合剂(例如EDTA)可添加到样品中。
在一些实施方式中,样品可以用一种或多种酶处理。例如,可以添加一种或多种用于片段化DNA的核酸内切酶、DNA聚合酶和用于扩增核酸的dNTP。也可添加到样品中的其他酶包括但不限于聚合酶、转座酶、连接酶、DNA酶和RNA酶。
在一些实施方式中,可将逆转录酶添加到样品中,包括具有末端转移酶活性的酶、引物和转换寡核苷酸。模板转换可用于增加cDNA的长度,例如,通过将预定义的核酸序列附加到cDNA。
(15)用于捕获探针相互作用的预处理
在一些实施方式中,生物样品中的分析物可在与捕获探针相互作用之前进行预处理。例如,在与捕获探针相互作用之前,在生物样品中进行由聚合酶(例如DNA聚合酶或逆转录酶)催化的聚合反应。在一些实施方式中,用于聚合反应的引物包括增强与捕获探针杂交的官能团。捕获探针可包括适当的捕获域以捕获感兴趣的生物分析物(例如,多聚(dT)序列以捕获多聚(A)mRNA)。
在一些实施方式中,通过下一代测序对生物分析物进行预处理以产生文库。例如,可以通过添加修饰物(例如,连接使与捕获探针相互作用的序列)来预处理分析物。在一些实施方式中,使用片段化技术(例如,使用转座酶和/或片段化缓冲液)片段化分析物(例如,DNA或RNA)。
片段化后可对分析物进行修饰。例如,修饰可以是通过连接使与捕获探针杂交的衔接子序列来添加。在一些实施方式中,其中感兴趣的分析物是RNA,进行多聚(A)加尾。将多聚(A)尾添加到不包含多聚(A)尾的RNA可促进与包含具有功能量的多聚(dT)序列的捕获域的捕获探针的杂交。
在一些实施方式中,在与捕获探针相互作用之前,在生物样品中进行由连接酶催化的连接反应。在一些实施方式中,可以通过化学连接来进行连接。在一些实施方式中,可以使用点击化学来进行连接,如下所述。在一些实施方式中,捕获域包括与RNA分子具有互补性的DNA序列,其中RNA分子与第二DNA序列具有互补性,并且其中RNA-DNA序列互补性用于将第二DNA序列连接到捕获域中的DNA序列。在这些实施方式中,可以直接检测RNA分子。
在一些实施方式中,在与捕获探针相互作用之前,在生物样品中进行靶特异性反应。靶特异性反应的实例包括但不限于靶向特异性衔接子、探针和/或其他寡核苷酸的连接、使用对一种或多种分析物特异性引物的靶特异性扩增、以及使用原位杂交、DNA显微镜和/或抗体检测的靶特异性检测。在一些实施方式中,捕获探针包括被靶向到靶特异性产物的捕获域(例如,扩增或连接)。
II.一般基于空间阵列的分析方法
本发明的这一部分描述了用于基于空间阵列的生物样品分析的方法、装置、系统和组合物。
(a)空间分析方法
基于阵列的空间分析方法涉及将一种或多种分析物从生物样品转移到基材上的特征阵列,其各自与阵列上的独特空间位置相关。转移分析物的后续分析包括确定分析物的相同性以及样品中每种分析物的空间位置。每种分析物在样品中的空间位置是基于阵列中每个分析物所结合的特征以及特征在阵列中的相对空间位置来确定的。
存在至少两种将空间条形码与一个或多个相邻细胞相关联的一般方法,使得空间条形码将一个或多个细胞和/或一个或多个细胞的内容标识为与特定空间位置相关联。一种一般方法是将目标分析物从细胞中驱出并朝向空间条码化阵列。图1描绘了该一般方法的示例性实施方式。在图1中,使聚集有捕获探针(如本文进一步描述)的空间条码化阵列与样品101接触,并且样品被透化,使目标分析物从样品迁移到阵列。目标分析物与空间条码化阵列102上的捕获探针相互作用。一旦目标分析物杂交/结合到捕获探针,则任选地从阵列移出样品并且分析捕获探针以获得空间解析的分析物信息103。
另一种一般方法是从阵列裂解空间条码化捕获探针,并驱动空间条码化捕获探针朝向样品和/或至样品中或至样品上。图2描绘了该一般方法的示例性实施方式,使聚集有捕获探针(如本文进一步描述的)的空间条码化阵列可以与样品201接触。空间条码化捕获探针被裂解,然后与所提供样品202内的细胞相互作用。这种相互作用可以是共价或非共价的细胞表面相互作用。该相互作用可以是由递送系统或细胞穿透肽促进的细胞内相互作用。一旦空间条码化捕获探针与特定细胞相关联,就可以任选地移出样品以进行分析。样品在分析前可以选择性地分离。一旦标记的细胞与空间条码化捕获探针相关联,就可以分析捕获探针以获得关于标记的细胞203的空间解析信息。
图3示出了包括在空间条码化阵列301上制备样品的示例性工作流。样品制备可包括将样品放置在载玻片上、固定样品和/或染色样品以供成像。然后使用亮场(对样品苏木精和伊红染色成像)和荧光(对特征成像)模式在阵列302上对染色样品成像。在一些实施方式中,然后从样品中释放目标分析物,并且形成空间条码化阵列的捕获探针杂交或结合释放的目标分析物303。然后从阵列304移出样品,并且从阵列305中裂解捕获探针。然后在两种模式305B中任选地对样品和阵列进行第二成像,同时将分析物反向转录成cDNA,并且制备扩增子文库306并测序307。这两组图像随后在空间上重叠,以便关联在空间上识别的样品信息308。当样品和阵列没有第二成像305B时,由制造商提供点坐标文件。点坐标文件替换第二成像步骤305B。此外,可以使用独特PCR衔接子和测序307来进行扩增子文库制备306。
图4显示了另一个示例性工作流,该工作流利用基材上的空间标记阵列,其中用空间条形码标记的捕获探针聚集在称为特征的区域。空间标记的捕获探针可以包括裂解结构域、一个或多个功能序列、空间条形码、独特分子标识符和捕获域。空间标记的捕获探针还可以包括5′端修饰,用于可逆地附接到基材。空间条形码阵列与样品401接触,并且通过应用透化试剂402使样品透化。透化试剂可通过将阵列/样品组件放置在大量溶液中来给予。或者,可经由抗扩散介质和/或物理屏障(例如盖)向样品给予透化试剂,其中样品夹在抗扩散介质和/或屏障与包含阵列的基材之间。使用本文公开的任何数量的技术将分析物迁移到空间条码化捕获阵列。例如,分析物迁移可以使用抗扩散介质盖和被动迁移进行。作为另一示例,例如,使用电泳转移系统,分析物迁移可以是主动迁移。一旦分析物接近空间条码化捕获探针,捕获探针可杂交或以其他方式结合目标分析物403。可以任选地从阵列404移出样品。
捕获探针可任选地从阵列405裂解,并且捕获的分析物可通过进行逆转录酶第一链cDNA反应来进行空间标记。第一链cDNA反应可任选地使用模板转换寡核苷酸来进行。例如,模板转换寡核苷酸可与通过逆转录酶添加到cDNA 3′端的多聚(C)尾杂交。原始的mRNA模板和模板转换寡核苷酸可以从cDNA中变性,然后条码化捕获探针可以与cDNA杂交并可生成cDNA的互补物。然后可以纯化第一链cDNA并收集用于下游扩增步骤。可使用PCR 406扩增第一链cDNA,其中正向和反向引物侧接感兴趣的空间条形码和靶向分析物区域,产生与特定空间条形码相关联的文库。在一些实施方式中,cDNA包含合成测序(SBS)引物序列。对文库扩增子进行测序和分析以解码空间信息407。
图5描述了一个示例性工作流,其中样品从空间条码化阵列移出,并且空间条码化捕获探针从阵列移出,用于条码化分析物扩增和文库制备。另一实施方式包括在空间条码化阵列上使用模板转换寡核苷酸进行第一链合成而不切割捕获探针。在本实施方式中,样品制备501和透化502如本文别处所述进行。一旦捕获探针捕获目标分析物,通过模板转换和逆转录酶503产生的第一链cDNA随后被变性,并且第二链随后被延伸504。然后将第二链cDNA从第一链cDNA变性、中和并转移到管505。cDNA定量和扩增可以使用本文讨论的标准技术来进行。然后,cDNA可经历文库制备506和索引化507,包括片段化、末端修复和A-加尾以及索引化PCR步骤。
在上述工作流的一些非限制性示例中,可将样品浸入100%冷冻甲醇中,并在-20℃孵育30分钟。20分钟后,可移出样品并在超纯水中冲洗。冲洗样品后,制备新鲜的曙红溶液,并用异丙醇覆盖样品。样品在异丙醇中孵育1分钟后,可通过将载玻片保持一定角度(载玻片的底部边缘可与实验室擦拭物接触并风干)去除试剂。样品可均匀地覆盖在苏木精溶液中,并在室温下孵育7分钟。样品在苏木精中孵育7分钟后,可通过将载玻片保持一定角度(载玻片的底部边缘可与实验室擦拭物接触)去除试剂。含有样品的载玻片可以浸入水中,多余的液体可以去除。然后用发蓝缓冲液覆盖样品,在室温下孵育2分钟。将含有样品的载玻片再次浸入水中,均匀地用曙红溶液覆盖,并在室温下孵育1分钟。载玻片可风干并在37℃孵育5分钟。可使用本文所公开的方法对样品成像。
以下是用于样品透化和cDNA产生的非限制性示例性步骤。样品可暴露于透化酶并在37℃孵育6分钟。本文描述了其他透化方法。通过添加SSC缓冲液,可去除透化酶,并制备样品用于分析物捕获。然后对样品进行预平衡热循环方案,并移出SSC缓冲液。可以添加含有无核酸酶水、逆转录酶试剂、模板转换寡核苷酸、还原剂和逆转录酶的主混合物,并且具有主混合物的样品可以经过热循环方案。可从样品中去除试剂,并可施加NaOH并在室温下孵育5分钟。可除去氢氧化钠,并可添加洗脱缓冲液并从样品中除去。第二链混合物,包括第二链试剂、第二链引物和第二链酶,可以添加到样品中,并且样品可以密封和孵育。孵育结束后,除去试剂,加入洗脱缓冲液,从样品中除去,再向样品中加入氢氧化钠,在室温下样品孵育10分钟。可添加Tris-HCl并混合试剂。
以下步骤是cDNA扩增和质量控制的非限制性示例性步骤。可以制备qPCR混合物,包括无核酸酶水、qPCR主混合物和cDNA引物,并且可以将NaOH/Tris-HCl混合物与qPCR混合物和样品混合,并且根据预定的热循环方案进行热循环。在完成热循环后,可以制备cDNA扩增混合物并与样品合并并混合。然后对样品进行孵育和热循环。然后,样品可在SPRIselect试剂中再悬浮,并用移液管移取,以确保正确混合。然后可在室温下对样品进行5分钟的孵育,并将样品放在磁铁上(例如,磁铁处于高位)进行清理。去除上清液,向沉淀物中加入80%乙醇,孵育30秒。乙醇可以被去除,沉淀物可以被再次清洗。然后将样品离心并放置在磁铁上(例如,磁铁处于低位)。任何残留的乙醇都可以去除,样品可以风干。可移出磁铁,将洗脱缓冲液添加到样品中,混合,并在室温下孵育2分钟。然后将样品放在磁铁上(例如,在高位),直到溶液澄清。部分样品可以在安捷伦生物分析仪高灵敏度芯片上运行,在该芯片上可以选择一个区域并测量cDNA浓度以计算总cDNA产量。或者,可通过安捷伦生物分析仪或安捷伦TapeStation测定定量。
以下步骤是空间基因表达文库构建的非限制性示例性步骤。可以在冰上制备片段化混合物,包括片段化缓冲液和片段化酶。洗脱缓冲液和片段化混合物可添加到每个样品中,混合并离心。然后可将样品混合物置于热循环仪中并根据预定方案进行循环。可将SPRIselect试剂添加到样品中,并在室温下孵育5分钟。样品可以放在磁铁上(例如,在高位),直到溶液澄清,上清液可以转移到新的管带(tube strip)上。可将SPRIselect试剂添加到样品中,混合并在室温下孵育5分钟。可将样品放在磁铁上(例如,在高位),直到溶液澄清。去除上清液,向沉淀物加入80%乙醇,沉淀物孵育30秒,可除去乙醇。可重复乙醇清洗,并将样品放在磁铁上(例如,在低位),直到溶液澄清。可去除剩余乙醇,将洗脱缓冲液添加到样品中,混合,并在室温下孵育2分钟。可将样品放在磁铁上(例如,在高位),直到溶液澄清,并将部分样品移到新的管带上。可以制备和离心包括连接缓冲液、DNA连接酶和衔接子寡核苷酸衔接子连接混合物。衔接子连接混合物可添加到样品中,移液管混合,并短暂离心。然后可根据预定方案对样品进行热循环。可将SPRIsleect试剂添加到样品中,在室温下孵育5分钟,并放置在磁铁上(例如,在高位),直到溶液澄清。去除上清液,用80%乙醇洗涤沉淀物,孵育30秒,可除去乙醇。可以重复乙醇洗涤,并且在将样品放置在磁铁上(例如,在低位)之前可以短暂地离心样品。任何残留的乙醇都可以被去除,样品可以被风干。可将洗脱缓冲液添加到样品中,将样品从磁铁中取出,然后将样品用移液管混合,在室温下培养2分钟,并放置在磁铁上(例如,在低位)直到溶液澄清。部分样品可以转移到一个新的管带上。可制备样品指数PCR混合物,包括扩增混合物和SI引物,并与样品合并。样品/样品指数PCR混合物可装入个体铬i7样品指数孔中,并可使用热循环方案。可将SPRIselect试剂添加到各样品中,混合并在室温下孵育5分钟。样品可以放在磁铁上(例如,在高位),直到溶液澄清,上清液可以转移到新的管带上。可将SPRIselect试剂添加到各样品中,移液管混合并在室温下孵育5分钟。然后可将样品放在磁铁上(例如,在高位),直到溶液澄清。去除上清液,用80%乙醇洗涤沉淀物,孵育30秒,然后可除去乙醇。可以重复进行乙醇清洗,将样品离心,并将其放置在磁铁上(例如,在低位)以去除任何剩余的乙醇。样品可从磁铁中取出,洗脱缓冲液可添加到样品中,移液管混合,并在室温下孵育2分钟。可将样品放在磁铁上(例如,在高位),直到溶液澄清,并将部分样品移到新的管带上。平均片段大小可使用生物分析仪示踪或Agilent TapeStation测定。
在一些实施方式中,对由该工作流和本文描述的其他工作流产生的数据进行相关分析可以产生跨两个捕获区域表达的基因的95%以上的相关性(例如,95%或更高、96%或更高、97%或更高、98%或更高、或99%或更高)。当使用细胞核的单细胞RNA测序来进行所述工作流时,在一些实施方式中,数据的相关分析可产生跨两个捕获区域表达的基因的超过90%(例如超过90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的相关性。
(b)捕获探针
“捕获探针”是指能够捕获(直接或间接)和/或标记生物样品中感兴趣的分析物的任何分子。在一些实施方式中,捕获探针是核酸或多肽。在一些实施方式中,捕获探针是偶联物(例如,寡核苷酸-抗体偶联物)。在一些实施方式中,捕获探针包括条形码(例如,空间条形码和/或独特分子标识符(UMI))和捕获域。
图6是示出如本文所述的捕获探针的示例的示意图。如图所示,捕获探针602任选地通过诸如二硫键接头的切割域603耦合到特征601。捕获探针可包括对后续处理有用的功能性序列,例如功能性序列604,其可包括测序仪特异性流动池附接序列,例如P5序列,以及功能性序列606,其可包括测序引物序列,例如R1引物结合位点。在一些实施方式中,序列604是P7序列,序列606是R2引物结合位点。空间条形码605可包括在捕获探针内以用于对目标分析物条码化。通常可选择功能性序列以与各种不同测序系统中的任何一种兼容,例如454测序、离子激流质子(Ion Torrent Proton)或PGM、Illumina X10、PacBio、纳米孔(Nanopore)等及其要求。在一些实施方式中,可选择功能性序列以与非商业化测序系统兼容。可使用适当功能性序列的此类测序系统和技术的实例包括(但不限于)Roche 454测序、离子激流质子或PGM测序、Illumina X10测序、PacBio SMRT测序和Oxford纳米孔测序。此外,在一些实施方式中,可以选择功能性序列以与其他测序系统(包括非商业化测序系统)兼容。
在一些实施方式中,空间条形码605、功能性序列604(例如,流动池附接序列)和606(例如,测序引物序列)可以是附接到给定特征的所有探针所共用的。空间条形码还可包括捕获域607以促进目标分析物的捕获。
捕获域
如上所述,每个捕获探针包括至少一个捕获域。“捕获域”是寡核苷酸、多肽、小分子或其任何组合,其特异性结合到所需分析物。在一些实施方式中,捕获域可用于捕获或检测所需分析物。
在一些实施方式中,捕获域是配置成与一种或多种分析物,例如一种或多种不同类型的核酸(例如,RNA分子和DNA分子)相互作用的功能性核酸序列。在一些实施方式中,功能性核酸序列可包括N-聚体序列(例如,随机N-聚体序列),其中N-聚体序列经配置以与多个DNA分子相互作用。在一些实施方式中,功能性序列可包括多聚(T)序列,其多聚(T)序列经配置以经由mRNA转录物的多聚(A)尾与信使RNA(mRNA)分子相互作用。在一些实施方式中,功能性核酸序列是蛋白质(例如,转录因子、DNA结合蛋白质或RNA结合蛋白质)的结合靶标,其中感兴趣的分析物是蛋白质。
捕获探针可以包括核糖核苷酸和/或脱氧核糖核苷酸以及能够参与Watson-Crick型或类似碱基对相互作用的合成核苷酸残基。在一些实施方式中,捕获域能够引发逆转录反应以产生与捕获的RNA分子互补的cDNA。在一些实施方式中,捕获探针的捕获域可引发DNA延伸(聚合酶)反应以产生与捕获的DNA分子互补的DNA。在一些实施方式中,捕获结构域可以作为捕获的DNA分子和直接或间接固定在基材上的表面探针之间的连接反应的模板。在一些实施方式中,捕获域可连接到捕获的DNA分子的一条链。例如,SplintR连接酶连同RNA或DNA序列(例如,简并RNA)一起可用于将单链DNA或RNA连接到捕获域。在一些实施方式中,具有RNA模板化连接酶活性的连接酶(例如,SplintR连接酶、T4 RNA连接酶2或KOD连接酶)可用于将单链DNA或RNA连接到捕获域。在一些实施方式中,捕获域包括夹板寡核苷酸。在一些实施方式中,捕获域捕获夹板寡核苷酸。
在一些实施方式中,捕获域位于捕获探针的3′端并且包括自由的3′端,其可例如通过模板依赖聚合来延伸以形成如本文所述的延伸的捕获探针。在一些实施方式中,捕获结构域包括能够与存在于与阵列接触的组织样品的细胞中的核酸(例如RNA或其他分析物)杂交的核苷酸序列。在一些实施方式中,捕获结构域可被选择或设计为选择性地或特异地结合到靶核酸。例如,捕获结构域可被选择或设计成通过与mRNA多聚(A)尾杂交的方式捕获mRNA。因此,在一些实施方式中,捕获域包括多聚(T)DNA寡核苷酸,即通过磷酸二酯键连接的一系列连续脱氧胸苷残基,其能够与mRNA的多聚(a)尾杂交。在一些实施方式中,捕获域可包括在功能上或结构上类似于多聚(T)尾的核苷酸。例如,多聚(U)寡核苷酸或包含脱氧胸苷类似物的寡核苷酸。在一些实施方式中,捕获域包括至少10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方式中,捕获域包括至少25、30或35个核苷酸。
在一些实施方式中,随机序列(例如,随机六聚体或类似序列)可用于形成捕获域的全部或部分。例如,随机序列可以与多聚(T)(或多聚(T)类似物)序列一起使用。因此,在捕获域包括多聚(T)(或“多聚(T)-样”)寡核苷酸的情况下,其还可以包括随机寡核苷酸序列(例如,“多聚(T)-随机序列”探针)。例如,这可以位于多聚(T)序列的5′或3′处,例如在捕获域的3′端。多聚(T)-随机序列探针可促进mRNA多聚(A)尾的捕获。在一些实施方式中,捕获域可以是完全随机的序列。在一些实施方式中,可以使用简并捕获域。
在一些实施方式中,两个或更多个捕获探针的集形成混合物,其中一个或多个捕获探针的捕获域包括多聚(T)序列,并且一个或多个捕获探针的捕获域包括随机序列。在一些实施方式中,两个或更多个捕获探针的集形成混合物,其中一个或多个捕获探针的捕获域包括多聚(T)样序列,并且一个或多个捕获探针的捕获域包括随机序列。在一些实施方式中,两个或更多个捕获探针的集形成混合物,其中一个或多个捕获探针的捕获域包括多聚(T)随机序列,并且一个或多个捕获探针的捕获域包括随机序列。在一些实施方式中,具有简并捕获域的探针可以添加到本文所列的任何前述组合中。在一些实施方式中,具有简并捕获域的探针可以替换本文所描述的每对中的探针之一。
捕获域可基于其被设计以捕获的特定基因序列或特定基序序列或共同/保守序列(即,序列特异性捕获域)。因此,在一些实施方式中,捕获域能够选择性地结合到期望的核酸亚型或子集,例如特定类型的RNA,例如mRNA、rRNA、tRNA、SRP RNA、tRNA、snRNA、snRNA、SmY RNA、sARNA、gRNA、RNA酶P、RNA酶MRP、TERC、SL RNA、aRNA、cis-NAT、crRNA、lncRNA、miRNA、piRNA、siRNA、shRNA、tasiRNA,rasiRNA、7SK、eRNA、ncRNA或其他类型的RNA。在非限制性示例中,捕获域能够选择性地结合到核糖核酸的所需子集,例如微生物组RNA,例如16SrRNA。
在一些实施方式中,捕获域包括“锚定物”或“锚定序列”,其是设计用于确保捕获域与预期生物分析物杂交的核苷酸序列。在一些实施方式中,锚定序列包括核苷酸序列,包括1-聚体、2-聚体、3-聚体或更长的序列。在一些实施方式中,短序列是随机的。例如,可以设计包括多聚(T)序列的捕获域来捕获mRNA。在此类实施方式中,锚定序列可包括有助于确保多聚(T)捕获域与mRNA杂交的随机3-聚体(例如,GGG)。在一些实施方式中,锚定序列可以是VN、N或NN。或者,可以使用特定的核苷酸序列来设计序列。在一些实施方式中,锚定序列位于捕获域的3′端。在一些实施方式中,锚定序列位于捕获域的5′端。
在一些实施方式中,捕获探针的捕获域在生物样品与阵列接触之前被阻断,并且当生物样品中的核酸在其被捕获到阵列上之前被修饰时,使用阻断性探针。在一些实施方式中,阻断性探针用于阻断或修饰捕获域的游离3′端。在一些实施方式中,阻断性探针可与捕获探针杂交以遮蔽捕获域的游离3′端,例如发夹探针或部分双链探针。在一些实施方式中,捕获域的游离3′端可以通过化学修饰来阻断,例如,添加叠氮甲基作为化学可逆的加帽部分,使得捕获探针不包括游离3′端。在生物样品与阵列接触之前,阻断或修饰捕获探针,特别是在捕获域的游离3′端,防止捕获探针的修饰,例如,防止将多聚(A)尾添加到捕获探针的游离3′端。
3′修饰的非限制性实例包括双脱氧C-3′(3′-ddC)、3′倒dT、3′C3间隔子、3′氨基和3′磷酸化。在一些实施方式中,可修饰生物样品中的核酸,使得其可被捕获结构域捕获。例如,衔接子序列(包括能够结合到捕获探针的捕获域的结合域)可以添加到核酸(例如片段化基因组DNA)的末端。在一些实施方式中,这是通过连接衔接子序列或核酸延伸来实现的。在一些实施方式中,酶用于在核酸序列末端纳入其它核苷酸,例如多聚(A)尾。在一些实施方式中,捕获探针可以可逆地遮蔽或修饰,使得捕获探针的捕获域不包括游离3′端。在一些实施方式中,移出、修饰或使3′端不可接近,使得捕获结构域不易受用于修饰生物样品的核酸的过程(例如,连接或延伸)的影响。
在一些实施方式中,修饰捕获探针的捕获域以去除在修饰生物样品的核酸分子期间发生的捕获探针的任何修饰。在一些实施方式中,捕获探针可包括捕获域下游,即,至捕获域的3′的其它序列,即阻断域。
在一些实施方式中,捕获探针的捕获域可以是非核酸域。不完全基于核酸的合适捕获域的实例包括但不限于蛋白质、肽、适体、抗原、抗体和模拟本文所述的任何捕获域的功能的分子类似物。
裂解域
每个捕获探针可任选地包括至少一个裂解域。裂解域表示用于将探针可逆地附接到阵列特征的探针部分,如下所述。此外,捕获探针的一个或多个区段或区域可任选地通过切割裂解域从阵列特征中释放。例如,空间条形码和/或通用分子标识符(UMI)可以通过切割裂解域来释放。
图7是说明可切割捕获探针的示意图,其中切割的捕获探针可进入非透化细胞并结合到样品内的目标分析物。捕获探针701包含裂解域702、细胞穿透肽703、报告分子704和二硫键(-S-S-)。705表示捕获探针的所有其他部分,例如空间条形码和捕获域。
在一些实施方式中,将捕获探针连接到特征的裂解域是二硫键。可以添加还原剂来破坏二硫键,从而使捕获探针从特征中释放出来。作为另一个例子,加热也可以导致裂解域的降解和从阵列特征中释放附接的捕获探针。在一些实施方式中,激光辐射用于在特定位置加热和降解捕获探针的裂解域。在一些实施方式中,裂解域是光敏化学键(即,当暴露于诸如紫外光的光时解离的化学键)。
裂解域的其它实例包括不稳定化学键,例如但不限于酯键(例如,可与酸、碱或羟胺裂解)、邻二醇键(例如,可通过高碘酸钠裂解)、狄尔斯一阿尔德键(例如,可通过热裂解)、砜键(例如,可通过碱裂解)、硅基醚键(例如,可通过酸裂解)、糖苷键(例如,可通过淀粉酶裂解)、肽键(例如,可通过蛋白酶裂解)或磷酸二酯键(例如,可通过核酸酶裂解(例如,DNA酶))。
在一些实施方式中,裂解域包括由一个或多个能够切割核酸分子,例如,能够破坏两个或更多个核苷酸之间的磷酸二酯键的酶识别的序列。键可以通过其他核酸分子靶向酶,如限制性酶(如限制性内切酶)进行切割。例如,裂解域可以包括限制性内切酶(限制性酶)识别序列。限制性内切酶在被称为限制性位点的特定识别核苷酸序列上切割双链或单链DNA。在一些实施方式中,使用稀有切割限制性酶,即具有长识别位点(长度至少为8个碱基对)的酶,以减少在捕获探针中其他位置切割的可能性。
在一些实施方式中,裂解域包括多聚(U)序列,其可由尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶内切酶VIII(商业上称为USERTM酶)的混合物切割。一旦释放,可释放的捕获探针可用于反应。因此,例如,可以通过从特征释放捕获探针来激活可激活的捕获探针。
在一些实施方式中,当捕获探针例如经由表面探针间接地附接到基材时,裂解域包括一个或多个错配核苷酸,使得表面探针和捕获探针的互补部分不是100%互补(例如,错配碱基对的数目可以是一个、两个或三个碱基对)。例如,通过MutY和T7核酸内切酶I酶识别这种错配,其导致错配位置处的核酸分子的裂解。
在一些实施方式中,当捕获探针例如经由表面探针间接地附接到特征时,裂解域包括切口酶识别位点或序列。切口酶是一种仅能切割DNA双链体的单链的核酸内切酶。因此,裂解域可以包括靠近表面探针的5′端(和/或捕获探针的5′端)的切口酶识别位点,使得表面探针或捕获探针的裂解使表面探针和捕获探针之间的双链体失稳,从而从特征中释放捕获探针。
切口酶也可用于捕获探针直接附接到特征的一些实施方式中。例如,基材可与杂交到捕获探针的裂解域的核酸分子接触以提供或重组切口酶识别位点,例如裂解辅助探针。因此,与切口酶接触将导致裂解域的裂解,从而从特征中释放捕获探针。这种裂解辅助探针还可用于为其他裂解酶(例如限制性内切酶)提供或重组裂解识别位点。
有些切口酶通过结合和识别特定的核苷酸识别序列,只在DNA分子的特定位点引入单链切口。已经发现了许多天然切口酶,目前已经确定了至少四个切口酶的序列识别特性。切口酶在美国专利号6,867,028中描述,其通过引用整体纳入本文。一般来说,任何合适的切口酶都可用于结合到裂解域的互补切口酶识别位点。使用后,可以从分析中去除切口酶,或在释放捕获探针后使其失活,以防止捕获探针的不必要切割。
不仅包括基于核酸的合适捕获域的实例包括但不限于蛋白质、肽、适体、抗原、抗体和模拟本文所述的任何捕获域的功能的分子类似物。
在一些实施方式中,捕获探针中不存在裂解域。例如在Macosko等,(2015)Cell161,1202-1214中描述了具有缺乏裂解域的附接捕获探针的基材的实例,其全部内容通过引用纳入本文中。
在一些实施方式中,与裂解域相对应的捕获探针区域可用于某些其它功能。例如,用于核酸延伸或扩增的其它区域可以包括在通常将定位裂解域的位置处。在这样的实施方式中,该区域可以补充功能域或者甚至作为其它功能域存在。在一些实施方式中,存在裂解域,但其用途是可选的。
功能域
每个捕获探针可任选地包括至少一个功能域。每个功能域通常包括用于整个分析程序中的下游分析步骤的功能核苷酸序列。
在一些实施方式中,捕获探针可包括用于附接到测序流动池的功能域,例如,用于
Figure BDA0003042696400000611
测序的P5序列。在一些实施方式中,捕获探针或其衍生物可包括另一功能域,例如用于附接到用于
Figure BDA0003042696400000612
测序的测序流动池的P7序列。可选择功能域以与各种不同测序系统中的任何一种兼容,例如454测序、离子激流质子或PGM、Illumina X10等及其要求。
在一些实施方式中,功能域包括引物。引物可以包括用于
Figure BDA0003042696400000613
删序的R1引物序列,并且在一些实施方式中,包括用于
Figure BDA0003042696400000614
测序的R2引物序列。美国专利公开号2014/0378345和2015/0376609中描述了此类捕获探针的示例及其用途,其全部内容通过引用纳入本文。
空间条形码
如上所述,捕获探针可包括一个或多个空间条形码(例如,两个或更多个、三个或更多个、四个或更多个、五个或更多个)空间条形码。“空间条形码”是一个连续的核酸区段或两个或更多个非连续的核酸区段,用作传递或能够传递空间信息的标签或标识符。在一些实施方式中,捕获探针包括具有空间方面的空间条形码,其中条形码与阵列内的特定位置或基材上的特定位置相关联。
空间条形码可以是分析物的部分,也可以独立于分析物(即捕获探针的部分)。空间条形码可以是附接在分析物(例如,核酸分子)上的标签,或者除了分析物的内源性特征(例如,分析物的大小或末端序列)之外的标签的组合。空间条形码可以是独特的。在空间条形码是独特的一些实施方式中,空间条形码既作为空间条形码又作为与一个特定捕获探针相关联的独特分子标识符(UMI)起作用。
空间条形码可以有多种不同的格式。例如,空间条形码可以包括多核苷酸空间条形码、随机核酸和/或氨基酸序列以及合成核酸和/或氨基酸序列。在一些实施方式中,空间条形码以可逆或不可逆的方式附接到分析物。在一些实施方式中,在样品测序之前、期间和/或之后将空间条形码添加到例如DNA或RNA样品的片段。在一些实施方式中,空间条形码使识别和/或定量个体序列读取结果。在一些实施方式中,空间条形码用作荧光条形码,其中荧光标记的寡核苷酸探针与空间条形码杂交。
在一些实施方式中,空间条形码是基本上不与生物样品中的分析物核酸分子杂交的核酸序列。在一些实施方式中,空间条形码在生物样品中的核酸分子的实质部分(例如80%或更多)上对核酸序列具有小于80%的序列相同性(例如,小于70%、60%、50%或小于40%的序列相同性)。
空间条形码序列可在捕获探针序列内包括约6至约20或更多核苷酸。在一些实施方式中,空间条形码序列的长度可以是约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些实施方式中,空间条形码序列的长度可以是至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些实施方式中,空间条形码序列的长度可以是至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。
这些核苷酸可以是完全连续的,即在邻近核苷酸的单个序列段(stretch)中,或者它们可以被分成两个或多个单独的子序列,这些子序列由1个或多个核苷酸分开。分离的空间条形码子序列的长度约为4到16个核苷酸。在一些实施方式中,空间条形码子序列可以是约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些实施方式中,空间条形码子序列可以是至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些实施方式中,空间条形码子序列可以是至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。
对于附接到共同阵列特征的多个捕获探针,多个捕获探针的一个或多个空间条形码序列可以包括对于耦合到特征的所有捕获探针相同的序列和/或在耦合到特征的所有捕获探针之间不同的序列。
图8是示例性多重空间标记特征的示意图。在图8中,特征801可耦合到空间条码化捕获探针,其中特定特征的空间条码化探针可具有相同的空间条形码,但具有设计成将特征的空间条形码与多个目标分析物相关联的不同捕获域。例如,特征可以耦合到四种不同类型的空间条码化捕获探针,每种类型的空间条码化捕获探针具有空间条形码802。与该特征相关联的一种类型捕获探针包括空间条形码802与多聚(T)捕获域803的组合,其设计用于捕获mRNA目标分析物。与该特征相关联的第二类型捕获探针包括空间条形码802与用于gDNA分析的随机N-聚体捕获域804的组合。与该特征相关联的第三类型捕获探针包括空间条形码802和与分析物捕获剂捕获剂条形码结构域805上的捕获域互补的捕获域组合。与该特征相关联的第四类型捕获探针包括空间条形码802与捕获探针组合,该捕获探针可特异性结合可在CRISPR分析(例如CRISPR/Cas9)中起作用的核酸分子806。虽然图8中仅示出了四种不同的捕获探针条码化构建体,但是捕获探针条码化构建体可被定制用于与核酸相关的任何给定分析物的分析,并且能够与这种构建体结合。例如,图8中所示的方案也可用于本文中所公开的其它分析物的同时分析,包括但不限于:(a)mRNA,谱系追踪构建体,细胞表面或细胞内蛋白质和代谢物,以及gDNA;(b)mRNA,可获得的染色质(例如,ATAC-seq,DNA酶-seq,和/或MNA酶-seq)细胞表面或细胞内蛋白质和代谢物,以及扰动剂(例如,CRISPR-crRNA/sgRNA、TALEN、锌指核酸酶和/或如本文所述的反义寡核苷酸);(c)mRNA、细胞表面或细胞内蛋白质和/或代谢物,条码化标记剂(例如,本文所述的MHC多聚体)和免疫细胞受体(例如,T细胞受体)的V(D)J序列。
附接到单个阵列特征的捕获探针可以包括相同(或共同)的空间条形码序列、不同的空间条形码序列或两者的组合。附接到特征的捕获探测可以包括多组捕获探针。给定组的捕获探针可以包括相同的空间条形码序列。相同的空间条形码序列可以不同于另一组捕获探针的空间条形码序列。
多个捕获探针可以包括与空间阵列上的特定位置相关联的空间条形码序列(例如,核酸条形码序列)。例如,第一多个捕获探针可以基于与第一区域内的捕获探针共同的空间条形码序列与第一区域相关联,并且第二多个捕获探针可以基于与第二区域内的捕获探针共同的空间条形码序列与第二区域相关联。第二区域可以与第一区域相关联,也可以不与第一区域相关联。其它多个捕获探针可以与其他区域内的捕获探针共用的空间条形码序列相关联。在一些实施方式中,空间条形码序列可以在多个捕获探针分子之间相同。
在一些实施方式中,将多个不同的空间条形码合并到单个阵列捕获探针中。例如,混合但已知的一组空间条形码序列可以通过提供对位置特性的重复或独立确认,来提供空间条形码到给定点或位置的更强的寻址(address)或属性。在一些实施方式中,多个空间条形码表示特定阵列点的位置的增加的特异性。
独特分子标识符
捕获探针可包括一个或多个(例如,两个或更多个、三个或更多个、四个或更多个、五个或更多个)独特分子标识符(UMI)。独特分子标识符是作为特定分析物或结合特定分析物的捕获探针(例如,通过捕获域)的标签或标识符的连续核酸区段或两个或更多个非连续核酸区段。
UMI可以是独特的。UMI可包括一个或多个特异性多核苷酸序列,一个或多个随机核酸和/或氨基酸序列,和/或一个或多个合成核酸和/或氨基酸序列。
在一些实施方式中,UMI是基本上不与生物样品中的分析物核酸分子杂交的核酸序列。在一些实施方式中,UMI在生物样品中的核酸分子的实质部分(例如80%或更多)上对核酸序列具有小于80%的序列相同性(例如,小于70%、60%、50%或小于40%的序列相同性)。
UMI可在捕获探针序列内包括约6至约20或更多核苷酸。在一些实施方式中,UMI的长度可以是约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些实施方式中,UMI的长度可以是至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些实施方式中,UMI的长度可以是至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。
这些核苷酸可以是完全连续的,即在邻近核苷酸的单个序列段中,或者它们可以被分成两个或多个单独的子序列,这些子序列由1个或多个核苷酸分开。分离的UMI子序列的长度约为4到16个核苷酸。在一些实施方式中,UMI子序列可以是约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些实施方式中,UMI子序列可以是至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些实施方式中,UMI子序列可以是至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。
在一些实施方式中,UMI以可逆或不可逆的方式附接到分析物。在一些实施方式中,在分析物测序之前、期间和/或之后将UMI添加到例如DNA或RNA样品的片段。在一些实施方式中,UMI使识别和/或定量个体序列读取结果(sequencing-read)。在一些实施方式中,UMI用作荧光条形码,其中荧光标记的寡核苷酸探针与UMI杂交。
捕获探针的其他方面
对于附接到阵列特征的捕获探针,个体阵列特征可以包括一个或多个捕获探针。在一些实施方式中,个体阵列特征包括数百或数千个捕获探针。在一些实施方式中,捕获探针与特定的个体特征相关联,其中个体特征包含捕获探针,该捕获探针包括对于阵列上限定的区域或位置独特的空间条形码。
在一些实施方式中,特定特征可以包含包括一个以上空间条形码的捕获探针(例如,特定特征处的一个捕获探针可以包括与相同特定特征处的另一个捕获探针中包括的空间条形码不同的空间条形码,而两个捕获探针都包括第二共同空间条形码),其中每个空间条形码对应于阵列上特定的限定区域或位置。例如,与阵列上的一个特定特征相关联的多个空间条形码序列可以通过提供位置的重复或独立确认来向给定位置提供更强的地址或属性。在一些实施方式中,多个空间条形码表示特定阵列点的位置的增加的特异性。在非限制性示例中,可以使用两个不同的空间条形码对特定阵列点进行编码,其中每个空间条形码标识阵列内的特定限定区域,并且具有两个空间条形码的阵列点标识两个限定区域交叠的子区域,例如,比如维恩图的重叠部分。
在另一非限制性示例中,特定阵列点可以用三个不同的空间条形码编码,其中第一空间条形码标识阵列内的第一区域,第二空间条形码标识第二区域,其中第二区域是完全在第一区域内的子区域,以及第三空间条形码标识第三区域,其中第三区域是完全在第一和第二子区域内的子区域。
在一些实施方式中,附接到阵列特征的捕获探针从阵列特征中释放以进行测序。或者,在一些实施方式中,捕获探针保持附接到阵列特征,并且探针被测序,同时保持附接到阵列特征(例如,通过原位测序)。捕获探针的测序的其他方面在本发明的后续部分中描述。
在一些实施方式中,阵列特征可以包括附接到特征的不同类型的捕获探针。例如,阵列特征可以包括第一类捕获探针和第二类捕获探针,第一类捕获探针具有设计为结合到一类分析物的捕获域,第二类捕获探针具有设计为结合到第二类分析物的捕获域。通常,阵列特征可以包括附接到单个阵列特征的一个或多个(例如,两个或多个、三个或多个、四个或多个、五个或多个、六个或多个、八个或多个、十个或多个、12个或多个、15个或多个、20个或多个、30个或多个、50个或多个)不同类型的捕获探针。
在一些实施方式中,捕获探针是核酸。在一些实施方式中,捕获探针通过其5′端附接到阵列特征。在一些实施方式中,捕获探针从5′端到3′端包括:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获域。在一些实施方式中,捕获探针从5′端到3′端包括:一个条形码(例如,空间条形码或UMI)和一个捕获域。在一些实施方式中,捕获探针从5′端到3′端包括:裂解域、功能域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获域。在一些实施方式中,捕获探针从5′端到3′端包括:裂解域、功能域、一个或多个条形码(例如,空间条形码和/或UMI)、第二功能域和捕获域。在一些实施方式中,捕获探针从5′端到3′端包括:裂解域、功能域、空间条形码、UMI和捕获域。在一些实施方式中,捕获探针不包括空间条形码。在一些实施方式中,捕获探针不包括UMI。在一些实施方式中,捕获探针包括用于起始测序反应的序列。
在一些实施方式中,捕获探针通过其3′端固定在特征上。在一些实施方式中,捕获探针从3′端到5′端包括:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获域。在一些实施方式中,捕获探针从3′端到5′端包括:一个条形码(例如,空间条形码或UMI)和一个捕获域。在一些实施方式中,捕获探针从3′端到5′端包括:裂解域、功能域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获域。在一些实施方式中,捕获探针从3′端到5′端包括:裂解域、功能域、空间条形码、UMI和捕获域。
在一些实施方式中,捕获探针包括原位合成的寡核苷酸。在一些实施方式中,原位合成的寡核苷酸包括一个或多个恒定序列,其中一个或多个用作引发序列(例如,用于扩增靶核酸的引物)。在一些实施方式中,恒定序列是可裂解序列。在一些实施方式中,原位合成的寡核苷酸包括条形码序列,例如可变条形码序列。在一些实施方式中,原位合成的寡核苷酸附接到阵列的特征。
在一些实施方式中,捕获探针是两个或更多个寡核苷酸序列的产物,例如,连接在一起的两个或更多个寡核苷酸序列。在一些实施方式中,寡核苷酸序列之一是原位合成的寡核苷酸。
在一些实施方式中,捕获探针包括夹板寡核苷酸。可以使用夹板寡核苷酸和本领域已知或本文所述的任何种类的连接酶(例如夹板连接酶)将两个或更多个寡核苷酸连接在一起。
在一些实施方式中,寡核苷酸之一包括:恒定序列(例如,与夹板寡核苷酸的部分互补的序列)、简并序列和捕获域(例如,如本文所述)。在一些实施方式中,捕获探针通过使酶在寡核苷酸序列末端添加多核苷酸来产生。捕获探针可以包括简并序列,该简并序列可以用作独特分子标识符。
捕获探针可以包括简并序列,简并序列是核苷酸序列的某些位置包含许多可能的碱基的序列。简并序列可以是简并核苷酸序列,包括约或至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45或50个核苷酸。在一些实施方式中,核苷酸序列包含核苷酸序列内的1、2、3、4、5、6、7、8、9、0、10、15、20、25或更多简并位置。在一些实施方式中,简并序列用作UMI。
在一些实施方式中,捕获探针包括限制性内切酶识别序列或可被特定酶活性切割的核苷酸序列。例如,尿嘧啶序列可以被特定的酶活性切割。作为另一实例,其它经修饰的碱基(例如,经甲基化修饰)可被特异性核酸内切酶识别和切割。捕获探针可经受酶切,其移出阻断域和在修饰过程中添加到捕获探针3′端的任何其它核苷酸。去除阻断域将显示和/或恢复捕获探针的捕获域的游离3′端。在一些实施方式中,可去除其它核苷酸以显示和/或恢复捕获探针的捕获域的3′端。
在一些实施方式中,阻断域可在其合成时或在其合成之后纳入捕获探针中。捕获域的末端核苷酸是可逆终止子核苷酸(例如,3′-O-阻断可逆终止子和3′-未阻断可逆终止子),并且可以在探针合成期间或之后包含在捕获探针中。
延伸的捕获探针
“延伸的捕获探针”是具有扩大的核酸序列的捕获探针。例如,在捕获探针包括核酸的情况下,“延伸的3′末端”表示其他核苷酸被添加到捕获探针的最末端3′核苷酸以延伸捕获探针的长度,例如,通过标准聚合反应来延伸核酸分子,包括由聚合酶(例如,DNA聚合酶或逆转录酶)催化的模板聚合。
在一些实施方式中,延伸捕获探针包括从捕获的(杂交的)RNA产生cDNA。该过程涉及合成杂交核酸的互补链,例如,基于捕获的RNA模板(与捕获探针的捕获域杂交的RNA)生成cDNA。因此,在延伸捕获探针的初始步骤(例如cDNA生成)中,捕获的(杂交的)核酸(例如RNA)充当延伸的模板(例如逆转录步骤)。
在一些实施方式中,捕获探针使用逆转录延伸。例如,逆转录包括使用逆转录酶从RNA(例如信使RNA)合成cDNA(互补或拷贝DNA)。在一些实施方式中,当组织仍在原位时进行逆转录,产生分析物文库,其中分析物文库包括来自邻近捕获探针的空间条形码。在一些实施方式中,捕获探针使用一种或多种DNA聚合酶延伸。
在一些实施方式中,捕获探针的捕获域包括用于产生与捕获探针杂交的核酸互补链的引物,例如,用于DNA聚合酶和/或逆转录的引物。由延伸反应产生的核酸(例如DNA和/或cDNA)分子包含捕获探针的序列。捕获探针的延伸,例如DNA聚合酶和/或逆转录反应,可以使用各种合适的酶和方案来进行。
在一些实施方式中,产生全长DNA(例如cDNA)分子。在一些实施方式中,“全长”DNA分子是指整个捕获的核酸分子。然而,如果核酸(例如RNA)在组织样品中部分降解,则捕获的核酸分子将与组织样品中的初始RNA长度不同。在一些实施方式中,延伸的探针的3′端(例如第一链cDNA分子)被修饰。例如,接头或衔接子可以连接到延伸的探针的3′端。这可以通过使用单链连接酶如T4 RNA连接酶或CircleGaseTM(可从威斯康星州麦迪逊的艾匹森特生物技术公司(Epicentre Biotechnologies)购得)来实现。在一些实施方式中,模板转换寡核苷酸用于延伸eDNA以产生全长eDNA(或尽可能接近全长eDNA)。在一些实施方式中,第二链合成辅助探针(能够与延伸的捕获探针的3′端杂交的部分双链DNA分子)可以使用双链连接酶(例如T4 DNA连接酶)连接到延伸的探针的3′端,例如第一链cDNA分子。适用于连接步骤的其他酶在本领域中是已知的,并且包括例如Tth DNA连接酶、Taq DNA连接酶、热球菌属(菌株9°N)DNA连接酶(9°NTM DNA连接酶,新英格兰生物实验室(New England Biolabs))、AmpligaseTM(可从威斯康星州麦迪逊的艾匹森特生物技术公司(EpicentreBiotechnologies)获得)和SplintR(可从马萨诸塞州伊普斯维奇的新英格兰生物实验室获得)。在一些实施方式中,多核苷酸尾(例如多聚(A)尾)纳入延伸的探针分子的3′端。在一些实施方式中,使用末端转移酶活性酶纳入多核苷酸尾。
在一些实施方式中,处理双链延伸的捕获探针以在扩增和/或分析(例如序列分析)之前去除任何未延伸的捕获探针。这可以通过多种方法实现,例如,使用酶降解未延伸的探针,例如核酸外切酶,或使用纯化柱。
在一些实施方式中,延伸的捕获探针被扩增以产生足以进行分析的量,例如通过DNA测序。在一些实施方式中,延伸的捕获探针的第一链(例如,DNA和/或cDNA分子)用作扩增反应(例如,聚合酶链反应)的模板。
在一些实施方式中,扩增反应使用包括亲和基团的引物将亲和力基团纳入延伸的捕获探针(例如,RNA-cDNA杂交)上。在一些实施方式中,所述引物包括亲和基团,所述延伸的捕获探针包括亲和基团。亲和基团可以对应于前面描述的任何亲和基团。
在一些实施方式中,包括亲和基团的延伸的捕获探针可以耦合到亲和基团特异性的阵列特征。在一些实施方式中,基材可包括抗体或抗体片段。在一些实施方式中,阵列特征包括亲和素或链霉亲和素,并且亲和基团包括生物素。在一些实施方式中,阵列特征包括麦芽糖,亲和基团包括麦芽糖结合蛋白。在一些实施方式中,阵列特征包括麦芽糖结合蛋白,亲和基团包括麦芽糖。在一些实施方式中,只要延伸的探针的拷贝未附接到阵列特征,则扩增延伸的捕获探针可以起到从阵列特征释放扩增的探针的作用。
在一些实施方式中,从阵列特征释放延伸的捕获探针或其互补物或扩增子。从阵列特征释放延伸的捕获探针或其互补物或扩增子的步骤可以通过多种方式实现。在一些实施方式中,通过核酸裂解和/或变性(例如通过加热使双链分子变性)从特征释放延伸的捕获探针或其互补物。
在一些实施方式中,通过物理手段从阵列特征释放延伸的捕获探针或其互补物或扩增子。例如,诱导物理释放的方法包括变性双链核酸分子。另一种释放延伸的捕获探针的方法是使用干扰双链分子氢键的溶液。在一些实施方式中,通过施加加热的水(例如至少85℃的水或缓冲液,例如至少90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃或99℃的水)来释放延伸的捕获探针。在一些实施方式中,添加包括盐、表面活性剂等可以进一步使核酸分子之间的相互作用不稳定的溶液以从阵列特征释放延伸的捕获探针。在一些实施方式中,甲酰胺溶液可用于使核酸分子之间的相互作用不稳定以从阵列特征中释放延伸的捕获探针。
分析物捕获剂
本发明还提供用于使用分析物捕获剂对生物分析物(例如,mRNA、基因组DNA、可接近染色质和细胞表面或细胞内蛋白质和/或代谢物)进行空间概况分析的方法和材料。如本文所用,“分析物捕获剂”(以前有时也称为“细胞标记剂”)是指与分析物(例如,样品中的分析物)和捕获探针(例如,附接到基材的捕获探针)相互作用以识别分析物的物质。在一些实施方式中,分析物捕获剂包括分析物结合部分和捕获剂条形码结构域。
图9是由分析物结合部分904和捕获剂条形码结构域908组成的示例性分析物捕获剂902的示意图。分析物结合部分904是能够结合到分析物906并与空间条码化捕获探针相互作用的分子。分析物结合部分可以高亲和力和/或高特异性结合到分析物906。分析物捕获剂可包括捕获剂条形码结构域908、核苷酸序列(例如,寡核苷酸),其可与捕获探针的捕获结构域的至少部分或全部杂交。分析物结合部分904可包括多肽和/或适体(例如,结合到特定目标分析物的寡核苷酸或肽分子)。分析物结合部分904可包括抗体或抗体片段(例如,抗原结合片段)。
如本文所用,术语“分析物结合部分”是指能够结合到大分子成分(例如,分析物,例如,生物分析物)的分子或部分。在本文所述的任何空间概况分析方法的一些实施方式中,结合到生物分析物的分析物捕获剂的分析物结合部分可包括但不限于抗体或其表位结合片段、细胞表面受体结合分子、受体配体、小分子,双特异性抗体、双特异性T细胞接合物、T细胞受体接合物、B细胞受体接合物、前体、适体、单体、粘合素、DARPin和蛋白质支架,或其任何组合。分析物结合部分可以高亲和力和/或高特异性结合到大分子成分(例如,分析物)。分析物结合部分可包括核苷酸序列(例如,寡核苷酸),其可对应于分析物结合部分的至少部分或全部。分析物结合部分可包括多肽和/或适体(例如,结合到特定靶分子的多肽和/或适体,例如,分析物)。分析物结合部分可包括结合到特定分析物(例如,多肽)的抗体或抗体片段(例如,抗原结合片段)。
在一些实施方式中,分析物捕获剂能够结合存在于细胞内的分析物。在一些实施方式中,分析物捕获剂能够结合细胞表面分析物,其可包括但不限于受体、抗原、表面蛋白、跨膜蛋白、分化蛋白簇、蛋白通道、蛋白泵、载体蛋白、磷脂、糖蛋白、糖脂、细胞-细胞相互作用蛋白复合物,抗原呈递复合物、主要组织相容性复合物、工程化T细胞受体、T细胞受体、B细胞受体、嵌合抗原受体、胞外基质蛋白、细胞表面蛋白的翻译后修饰(例如,磷酸化、糖基化、泛素化、亚硝化、甲基化、乙酰化或脂质化)状态、间隙连接和粘附连接。在一些实施方式中,分析物捕获剂能够结合到翻译后修饰的细胞表面分析物。在此类实施方式中,分析物捕获剂可基于翻译后修饰的给定状态(例如,磷酸化、糖基化、泛素化、亚硝基化、甲基化、乙酰化或脂质化)对细胞表面分析物特异性,使得细胞表面分析物概况可包括一种或多种分析物的翻译后修饰信息。
在一些实施方式中,分析物捕获剂包括与分析物结合部分偶联或以其他方式附接到分析物结合部分的捕获剂条形码结构域。在一些实施方式中,捕获剂条形码结构域共价连接到分析物结合部分。在一些实施方式中,捕获剂条形码结构域是核酸序列。在一些实施方式中,捕获剂条形码结构域包括分析物结合部分条形码和分析物捕获序列。
如本文所用,术语“分析物结合部分条形码”是指与分析物结合部分相关联或以其他方式识别分析物结合部分的条形码。在一些实施方式中,通过(识别分析物结合部分(通过识别其相关的分析物结合部分条形码),还可以识别分析物结合部分结合的分析物。分析物结合部分条形码可以是给定长度的核酸序列和/或与分析物结合部分相关联的序列。分析物结合部分条形码通常可包括本文所述条形码的各种方面中的任一方面。例如,一种类型的分析物特异性的分析物捕获剂可具有耦合到其上的第一捕获剂条形码结构域(例如,其包括第一分析物结合部分条形码),而不同分析物特异性的分析物捕获剂可具有耦合到其上的不同的捕获剂条形码结构域(例如,其包括第二条形码分析物结合部分条形码)。在一些方面中,这种捕获剂条形码结构域可包括使识别捕获剂条形码结构域耦合到的分析物结合部分的分析物结合部分条形码。捕获剂条形码结构域的选择可得到序列方面的显著多样性,同时也可容易地附接到大多数分析物结合部分(例如,抗体)以及容易地检测(例如,使用测序或阵列技术)。在一些实施方式中,分析物捕获剂可包括具有附接到其上的捕获剂条形码结构域的分析物结合部分。例如,分析物捕获剂可包括第一分析物结合部分(例如,结合到分析物的抗体,例如,第一细胞表面特征),其具有与其相关联的捕获剂条形码结构域,其包括第一分析物结合部分条形码。
在一些实施方式中,分析物捕获剂的捕获剂条形码结构域包括分析物捕获序列。如本文所用,术语“分析物捕获序列”是指被配置为杂交到捕获探针的捕获域、结合到捕获探针的捕获域、耦合到捕获探针的捕获域或以其他方式与捕获探针的捕获域相互作用的区域或部分。在一些实施方式中,分析物捕获序列包括与捕获探针的捕获域互补或基本互补的核酸序列,使得分析物捕获序列与捕获探针的捕获域杂交。在一些实施方式中,分析物捕获序列包含与包含多聚(T)核酸序列的捕获域杂交的多聚(A)核酸序列。在一些实施方式中,分析物捕获序列包含与包含多聚(A)核酸序列的捕获域杂交的多聚(T)核酸序列。在一些实施方式中,分析物捕获序列包含与捕获域杂交的非均聚核酸序列,该捕获域包含与分析物捕获区域的非均聚核酸序列互补(或基本互补)的非均聚核酸序列。
在使用分析物捕获剂的本文所述的任何空间分析方法的一些实施方式中,捕获剂条形码结构域可以直接耦合到分析物结合部分,或者它们可以附接到珠、分子晶格,例如线性、球状、交联或其他聚合物,或与分析物结合部分附接或以其他方式相关联的其他框架,其使将多个捕获剂条形码结构域附接到单个分析物结合部分。捕获剂条形码结构域到分析物结合部分的附接(耦合)可通过各种直接或间接、共价或非共价结合或附接中的任何一种来实现。例如,在捕获剂条形码结构域耦合到包括抗体或抗原结合片段的分析物结合部分的情况下,可以使用化学偶联技术(例如,可从银诺瓦生物科学有限公司(InnovaBiosciences)获得的Lightning
Figure BDA0003042696400000741
抗体标记试剂盒)将这些捕获剂条形码结构域共价附接到抗体或抗原结合片段的部分。在一些实施方式中,捕获剂条形码结构域可使用非共价附接机制(例如,使用生物素化抗体和包括一个或多个生物素化接头的寡核苷酸或珠,用亲和素或链霉亲和素接头耦合到寡核苷酸)耦合到抗体或抗原结合片段。可使用抗体和寡核苷酸生物素化技术,并且其例如在Fang等,Nucleic Acids Res.(2003),31(2):708-715中描述,其全部内容通过引用纳入本文中。同样地,蛋白质和肽生物素化技术已被开发并可被使用,并且例如在美国专利号6,265,552中描述,其全部内容通过引用纳入本文。此外,点击反应化学(例如甲基四嗪-PEG5-NHS酯反应、TCO-PEG4-NHS酯反应等)可用于将捕获剂条形码结构域耦合到分析物结合部分。分析物结合部分上的反应部分还可包括用于靶向醛类的胺、用于靶向马来酰亚胺(例如,游离巯基)的胺、用于靶向点击化学化合物(例如,炔烃)的叠氮化物、用于靶向链霉亲和素的生物素、用于靶向EDC的磷酸盐,其反过来靶向活性酯(例如,NH2)。分析物结合部分上的反应部分可以是与分析物结合部分上的反应部分结合的化合物或基团。将分析物结合部分偶联到捕获剂条形码结构域的示例性策略包括使用商业试剂盒(例如,Solulink、Thunder link)、铰链区的轻微还原和马来酰亚胺标记的结合、对标记的酰胺(例如,无铜)的染色促进的点击化学反应,糖链的高碘酸盐氧化的偶联和胺的偶联。在分析物结合部分是抗体的情况下,抗体可以在寡核苷酸偶联之前或同时进行修饰。例如,抗体可用β-1,4-半乳糖基转移酶的基材允许的突变体GalT(Y289L)和含叠氮化物的尿苷二磷酸-N-乙酰半乳糖胺类似物尿苷二磷酸-GalNAz进行糖基化。修饰后的抗体可与具有二苯并环辛炔-PEG4-NHS基团的寡核苷酸偶联。在一些实施方式中,可以避免某些步骤(例如,COOH活化(例如,EDC)和同双功能交联剂)以防止分析物结合部分与其自身偶联。在本文所述的任何空间概况分析方法的一些实施方式中,分析物捕获剂(例如,耦合到寡核苷酸的分析物结合部分)可通过转染(例如,使用转染胺、阳离子聚合物、磷酸钙或电穿孔)、转导(例如,使用噬菌体或重组病毒载体),通过机械递送(例如,磁珠),通过脂质(例如,1,2-二油酸-sn-甘油-3-磷酸胆碱(DOPC)),或通过转运蛋白递送至细胞内。分析物捕获剂可以通过外来体被递送至细胞内。例如,可产生释放包含分析物捕获剂的外来体的第一细胞。分析物捕获剂可以附接在外来体膜上。分析物捕获剂可以包含在外来体的胞浆中。释放的外来体可被收获并提供给第二细胞,从而将分析物捕获剂递送到第二细胞中。分析物捕获剂可在递送到细胞之前、期间或之后从外来体膜释放。在一些实施方式中,使细胞透化以使分析物捕获剂与胞内细胞成分(例如但不限于细胞内蛋白质、代谢物和核膜蛋白质)耦合。在细胞内递送之后,可使用分析物捕获剂来分析如本文所述的胞内成分。
在本文描述的任何空间概况分析方法的一些实施方式中,耦合到分析物捕捉剂的捕捉剂条形码结构域可包括使其不可由聚合酶扩增的修饰。在一些实施方式中,当结合到用于引物延伸反应的样品中的核酸或捕获探针的捕获域时,捕获剂条形码结构域可以用作模板而不是引物。当捕获剂条形码结构域还包括条形码(例如,分析物结合部分条形码)时,这样的设计可以通过增加捕获剂条形码结构域和未编码样品核酸之间的亲和力来提高分子条码化的效率,并且消除衔接子伪影的潜在形成。在一些实施方式中,捕获剂条形码结构域可包括随机N-聚体序列,该随机N-聚体序列被使其不可由聚合酶延伸的修饰所加帽。在某些情况下,随机N-聚体序列的组成可以被设计成最大化与游离的、未编码的ssDNA分子的结合效率。设计可包括具有较高GC含量的随机序列组合物、在特定位置具有固定G或C的部分随机序列、鸟苷的使用、锁核酸的使用或其任何组合。
通过聚合酶阻断引物延伸的修饰可以是不同长度的碳间隔子基团或双脱氧核苷酸。在一些实施方式中,修饰可为具有无嘌呤或无嘧啶结构的无碱位点、碱基类似物或磷酸盐主链的类似物,例如通过酰胺键连接的N-(2-氨基乙基)-甘氨酸主链、四氢呋喃或1’,2’-二脱氧核糖。修饰还可以是尿嘧啶碱、2’OMe修饰RNA、C3-18间隔子(例如,具有3-18个连续碳原子的结构,例如C3间隔子)、乙二醇多聚体间隔子(例如,间隔子18(六乙二醇间隔子))、生物素、二脱氧核苷酸三磷酸酯、乙二醇、胺或磷酸盐。
在本文描述的任何空间概况分析方法的一些实施方式中,耦合到分析物结合部分的捕获剂条形码结构域包括可裂解结构域。例如,在分析物捕获剂结合到分析物(例如,细胞表面分析物)之后,可以根据本文所述的方法切割和收集捕获剂条形码结构域以用于下游分析。在一些实施方式中,捕获剂条形码结构域的可裂解结构域包括使物质从珠释放的U-切除元件。在一些实施方式中,U-切除元件可包括包含至少一种尿嘧啶的单链DNA(ssDNA)序列。该物质可以通过ssDNA序列附接到珠上。该物质可通过尿嘧啶-DNA糖基化酶(例如,去除尿嘧啶)和核酸内切酶(例如,诱导ssDNA断裂)的组合释放。如果核酸内切酶从裂解产生5′磷酸基团,则可在下游加工中包括其它酶处理以消除磷酸基团,例如,在连接其它测序手柄元件(例如,Illumina全P5序列、部分P5序列、全R1序列和/或部分R1序列)之前。
在一些实施方式中,分析物捕获剂的分析物结合部分包括一个或多个抗体或其抗原结合片段。包括分析物结合部分的抗体或抗原结合片段可特异性结合到目标分析物。在一些实施方式中,分析物是蛋白质(例如,生物样品(例如,细胞)表面上的蛋白质或胞内蛋白质)。在一些实施方式中,包含多个分析物结合部分的多个分析物捕获剂结合存在于生物样品中的多个分析物。在一些实施方式中,多个分析物包括单一种类的分析物(例如,单一种类的多肽)。在多个分析物包括单一种类的分析物的一些实施方式中,多个分析物捕获剂的分析物结合部分相同。在多个分析物包括单一种类的分析物的一些实施方式中,多个分析物捕获剂的分析物结合部分是不同的(例如,多个分析物捕获剂的成员可以具有两个或更多个分析物结合部分,其中两个或更多个分析物结合部分中的每一个结合单一种类的分析物(例如,在不同的结合位点))。在一些实施方式中,多个分析物包括多个不同种类的分析物(例如,多个不同种类的多肽)。
在一些实施方式中,来自生物样品的多种不同种类的分析物(例如,多肽)可随后与生物样品的一个或多个物理性质相关联。例如,多种不同种类的分析物可与分析物在生物样品中的位置相关联。此类信息(例如,当分析物结合部分识别多肽时的蛋白质组学信息)可与其它空间信息(例如,来自生物样品的遗传信息,例如DNA序列信息、转录组信息(即转录物序列)或两者)联用。例如,细胞的细胞表面蛋白质可与细胞的一个或多个物理性质(例如,细胞的形状、大小、活性或类型)相关联。一个或多个物理性质可以通过对细胞成像来表征。细胞可由分析物捕获剂结合,该分析物捕获剂包含结合到细胞表面蛋白质的分析物结合部分和识别该分析物结合部分的分析物结合部分条形码,并且细胞可经空间分析(例如,本文所述的各种空间分析方法中的任何一种)。例如,结合到细胞表面蛋白质的分析物捕获剂可结合到捕获探针(例如,阵列上的捕获探针),该捕获探针包括与存在于分析物捕获剂的捕获剂条形码结构域上的分析物捕获序列相互作用的捕获域。所有或部分捕获剂条形码结构域(包括分析物结合部分条形码)可使用聚合酶复制,使用捕获结构域的3′末端作为引发位点,生成延伸的捕获探针,其包括捕获探针的全部或部分(包括捕获探针上存在的空间条形码)和分析物结合部分条形码的拷贝。在一些实施方式中,具有延伸的捕获探针的空间阵列可与样品接触,其中与空间阵列相关联的分析物捕获剂捕获目标分析物。包含延伸的捕获探针(其包括捕获探针的空间条形码和分析物结合部分条形码)的分析物捕获剂随后可从空间阵列的捕获探针变性。这样就可以重复使用空间阵列。样品可分离成非聚集细胞(例如单细胞)并通过本文所述的单细胞/液滴方法进行分析。延伸的捕获探针可被测序以获得核酸序列,其中捕获探针的空间条形码与分析物捕获剂的分析物结合部分条形码相关联。因此,延伸的捕获探针的核酸序列可与分析物(例如,细胞表面蛋白质)相关联,并反过来与细胞的一个或多个物理性质(例如,形状或细胞类型)相关联。在一些实施方式中,延伸的捕获探针的核酸序列可与附近细胞的细胞内分析物相关联,其中使用本文所述的任何细胞透化或分析物迁移技术释放细胞内分析物。
在本文所描述的任何空间概况分析方法的一些实施方式中,然后可以对从分析物捕获剂释放的捕获剂条形码结构域进行序列分析,以识别哪些分析物捕获剂与分析物结合。基于与空间阵列上的特征(例如,特定位置的特征)相关联的捕获剂条形码结构域和分析物结合部分条形码序列的存在,可以为生物样品创建分析物文件。个体细胞或细胞群的文件可与其他细胞(例如,“正常”细胞)的文件进行比较,以确定分析物的变化,从而提供诊断相关信息。在一些实施方式中,这些文件可用于诊断以细胞表面受体的变化为特征的各种疾病,例如癌症和其他疾病。
图10是描绘特征固定的捕获探针1024和分析物捕获剂1026之间的示例性相互作用的示意图。特征固定的捕获探针1024可以包括空间条形码1008以及一个或多个功能序列1006和1010,如本文别处所述。捕获探针还可以包括能够结合到分析物捕获剂1026的捕获域1012。分析物捕获剂1026可以包括功能序列1018、捕获剂条形码结构域1016和能够结合到捕获探针1024的捕获域1012的分析物捕获序列1014。分析物捕获剂还可以包括接头1020,其使捕获剂条形码结构域1016耦合到分析物结合部分1022。
在本文所描述的任何空间概况分析方法的一些实施方式中,所述方法用于识别免疫细胞文件。免疫细胞表达与免疫功能相关的各种适应性免疫受体,如T细胞受体(TCR)和B细胞受体(BCR)。T细胞受体和B细胞受体通过特异性识别和结合抗原并协助其破坏而在免疫应答中发挥作用。
T细胞受体(TCR)是一种存在于T细胞表面的分子,通常负责将抗原片段识别为与主要组织相容性复合物(MHC)分子结合的肽。TCR通常是两条链的异二聚体,每条链都是免疫球蛋白超家族的成员,具有N末端可变(V)结构域和C末端恒定结构域。在人类,95%的T细胞中,TCR由α和β链组成,而在5%的T细胞中,TCR由γ和δ(γ/δ)链组成。这一比例在个体发育过程中、疾病状态下以及不同物种中都会发生变化。当TCR与抗原肽和MHC(肽/MHC或pMHC)结合时,T淋巴细胞通过信号转导被激活。
TCR的两条链中的每一条都包含基因区段的多个拷贝——可变的“V”基因区段、多样性的“D”基因区段和连接的“J”基因区段。TCRα链(TCRa)由V、J区段重组产生,而β链(TCRb)由V、D、J区段重组产生。类似地,TCRγ链的产生涉及V和J基因区段的重组,而TCRδ链的产生是通过V、D和J基因区段的重组来实现的。这些特定区域的交叉点(α链或γ链的V和J,β链或δ链的V、D和J)对应于对抗原MHC识别很重要的CDR3区域。互补决定区(例如,CDR1、CDR2和CDR3)或高变区是抗原受体(例如,T细胞受体和免疫球蛋白)可变域中可与抗原互补的序列。CDR的大部分多样性存在于CDR3中,这种多样性是由T淋巴细胞发育过程中的体细胞重组事件产生的。在基因排列过程中产生的独特核苷酸序列可以称为克隆型。
B细胞受体(BCR)是一种存在于B细胞表面的分子。BCR的抗原结合部分由膜结合抗体组成,与大多数抗体(例如免疫球蛋白)一样,膜结合抗体具有独特且随机确定的抗原结合位点。BCR的抗原结合部分包括一种同种型(例如IgD、IgM、IgA、IgG或IgE)的膜结合免疫球蛋白分子。当B细胞被它第一次遇到的同源抗原激活时,该细胞增殖和分化产生抗体分泌型浆B细胞和记忆B细胞群体。不同的免疫球蛋白同种型在生物学特性、结构、靶特异性和分布上存在差异。存在多种分子机制来产生初始多样性,包括多个位点的基因重组。
BCR由编码抗体重链和轻链的IgH和IgK(或IgL)两个基因组成。免疫球蛋白是通过基因区段间的重组、这些区段连接处的序列多样化以及整个基因的点突变形成的。每个重链基因包含三个不同基因区段的多个拷贝——可变的“V”基因区段、多样性的“D”基因区段和连接的“J”基因区段。每个轻链基因包含蛋白质可变区的两个不同基因区段的多个拷贝-可变的“V”基因区段和连接的“J”基因区段。
重组可以产生一个V、D和J段各有一个的分子。此外,在两个连接的每个连接处可以删除几个碱基,并添加其他碱基(称为N和P核苷酸),从而产生进一步的多样性。B细胞活化后,通过体细胞超突变发生亲和成熟过程。在这个过程中,活化的B细胞的子代细胞在整个基因中积累不同的体细胞突变,在CDR区域具有更高的突变浓度,从而产生对抗原具有更高亲和力的抗体。
除了体细胞超突变外,活化的B细胞也经历了同种型转换的过程。具有相同可变区段的抗体根据恒定区段可以具有不同的形式(同种型)。而所有的原始B细胞都表达IgM(或IgD),活化的B细胞大多数表达IgG,但也表达IgM、IgA和IgE。这种从IgM(和/或IgD)到IgG、IgA或IgE的表达转换通过重组事件发生,该事件导致一个细胞专一产生特定的同种型。在基因排列过程中产生的独特核苷酸序列可以类似地称为克隆型。
本文所描述的某些方法用于分析来自免疫细胞的TCR和BCR的各种序列,例如各种克隆型。在一些实施方式中,所述方法用于分析TCRα链、TCRβ链、TCRδ链、TCRγ链或其任何片段(例如,包括V(D)J或VJ区的可变区、恒定区、跨膜区、其片段、其组合和其片段组合)的序列。在一些实施方式中,本文所述的方法可用于分析B细胞受体重链、B细胞受体轻链或其任何片段(例如,包括V(D)J或VJ区的可变区、恒定区、跨膜区、其片段、其组合和其片段组合)的序列。
在将要分析免疫细胞的情况下,用于附接条形码序列和/或扩增反应的各种操作中的任何一种的引物序列可包括靶向免疫细胞蛋白质(例如免疫受体)的基因或基因区域的基因特异性序列。这些基因序列包括但不限于各种T细胞受体α可变基因(TRAV基因)、T细胞受体α连接基因(TRAJ基因)、T细胞受体α恒定基因(TRAC基因)、T细胞受体β可变基因(TRBV基因)、T细胞受体β多样性基因(TRBD基因)的序列,T细胞受体β连接基因(TRBJ基因)、T细胞受体β恒定基因(TRBC基因)、T细胞受体γ可变基因(TRGV基因)、T细胞受体γ连接基因(TRGJ基因)、T细胞受体γ恒定基因(TRGC基因)、T细胞受体δ可变基因(TRDV基因),T细胞受体δ多样性基因(TRDD基因)、T细胞受体δ连接基因(TRDJ基因)和T细胞受体δ恒定基因(TRDC基因)的序列。
在一些实施方式中,分析物结合部分基于I类或II类主要组织相容性复合物(MHC)。在一些实施方式中,分析物结合部分是MHC多聚体,包括但不限于MHC右旋体、MHC四聚体和MHC五聚体(例如,参见美国专利申请公开号US 2018/0180601和US 2017/0343545,其全部内容通过引用纳入本文中)。包括全部或部分MHC肽的MHC(例如可溶性MHC单体分子)可用作分析物捕获剂的分析物结合部分,所述分析物捕获剂耦合到捕获剂条形码结构域,所述捕获剂条形码结构域包括识别其相关MHC的分析物结合部分条形码(因此,例如MHC的TCR结合伴侣)。在一些实施方式中,MHC用于分析T细胞的一个或多个细胞表面特征,例如TCR。在某些情况下,多个MHC以更大的复合物(MHC多聚体)结合在一起,通过多配体结合协同作用提高MHC与TCR的结合亲和力。
图11A、11B和11C是图示如何在基于阵列的系统中利用链霉亲和素细胞标签来产生空间条码化的细胞或细胞内容物的示意图。例如,如图11所示,肽结合的主要组织相容性复合物(pMHC)可单独与生物素结合并结合到链霉亲和素部分,使得链霉亲和素部分包含多个pMHC部分。这些部分中的每一个可结合到TCR,使得链霉亲和素通过多个MCH/TCR结合相互作用结合到靶T细胞。多个相互作用协同作用,可以大大提高结合亲和力。这种改进的亲和力可以改善T细胞的标记,也可以降低标记从T细胞表面解离的可能性。如图11B所示,捕获剂条形码结构域1101可由链霉亲和素1102修饰并与生物素化MHC 1103的多个分子(例如pMHC)接触,使得生物素化MHC 1103分子与链霉亲和素偶联的捕获剂条形码结构域1101耦合。结果是条码化的MHC多聚体复合物1105。如图11B所示,捕获剂条形码结构域序列1101可以将MHC识别为其相关联的标签,并且还包括可选的功能序列,例如用于与其他寡核苷酸杂交的序列。如图11C所示,一个示例寡核苷酸是捕获探针1106,其包括互补序列(例如,与C CC相对应的rGrGrG)、条形码序列和其他功能序列,例如,UMI、衔接子序列(例如,包括测序引物序列(例如,R1或部分R1(“pR1”))、流动池附接序列(例如,P5或P7或其部分序列)等。在某些情况下,捕获探针1106可首先与特征(例如,凝胶珠)相关联并从特征中释放。在其它实施方式中,捕获探针1106可与MHC-寡核苷酸复合物1105的捕获剂条形码结构域1101杂交。杂交的寡核苷酸(间隔子C C C和间隔子rGrGrG)随后可在引物延伸反应中延伸,使得生成包含对应于两个空间条形码序列(与捕获探针相关联的空间条形码,与MHC-寡核苷酸复合物相关联的条形码)中的每一个的序列的构建物。在一些情况下,这些对应序列中的一个或两个可以是捕获探针1106或捕获剂条形码结构域1101中的原始序列的互补物。在其他实施方式中,捕获探针和捕获剂条形码结构域连接在一起。所得到的构建体可以任选地进一步加工(例如,以添加任何其它序列和/或用于清理)并进行测序。如本文别处所述,源自捕获探针1106空间条形码序列的序列可用于识别特征,并且源自捕获剂条形码结构域1101上的空间条形码序列的序列可用于识别结合在细胞表面上的特定肽MHC复合物1104(例如,当使用用于筛选免疫细胞或免疫细胞群的MHC肽库时)。
(c)基材
对于本节中描述的基于空间阵列的分析方法,基材起到了支持捕获探针直接或间接附接到阵列特征的作用。此外,在一些实施方式中,基材(例如,相同的基材或不同的基材)可用于为生物样品,特别是,例如薄组织切片提供支持。因此,“基材”是不溶于水性溶液的支持物,其使生物样品、分析物、特征和/或捕获探针定位在基材上。
多种不同的基材可用于上述目的。通常,基材可以是任何合适的支持材料。示例性基材包括但不限于玻璃、改性和/或功能化玻璃、水凝胶、膜、薄膜、塑料(包括例如丙烯酸、聚苯乙烯、苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM、环烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂,Zeonor、二氧化硅或二氧化硅基材料,包括硅和改性硅、碳、金属、无机玻璃、光纤束和聚合物,例如聚苯乙烯、环烯烃共聚物(COC)、环烯烃聚合物(COP)、聚丙烯、聚乙烯和聚碳酸酯。
基材也可以对应于流动池。流动池可以由上述任何材料形成,并且可以包括使试剂、溶剂、特征和分子通过流动池的通道。
在上面讨论的基材材料的实例中,聚苯乙烯是适于结合带负电大分子的疏水性材料,因为它通常几乎不包含亲水性基团。对于固定在玻片上的核酸,通过增加玻璃表面的疏水性,可以增加核酸的固定。这种增强可以使相对更密集的堆叠形成(例如,提供改进的特异性和分辨率)。
在一些实施方式中,用表面处理剂(例如聚(L)-赖氨酸)涂覆基材。另外或可选择地,可通过硅烷化(例如采用环氧硅烷、氨基硅烷)和/或通过聚丙烯酰胺处理来处理基材。
基材通常可以具有任何合适的形式或形态。例如,基材可以是平坦的、弯曲的,例如向生物样品(例如组织样品)和基材之间发生相互作用的区域呈凸形或凹形弯曲。在一些实施方式中,基材是平坦的,例如,平面、芯片或载玻片。基材可包含基材内的一个或多个图案化表面(例如,通道、孔、凸起、脊、凹坑等)。
基材可以是任何期望的形状。例如,基材通常可以是薄的扁平形状(例如,正方形或矩形)。在一些实施方式中,基材结构具有圆角(例如,为了增加安全性或稳健性)。在一些实施方式中,基材结构具有一个或多个截止角(例如,用于滑动夹或交叉台)。在一些实施方式中,当基材结构是平坦的时,基材结构可以是具有平坦表面的任何适当类型的支持物(例如,芯片或载玻片,例如显微镜载玻片)。
基材可任选地包括各种结构,例如但不限于凸起、脊和通道。基材可以被微图案化以限制横向扩散(例如,防止空间条形码的重叠)。用这种结构修饰的基材可以被修饰以使分析物、特征物(例如,珠)或探针在各个位置的结合。例如,用各种结构修饰基材的位点可以与其他位点连续或不连续。
在一些实施方式中,基材的表面可以被修饰,以便形成只能具有或容纳单个特征的离散位置。在一些实施方式中,基材的表面可以被修饰,使得特征粘附到随机位点。
在一些实施方式中,使用诸如(但不限于)冲压技术、微蚀技术和模制技术等技术来修饰基材的表面以包含一个或多个孔。在基材包括一个或多个孔的一些实施方式中,基材可以是凹面载玻片或凹穴载玻片。例如,孔可以由基材表面上的一个或多个浅凹陷形成。在一些实施方式中,在基材包括一个或多个孔的情况下,可以通过将盒(例如,包含一个或多个腔室的盒)附接到基材结构的表面来形成孔。
在一些实施方式中,基材(例如,孔)的结构可各自承载不同的捕获探针。可以根据结构在基材表面中或基材表面上的位置来识别附接在每个结构上的不同捕获探针。示例性基材包括阵列,其中分开的结构位于基材上,包括例如具有容纳特征的孔的阵列。
在一些实施方式中,基材包括基材表面上的一个或多个标识,例如,以提供将空间信息与感兴趣的分析物的表征相关联的指引。例如,可以用线的网格来标记基材(例如,使容易地估计在放大率下看到的对象的大小和/或提供用于计数对象的参考区域)。在一些实施方式中,基准标志可以包括在基材上。此类标识可使用包括但不限于印刷、喷砂和表面沉积等技术制作。
在一些实施方式中,其中基材被修饰以包含一个或多个结构,包括但不限于孔、凸起、脊或标识,所述结构可包括物理改变的位点。例如,用各种结构修饰的基材可包括物理性质,包括但不限于物理构型、磁力或压缩力、化学官能化位点、化学改变位点和/或静电改变位点。
在一些实施方式中,其中基材被修饰以包含各种结构,包括但不限于孔、凸起、脊或标识,所述结构以图案施加。或者,结构可以随机分布。
在一些实施方式中,处理基材以最小化或减少特征内或特征之间的非特异性分析物杂交。例如,处理可包括用水凝胶、膜和/或薄膜涂覆基材,其对非特异性杂交形成物理屏障。可以使用任何合适的水凝胶。例如,可以使用根据美国专利号6,391,937、9,512,422和9,889,422以及美国专利申请公开号U.S.2017/0253918和U.S.2018/0052081中所述方法制备的水凝胶基材。上述各文件的全部内容通过引用纳入本文。
处理可包括添加具有反应性或能够被激活的官能团,使得其在接收刺激(例如,光活性)后变得具有反应性。处理可包括使用具有一种或多种物理性质(例如,机械、电气、磁性和/或热)的聚合物进行处理,以最小化非特异性结合(例如,在某些位置激活基材以使在这些位置进行分析物杂交)。
基材(例如,珠或阵列上的特征)可包括几万到几十万或数百万个个体寡核苷酸分子(例如,至少约10000、50000、100000、500000、1000000、10000000、10000000、100000000、100000000、100000000或1000000000个寡核苷酸分子)。
在一些实施方式中,基材的表面涂有细胞受纳涂层以使活细胞粘附。“细胞受纳涂层(cell-permissive coating)”是使细胞或帮助细胞在基材上维持细胞活力(例如保持活力)的涂层。例如,细胞受纳涂层可增强细胞附接、细胞生长和/或细胞分化,例如,细胞受纳涂层可向活细胞提供营养。细胞受纳涂层可以包括生物材料和/或合成材料。细胞受纳涂层的非限制性示例包括特征在于具有一个或多个细胞外基质(ECM)成分(例如蛋白聚糖和纤维蛋白,例如胶原、弹性蛋白、纤连蛋白和层粘连蛋白)、聚赖氨酸、聚(L)-鸟氨酸和/或生物相容性硅酮(例如
Figure BDA0003042696400000861
)的涂层。例如,包括一种或多种细胞外基材成分的细胞受纳涂层可包括I型胶原、II型胶原、IV型胶原、弹性蛋白、纤连蛋白、层粘连蛋白和/或玻连蛋白。在一些实施方式中,细胞受纳涂层包括从Engelbreth-Holm-Swarm(EHS)小鼠肉瘤(例如,
Figure BDA0003042696400000862
)中提取的可溶性基膜制剂。在一些实施方式中,细胞受纳涂层包括胶原。细胞受纳涂层可用于在空间条码化阵列上培养贴壁细胞,或在与空间条码化阵列接触时维持组织样品或切片的细胞活力。
当基材包括凝胶(例如,水凝胶或凝胶基材)时,凝胶内的寡核苷酸可附接于基材。术语“水凝胶”和“水凝胶基材”在本文中互换使用以指代包括网络的大分子聚合物凝胶。在网络中,一些聚合物链可以选择性地交联,尽管交联并不总是发生。
在一些实施方式中,水凝胶可包括水凝胶亚基。“水凝胶亚基”是亲水单体、分子前体或可聚合(例如交联)以形成三维(3D)水凝胶网络的聚合物。水凝胶亚基可包括任何方便的水凝胶亚基,例如但不限于丙烯酰胺、双丙烯酰胺、聚丙烯酰胺及其衍生物、聚乙二醇及其衍生物(例如PEG-丙烯酸酯(PEG-DA)、PEG-RGD)、明胶-甲基丙烯酰(GelMA)、甲基丙烯酸化透明质酸(MeHA)、聚脂肪族聚氨酯,聚醚型聚氨酯、聚酯型聚氨酯、聚乙烯共聚物、聚酰胺、聚乙烯醇、聚丙二醇、聚氧丁撑、聚乙烯吡咯烷酮、聚丙烯酰胺、聚丙烯酸羟乙酯和聚甲基丙烯酸羟乙酯、胶原蛋白、透明质酸、壳聚糖、葡聚糖、琼脂糖、明胶、海藻酸盐、蛋白质聚合物、甲基纤维素等及其组合。
在一些实施方式中,水凝胶包括杂化材料,例如,水凝胶材料包括合成聚合物和天然聚合物的元素。例如,在美国专利号6,391,937、9,512,422和9,889,422以及美国专利申请公开号2017/0253918、2018/0052081和2010/0055733中描述了合适水凝胶的实例,其全部内容通过引用纳入本文中。
在一些实施方式中,将交联剂和/或引发剂添加到水凝胶亚基。交联剂的实例包括但不限于双丙烯酰胺和双吖丙啶。引发剂的实例包括但不限于偶氮二异丁腈(AIBN)、核黄素和L-精氨酸。包含交联剂和/或引发剂可导致在后期聚合步骤中相互作用的生物大分子之间共价键合增加。
在一些实施方式中,水凝胶可具有胶体结构(例如琼脂糖)或聚合物网状结构(例如明胶)。
在一些实施方式中,一些水凝胶亚基共价或物理交联聚合(例如经历“形成”),以形成水凝胶网络。例如,水凝胶亚基可通过任何方法聚合,包括但不限于热交联、化学交联、物理交联、离子交联、光交联、辐照交联(例如,x射线、电子束)及其组合。光刻聚合等技术也可用于形成水凝胶。
可选择水凝胶亚基的聚合方法以形成具有不同性质(例如,水凝胶的孔径、溶胀性质、生物降解性、导电性、透明度和/或透化性)的水凝胶。例如,水凝胶可包括足够大小的孔,以使大分子(例如,核酸、蛋白质、染色质、代谢物、gRNA、抗体、碳水化合物、肽、代谢物和/或小分子)进入样品(例如,组织切片)。众所周知,孔径通常随着水凝胶亚基浓度的增加而减小,并且通常随着水凝胶亚基与交联剂的比例的增加而增大。因此,可制备包含一定浓度的使此类生物大分子通过的水凝胶亚基的固定剂/水凝胶组合物。
在一些实施方式中,水凝胶可形成基材。在一些实施方式中,基材包括水凝胶和一种或多种第二材料。在一些实施方式中,将水凝胶放置在一种或多种第二材料的顶部。例如,水凝胶可以预先形成,然后用一种或多种第二材料放置在顶部、底部或以任何其他构造放置中。在一些实施方式中,水凝胶形成发生在于基材形成期间接触一种或多种第二材料之后。水凝胶形成也可以发生在位于基材上的结构(例如,孔、脊、凸起和/或标识)内。
在一些实施方式中,基材上的水凝胶形成发生在特征(例如,珠)附接到基材之前、同时或之后。例如,当捕获探针附接(例如,直接或间接)至基材时,可在已包含捕获探针的基材上进行水凝胶形成。
在一些实施方式中,水凝胶形成发生在生物样品内。在一些实施方式中,生物样品(例如,组织切片)包埋在水凝胶中。在一些实施方式中,将水凝胶亚基注入生物样品中,并且水凝胶的聚合由外部或内部刺激引发。
在其中在生物样品内形成水凝胶的实施方式中,可使用官能化化学。在一些实施方式中,官能化化学包括水凝胶组织化学(HTC)。适用于HTC的任何水凝胶组织骨架(例如,合成的或天然的)可用于锚定生物大分子和调节官能化。使用HTC骨架变体的方法的非限制性示例包括CLARITY、PACT、ExM、SWITCH和ePACT。在一些实施方式中,生物样品内的水凝胶形成是永久的。例如,生物大分子可以永久地粘附在水凝胶上,从而使进行多轮询查。在一些实施方式中,生物样品内的水凝胶形成是可逆的。
在一些实施方式中,在聚合之前、同时和/或之后向水凝胶亚基添加其它试剂。例如,其它试剂可包括但不限于寡核苷酸(例如,捕获探针)、用于片段化DNA的核酸内切酶、用于DNA的片段化缓冲液、DNA聚合酶、用于扩增核酸和将条形码附接到扩增片段上的dNTP。可以使用其他酶,包括但不限于RNA聚合酶、转座酶、连接酶、蛋白酶K和DNA酶。其它试剂还可以包括逆转录酶,包括具有末端转移酶活性的酶、引物和转换寡核苷酸。在一些实施方式中,在聚合之前、同时和/或之后向水凝胶亚基添加光学标记。
在一些实施方式中,在聚合之前、同时和/或之后向水凝胶添加HTC试剂。在一些实施方式中,在聚合之前、同时和/或之后将细胞标记剂添加到水凝胶中。在一些实施方式中,在聚合之前、同时和/或之后将细胞透化剂添加到水凝胶中。
包埋在生物样品中的水凝胶可以用任何合适的方法清除。例如,电泳组织清除方法可用于去除水凝胶包埋样品中的生物大分子。在一些实施方式中,水凝胶包埋的样品在水凝胶清除之前或之后存储在介质(例如,固定介质、甲基纤维素或其他半固体介质)中。
“可条件性移出涂层”是指在应用释放剂后可从基材表面移出的涂层。在一些实施方式中,可条件性移出涂层包括如本文所述的水凝胶,例如,包括基于多肽的材料的水凝胶。具有基于多肽的材料的水凝胶的非限制性实例包括具有蜘蛛丝和人类肌肉L型钙通道的跨膜区段(例如,
Figure BDA0003042696400000891
)的组合的基于合成肽的材料,含有重复的精氨酸-丙氨酸-天冬氨酸-丙氨酸序列(RADARADARADARADA)(例如
Figure BDA0003042696400000892
)、EAK16(AEAEAKAKAEAEAKAK)、KLD12(KLDLKLDLKLDL)和PGMATRIXTM的两亲性16残基肽。
在一些实施方式中,条件可移出涂层中的水凝胶是刺激响应性水凝胶。刺激响应性水凝胶可在施加一个或多个外部触发物(例如释放剂)时经历凝胶到溶液和/或凝胶到固体的转变。参见,例如,Willner,Acc.Chem.Res.50:657-658,2017,其全文通过引用纳入本文。刺激响应性水凝胶的非限制性实例包括热响应性水凝胶、pH响应性水凝胶、光响应性水凝胶、氧化还原响应性水凝胶、分析物响应性水凝胶或其组合。在一些实施方式中,刺激响应性水凝胶可以是多刺激响应性水凝胶。
“释放剂”或“外部触发物”是当释放剂施加到可条件性移出涂层上时,使从基材移出可条件性移出涂层的试剂。外部触发物或释放剂可包括物理触发物,例如热、磁、超声、电化学和/或光刺激,以及化学触发物,例如pH、氧化还原反应、超分子复合物和/或生物催化驱动反应。参见例如Echeverria等,Gels(2018),4,54;doi:10.3390/gels4020054,其全文通过引用纳入本文。“释放剂”或“外部触发物”的类型可取决于可条件性移出涂层的类型。例如,特征在于具有氧化还原响应性水凝胶的可条件性移出涂层可在施用包括还原剂(例如二硫苏糖醇(DTT))的释放剂时移出。作为另一个例子,pH响应性水凝胶可在施加改变pH的释放剂时去除。
(d)阵列
在本文描述的许多方法中,特征(如下面进一步描述的)被集体地定位在基材上。“阵列”是不规则或形成规则图案的多个特征的特定排列。阵列中的各个特征基于其相对空间位置而彼此不同。一般而言,阵列中的多个特征中的至少两个包括不同的捕获探针(例如,本文描述的捕获探针的任何示例)。
阵列可用于同时测量大量分析物。在一些实施方式中,至少部分地使用寡核苷酸来创建阵列。例如,单一种类的寡核苷酸(例如,捕获探针)的一个或多个拷贝可对应于或直接或间接地附接到阵列中的给定特征。在一些实施方式中,阵列中的给定特征包括两种或更多种寡核苷酸(例如,捕获探针)。在一些实施方式中,直接或间接连接到阵列上给定特征的两种或更多种寡核苷酸(例如,捕获探针)包括共同(例如,相同)空间条形码。
“特征”是一个实体,作为样品分析中使用的各种分子实体的支持或存储库。特征的示例包括但不限于珠、任何二维或三维几何形状的点(例如,喷墨点、掩模点、网格上的正方形)、孔和水凝胶垫。在一些实施方式中,特征直接或间接地附接或固定到基材。在一些实施方式中,所述特征不直接或间接地附接或固定到基材,而是例如布置在封闭或部分封闭的三维空间(例如,孔或凹坑)内。
除上述特征外,还可以使用多种其他特征来形成本文所述的阵列。例如,在一些实施方式中,由喷墨印刷、丝网印刷或静电沉积在基材上的聚合物和/或生物聚合物形成的特征可用于形成阵列。例如,在PCT专利申请公开号WO 2014/085725中描述了生物聚合物的喷墨印刷。例如,在de Gans等,Adv Mater.16(3):203-213(2004)中描述了聚合物的喷墨印刷。聚合物和生物聚合物的静电沉积方法被描述于,例如,Hoyer等,Anal.Chem.68(21):3840-3844(1996)。上述各参考文献的全部内容通过引用纳入本文。
作为另一实例,在一些实施方式中,特征由金属微颗粒或纳米颗粒形成。例如,Lee等,Beilstein J.Nanotechnol.8:1049-1055(2017)中描述了沉积此类颗粒以形成阵列的合适方法,其全部内容通过引用纳入本文。
作为另一示例,在一些实施方式中,特征由组装在基材上的磁性颗粒形成。Ye等,Scientific Reports 6:23145(2016)中描述了此类组装阵列的方法和颗粒的示例,其全部内容通过引用纳入本文。
作为另一示例,在一些实施方式中,特征对应于其中已纳入一个或多个光学标记物和/或已通过诸如永久性光漂白的过程改变的基材区域。以这种方式实施特征的合适基材包括例如多种聚合物。例如,在Moshrefzadeh等,Appl.Phys.Lett.62:16(1993)中描述了形成这种特征的方法,其全部内容通过引用纳入本文。
作为又一实例,在一些实施方式中,特征可对应于组装(例如,经由自组装)以形成阵列的胶体颗粒。合适的胶体颗粒例如在Sharma,Resonance 23(3):263-275(2018)中描述,其全部内容通过引用纳入本文。
作为另一示例,在一些实施方式中,可以通过单体溶液在基材上的点阵列光聚合来形成特征。特别地,双光子和三光子聚合可用于制造相对较小(例如,亚微米)尺寸的特征。Nguyen等,Materials Today 20(6):314-322(2017)中描述了以这种方式在基材上制备特征的合适方法,其全部内容通过引用纳入本文。
在一些实施方式中,特征直接或间接地附接或固定到液体可透化的基材。在一些实施方式中,特征直接或间接地附接或固定到生物相容性基材。在一些实施方式中,特征直接或间接地附接或固定到基材,该基材是水凝胶。
图12描述了阵列中条码化特征的示例性排列。从左到右,图12示出了(L)包括六个空间条码化阵列的载玻片,(C)六个空间条码化阵列中的一个的放大示意图,显示了与生物样品有关的条码化特征的网格,以及(R)阵列的一个部分的放大示意图,显示阵列中多个特征的特定标识(标记为ID578、ID579、ID560等)。
如本文所使用的,术语“珠阵列”是指包括多个珠作为阵列中的特征的阵列。在一些实施方式中,珠附接到基材。例如,所述珠可以任选地附接到诸如显微镜载玻片之类的基材上并且靠近生物样品(例如,包括细胞的组织切片)。珠也可悬浮在溶液中并沉积在表面(例如,膜、组织切片或基材(例如,显微镜载玻片))上。
基材上或基材内珠阵列的示例包括位于孔中的珠,例如BeadChip阵列(可从加利福尼亚州圣迭戈的亿明达公司(Illumina Inc.)获得)、454LifeSciences(瑞士巴塞尔罗氏公司的子公司)测序平台中使用的阵列,以及用于离子激流测序平台的阵列(加利福尼亚州卡尔斯巴德生命科技公司的子公司)。例如,美国专利号6,266,459、6,355,431、6,770,441、6,859,570、6,210,891、6,258,568和6,274,320;美国专利申请公开号2009/0026082;2009/0127589;2010/0137143;和2010/0282617;以及PCT专利申请公开号WO 00/063437和WO2016/162309中描述了珠阵列的示例,其全部内容通过引用纳入本文。
在一些实施方式中,珠阵列包括多个珠。例如,珠阵列可以包括至少10000个珠(例如,至少100000个珠、至少1000000个珠、至少5000000个珠、至少10000000个珠)。在一些实施方式中,所述多个珠包括单一类型的珠(例如,在尺寸、形状和其他物理性质上基本均匀,例如半透明)。在一些实施方式中,所述多个珠包括两种或更多种类型的不同珠。
在一些实施方式中,当珠包埋在水凝胶层中时形成珠阵列,其中水凝胶聚合并固定相对珠位置。珠阵列可以预先平衡并与反应缓冲液和酶(例如,逆转录混合物)合并。在一些实施方式中,珠阵列被冷冻。
“柔性阵列”包括多个空间条码化特征,所述多个空间条码化特征附接至或包埋至放置在生物样品上的柔性基材(例如,膜或带)。在一些实施方式中,柔性阵列包括包埋在水凝胶基材中的多个空间条码化特征。为了形成这样的阵列,将微阵列的特征复制到水凝胶中,并且通过去除水来减小水凝胶的尺寸。这些步骤可以进行多次。例如,在一些实施方式中,用于制备高密度空间条码化阵列的方法可包括将来自微阵列的多个特征复制到第一水凝胶中,其中第一水凝胶与微阵列接触;通过去除水来减小包括所复制特征的第一水凝胶的尺寸,形成包括所复制特征的第一收缩水凝胶;将所述第一收缩水凝胶中的特征复制到第二水凝胶中,其中所述第二水凝胶与所述第一水凝胶接触;并且通过去除水来减小包括所复制特征的第二水凝胶的尺寸,形成包括所复制特征的第二收缩水凝胶,从而生成高密度的空间条码化阵列。结果产生包括空间条码化特征的高密度柔性阵列。
在一些实施方式中,可将空间条码化珠加载到基材(例如,水凝胶)上以产生高密度自组装珠阵列。
柔性阵列可以预先平衡,合并反应缓冲液和功能浓度的酶(例如,逆转录混合物)。在一些实施方式中,柔性珠阵列可被长时间(例如,数天)存储或冷冻直到备用。在一些实施方式中,生物样品(例如,组织切片)的透化可在与柔性阵列接触之前通过添加酶/洗涤剂来进行。柔性阵列可直接放置在样品上,或与生物样品间接接触(例如,在生物样品和柔性珠阵列之间具有中间层或物质)。在一些实施方式中,一旦将柔性阵列应用于样品,可在固体微球或第一尺寸的圆形珠和第二尺寸的圆形珠上进行分析物的逆转录和靶向捕获。
“微细管阵列”是由微细管划分的一系列阵列特征。“微细管通道”是由微细管创建的单独分区。例如,微细管通道可与其它微细管通道流体隔离,使得阵列中一个微细管通道中的流体或其它内容物与阵列中相邻微细管通道中的流体或其它内容物分离。微细管的密度和排列顺序可以是任何合适的离散位点的密度或排列顺序。
在一些实施方式中,处理微细管阵列以产生有助于加载的条件。一个例子是使用电晕棒(BD-20AC,电子技术产品公司(Electro Technic Products))以产生亲水表面。在一些实施方式中,特征(例如,附接捕获探针的珠)被加载到微细管阵列上,使得特征在阵列中的确切位置是已知的。例如,可以将包含空间条形码的捕获探针放置到微细管通道中,使得空间条形码能够识别从中衍生出条码化核酸分子的条形码序列的位置。
在一些实施方式中,当使用随机分布来分布特征时,可以进行经验测试以生成有助于每个微细管的单个特征的加载/分布条件。在一些实施方式中,可以期望实现仅促进每个微细管通道的单个特征(例如珠)的分布条件。在一些实施方式中,可以期望通过使特征流过微细管通道来实现促进每个微细管通道的一个以上特征(例如,珠)的分布条件。
在一些实施方式中,将微细管阵列放置在与样品接触的位置(例如,在顶部或下方),使得包含特征的微细管(例如,可以包括捕获探针的珠)与生物样品接触。在一些实施方式中,将生物样品放置在微细管阵列的暴露侧上并且施加机械加压,将生物样品移动到微细管通道中以创建包含生物样品的流体隔离反应室。
在一些实施方式中,通过将微细管阵列接触生物样品来划分生物样品,从而创建包括珠和生物样品的部分的微细管通道。在一些实施方式中,包含在微细管通道中的生物样品的部分是一个或多个细胞。在一些实施方式中,在将一个或多个细胞添加到微细管通道之后,通过流将特征引入微细管阵列。
在一些实施方式中,将试剂添加到微细管阵列。添加的试剂可以包括酶试剂和用于进行核酸扩增的试剂混合物。在一些实施方式中,试剂包括逆转录酶、连接酶、一种或多种核苷酸及其任何组合。将试剂添加到微细管通道后,例如使用硅油、矿物油、无孔材料或盖子,可以密封一个或多个微毛细管通道。
在一些实施方式中,在孵育一定时间和一定温度或温度范围后(例如,在杂交或扩增反应后),从每个微毛细管通道移出试剂溶液。试剂溶液可以单独加工用于测序,也可以合并用于测序分析。
在一些实施方式中,阵列中的一些或所有特征包括捕获探针。在一些实施方式中,阵列可包括直接或间接附接到基材的捕获探针。
捕获探针包括捕获结构域(例如,核苷酸序列),其可以特异性地结合(例如,杂交)到样品内的目标分析物(例如,mRNA、DNA或蛋白质)。在一些实施方式中,捕获探针与靶标的结合(例如杂交)可通过检测已纳入靶标中的视觉信号(例如荧光团、重金属(例如银离子)或化学发光标记)来检测和定量。在一些实施方式中,视觉信号的强度与生物样品中每个分析物的相对丰度相关。由于一个阵列可以包含成千上万或数百万个捕获探针(或更多),带有捕获探针的特征阵列可以平行地询查许多分析物。
在一些实施方式中,基材包括一个或多个捕获探针,其设计用于捕获来自一个或多个生物体的分析物。在非限制性示例中,基材可包含设计用于捕获来自一个生物体(例如,人类)的mRNA的一个或多个捕获探针和设计用于捕获来自第二生物体(例如,细菌)的DNA的一个或多个捕获探针。
捕获探针可以使用多种技术附接到基材或特征。在一些实施方式中,捕获探针直接附接到固定在阵列上的特征。在一些实施方式中,捕获探针通过化学固定固定到基材上。例如,在基材上的官能团和捕获探针上的相应功能元件之间可以发生化学固定。捕获探针中的示例性对应功能元件可以是捕获探针的固有化学基团,例如羟基,或者可以将功能元件引入到捕获探针上。基材上官能团的实例为胺基。在一些实施方式中,要固定的捕获探针包括官能胺基或经化学修饰以包括官能胺基。用于这种化学改性的手段和方法在本领域是众所周知的。
在一些实施方式中,捕获探针是核酸。在一些实施方式中,捕获探针通过其5′端固定在特征或基材上。在一些实施方式中,捕获探针通过其5′端固定在特征或基材上,并且从5′端到3′端包括:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获域。在一些实施方式中,捕获探针通过其5′端固定在特征上,并且从5′端到3′端包括:一个条形码(例如,空间条形码或UMI)和一个捕获域。在一些实施方式中,捕获探针通过其5′端固定在特征或基材上,并且从5′端到3′端包括:裂解域、功能域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获域。
在一些实施方式中,捕获探针通过其5′端固定在特征或基材上,并且从5′端到3′端包括:裂解域、功能域、一个或多个条形码(例如,空间条形码和/或UMI)、第二功能域和捕获域。在一些实施方式中,捕获探针通过其5′端固定在特征或基材上,并且从5′端到3′端包括:裂解域、功能域、空间条形码、UMI和捕获域。在一些实施方式中,捕获探针通过其5′端固定在特征或基材上,并且不包括空间条形码。在一些实施方式中,捕获探针通过其5′端固定在特征或基材上,并且不包括UMI。在一些实施方式中,捕获探针包括用于起始测序反应的序列。
在一些实施方式中,捕获探针通过其3′端固定在特征或基材上。在一些实施方式中,捕获探针通过其3′端固定在特征或基材上,并且从3′端到5′端包括:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获域。在一些实施方式中,捕获探针通过其3′端固定在特征或基材上,并且从3′端到5′端包括:一个条形码(例如,空间条形码或UMI)和一个捕获域。在一些实施方式中,捕获探针通过其3′端固定在特征或基材上,并且从3′端到5′端包括:裂解域、功能域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获域。在一些实施方式中,捕获探针通过其3′端固定在特征或基材上,并且从3′端到5′端包括:裂解域、功能域、空间条形码、UMI和捕获域。
待固定的捕获探针内的官能团的定位可用于控制和塑造捕获探针的结合行为和/或取向,例如,官能团可放置在捕获探针的5′或3′端部或捕获探针的序列内。在一些实施方式中,捕获探针还可以包括基材(例如,附接到捕获探针的支持物、附接到特征的支持物或附接到基材的支持物)。待固定的捕获探针的典型基材包括能够结合到所述捕获探针(例如,结合到胺官能化核酸)的部分。此类基材的实例为羧基、醛基或环氧基支持物。
在一些实施方式中,可将捕获探针固定在其上的基材可被化学活化,例如通过活化基材上可用的官能团。术语“活化(的)基材”涉及其中通过化学修饰程序建立或实现相互作用或反应性化学官能团的材料。例如,包括羧基的基材可在使用前活化。此外,某些基材含有能与捕获探针中已有的特定部分反应的官能团。
在一些实施方式中,共价键用于将捕获探针直接耦合到基材。在一些实施方式中,捕获探针通过将捕获探针的“第一”核苷酸与基材分离的接头(即化学接头)间接耦合到基材。在一些实施方式中,捕获探针不直接结合到阵列,而是间接地相互作用,例如通过结合到本身直接或间接结合到阵列的分子。在一些实施方式中,捕获探针间接地附接到基材(例如,经由包括聚合物的溶液)。
在捕获探针间接固定在阵列特征上的一些实施方式中,例如通过与能够结合捕获探针的表面探针杂交,捕获探针还可以包括能够与表面探针的5′端杂交的上游序列(与杂交到核酸,例如,组织样品的RNA的序列的5′方向上)。单独地,捕获探针的捕获域可被视为捕获域寡核苷酸,其可在捕获探针间接固定在阵列上的实施方式中用于捕获探针的合成。
在一些实施方式中,基材由惰性材料或基质(例如,载玻片)组成,所述惰性材料或基质已通过例如用包含能够固定捕获探针的反应基团的材料处理而官能化。例如,参见WO2017/019456,其全部内容通过引用纳入本文。非限制性示例包括惰性基材上支持的聚丙烯酰胺水凝胶(例如,载玻片;参见WO 2005/065814和美国专利申请号2008/0280773,其全部内容通过引用纳入本文)。
在一些实施方式中,使用共价方法将官能化生物分子(例如,捕获探针)固定在官能化基材上。共价附接的方法包括,例如胺和活化的羧酸酯(例如,N-羟基琥珀酰亚胺酯)的缩合;胺和醛在还原胺化条件下的缩合;以及环加成反应,例如Diels-Alder[4+2]反应、1,3-偶极环加成反应,和[2+2]环加成反应。共价附接的方法还包括,例如点击化学反应,包括[3+2]环加成反应(例如,Huisgen 1,3-偶极环加成反应和铜(I)催化的叠氮炔环加成反应(CuAAC));巯基-烯反应;Diels-Alder反应和逆电子需求Diels-Alder反应;[4+1]异腈和四嗪的环加成;小碳环的亲核开环(例如,氨基寡核苷酸的环氧化物开环)。共价附接的方法还包括例如马来酰亚胺和硫醇;以及对硝基苯酯-官能化寡核苷酸和聚赖氨酸-官能化基材。共价附接的方法还包括,例如,二硫键反应;自由基反应(参见,例如,美国专利号5919626,其全部内容通过引用纳入本文);和酰肼-官能化基材(例如,其中酰肼官能团直接或间接附接到基材)和醛-官能化寡核苷酸(参见例如Yershov等,(1996)Proc.Natl.Acad.Sci.USA93,4913-4918,其全部内容通过引用纳入本文)。
在一些实施方式中,使用光化学共价方法将官能化的生物分子(例如,捕获探针)固定在官能化的基材上。光化学共价连接的方法包括,例如,安曲酮-偶联寡核苷酸的固定(参见,例如,Koch等,(2000)Bioconjugate Chem.11,474-483,其全部内容通过引用纳入本文)。
在一些实施方式中,使用非共价方法将官能化生物分子(例如,捕获探针)固定在官能化基材上。用于非共价附接的方法包括例如生物素-官能化的寡核苷酸和链霉亲和素-处理的基材(参见例如
Figure BDA0003042696400000991
等,(1993)Analytical Biochemistry 209,278-283和Gilles等,(1999)Nature Biotechnology 17,365-370,其全部内容通过引用纳入本文)。
在一些实施方式中,寡核苷酸(例如,捕获探针)可根据以下所述的方法附接到基材或特征:美国专利号6737236、7259258、7375234、7427678、5610287、5807522、5837860和5472881;美国专利申请公开号2008/0280773和2011/0059865;Shalon等,(1996)GenomeResearch,639-645;Rogers等,(1999)Analytical Biochemistry 266,23-30;Stimpson等,(1995)Proc.Natl.Acad.Sci.USA 92,6379-6383;Beattie等,(1995)Clin.Chem.45,700-706;Lamture等,(1994)Nucleic Acids Research 22,2121-2125;Beier等,(1999)NucleicAcids Research 27,1970-1977;Joos等,(1997)Analytical Biochemistry 247,96-101;Nikiforov等,(1995)Analytical Biochemistry 227,201-209;Timofeev等,(1996)Nucleic Acids Research 24,3142-3148;Chrisey等,(1996)Nucleic Acids Research24,3031-3039;Guo等,(1994)Nucleic Acids Research 22,5456-5465;Running和Urdea(1990)BioTechniques 8,276-279;Fahy等,(1993)Nucleic Acids Research 21,1819-1826;Zhang等,(1991)19,3929-3933;和Rogers等,(1997)Gene Therapy 4,1387-1392。上述各文件的全部内容通过引用纳入本文。
阵列可以通过多种方法制备。在一些实施方式中,通过在阵列上合成(例如,原位合成)寡核苷酸或通过喷墨印刷或平版印刷来制备阵列。例如,高密度DNA寡核苷酸的光定向合成可以通过光刻或固相DNA合成来实现。为了实现光刻合成,可以将用光化学保护基团修饰的合成接头附接到基材上,并且可以使用光刻掩模(应用于基材的特定区域)和光来修饰光化学保护基团,从而产生具有局部光脱保护作用的阵列。这些方法中的许多在本领域中是已知的,并且在例如Miller等的“微阵列的基本概念和临床微生物学中的潜在应用(Basic concepts of microarrays and potential applications in clinicalmicrobiology)”,Clinical microbiology reviews 22.4(2009):611-633;US201314111482A;US9593365B2;US2019203275;和WO2018091676中描述,其全部通过引用纳入本文。
在一些实施方式中,用寡核苷酸“点样”或“印刷”所述阵列,然后将这些寡核苷酸(例如,捕获探针)附接到所述基材。寡核苷酸可以通过非接触或接触印刷来施加。非接触式打印机可以使用与计算机打印机相同的方法(例如,气泡喷射或喷墨)将探针溶液的小液滴喷射到基材上。这种专用的喷墨式打印机可以将纳升到皮升体积的寡核苷酸溶液滴(而不是墨水)喷射到基材上。在接触印刷中,每个印刷针直接将寡核苷酸溶液施涂在表面的特定位置上。寡核苷酸可通过DNA磷酸主链的负电荷与基材表面的带正电涂层的静电相互作用或通过DNA中的胸腺嘧啶碱与处理过的基材表面上的胺基之间的紫外光交联共价键附接到基材表面。在一些实施方式中,所述基材是载玻片。在一些实施方式中,寡核苷酸(例如,捕获探针)通过共价键附接到化学基材,例如环氧硅烷、氨基硅烷、赖氨酸、聚丙烯酰胺等。
这些阵列也可以通过原位合成的方法来制备。在一些实施方式中,可以使用光刻制备这些阵列。该方法通常依赖于在基材上的紫外光掩蔽和光定向的组合化学合成来直接在阵列表面选择性地合成探针,每个点一次一个核苷酸,同时用于多个点。在一些实施方式中,基材包含共价接头分子,其在游离端上具有可被光移除的保护基团。紫外光通过光刻掩模被引导以去保护和激活带有羟基的选定位点,其起始与附接到激活的位点的进入的受保护核苷酸的耦合。掩模的设计方式是可以选择暴露位点,从而指定每个核苷酸可以附接的阵列上的坐标。这个过程可以重复,一个新的掩膜被应用于激活不同的位点集和耦合不同的碱基,使在每个位点构建任意的寡核苷酸。这个过程可以用来合成成千上万种不同的寡核苷酸。在一些实施方式中,可以使用无掩模阵列合成器技术。它使用可编程微镜阵列来制作数字掩模,其反射所需的紫外线图案,以去除特征的保护。
在一些实施方式中,喷墨点蚀工艺还可用于原位寡核苷酸合成。不同的核苷酸前体加催化剂可以印在基材上,然后结合耦合和去保护步骤。该方法依赖于在阵列表面以重复轮次的逐个碱基印刷方式印刷皮升体积的核苷酸,其延长阵列上寡核苷酸探针的长度。
阵列也可以通过电场主动杂交来制备,以控制核酸的转运。当正电流施加到阵列上的一个或多个测试位点时,带负电荷的核酸可以被转运到特定的位点或特征。阵列的表面可包含结合分子,例如链霉亲和素,其使在电子寻址的生物素化探针到达其靶向的位置时形成键(例如链霉亲和素-生物素键)。然后从激活的特征移除正电流,新的测试位点可以通过正电流的靶向应用被激活。重复此过程,直到阵列上的所有位点都被覆盖。
可通过如本文所述的各种方法来生成用于空间分析的阵列。在一些实施方式中,阵列具有多个包含空间条形码的捕获探针。可以确定这些空间条形码及其与阵列上位置的关系。在某些情况下,这样的信息很容易获得,因为寡核苷酸是以预先确定的图案在阵列上被点样、印刷或合成的。在一些情况下,可以通过本文描述的方法(例如,通过原位测序、通过与空间条形码相关联的各种标签等)对空间条形码进行解码。在一些实施方式中,可以使用阵列作为模板来生成子阵列。因此,可以将空间条形码转移到具有已知图案的子阵列。
在一些实施方式中,可通过连接多个寡核苷酸来产生包含条码化的探针的阵列。在一些实例中,所述多个寡核苷酸包含条形码的部分,并且在连接所述多个寡核苷酸时生成完整的条形码。例如,包含条形码的第一部分的第一寡核苷酸可附接到基材(例如,使用本文所述的将寡核苷酸附接到基材的任何方法),然后,包含条形码的第二部分的第二寡核苷酸可以连接到第一寡核苷酸上以生成完整的条形码。条形码的第一、第二和任何其它部分的不同组合可用于增加条形码的多样性。在第二寡核苷酸在连接之前也附接于基材的实例中,第一和/或第二寡核苷酸可经由包含裂解位点的表面接头附接于基材。连接后,通过在裂解位点裂解将连接的寡核苷酸线性化。
为了增加条形码的多样性,包含两个或更多个不同条形码序列的多个第二寡核苷酸可以连接到包含相同条形码序列的多个第一寡核苷酸上,从而产生两个或更多个不同种类的条形码。为了实现选择性连接,附接到包含条形码的第一部分的基材的第一寡核苷酸最初可以用保护基团(例如,光可裂解保护基团)保护,并且在第一寡核苷酸和第二寡核苷酸之间连接之前可以移除保护基团。在阵列上的条码化的探针通过连接两个或更多个寡核苷酸产生的情况下,寡核苷酸的浓度梯度可应用于基材,使得寡核苷酸的不同组合根据其在基材上的位置纳入条码化的探针中。
阵列上的条形码探针也可以通过将单个核苷酸添加到阵列上现有的寡核苷酸来生成,例如,使用以模板独立方式起作用的聚合酶。单个核苷酸可以以浓度梯度添加到现有的寡核苷酸中,从而产生具有不同长度的探针,这取决于探针在阵列上的位置。
也可以通过修饰现有的阵列来制备阵列,例如,通过修饰附接到阵列的寡核苷酸。例如,可以在包含寡核苷酸的阵列上生成探针,寡核苷酸在3′端附接到阵列并且具有游离的5′端。所述寡核苷酸可以是原位合成的寡核苷酸,并且可以包括条形码。寡核苷酸的长度可以小于50个核苷酸(nt)(例如,小于45、40、35、30、25、20、15或10个nt)。为了使用这些寡核苷酸产生探针,可使用与寡核苷酸的部分互补的引物(例如,寡核苷酸共有的恒定序列)与寡核苷酸杂交并延伸(使用寡核苷酸作为模板)以形成双链体并产生3′突出端。因此,3′突出端使其它的核苷酸或寡核苷酸被添加到双链体上。捕获探针可以通过例如将一个或多个寡核苷酸添加到3′突出端的末端来产生(例如,通过夹板寡核苷酸介导的连接),其中添加的寡核苷酸可以包括捕获域的序列或该序列的部分。
在现有阵列上的寡核苷酸包括可与夹板寡核苷酸杂交的识别序列的情况中,还可通过经由夹板寡核苷酸将其它寡核苷酸直接连接到现有寡核苷酸上来产生探针。识别序列可以位于现有阵列上寡核苷酸的游离5′端或游离3′端。对本发明方法有用的识别序列可以不包含限制性酶识别位点或二级结构(例如发夹),并且可以包括高含量的鸟嘌呤和胞嘧啶核苷酸,因此具有高稳定性。
可以通过将珠(例如,条码化的珠)以规则的图案或不规则的排列附接到基材来生成珠阵列。可以通过例如选择性地激活基材上的区域来将珠附接到基材上的选择性区域以使珠的附接。活化基材上的选择性区域可包括活化施涂在基材上的涂层(例如,光可裂解涂层)或聚合物。可以迭代地附接珠,例如,可以一次附接珠的子集,并且可以重复相同的过程来附接剩余的珠。或者,可以一步将珠全部附接到基材上。
可通过首先在基材上制备多个条码化的探针、在基材上沉积多个珠并使用基材上的探针作为模板生成附接到珠的探针来生成条码化的珠或包含多个条码化的探针的珠。
大规模的商业制造方法使数百万的寡核苷酸被附接到一个阵列上。商用阵列包括来自Roche NimbleGen公司(威斯康星州)和Affymetrix公司(赛默飞(ThermoFisherScientific))的阵列。
在一些实施方式中,可根据WO 2012/140224、WO 2014/060483、WO 2016/162309、WO 2017/019456、WO 2018/091676和WO 2012/140224以及美国专利申请号2018/0245142中所述的方法来制备阵列。上述文件的全部内容通过引用纳入本文。
在一些实施方式中,阵列上的特征包括珠。在一些实施方式中,两个或多个珠分散在基材上以创建阵列,其中每个珠是阵列上的特征。可任选地将珠分散到基材上的孔中,例如,使得每个孔仅容纳单个珠。
“珠”是颗粒。珠可以是多孔的、无孔的、固体的、半固体的和/或其组合。在一些实施方式中,珠可溶解、可破裂和/或可降解,而在某些实施方式中,珠不可降解。
珠通常可以是任何合适的形状。珠形状的示例包括但不限于球形、非球形、椭圆形、长方形、无定形、圆形、圆柱形及其变体。横截面(例如,第一横截面)可对应于珠的直径或最大横截面尺寸。在一些实施方式中,珠可以是近似球形的。在这些实施方式中,第一横截面可对应于珠的直径。在一些实施方式中,珠可以是近似圆柱形的。在这样的实施方式中,第一横截面可对应于沿近似圆柱形珠的直径、长度或宽度。
珠可以是均匀尺寸或不均匀尺寸。“多分散性”一般是指分子或颗粒大小的不均匀性。珠的多分散性指数(PDI)可使用方程式PDI=Mw/Mn计算,其中Mw是重均摩尔质量,Mn是数均摩尔质量。在某些实施方式中,可将珠提供为具有相对单分散尺寸分布的多个珠或珠群。当需要提供相对一致的试剂量时,保持相对一致的珠特征(例如尺寸)有助于整体一致性。
在一些实施方式中,本文提供的珠可具有尺寸分布,其横截面尺寸的变化系数小于50%、小于40%、小于30%、小于20%、小于15%、小于10%、小于5%或更低。在一些实施方式中,本文提供的多个珠具有小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%或更低的多分散性指数。
在一些实施方式中,珠的直径或最大尺寸可不大于100μm(例如,不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm、12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm,或1μm)。
在一些实施方式中,多个珠的平均直径不大于100μm。在一些实施方式中,多个珠的平均直径或最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm,12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。
在一些实施方式中,珠的体积可为至少约1μm3,例如至少1μm3、2μm3、3μm3、4μm3、5μm3、6μm3、7μm3、8μm3、9μm3、10μm3、12μm3、14μm3、16μm3、18μm3、20μm3、25μm3、30μm3、35μm3、40μm3、45μm3、50μm3、55μm3、60μm3、65μm3、70μm3、75μm3、80μm3、85μm3、90μm3、95μm3、100μm3、125μm3、150μm3、175μm3、200μm3、250μm3、300μm3、350μm3、400μm3、450μm3、μm3、500μm3、550μm3、600μm3、650μm3、700μm3、750μm3、800μm3、850μm3、900μm3、950μm3、1000μm3、1200μm3、1400μm3、1600μm3、1800μm3、2000μm3、2200μm3、2400μm3、2600μm3、2800μm3、3000μm3或更大。
在一些实施方式中,珠可具有约1μm3与100μm3之间的体积,例如约1μm3与10μm3之间、约10μm3与50μm3之间或约50μm3与100μm3之间的体积。在一些实施方式中,珠可包括约100μm3与1000μm3之间的体积,例如约100μm3与500μm3之间或约500μm3与1000μm3之间的体积。在一些实施方式中,珠可包括约1000μm3与3000μm3之间的体积,例如约1000μm3与2000μm3之间或约2000μm3与3000μm3之间的体积。在一些实施方式中,珠可包括约1μm3与3000μm3之间的体积,例如约1μm3与2000μm3之间、约1μm3与1000μm3之间、约1μm3与500μm3之间或约1μm3与250μm3之间的体积。
珠可以包括一个或多个相同或不同的横截面。在一些实施方式中,珠可具有不同于第二横截面的第一横截面。该珠可具有至少约为0.0001微米、0.001微米、0.01微米、0.1微米或1微米的第一横截面。在一些实施方式中,珠可包括至少约1微米(μm)、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、11μm、12μm、13μm、14μm、15μm、16μm、17μm、18μm、19μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、120μm、140μm、160μm、180μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、550μm、600μm、650μm、700μm、750μm、800μm、850μm、900μm、950μm、1毫米(mm)或更大的横截面(例如,第一横截面)。在一些实施方式中,珠可包括约1μm与500μm之间的横截面(例如,第一横截面),例如约1μm与100μm之间、约100μm与200μm之间、约200μm与300μm之间、约300μm与400μm之间或约400μm与500μm之间。例如,珠可包括约1μm与100μm之间的横截面(例如,第一横截面)。在一些实施方式中,珠可具有至少约1μm的第二横截面。例如,珠可包括至少约1微米(μm)、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、11μm、12μm、13μm、14μm、15μm、16μm、17μm、18μm、19μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、120μm、140μm、160μm、180μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、550μm、600μm、650μm、700μm、750μm、800μm、850μm、900μm、950μm、1毫米(mm)或更大的第二横截面。在一些实施方式中,珠可包括约1μm与500μm之间的第二横截面,例如约1μm与100μm之间、约100μm与200μm之间、约200μm与300μm之间、约300μm与400μm之间或约400μm与500μm之间。例如,珠可包括约1μm与100μm之间的第二横截面。
在一些实施方式中,珠可以是纳米级的(例如,珠可以具有约100纳米(nm)到约900纳米(nm)的直径或最大横截面尺寸)(例如,850纳米或更小、800纳米或更小、750纳米或更小、700纳米或更小、650纳米或更小、600纳米或更小、550纳米或更小、500纳米或更小、450纳米或更小、400纳米或更小,350纳米或更小、300纳米或更小、250纳米或更小、200纳米或更小、150纳米或更小)。多个珠可具有约100纳米(nm)到约900纳米(nm)的平均直径或平均最大横截面尺寸(例如,850纳米或更小、800纳米或更小、750纳米或更小、700纳米或更小、650纳米或更小、600纳米或更小、550纳米或更小、500纳米或更小、450纳米或更小、400纳米或更小、350纳米或更小,300纳米或更小、250纳米或更小、200纳米或更小、150纳米或更小)。在一些实施方式中,珠的直径或尺寸约为单个细胞(例如,被评估的单个细胞)的尺寸。
在一些实施方式中,珠可以是凝胶珠。“凝胶”是一种对液体和气体具有透化性的半刚性材料。示例性凝胶包括但不限于具有胶体结构的凝胶,例如琼脂糖;聚合物网状结构,例如明胶;水凝胶;以及交联聚合物结构,例如聚丙烯酰胺、SFA(例如,参见美国专利申请公开号2011/0059865,通过引用将其全部纳入本文)和PAZAM(例如,参见美国专利申请公开号2014/0079923,通过引用将其全部纳入本文)。
根据预期用途的不同,凝胶可以配制成各种形状和尺寸。在一些实施方式中,制备凝胶并将其配制成凝胶珠(例如,凝胶珠,其包括附接于凝胶珠或与凝胶珠相关联的捕获探针)。凝胶珠可以是水凝胶珠。水凝胶珠可由分子前体形成,例如聚合物或单体物质。
在一些实施方式中,水凝胶珠可包括聚合物基质(例如,通过聚合或交联形成的基质)。聚合物基质可包括一种或多种聚合物(例如,具有不同官能团或重复单元的聚合物)。交联可以通过共价、离子和/或诱导相互作用和/或物理缠结实现。
半固体珠可以是脂质体珠。
固体珠可包括金属,包括但不限于氧化铁、金和银。在一些实施方式中,珠可以是二氧化硅珠。在一些实施方式中,珠可以是刚性的。在一些实施方式中,珠可以是柔性的和/或可压缩的。
珠可以是大分子。珠可以由结合在一起的核酸分子形成。珠可以通过分子(例如大分子)的共价或非共价组装形成,例如单体或聚合物。聚合物或单体可以是天然的或合成的。聚合物或单体可以是或包括例如核酸分子(例如DNA或RNA)。
珠可以是刚性的,或可以是柔性的和/或可压缩的。珠可以包括包括一种或多种聚合物的涂层。这种涂层可以被破坏或溶解。在一些实施方式中,珠包括直接或间接(例如,通过接头)附接到珠的光谱或光学标记物(例如,染料)。例如,珠可制备为有色制剂(例如,在可见光谱内表现出不同颜色的珠),其可在施加所需刺激(例如,热和/或化学反应)时改变颜色(例如,比色珠)以形成不同颜色的珠(例如,不透明和/或透明珠)。
珠可包括天然和/或合成材料。例如,珠可包括天然聚合物、合成聚合物或天然聚合物和合成聚合物两者。天然聚合物的实例包括但不限于蛋白质、诸如脱氧核糖核酸的糖、橡胶、纤维素、淀粉(例如直链淀粉、支链淀粉)、酶、多糖、丝、聚羟基烷酸酯、壳聚糖、葡聚糖、胶原、卡拉胶、依巴瓜胶、阿拉伯胶、琼脂、明胶、虫胶、梧桐胶、黄原胶、玉米糖胶、瓜尔胶、卡拉亚胶、琼脂糖、海藻酸、海藻酸钠或其天然聚合物。合成聚合物的实例包括但不限于丙烯酸、树脂、尼龙、硅酮、氨纶、粘胶人造丝、聚羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二酯、聚三氟氯乙烯、聚环氧乙烷、聚对苯二甲酸乙二酯、聚乙烯、聚异丁烯、聚甲基丙烯酸甲酯、聚甲醛、聚丙烯、聚苯乙烯、聚四氟乙烯、聚乙酸乙烯酯、聚乙烯醇、聚氯乙烯、聚偏二氯乙烯、聚偏二氟乙烯、聚氟乙烯和/或其组合(例如共聚合物)。珠也可以由聚合物以外的材料形成,包括例如脂类、胶束、陶瓷、玻璃陶瓷、材料复合物、金属和/或其他无机材料。
在一些实施方式中,珠是可降解珠。可降解珠可包括具有不稳定键的一种或多种物质(例如,二硫键接头、引物、其他寡核苷酸等),使得当珠/物质暴露于适当的刺激物时,不稳定键被破坏并且珠降解。不稳定键可以是化学键(例如,共价键、离子键)或者可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些实施方式中,用于生成珠的交联剂可包括不稳定键。当暴露在适当的条件下时,不稳定键会断裂,珠会降解。例如,当将包含半胱胺交联剂的聚丙烯酰胺凝胶珠暴露于还原剂时,胱胺的二硫键可被破坏且珠降解。
降解可指结合或夹带物质(例如,二硫键接头、引物、其他寡核苷酸等)与珠的解离,无论是否在结构上降解物理珠本身。例如,由于化学环境的变化,夹带的物质可以通过透化压差从珠中释放出来。举例来说,由于透化压差引起的珠孔径的改变通常可以在珠本身没有结构降解的情况下发生。在一些实施方式中,由于珠的透化溶胀导致的孔径增大可使珠内夹带的物质释放。在一些实施方式中,由于孔径收缩,珠的透化收缩可导致珠更好地保留夹带的物质。
可使用任何可降解珠的合适试剂。在一些实施方式中,温度或pH值的变化可用于降解珠内的热敏或pH敏感键。在一些实施方式中,化学降解剂可用于通过氧化、还原或其他化学变化降解珠内的化学键。例如,化学降解剂可以是还原剂,例如DTT,其中DTT可以降解交联剂和凝胶前体之间形成的二硫键,从而降解珠。在一些实施方式中,可添加还原剂以降解珠,其可导致珠释放其内容物。还原剂的实例可包括但不限于二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。
任何一种化学试剂都可以用来引发珠的降解。化学试剂的实例包括但不限于pH介导的珠内组分完整性的改变、通过交联键的裂解降解珠的组分以及珠的组分的解聚。
在一些实施方式中,珠可由包括可降解化学交联剂(例如N,N’-双-(丙烯酰)胱胺(BAC)或胱胺)的材料形成。这种可降解交联剂的降解可以通过各种机制来实现。在一些实例中,珠可与可引起氧化、还原或其它化学变化的化学降解剂接触。例如,化学降解剂可以是还原剂,例如二硫苏糖醇(DTT)。还原剂的其他实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。
在一些实施方式中,暴露于水性溶液(例如水)可触发水解降解,从而引发珠的降解。在应用热刺激时,也可以诱导珠释放其内容物。温度的变化会引起珠的各种变化。例如,热会使固体珠液化。热的变化会导致珠熔化,使珠的部分降解。在一些实施方式中,热可增加珠组分的内部压力,使得珠破裂或爆炸。热也可以作用于作为构建珠的材料的热敏聚合物。
在使用可降解珠的情况下,避免在给定时间之前将所述珠暴露于引起所述降解的一个或多个刺激物是有益的,以便例如避免珠过早降解和由此降解引起的问题,包括例如不良流动特性和聚集。举例来说,在珠包括可还原交联基团(例如二硫化物基团)的情况下,将期望避免将所述珠与还原剂(例如DTT或其它二硫化物裂解试剂)接触。在这些实施方式中,在一些实施方式中,本文所述的珠的处理将不含还原剂,例如DTT。由于还原剂通常在商业酶制剂中提供,因此在处理本文所述的珠时希望提供不含还原剂(或不含DTT)的酶制剂。此类酶的实例包括例如聚合酶制剂、逆转录酶制剂、连接酶制剂以及可用于处理本文所述珠的许多其它酶制剂。术语“无还原剂”或“无DTT”制剂是指具有小于此类用于降解珠的材料的较低范围的约1/10、约1/50或约1/100的制剂。例如,对于DTT,无还原剂制剂可具有小于约0.01毫摩尔(mM)、0.005mM、0.001mM DTT、0.0005mM DTT或小于约0.0001mM DTT。在一些实施方式中,DTT的量可以是不可检测的。
与不降解的珠相比,当对珠施加适当的刺激时,可降解珠可用于更快速地从珠释放附接的捕获探针(例如,核酸分子、空间条形码序列和/或引物)。例如,对于结合到多孔珠的内表面的物质或在包封的物质的情况下,在珠降解时,该物质可对溶液中的其他物质具有更大的移动性和可及性。在一些实施方式中,物质还可经由可降解接头(例如,二硫化物接头)附接到可降解珠。所述可降解接头可对与所述可降解珠相同的刺激作出响应,或者所述两种可降解物质可对不同的刺激作出响应。例如,可以通过二硫键将具有一个或多个空间条形码的捕获探针附接到包括胱胺的聚丙烯酰胺珠。当空间条码化珠暴露于还原剂时,珠降解并且在捕获探针和珠之间的二硫键和珠内胱胺的二硫键断裂时释放具有一个或多个空间条形码序列的捕获探针。
向珠中添加多种类型的不稳定键可以产生能够响应各种刺激的珠。每种类型的不稳定键可对相关刺激(例如,化学刺激、光、温度、pH、酶等)敏感,使得通过每种不稳定键附接到珠上的试剂的释放可通过施加适当的刺激来控制。可耦合至前体或珠的不稳定键的一些非限制性实例包括酯键(例如,可与酸、碱或羟胺裂解)、邻二醇键(例如,可通过高碘酸钠裂解)、Diels-Alder键(例如,可通过热裂解)、砜键(例如,可通过碱裂解)、硅基醚键(例如,可通过酸裂解)、糖苷键(例如,可通过淀粉酶裂解)、肽键(例如,可通过蛋白酶裂解)或磷酸二酯键(例如,可通过核酸酶裂解(例如,DNA酶))。键可以通过其他核酸分子靶向酶,如限制性酶(如限制性内切酶)进行裂解。这种功能性可用于控制从珠中释放试剂。在一些实施方式中,包括不稳定键的另一试剂可在凝胶珠形成后经由例如上述珠的活化官能团连接到珠。在一些实施方式中,包括不稳定键的凝胶珠是可逆的。在一些实施方式中,使用具有可逆不稳定键的凝胶珠来捕获生物样品的一个或多个感兴趣区域。例如,但不限于,包括不耐热键的珠可由光源(例如,激光)加热,所述光源使凝胶珠中的变化有助于捕获与凝胶珠接触的生物样品。具有一个或多个可释放、可裂解或可逆地附接到本文所述珠的空间条形码的捕获探针包括通过捕获探针和珠之间的连接的裂解而释放或可释放的捕获探针,或通过底层珠本身的降解而释放的捕获探针,使具有一个或多个空间条形码的捕获探针待被其他试剂触及或变得可被其他试剂触及,或两者。
珠可以有不同的物理性质。珠的物理性质可以用来表征珠。珠的物理性质的非限制性例子包括尺寸、形状、圆度、密度、对称性和硬度。例如,珠可以有不同的尺寸。通过使用配置为提供特定尺寸的珠的微流体通道网络(例如,基于通道尺寸、流速等),可以获得不同尺寸的珠。在一些实施方式中,珠具有不同的硬度值,其可通过改变用于生成珠的聚合物浓度来获得。在一些实施方式中,可以使用捕获探针的物理性质使附接到珠的空间条形码在光学上可检测。例如,核酸折纸,例如脱氧核糖核酸(DNA)折纸,可用于产生光学可检测的空间条形码。为此,可以折叠一个核酸分子或多个核酸分子以形成二维和/或三维几何形状。不同的几何形状可以通过光学检测。
在一些实施方式中,具有一种以上不同物理性质的特殊类型的纳米颗粒可用于使珠在物理上可区分。例如,具有亲水和疏水表面的Janus颗粒可用于提供独特的物理性质。
在一些实施方式中,珠能够识别来自单个细胞的多种分析物(例如,核酸、蛋白质、染色质、代谢物、药物、gRNA和脂质)。在一些实施方式中,珠能够识别来自单个细胞的单个分析物(例如,mRNA)。
珠的孔径可以调节。例如,可以选择孔径以保留变性核酸。可选择孔径以维持对诸如氢氧化钠(NaOH)的外源性化学品和/或诸如抑制剂的内源性化学品的扩散透化性。珠可由生物相容性和/或生物化学相容性材料和/或维持或增强细胞活力的材料形成。珠可由可热解聚、化学解聚、酶解聚和/或光学解聚的材料形成。
在一些实施方式中,珠可非共价地加载一种或多种试剂。可通过(例如)使珠经受足以使珠溶胀的条件、使试剂扩散到珠内部的足够时间以及使珠经受足以使珠去溶胀的条件来非共价地加载珠。可通过例如将珠置于热力学有利溶剂中、使珠经受较高或较低温度、使珠经受较高或较低离子浓度和/或使珠经受电场来实现珠的溶胀。
珠的溶胀可以通过各种溶胀方法来实现。在一些实施方式中,溶胀是可逆的(例如,通过使珠经受促进去溶胀的条件)。在一些实施方式中,例如通过在热力学不利的溶剂中转移珠、使珠经受更低或更高的温度、使珠经受更低或更高的离子浓度和/或添加或移除电场来实现珠的去溶胀。珠的去溶胀可以通过各种去溶胀方法来实现。在一些实施方式中,去溶胀是可逆的(例如,通过使珠经受促进溶胀的条件)。在一些实施方式中,珠的去膨胀可包括转移珠以使珠中的孔收缩。收缩会阻碍珠内的试剂扩散出珠内部。所产生的阻碍可能是由于试剂和珠内部之间的空间相互作用造成的。这种转移可以通过微流体来完成。例如,可以通过将珠从一个同流溶剂流移动到不同的同流溶剂流来实现转移。可通过改变珠的聚合物组成来调节珠的可溶胀性和/或孔径。
珠可以包括对温度有响应的聚合物,以便当珠被加热或冷却时,珠的特性或尺寸可以改变。例如,聚合物可包括聚(N-异丙基丙烯酰胺)。凝胶珠可包括聚(N-异丙基丙烯酰胺),并且当加热时,凝胶珠可在一个或多个尺寸上减小(例如,横截面直径、多个横截面直径)。足以改变凝胶珠的一个或多个特性的温度可为例如至少约0摄氏度(℃)、1摄氏度、2摄氏度、3摄氏度、4摄氏度、5摄氏度、10摄氏度或更高。例如,温度可为约4℃。在一些实施方式中,足以改变凝胶珠的一个或多个特性的温度可为(例如)至少约25℃、30℃、35℃、37℃、40℃、45℃、50℃或更高。例如,温度可为约37℃。
用于附接捕获探针的珠的官能化可以通过多种不同的方法来实现,包括但不限于在聚合物内激活化学基团,在聚合物结构中引入活性或可激活的官能团,或在珠生产的预聚物或单体阶段的附接。珠可被官能化以结合到目标分析物,例如核酸、蛋白质、碳水化合物、脂质、代谢物、肽或其它分析物。
在一些实施方式中,珠可包含分子前体(例如,单体或聚合物),其可通过分子前体的聚合形成聚合物网络。在一些实施方式中,前体可以是能够经由例如化学交联经历进一步聚合的已聚合物质。在一些实施方式中,前体可包括丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些实施方式中,珠可包括预聚物,其为能够进一步聚合的低聚物。例如,可以使用预聚物制备聚氨酯珠。在一些实施方式中,珠可包含可进一步聚合在一起(例如,形成共聚物)的单个聚合物。在一些实施方式中,可以通过不同前体的聚合来生成珠,使得它们包括混合的聚合物、共聚物和/或嵌段共聚物。在一些实施方式中,珠可包括聚合物前体(例如,单体、低聚物和线性聚合物)、核酸分子(例如,寡核苷酸)、引物和其他实体之间的共价键或离子键。在一些实施方式中,共价键可以是碳碳键或硫醚键。
聚合物的交联可以是永久性的,也可以是可逆的,这取决于所使用的特定交联剂。可逆交联可使聚合物在适当条件下线性化或解离。在一些实施方式中,可逆交联还可允许结合到珠表面的材料的可逆附接。在一些实施方式中,交联剂可形成二硫键。在一些实施方式中,形成二硫键的化学交联剂可以是胱胺或改性胱胺。
例如,在聚合物前体材料包括线性聚合物材料(例如线性聚丙烯酰胺、PEG或其他线性聚合物材料)的情况下,活化剂可包括交联剂或活化形成的液滴内的交联剂的化学品。同样,对于包括可聚合单体的聚合物前体,活化剂可包括聚合引发剂。例如,在某些实施方式中,其中聚合物前体包括丙烯酰胺单体与N,N’-双-(丙烯酰)胱胺(BAC)共聚单体的混合物,可提供诸如四乙基甲二胺(TEMED)的试剂,其可引发丙烯酰胺和BAC共聚成交联的聚合物网络,或其他足以使前体聚合或凝胶化的条件。足以使前体聚合或凝胶化的条件可包括暴露于加热、冷却、电磁辐射和/或光下。
在聚合或凝胶化之后,可以形成聚合物或凝胶。聚合物或凝胶对于化学或生化试剂可以是可扩散透化的。聚合物或凝胶可对大分子组分不可扩散透化。所述聚合物或凝胶可包括二硫化物交联聚丙烯酰胺、琼脂糖、海藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG丙烯酸酯、PEG巯基、PEG叠氮化物、PEG炔烃、其他丙烯酸酯、壳聚糖、透明质酸、胶原、纤维蛋白、明胶或弹性蛋白中的一种或多种。聚合物或凝胶可以包括任何其他聚合物或凝胶。
在一些实施方式中,可在分子前体单元(例如,单体、低聚物或线性聚合物)或纳入珠中的前体与核酸分子(例如,寡核苷酸、捕获探针)之间形成二硫键。例如,胱胺(包括改性胱胺)是包括二硫键的有机试剂,其可用作珠的个体单体或聚合前体之间的交联剂。聚丙烯酰胺可在胱胺或包括胱胺的物质(例如,改性胱胺)存在下聚合以产生包括二硫键的聚丙烯酰胺凝胶珠(例如,包括化学可还原交联剂的化学可降解珠)。二硫键可使珠在暴露于还原剂时降解(或溶解)。
在一些实施方式中,线性多糖聚合物壳聚糖可通过亲水链与戊二醛交联以形成珠。壳聚糖聚合物的交联可以通过热、压力、pH值变化和/或辐射引发的化学反应来实现。
在一些实施方式中,珠可包括丙烯酸亚磷酰胺部分,其在某些方面可用于将一个或多个捕获探针附接到珠。在一些实施方式中,丙烯酸亚磷酰胺(acrydite)部分可指由丙烯酸亚磷酰胺与一种或多种物质(例如,二硫键接头、引物、其他寡核苷酸等)的反应生成的丙烯酸亚磷酰胺类似物,例如但不限于在聚合反应期间丙烯酸亚磷酰胺与其他单体和交联剂的反应。丙烯酸亚磷酰胺部分可以被修饰以形成与待附接物质(例如捕获探针)的化学键。丙烯酸亚磷酰胺部分可以用能够形成二硫键的巯基修饰,或者可以用已经包括二硫键的基团修饰。巯基或二硫化物(通过二硫化物交换)可用作将要附接的物质的锚定点,或可使用丙烯酸亚磷酰胺部分的另一部分来附接。在一些实施方式中,附接可以是可逆的,使得当二硫键断裂时(例如,在存在还原剂的情况下),附接的物质从珠中释放。在一些实施方式中,丙烯酸亚磷酰胺部分可包括可用于物质附接的反应性羟基。
在一些实施方式中,聚合以形成珠的前体(例如,单体或交联剂)可包括丙烯酸亚磷酰胺部分,使得当产生珠时,珠还包括丙烯酸亚磷酰胺部分。丙烯酸亚磷酰胺部分可附接于核酸分子(例如,寡核苷酸),其可包括引发序列(例如,用于扩增靶核酸的引物、随机引物、信使RNA的引物序列)和/或一个或多个捕获探针。一个或多个捕获探针可以包括对于耦合到给定珠的所有捕获探针相同的序列和/或对于耦合到给定珠的所有捕获探针不同的序列。捕获探针可纳入珠中。在一些实施方式中,捕获探针可纳入或附接到珠上,使得捕获探针保持游离的3′端。在一些实施方式中,捕获探针可纳入或附接到珠上,使得捕获探针保持游离的5′端。在一些实施方式中,可以对珠进行官能化,使得每个珠包含多个不同的捕获探针。例如,珠可以包括多个捕获探针,例如捕获探针1、捕获探针2和捕获探针3,并且捕获探针1、捕获探针2和捕获探针3中的每一个都包含不同的捕获域(例如,捕获探针1的捕获域包括聚(dT)捕获域,捕获探针2的捕获域包括基因特异性捕获域,捕获探针3的捕获域包括CRISPR特异性捕获域)。通过使珠官能化以使每个珠包含多个不同捕获域,可提高用于分析物检测的复用能力的水平。
在一些实施方式中,聚合以形成珠的前体(例如,单体或交联剂)可包括具有反应性或能够被激活的官能团,使得当其变得具有反应性时,其可与其它前体聚合以产生包括所述活化或可激活官能团的珠。然后可以使用官能团将其它物质(例如,二硫键接头、引物、其他寡核苷酸等)附接到珠上。例如,包括羧酸(COOH)基团的一些前体可与其它前体共聚合以形成也包括COOH官能团的珠。在一些实施方式中,丙烯酸(包括游离COOH基团的物质)、丙烯酰胺和双(丙烯酰)胱胺可共聚合在一起以产生包括游离COOH基团的珠。珠的COOH基团可被活化(例如,经由1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(DMTMM))以使其具有反应性(例如,与胺官能团反应,其中EDC/NHS或DMTMM用于活化)。活化的COOH基团随后可与适当的物质(例如,包括胺官能团的物质,其中羧酸基团被活化以可与胺官能团反应)反应,其作为待连接到珠的部分上的官能团。
通过将一些二硫键还原为游离巯基,在其聚合物网络中包括二硫键的珠可以用其它物质(例如,二硫键接头、引物、其他寡核苷酸等)官能化。二硫键可通过例如还原剂(例如DTT、TCEP等)的作用来还原以生成游离巯基,而不使珠溶解。然后,珠的游离巯基可与物质或包括另一二硫键的物质的游离巯基反应(例如,通过巯基二硫键交换),使得物质可连接到珠(例如,通过生成的二硫键)。在一些实施方式中,珠的游离巯基可与任何其它合适基团反应。例如,珠的游离巯基可与包括丙烯酸亚磷酰胺部分的物质反应。珠的游离巯基可以通过Michael加成化学与丙烯酸亚磷酰胺反应,使得包括丙烯酸亚磷酰胺的物质与珠相连。在一些实施方式中,可通过包含巯基封端剂(例如N-乙基马来酰胺或碘乙酸盐)来防止非受控反应。
可以控制珠中二硫键的激活,使得只有少量二硫键被激活。例如,可以通过控制用于生成游离巯基的还原剂的浓度和/或用于在珠聚合中形成二硫键的试剂的浓度来施加控制。在一些实施方式中,低浓度的还原剂(例如,还原剂分子:凝胶珠比率)小于或等于约1∶10000000000,小于或等于约1∶10000000000,小于或等于约1∶1000000000,小于或等于约1∶100000000,小于或等于约1∶10000000,小于或等于约等于1∶1000000,小于或等于约1∶100000,或小于或等于约1∶10000)可用于还原。控制还原为游离巯基的二硫键的数量有助于确保官能化过程中珠结构的完整性。在一些实施方式中,光学活性剂(例如荧光染料)可经由珠的游离巯基耦合到珠并用于定量珠中存在的游离巯基的数量和/或跟踪珠。
在一些实施方式中,在珠形成后向珠添加部分可能是有利的。例如,在珠形成后添加捕获探针可避免在聚合期间可能发生的链转移终止期间物质(例如,二硫键接头、引物、其他寡核苷酸等)的损失。在一些实施方式中,较小的前体(例如,不包括侧链基团和联接部分的单体或交联剂)可用于聚合,并且可由于粘性效应而最小程度地阻止链末端的生长。在一些实施方式中,珠合成后的官能化可最小化物质(例如,寡核苷酸)对于待加载的潜在破坏剂(例如,自由基)和/或化学环境的暴露。在一些实施方式中,所生成的水凝胶可具有使温度驱动的珠溶胀和崩塌的上临界溶液温度(UCST)。这种功能性可帮助寡核苷酸(例如,引物)在随后用寡核苷酸对珠进行官能化期间渗入珠。生产后官能化也可用于控制珠中物质的加载率,例如,使得加载率的可变性最小化。还可以在批次处理过程中进行物质加载,使得多个珠可以在单个批次处理中用物质官能化。
试剂可在珠生成期间(例如,在前体聚合期间)包封在珠中。这些试剂可以或不能参与聚合。此类试剂可进入聚合反应混合物中,使得生成的珠在珠形成时包含试剂。在一些实施方式中,可在形成后将此类试剂添加到珠中。此类试剂可包括例如捕获探针(例如,寡核苷酸)、用于核酸扩增反应的试剂(例如,引物、聚合酶、dNTP、辅因子(例如,离子辅因子)、缓冲剂),包括本文所述的试剂、用于酶促反应的试剂(例如,酶、辅因子、基材、缓冲剂),用于聚合、连接或消化等核酸修饰反应的试剂和/或用于一个或多个测序平台的模板制备(例如,标签化)的试剂(例如,用于
Figure BDA0003042696400001181
Figure BDA0003042696400001182
)。此类试剂可包括本文所述的一种或多种酶,包括但不限于聚合酶、逆转录酶、限制性内切酶(例如,核酸内切酶)、转座酶、连接酶、蛋白酶K、DNA酶等。此类试剂还可或可选地包括一种或多种试剂,例如裂解剂、抑制剂、灭活剂,螯合剂,刺激剂。此类试剂的捕获可通过前体聚合期间产生的聚合物网络密度、珠内离子电荷的控制(例如,通过与聚合物质相连的离子物质)或其他物质的释放来控制。当珠降解和/或通过施加能够从珠中释放试剂的刺激时,可从珠中释放包封的试剂。
在一些实施方式中,珠还可包括(例如,包封或在其上附接)包括空间条形码的多个捕获探针,并且空间条形码的光学特性可用于珠的光学检测。例如,空间条形码的光吸收率可以用来区分珠。在一些实施方式中,可检测标签可以直接或间接地附接到空间条形码上并提供对珠的光学检测。在一些实施方式中,一个或多个珠的组中的每个珠具有独特可检测标签,并且独特可检测标签的检测确定与珠相关联的空间条形码序列的位置。
引起珠光学检测的光学性质可归因于珠表面的光学性质(例如,附接在珠上的可检测标签或珠的尺寸)或珠的大片区域(bulk region)的光学性质(例如,在珠形成期间纳入的可检测标签或珠本身的光学性质)。在一些实施方式中,可检测标签可与珠或耦合到珠的一个或多个部分相关联。
在一些实施方式中,珠包括多个可检测标签。例如,荧光染料可附接于珠的表面和/或可纳入珠中。不同荧光染料的不同强度可用于增加可用于区分珠的光学组合的数量。例如,如果N是荧光染料的数量(例如,2到10种荧光染料,例如4种荧光染料),M是染料的可能强度(例如,2到50种强度,例如20种强度),那么MN是可能的不同光学组合。在一个实例中,可使用具有20种可能强度的4种荧光染料来产生160000种不同的光学组合。
珠或生物内容物(例如细胞或细胞核)的一个或多个光学性质可用于将个体珠或生物内容物与其他珠或生物内容物区分开来。在一些实施方式中,通过包括具有光学特性以将珠彼此区分的可检测标签,使得珠可进行光学检测。
在一些实施方式中,珠的光学性质可用于珠的光学检测。例如,但不限于,光学性质可以包括吸光度、双折射、颜色、荧光、光度、光敏性、反射率、折射率、散射或透射率。例如,珠可以基于聚合度、链长或单体化学具有不同的双折射值。
在一些实施方式中,纳米珠(例如量子点或Janus珠)可以用作光学标记物或其组件。例如,量子点可以附接在珠的空间条形码上。
珠的光学标记物可以提供增强的光谱分辨率,以区分具有独特空间条形码的珠(例如,包括独特空间条形码序列的珠)。在一些实施方式中,第一珠包括第一光学标记物和空间条形码,每个空间条形码具有第一空间条形码序列。第二珠包括第二光学标记物和空间条形码,每个空间条形码具有第二空间条形码序列。第一光学标记物和第二光学标记物可以不同(例如,由两种不同的荧光染料或两种不同强度的相同荧光染料提供)。第一和第二空间条形码序列可以是不同的核酸序列。在一些实施方式中,可以对珠成像以识别第一和第二光学标记物,然后可以使用第一和第二光学条形码将第一和第二光学标记物分别与第一和第二空间条形码序列相关联。
生成珠时可以包括光学标记物。例如,光学标记物可以包括在凝胶珠的聚合物结构中,或者在珠生产的预聚合物或单体阶段附接。在一些实施方式中,珠包括附接到一个或多个光学标记物的部分(例如,在珠的表面和/或珠内)。在一些实施方式中,光学标记物可以用一种或多种试剂加载到珠中。例如,试剂和光学标记物可以通过试剂的扩散(例如,包括光学条形码的试剂溶液)被加载到珠中。在一些实施方式中,在制备空间条形码时可以包括光学标记物。例如,可以通过合成包括条形码序列的分子(例如,使用分离池(splitpool)或组合方法)来制备空间条形码。光学标记物可以在将空间条形码附接到珠之前附接到空间条形码。在一些实施方式中,在将空间条形码附接到珠之后可以包括光学标记物。例如,光学标记物可以附接到耦合到珠的空间条形码上。在一些实施方式中,空间条形码或其序列可以可释放地或可裂解地附接到珠。光学标记物可以可释放或不可释放形式附接到珠上。在一些实施方式中,第一珠(例如,包括多个空间条形码的珠)可耦合到包括一个或多个光学标记物的第二珠。例如,第一珠可经由化学键与第二珠共价耦合。在一些实施方式中,第一珠可与第二珠非共价结合。
第一和/或第二珠可以包括多个空间条形码。耦合到给定珠的多个空间条形码可以包括相同的条形码序列。在第一和第二珠都包括空间条形码的情况下,第一和第二珠可以包括包括相同条形码序列或不同条形码序列的空间条形码。
含有捕获的分析物的珠阵列可以批量处理,也可以分为液滴乳液,以制备测序文库。在一些实施方式中,下一代测序读取被聚集并与珠阵列上空间条形码的空间位置相关。例如,该信息可计算地叠加在组织切片的高分辨率图像上以识别检测到分析物的位置。
在一些实施方式中,可进行解交联以说明可能与某些条码化/文库制备生物化学(例如,蛋白酶的存在)不相容的解交联化学。例如,两步过程是可能的。在第一步中,可以以液滴的形式提供珠,使得在进行常规的去交联化学后DNA结合到珠上。在第二步中,将乳液破碎并收集珠,然后在洗涤后重新包封以进行进一步加工。
在一些实施方式中,可使用光化学方法将珠固定或附接至基材。例如,珠可使用全氟苯基叠氮化物硅烷(PFPA硅烷)官能化,与基材接触,然后暴露于辐照(参见,例如,Liu等,(2006)Journal of the American Chemical Society 128,14067-14072)。例如,安曲酮官能化基材的固定(参见,例如,Koch等,(2000)Bioconjugate Chem.11,474-483,其全部内容通过引用纳入本文)。
这些阵列也可以通过珠自组装来制备。每个珠上都覆盖着数十万个特定的寡核苷酸拷贝。在一些实施方式中,每个珠可被约1000至约1000000个寡核苷酸覆盖。在一些实施方式中,每个珠可被约1000000至约10000000个寡核苷酸覆盖。在一些实施方式中,每个珠可覆盖约2000000至约3000000、约3000000至约4000000、约4000000至约5000000、约5000000至约6000000、约6000000至约7000000、约7000000至约8000000、约8000000至约9000000或约9000000至约10000000个寡核苷酸。在一些实施方式中,每个珠可被约10000000至约100000000个寡核苷酸覆盖。在一些实施方式中,每个珠可被约100,000,000至约1,000,000,000个寡核苷酸覆盖。在一些实施方式中,每个珠可被约1,000,000,000至约10,000,000,000个寡核苷酸覆盖。在阵列生产过程中,珠可以不规则地分布在蚀刻基材上。在此过程中,珠可自组装成阵列(例如,在光纤束基材或二氧化硅载玻片基材上)。在一些实施方式中,珠不规则地到达其在阵列上的最终位置。因此,可能需要映射珠位置或者可能需要基于预定图案合成寡核苷酸。
珠可以用粘合剂或其组合以共价或非共价方式固定或附接至基材。附接的珠可以例如以单层、双层、三层或簇的形式分层。如本文所定义,“单层”通常是指固定或附接于基材的一系列探针、珠、斑点、点、特征、微位置或岛的阵列,使得珠排列成一层单珠。在一些实施方式中,珠被紧密地包装。
如本文所定义,短语“基本单层”或“基本形成单层”通常指(形成)固定或附接至基材的成阵列系列的探针、珠、微球、斑点、点、特征、微位置或岛,使得约50%至约99%(例如,约50%至约98%)的珠排列成一层单珠。这种排列可以使用多种方法来确定,包括显微成像。
在一些实施方式中,单层珠位于基材上的预定区域中。例如,预定区域可以用物理屏障、光掩模、基材中的凹口或基材中的孔来划分。
如本文所用,术语“反应性元件”通常指可与另一分子或分子部分反应以形成共价键的分子或分子部分。反应性元件包括例如胺、醛、炔烃、叠氮化物、硫醇、卤代乙酰基、吡啶基二硫化物、酰肼、羧酸、烷氧基胺、巯基、马来酰亚胺、迈克尔受体、羟基和活性酯。一些反应性元件,例如羧酸,可以用一种或多种活化剂(例如酰化剂、异脲形成剂)处理以增加反应性元件对亲核攻击的敏感性。活化剂的非限制性实例包括N-羟基琥珀酰亚胺、N-羟基磺基琥珀酰亚胺、1-乙基-3-(3-二甲氨基丙基)碳二亚胺、二环己基碳二亚胺、二异丙基碳二亚胺、六氟磷酸1-羟基苯并三唑、(苯并三唑-1-基氧基)三吡咯烷基鏻、六氟磷酸(苯并三唑-1-基)-N,N,N’,N’-四甲基脲、4-(N,N-二甲氨基)吡啶和羰基二咪唑。
在一些实施方式中,反应性元件直接结合到珠。例如,水凝胶珠可以用丙烯酸单体处理以形成丙烯酸官能化水凝胶珠。在某些情况下,反应性元件通过一个或多个接头间接地结合到珠。如本文所用,“接头”通常指用于偶联两个或更多化学部分的多功能(例如,双功能、三功能)试剂。接头可以是能够经历诱导离解的可裂解接头。例如,可通过溶剂(例如,水解和溶剂解)、辐照(例如,光解)、酶(例如,酶解)或用特定pH(例如,pH 4、5、6、7或8)的溶液处理来诱导离解。
在一些实施方式中,反应性元件直接结合到基材。例如,载玻片可涂有(3-氨基丙基)三乙氧基硅烷。在一些实施方式中,反应性元件经由一个或多个接头间接地结合到基材。
将珠共价键合到基材的方法
本文提供用于将珠(例如,光学标记珠、水凝胶珠、微球珠)共价键合到基材的方法。
在一些实施方式中,通过第一反应性元件和第二反应性元件之间的共价键将珠耦合到基材。在一些实施方式中,共价结合的珠基本上在基材上形成单层珠(例如,水凝胶珠、微球珠)。
在一些实施方式中,所述珠用第一反应性元件官能化,所述第一反应性元件直接结合到所述珠。在一些实施方式中,所述珠用第一反应性元件官能化,所述第一反应性元件通过接头间接结合到所述珠。在一些实施方式中,连接剂是二苯甲酮。在一些实施方式中,连接剂是氨基甲基丙烯酰胺。例如,接头可以是3-氨基丙基甲基丙烯酰胺。在一些实施方式中,接头是PEG接头。在一些实施方式中,接头是可裂解接头。
在一些实施方式中,用直接结合到基材的第二反应性元件使基材官能化。在一些实施方式中,所述基材用第二反应性元件官能化,所述第二反应性元件通过接头间接结合到所述珠。在一些实施方式中,连接剂是二苯甲酮。例如,接头可以是二苯甲酮。在一些实施方式中,接头是氨基甲基丙烯酰胺。例如,接头可以是3-氨基丙基甲基丙烯酰胺。在一些实施方式中,接头是PEG接头。在一些实施方式中,接头是可裂解接头。
在一些实施方式中,所述基材是载玻片。在一些实施方式中,基材是预官能化的载玻片。
在一些实施方式中,约99%的共价结合珠在基材上形成单层珠。在一些实施方式中,约50%至约98%在基材上形成单层珠。例如,约50%至约95%、约50%至约90%、约50%至约85%、约50%至约80%、约50%至约75%、约50%至约70%、约50%至约65%、约50%至约60%或约50%至约55%的共价结合珠在基材上形成单层珠。在一些实施方式中,约55%至约98%、约60%至约98%、约65%至约98%、约70%至约98%、约75%至约98%、约80%至约98%、约85%至约98%、约90%至约95%或约95%至约98%的共价结合珠在基材上形成单层珠。在一些实施方式中,约55%至约95%、约60%至约90%、约65%至约95%、约70%至约95%、约75%至约90%、约75%至约95%、约80%至约90%、约80%至约95%、约85%至约90%、或约85%至约95%共价结合的珠在基材上形成单层珠。
在一些实施方式中,第一反应性元件和第二反应性元件中的至少一个选自以下组:
Figure BDA0003042696400001241
其中
R1选自H,C1-C6烷基,或-SO3
R2是C1-C6烷基;和
X是卤素部分。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001242
其中
Figure BDA0003042696400001243
表示第一反应性元件或第二反应性元件与珠(例如,水凝胶珠或微球珠)或基材附接的点。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个选自以下组:
Figure BDA0003042696400001244
其中
R1选自H,C1-C6烷基,或-SO3
R2是C1-C6烷基;和
X是卤素部分。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001251
其中R1选自H、C1-C6烷基或-SO3。在一些实施方式中,R1是H。在一些实施方式中,R1是C1-C6烷基。在一些实施方式中,R1是-SO3
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001252
其中R2是C1-C6烷基。在一些实施方式中,R2是甲基。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001253
在一些实施方式中,
Figure BDA0003042696400001254
可与活化剂反应形成活性酯。在一些实施方式中,活性酯为
Figure BDA0003042696400001255
在一些实施方式中,活化剂是酰化剂(例如,N-羟基琥珀酰亚胺和N-羟基磺基琥珀酰亚胺)。在一些实施方式中,活化剂是O-酰基脲形成剂(例如,1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)、二环己基碳二亚胺和二异丙基碳二亚胺)。在一些实施方式中,活化剂是至少一种酰化剂和至少一种O-异脲形成剂(例如,N-羟基琥珀酰亚胺(NHS)、1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)、N-羟基磺基琥珀酰亚胺(磺基NHS)及其组合)的组合。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001256
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001261
其中X是卤素部分。例如,X是氯、溴或碘。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001262
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001263
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001264
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个选自以下组:
Figure BDA0003042696400001265
其中
R3是H或C1-C6烷基;并且
R4是H或三甲基甲硅烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001266
其中R4是H或三甲基甲硅烷基。在一些实施方式中,R4是H。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个选自以下组:
Figure BDA0003042696400001267
其中R3是H或C1-C6烷基。在一些实施方式中,R3是H。在一些实施方式中,R3是C1-C6烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001271
其中R3是H或C1-C6烷基。在一些实施方式中,R3是H。在一些实施方式中,R3是C1-C6烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001272
在一些实施方式中,第一反应性元件或第二反应性元件中的至少一个包括
Figure BDA0003042696400001273
在一些实施方式中,第一反应性元件或第二反应性元件中的一个选自以下组:
Figure BDA0003042696400001274
其中
R1选自H,C1-C6烷基,或-SO3
R2是C1-C6烷基;
X是卤素部分;
并且第一反应性元件或第二反应性元件中的另一个选自以下组:
Figure BDA0003042696400001275
其中
R3是H或C1-C6烷基;并且
R4是H或三甲基甲硅烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的一个选自以下组:
Figure BDA0003042696400001281
其中R3是H或C1-C6烷基;
并且第一反应性元件或第二反应性元件中的另一个是
Figure BDA0003042696400001282
其中R4是H或三甲基甲硅烷基。在一些实施方式中,R3是H。在一些实施方式中,R3是C1-C6烷基。在一些实施方式中,R4是H。在一些实施方式中,R4是三甲基甲硅烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的一个选自以下组:
Figure BDA0003042696400001283
其中
R1选自H,C1-C6烷基,或-SO3
R2是C1-C6烷基;
X是卤素部分;
并且第一反应性元件或第二反应性元件中的另一个选自以下组:
Figure BDA0003042696400001284
其中R3是H或C1-C6烷基。在一些实施方式中,R1是H。在一些实施方式中,R1是C1-C6烷基。在一些实施方式中,R1是-SO3。在一些实施方式中,R2是甲基。在一些实施方式中,X是碘。在一些实施方式中,R3是H。在一些实施方式中,R3是C1-C6烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的一个选自以下组:
Figure BDA0003042696400001291
其中
R1选自H,C1-C6烷基,或-SO3
R2是C1-C6烷基;
并且第一反应性元件或第二反应性元件中的另一个包括
Figure BDA0003042696400001292
其中R3是H或C1-C6烷基。在一些实施方式中,R1是H。在一些实施方式中,R1是C1-C6烷基。在一些实施方式中,R1是-SO3。在一些实施方式中,R2是甲基。在一些实施方式中,R3是H。在一些实施方式中,R3是C1-C6烷基。
在一些实施方式中,第一反应性元件或第二反应性元件中的一个选自以下组:
Figure BDA0003042696400001293
其中X是卤素部分;
并且第一反应性元件或第二反应性元件中的另一个包括
Figure BDA0003042696400001294
在一些实施方式中,X是溴。在一些实施方式中,X是碘。
在一些实施方式中,第一反应性元件或第二反应性元件中的一个选自以下组:
Figure BDA0003042696400001301
并且第一反应性元件或第二反应性元件中的另一个包括
Figure BDA0003042696400001302
术语“卤素”是指氟(F),氯(Cl),溴(Br)或碘(I)。
术语“烷基”是指可以是直链或支链的烃链,其包含所示数目的碳原子。例如,C1-10表示该基团中可以具有1至10个(含)碳原子。非限制性示例包括甲基、乙基、异-丙基、叔-丁基、正-己基。
术语“卤代烷基”是指其中一个或多个氢原子被独立选择的卤素取代的烷基。
术语“烷氧基”是指-O-烷基(例如,-OCH3)。
术语“亚烷基”是指二价烷基(例如,-CH2-)。
术语“烯基”是指可以是具有一个或多个碳-碳双键的直链或支链的烃链。烯基部分包含指定数目的碳原子。例如,C2-6表示该基团中可以具有2至6个(包括)碳原子。
术语“炔基”是指可以是具有一个或多个碳-碳三键的直链或支链的烃链。炔基部分包含指定数目的碳原子。例如,C2-6表示该基团中可以具有2至6个(包括)碳原子。
术语“芳基”是指6-20个碳的单环、双环、三环或多环基团,其中系统中的至少一个环是芳族的(例如6-碳单环,10-碳双环或14-碳三环芳族环系统);以及其中每个环的0、1、2、3或4个原子可以被取代基取代。芳基的实例还包括苯基、萘基、四氢萘基等。
将珠非共价键合到基材的方法
本文提供用于将珠(例如,光学标记珠、水凝胶珠、或微球珠)非共价键合到基材的方法。
在一些实施方式中,珠经由第一亲合基团和第二亲合基团之间的非共价键耦合到基材。在一些实施方式中,非共价结合的珠基本上在基材上形成珠的单层(例如,水凝胶珠、微球珠)。
在一些实施方式中,所述珠用第一亲和基团官能化,所述第一亲和基团直接结合到所述珠。在一些实施方式中,所述珠用第一亲和基团官能化,所述第一亲和基团通过接头间接结合到所述珠。在一些实施方式中,接头是二苯甲酮。在一些实施方式中,接头是氨基甲基丙烯酰胺。例如,接头可以是3-氨基丙基甲基丙烯酰胺。在一些实施方式中,接头是PEG接头。在一些实施方式中,接头是可裂解接头。
在一些实施方式中,用直接结合到基材的第二亲和基团使基材官能化。在一些实施方式中,所述基材用第二亲核基团官能化,所述第二亲和基团通过接头间接结合到所述珠。在一些实施方式中,接头是二苯甲酮。在一些实施方式中,接头是氨基甲基丙烯酰胺。例如,接头可以是3-氨基丙基甲基丙烯酰胺。在一些实施方式中,接头是PEG接头。在一些实施方式中,接头是可裂解接头。
在一些实施方式中,第一亲和基团或第二亲和基团是生物素,并且第一亲和基团或第二亲和基团中的另一个是链霉亲和素。
在一些实施方式中,约99%的非共价结合珠在基材上形成珠单层。在一些实施方式中,约50%至约98%在基材上形成单层珠。例如,约50%至约95%、约50%至约90%、约50%至约85%、约50%至约80%、约50%至约75%、约50%至约70%、约50%至约65%、约50%至约60%或约50%至约55%的非共价结合珠在基材上形成单层珠。在一些实施方式中,约55%至约98%、约60%至约98%、约65%至约98%、约70%至约98%、约75%至约98%、约80%至约98%、约85%至约98%、约90%至约95%或约95%至约98%的非共价结合珠在基材上形成单层珠。在一些实施方式中,约55%至约95%、约60%至约90%、约65%至约95%、约70%至约95%、约75%至约90%、约75%至约95%、约80%至约90%、约80%至约95%、约85%至约90%、或约85%至约95%的非共价结合的珠在基材上形成单层珠。
在一些实施方式中,珠的单层在基材上的预定区域中形成。在一些实施方式中,预定区域用物理屏障划分。例如,基材中的凹坑或孔。在一些实施方式中,使用光掩模对预定区域进行分区。例如,用光活化的溶液涂覆基材,干燥,然后在光掩模下辐照。在一些实施方式中,光活化的溶液是经紫外光活化的。
如本文所用,“粘合剂”通常指用于将物体或材料粘在一起的物质。粘合剂包括,例如,胶水、糊料、液体胶带、环氧树脂、生物粘合剂、凝胶和粘液。在一些实施方式中,粘合剂是液体胶带。在一些实施方式中,粘合剂是胶水。
在一些实施方式中,使用粘合剂(例如,液体胶带、胶水、糊料)将珠粘附到基材上。在一些实施方式中,粘附的珠基本上在基材(例如,载玻片)上形成单层珠。在一些实施方式中,珠是水凝胶珠。在一些实施方式中,珠是微球珠。在一些实施方式中,用粘合剂涂覆珠,然后珠与基材接触。在一些实施方式中,用粘合剂涂覆基材,然后使基材与珠接触。在一些实施方式中,用粘合剂涂覆基材和用粘合剂涂覆珠,然后珠和基材彼此接触。
在一些实施方式中,约99%的粘附珠在基材上形成单层珠。在一些实施方式中,约50%至约98%在基材上形成单层珠。例如,约50%至约95%、约50%至约90%、约50%至约85%、约50%至约80%、约50%至约75%、约50%至约70%、约50%至约65%、约50%至约60%或约50%至约55%的粘附的珠在基材上形成单层珠。在一些实施方式中,约55%至约98%、约60%至约98%、约65%至约98%、约70%至约98%、约75%至约98%、约80%至约98%、约85%至约98%、约90%至约95%或约95%至约98%的粘附的珠在基材上形成单层珠。在一些实施方式中,约55%至约95%、约60%至约90%、约65%至约95%、约70%至约95%、约75%至约90%、约75%至约95%、约80%至约90%、约80%至约95%、约85%至约90%、或约85%至约95%的粘附的珠在基材上形成单层珠。
在一些实施方式中,可以将珠沉积到生物样品上,使得沉积的珠在生物样品上形成单层珠(例如,在生物样品上或下)。在一些实施方式中,沉积在基材上的珠可自组装成单层珠,其饱和所研究生物样品的预期表面积。在这种方法中,可以设计、配制和制备珠阵列,以评估来自任何大小或尺寸的生物样品的多种分析物。在一些实施方式中,应用于生物样品的珠(例如凝胶珠)的浓度或密度使得整个区域或生物样品中的一个或多个感兴趣区域被单层珠饱和。在一些实施方式中,通过在生物样品上浇注、移液、喷涂等方式使珠与生物样品接触。可以使用任何合适的珠沉积形式。
在一些实施方式中,生物样品可限定于阵列的特定区或区域。例如,可以将生物样品固定在载玻片上,并且将腔室、垫圈或笼定位在生物样品上,以充当容纳区域或框架,在其中沉积珠。显而易见,饱和区域或生物样品所需的珠的密度或浓度可由本领域普通技术人员容易地确定(例如,通过生物样品上珠的显微可视化)。在一些实施方式中,珠阵列包含微流体通道以将试剂引导到阵列的斑点或珠。
特征几何属性
阵列上的特征可以有多种大小。在一些实施方式中,阵列的特征可以具有1μm到100μm之间的直径或最大尺寸。例如,1μm到10μm、1μm到20μm、1μm到30μm、1μm到40μm、1μm到50μm、1μm到60μm、1μm到70μm、1μm到80μm、1μm到90μm、90μm到100μm、80μm到100μm、70μm到100μm,60μm到100μm、50μm到100μm、40μm到100μm、30μm到100μm、20μm到100μm或10μm到100μm。在一些实施方式中,特征具有30μm至100μm、40μm至90μm、50μm至80μm、60μm至70μm之间的直径或最大尺寸,或公开的子范围内的任何范围。在一些实施方式中,特征的直径或最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm,12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。在一些实施方式中,特征的直径或最大尺寸约为65μm。
在一些实施方式中,阵列的多个特征的大小和/或形状大致相同。在一些实施方式中,阵列的多个特征的大小和/或形状不均匀。例如,在一些实施方式中,阵列中的特征可以具有平均横截面尺寸,并且特征之间的横截面尺寸的分布可以具有分布的平均横截面尺寸的0%或更多(例如,5%或更多、10%或更多、20%或更多、30%或更多、40%或更多、50%或更多、70%或更多、或100%或更多)的全宽和半最大值。
在某些实施方式中,阵列中的特征可以具有约1μm到约10μm之间的平均横截面尺寸。该平均特征横截面尺寸的范围对应于单个哺乳动物细胞的近似直径。因此,这些特征的阵列可用于检测处于或低于哺乳动物单细胞分辨能力的分析物。
在一些实施方式中,多个特征具有约0.1μm到约100μm的平均直径或平均最大尺寸(例如,约0.1μm到约5μm,约1μm到约10μm,约1μm到约20μm,约1μm到约30μm,约1μm到约40μm,约1μm到约50μm,约1μm到约60μm,约1μm至约70μm,约1μm至约80μm,约1μm至约90μm,约90μm至约100μm,约80μm至约100μm,约70μm至约100μm,约60μm至约100μm,约50μm至约100μm,约40μm至约100μm,约30μm至约100μm,约20μm至约100μm,或约10μm至约100μm)。在一些实施方式中,多个特征具有30μm至100μm、40μm至90μm、50μm至80μm、60μm至70μm之间的平均直径或平均最大尺寸,或公开的子范围内的任何范围。在一些实施方式中,多个特征的平均直径或平均最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm,12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。在一些实施方式中,多个特征具有约65μm的平均直径或平均最大尺寸。
在一些实施方式中,如果特征是珠,则珠的直径或最大尺寸可不大于100μm(例如,不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm、12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm,或1μm)。
在一些实施方式中,多个珠的平均直径不大于100μm。在一些实施方式中,多个珠的平均直径或最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm,12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。
在一些实施方式中,珠的体积可为至少约1μm3,例如至少1μm3、2μm3、3μm3、4μm3、5μm3、6μm3、7μm3、8μm3、9μm3、10μm3、12μm3、14μm3、16μm3、18μm3、20μm3、25μm3、30μm3、35μm3、40μm3、45μm3、50μm3、55μm3、60μm3、65μm3、70μm3、75μm3、80μm3、85μm3、90μm3、95μm3、100μm3、125μm3、150μm3、175μm3、200μm3、250μm3、300μm3、350μm3、400μm3、450μm3、μm3、500μm3、550μm3、600μm3、650μm3、700μm3、750μm3、800μm3、850μm3、900μm3、950μm3、1000μm3、1200μm3、1400μm3、1600μm3、1800μm3、2000μm3、2200μm3、2400μm3、2600μm3、2800μm3、3000μm3或更大。
在一些实施方式中,珠可具有约1μm3与100μm3之间的体积,例如约1μm3与10μm3之间、约10μm3与50μm3之间或约50μm3与100μm3之间的体积。在一些实施方式中,珠可包括约100μm3与1000μm3之间的体积,例如约100μm3与500μm3之间或约500μm3与1000μm3之间的体积。在一些实施方式中,珠可包括约1000μm3与3000μm3之间的体积,例如约1000μm3与2000μm3之间或约2000μm3与3000μm3之间的体积。在一些实施方式中,珠可包括约1μm3与3000μm3之间的体积,例如约1μm3与2000μm3之间、约1μm3与1000μm3之间、约1μm3与500μm3之间或约1μm3与250μm3之间的体积。
珠可以包括一个或多个相同或不同的横截面。在一些实施方式中,珠可具有不同于第二横截面的第一横截面。该珠可具有至少约为0.0001微米、0.001微米、0.01微米、0.1微米或1微米的第一横截面。在一些实施方式中,珠可包括至少约1微米(μm)、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、11μm、12μm、13μm、14μm、15μm、16μm、17μm、18μm、19μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、120μm、140μm、160μm、180μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、550μm、600μm、650μm、700μm、750μm、800μm、850μm、900μm、950μm、1毫米(mm)或更大的横截面(例如,第一横截面)。在一些实施方式中,珠可包括约1μm与500μm之间的横截面(例如,第一横截面),例如约1μm与100μm之间、约100μm与200μm之间、约200μm与300μm之间、约300μm与400μm之间或约400μm与500μm之间。例如,珠可包括约1μm与100μm之间的横截面(例如,第一横截面)。在一些实施方式中,珠可具有至少约1μm的第二横截面。例如,珠可包括至少约1微米(μm)、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、11μm、12μm、13μm、14μm、15μm、16μm、17μm、18μm、19μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、120μm、140μm、160μm、180μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、550μm、600μm、650μm、700μm、750μm、800μm、850μm、900μm、950μm、1毫米(mm)或更大的第二横截面。在一些实施方式中,珠可包括约1μm与500μm之间的第二横截面,例如约1μm与100μm之间、约100μm与200μm之间、约200μm与300μm之间、约300μm与400μm之间或约400μm与500μm之间。例如,珠可包括约1μm与100μm之间的第二横截面。
在一些实施方式中,珠可以是纳米级的(例如,珠可以具有约100纳米(nm)到约900纳米(nm)的直径或最大横截面尺寸)(例如,850纳米或更小、800纳米或更小、750纳米或更小、700纳米或更小、650纳米或更小、600纳米或更小、550纳米或更小、500纳米或更小、450纳米或更小、400纳米或更小,350纳米或更小、300纳米或更小、250纳米或更小、200纳米或更小、150纳米或更小)。多个珠可具有约100纳米(nm)到约900纳米(nm)的平均直径或平均最大横截面尺寸(例如,850纳米或更小、800纳米或更小、750纳米或更小、700纳米或更小、650纳米或更小、600纳米或更小、550纳米或更小、500纳米或更小、450纳米或更小、400纳米或更小、350纳米或更小,300纳米或更小、250纳米或更小、200纳米或更小、150纳米或更小)。在一些实施方式中,珠的直径或尺寸约为单个细胞(例如,被评估的单个细胞)的尺寸。
珠可以是均匀尺寸或不均匀尺寸。“多分散性”一般是指分子或颗粒大小的不均匀性。多分散性指数(PDI)可使用方程式PDI=Mw/Mn计算,其中Mw是重量平均摩尔质量,Mn是数平均摩尔质量。在某些实施方式中,可将珠提供为具有相对单分散尺寸分布的多个珠或珠群。当需要提供相对一致的试剂量时,保持相对一致的珠特征(例如尺寸)有助于整体一致性。
在一些实施方式中,本文提供的珠可具有尺寸分布,其横截面尺寸的变化系数小于50%、小于40%、小于30%、小于20%、小于15%、小于10%、小于5%或更低。在一些实施方式中,本文提供的多个珠具有小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%或更低的多分散性指数。
阵列几何属性
在一些实施方式中,阵列包括多个特征。例如,阵列包含4000到10000个特征,或4000到6000个特征的任何范围内的特征。例如,阵列包括4000到4400个特征、4000到4800个特征、4000到5200个特征、4000到5600个特征、5600到6000个特征、5200到6000个特征、4800到6000个特征或4400到6000个特征。在一些实施方式中,阵列包括4100到5900个特征、4200到5800个特征、4300到5700个特征、4400到5600个特征、4500到5500个特征、4600到5400个特征、4700到5300个特征、4800到5200个特征、4900到5100个特征,或者所公开的子范围内的任何范围。例如,阵列可包括约4000个特征、约4200个特征、约4400个特征、约4800个特征、约5000个特征、约5200个特征、约5400个特征、约5600个特征或约6000个特征。在一些实施方式中,阵列包括至少4000个特征。在一些实施方式中,阵列包括大约5000个特征。
在一些实施方式中,阵列内的特征彼此具有不规则的排列或关系,使得在特征之间的几何间距关系中没有明显的可辨别的图案或规则性。例如,阵列中的特征可以彼此随机定位。或者,阵列内的特征可以不规则地定位,但是可以确定地选择间隔,以确保所得到的特征排列是不规则的。
在一些实施方式中,阵列内的特征相对于彼此规则地定位以形成图案。阵列中可以实现多种不同的特性模式。这种模式的示例包括但不限于特征的正方形阵列、特征的矩形阵列、特征的六边形阵列(包括六边形密排阵列)、特征的径向阵列、特征的螺旋阵列、特征的三角形阵列,以及更一般地,其中阵列中邻近特征在通过线性和/或角度坐标尺寸的规则增量彼此达到的任何阵列。
在一些实施方式中,阵列内的特征以相对于彼此的一定规则度定位,使得特征阵列既不是完全规则的,也不是完全不规则的(即,阵列是“部分规则的”)。例如,在一些实施方式中,阵列中的邻近特征可以由一个或多个线性和/或角度坐标尺寸中的位移分离,该位移为阵列中邻近特征之间的平均位移或标称位移的10%或更多(例如,20%或更多、30%或更多、40%或更多、50%或更多、60%或更多、70%或更多、80%或更多、90%或更多、100%或更多、110%或更多、120%或更多、130%或更多,140%或更多、150%或更多、160%或更多、170%或更多、180%或更多、190%或更多、200%或更多)。在某些实施方式中,阵列中邻近特征之间的位移分布(线性和/或角度)具有阵列中邻近特征之间的平均位移或标称位移的0%和200%之间(例如,0%和100%之间、0%和75%之间、0%和50%之间、0%和25%之间、0%和15%之间、0%和10%之间)的半最大值处的全宽。
在一些实施方式中,特征阵列可以具有可变几何形状。例如,可以根据第一几何图案排列阵列中的特征的第一子集,并且可以根据与第一图案不同的第二几何图案排列阵列中的特征的第二子集。例如,上述任何图案都可以对应于第一和/或第二几何图案。
通常,可以通过调整阵列中邻近特征之间的间距来制备不同特征密度的阵列。在一些实施方式中,阵列中邻近特征之间的几何中心到中心间距在100nm到100μm之间。例如,中心到中心间距可以在20μm到40μm、20μm到60μm、20μm到80μm、80μm到100μm、60μm到100μm或40μm到100μm之间。在一些实施方式中,邻近阵列特征之间的中心到中心间距在30μm和100μm、40μm和90μm、50μm和80μm、60μm和70μm、80μm和120μm之间,或在所公开的子范围内的任何范围。在一些实施方式中,阵列特征的邻近阵列特征之间的中心到中心间距约为65μm。
在一些实施方式中,特征阵列可以具有空间上变化的分辨率。通常,具有空间变化分辨率的阵列是阵列中邻近特征之间的中心到中心间距(沿线性、角度或线性和角度坐标尺寸)变化的阵列。这种阵列可用于各种应用。例如,在一些实施方式中,取决于要调查样品的空间分辨率,样品可以选择性地与阵列中大约对应于测量的期望空间分辨率的部分相关联。
空间上不同分辨率的阵列可以以多种方式实现。在一些实施方式中,例如,阵列中邻近特征之间的中心到中心间距沿一个或多个线性和/或角度坐标方向连续变化。因此,对于矩形阵列,特征的连续行之间、特征的连续列之间或特征的连续行和连续列之间的间距可以连续变化。
在某些实施方式中,空间上变化的分辨率的阵列可以包括具有特征总体的离散域。在每个域中,邻近特征可以有规则的中心到中心间距。因此,例如,阵列可以包括第一域,其中邻近特征沿线性和/或角度坐标维度彼此间隔第一组均匀坐标位移,以及第二域,其中邻近特征沿线性和/或角度坐标维度彼此间隔第二组均匀坐标位移。第一和第二组位移在至少一个坐标位移中不同,使得两个域中的邻近特征间隔不同,因此第一域中的阵列的分辨率不同于第二域中的阵列的分辨率。
在一些实施方式中,阵列特征的中心到中心间距可以足够小,使得阵列特征沿着一个或多个阵列维度有效地连续或几乎连续地定位,并且阵列特征之间沿着这些维度很少或没有位移。例如,在其中特征对应于基材的区域(即,寡核苷酸直接结合到基材)的特征阵列中,邻近寡核苷酸之间的位移可以非常小-有效地,单个寡核苷酸的分子宽度。在这些实施方式中,每个寡核苷酸可以包括不同的空间条形码,使得可以在样品分析期间确定阵列中每个寡核苷酸的空间位置。这种类型的阵列可以具有非常高的空间分辨率,但可能仅包括对应于样品中每个不同空间位置的单个寡核苷酸。
通常,阵列的大小(对应于沿一个坐标方向包围阵列中所有特征的最小边界的最大维度)可以根据需要进行选择,这是基于诸如每个特征内样品大小、特征大小和捕获探针的密度等标准。例如,在一些实施方式中,阵列可以是矩形或正方形阵列,其沿每个坐标方向的最大阵列维度为10mm或更小(例如,9mm或更小、8mm或更小、7mm或更小、6mm或更小、5mm或更小、4mm或更小、3mm或更小)。因此,例如,特征的正方形阵列可以具有8mm×8mm、7mm×7mm、5mm×5mm或小于5mm×5mm的维度。
(e)分析物捕获
在本节中,描述了捕获分析物的方法和系统的一般方面。在许多不同的实施方式中,可以组合地呈现各个方法步骤和系统特征;本文描述的特定组合不以任何方式限制步骤和特征的其他组合。
通常,当生物样品与例如包含捕获探针的基材(例如,具有嵌入、点样、印刷在基材上的捕获探针的基材或具有包含捕获探针的特征(例如,珠、孔)的基材)接触时,可捕获分析物。
如本文所用,使生物样品“接触”包含特征的基材指任何接触(例如,直接或间接),使得捕获探针可以与来自生物样品的分析物相互作用(例如,捕获)。例如,基材可以靠近或邻近生物样品而不直接物理接触,但是能够从生物样品捕获分析物。在一些实施方式中,生物样品与基材直接物理接触。在一些实施方式中,生物样品与基材间接物理接触。例如,液体层可以在生物样品和基材之间。在一些实施方式中,分析物扩散穿过液体层。在一些实施方式中,捕获探针扩散穿过液体层。在一些实施方式中,试剂可经由生物样品和基材之间的液体层递送。在一些实施方式中,间接物理接触可以是在生物样品和第一基材之间存在第二基材(例如,水凝胶、膜、多孔膜),所述第一基材包括具有捕获探针的特征。在一些实施方式中,试剂可由第二基材递送至生物样品。
抗扩散介质/盖
为了通过鼓励分析物向空间标记的捕获探针扩散来提高效率,可以使用抗扩散介质。一般而言,生物分析物的分子扩散发生在所有方向,包括朝向捕获探针(即朝向空间条码化阵列)和远离捕获探针(即进入整体溶液)。增加朝向空间条码化阵列的扩散可减少远离空间条码化阵列的分析物扩散,并提高捕获探针的捕获效率。
在一些实施方式中,将生物样品放置在空间条码化基材的顶部,并且将抗扩散介质放置在生物样品的顶部。例如,可将抗扩散介质放置在已与生物样品接触的阵列上。在一些实施方式中,抗扩散介质和空间标记阵列是相同的组件。例如,抗扩散介质可包含在抗扩散介质(例如盖玻片、载玻片、水凝胶或膜)内或其上的空间标记捕获探针。在一些实施方式中,将样品放置在基材上并且将抗扩散介质放置在生物样品的顶部。此外,空间条码化捕获探针阵列可被放置在抗扩散介质上的邻近位置。例如,抗扩散介质可以夹在空间标记阵列和基材上的样品之间。在一些实施方式中,抗扩散介质被布置或点样到样品上。在其它实施方式中,抗扩散介质放置在样品附近。
一般来说,抗扩散介质可以是任何已知的限制生物分析物扩散率的材料。例如,抗扩散介质可以是固体盖(例如,盖玻片或玻片)。在一些实施方式中,抗扩散介质可由玻璃、硅、纸、水凝胶、聚合物整材或其他材料制成。在一些实施方式中,盖玻片可以是丙烯酸玻璃载玻片。在一些实施方式中,抗扩散介质是多孔膜。在一些实施方式中,材料可以是天然多孔的。在一些实施方式中,该材料可具有蚀刻到固体材料中的孔或洞。在一些实施方式中,可操纵孔径以最小化目标分析物的损失。在一些实施方式中,可操纵膜化学以最小化目标分析物的损失。在一些实施方式中,抗扩散介质(即水凝胶)共价地附接到基材(即载玻片)上。在一些实施方式中,抗扩散介质可以是已知限制多聚(A)转录物扩散率的任何材料。在一些实施方式中,抗扩散介质可以是已知限制蛋白质扩散率的任何材料。在一些实施方式中,抗扩散介质可以是已知的限制大分子成分扩散率的任何材料。
在一些实施方式中,抗扩散介质包括一种或多种抗扩散介质。例如,在将一种或多种抗扩散介质置于与生物样品接触之前,可以以多种方式组合一种或多种抗扩散介质,包括但不限于涂层、分层或点样。作为另一个例子,可以将水凝胶放置在生物样品上,然后在水凝胶顶部放置盖子(例如,载玻片)。
在一些实施方式中,施加力(例如,流体动压、超声振动、溶质对比度、微波辐射、血管循环或其他电、机械、磁力、离心力和/或热力)以控制扩散并增强分析物捕获。在一些实施方式中,一个或多个力和一个或多个抗扩散介质用于控制扩散和增强捕获。例如,离心力和载玻片可以同时使用。力和抗扩散介质的各种组合中的任何一种都可用于控制或减轻扩散并增强分析物捕获。
在一些实施方式中,抗扩散介质与空间条码化阵列和样品一起浸没在大量溶液(bulk solution)中。在一些实施方式中,大量溶液包括透化试剂。在一些实施方式中,抗扩散介质包括至少一种透化试剂。在一些实施方式中,在抗扩散介质与样品接触之前,将抗扩散介质(即水凝胶)浸泡在透化试剂中。在一些实施方式中,抗扩散介质可包括含有透化缓冲液或试剂的孔(例如,微孔、纳米孔或皮孔)。在一些实施方式中,抗扩散介质可包括透化试剂。在一些实施方式中,当抗扩散介质应用于生物样品时,抗扩散介质可包含干燥试剂或单体以递送透化试剂。在一些实施方式中,在将所述组件浸入大量溶液中之前,将所述抗扩散介质添加到所述空间条码化阵列和样品组件中。在一些实施方式中,在样品暴露于透化试剂之后,将抗扩散介质添加到空间条码化阵列和样品组件中。在一些实施方式中,透化试剂流过抗扩散介质上的微流体室或通道。在一些实施方式中,流控制样品对透化试剂的可及性。在一些实施方式中,目标分析物扩散出样品并朝向大量溶液,并且包埋到空间标记的捕获探针包埋的抗扩散介质中。在一些实施方式中,游离溶液夹在生物样品和抗扩散介质之间。
图13是抗扩散介质的示例性使用的图示。抗扩散介质1302可与样品1303接触。在图13中,载玻片1304填充有空间条码化捕获探针1306,并且样品1303、1305与阵列1304、1306接触。可将抗扩散介质1302施加至样品1303,其中样品1303夹在抗扩散介质1302与经捕获探针包被的载玻片1304之间。当将透化溶液1301施加到样品时,使用抗扩散介质/盖1302通过减少分析物向外扩散到介质中来引导分析物1305向捕获探针1306的迁移。或者,盖可以包含透化试剂。
捕获条件
基材(或基材上的特征)上的捕获探针通过捕获域与释放的分析物相互作用,如别处所述,以捕获分析物。在一些实施方式中,进行某些步骤以增强通过阵列的捕获探针进行的分析物的转移或捕获。此类修改的实例包括但不限于调整用于使基材与生物样品接触的条件(例如,时间、温度、取向、pH水平、生物样品的预处理等)、使用力来传输分析物(例如,电泳、离心、机械等),进行扩增反应以增加生物分析物的量(例如,PCR扩增、原位扩增、克隆扩增),和/或使用标记的探针检测扩增子和条形码。
在一些实施方式中,通过用透化试剂处理生物样品来促进分析物的捕获。如果生物样品透化不够,则在基材上捕获的分析物的量可能过低,无法进行充分的分析。相反,如果生物样品透化性太强,则分析物可从其在生物样品中的来源扩散出去,从而失去生物样品中分析物的相对空间关系。因此,在充分透化生物样品以获得良好信号强度同时仍保持生物样品中分析物分布的空间分辨率之间的平衡是理想的。本领域已知制备促进生物样品的方法,并且可以根据生物样品和制备生物样品的方式(例如,新鲜冷冻、FFPE等)进行修改。
被动捕获方法
在一些实施方式中,分析物可从样品迁移到基材。促进迁移的方法可以是被动的(例如扩散)和/或主动的(例如核酸的电泳迁移)。被动迁移的非限制性例子可包括脱水物体再水化产生的简单扩散和渗透压。
通过扩散被动迁移使用浓度梯度。扩散是无约束物体向平衡方向运动。因此,当存在高对象浓度区域和低对象浓度区域时,对象(捕获探针、分析物等)移动到低浓度区域。在一些实施方式中,无约束的分析物在浓度梯度上向下移动。
在一些实施方式中,可将不同试剂添加到生物样品中,使得生物样品被再水化,同时改进分析物的捕获。在一些实施方式中,生物样品可以用透化试剂再水化。在一些实施方式中,可使用染色溶液(例如苏木精和伊红染色)将生物样品再水化。
主动捕获方法
在本文所述的任何方法的一些示例中,细胞或生物样品中的分析物可被输送(例如,被动或主动地)到捕获探针(例如,固定在固体表面上的捕获探针)。
例如,可以使用电场(例如,使用电泳)、压力梯度、流体流、化学浓度梯度、温度梯度和/或磁场将细胞或生物样品中的分析物输送到捕获探针(例如,固定的捕获探针)。例如,分析物可通过例如凝胶(例如,水凝胶基材)、流体或透化的细胞输送到捕获探针(例如,固定的捕获探针)。
在一些实例中,电泳场可施加于分析物以促进分析物向捕获探针迁移。在一些示例中,样品接触基材和固定在基材(例如,载玻片、盖玻片或珠)上的捕获探针,并且施加电流以促进带电分析物朝向固定在基材上的捕获探针的定向迁移。其中细胞或生物样品与阴极和捕获探针(例如,固定在基材上的捕获探针)接触,和其中捕获探针(例如,固定在基材上的捕获探针)与细胞或生物样品和阳极接触的电泳组件可用于施加电流。
在保持样品中分析物的相对空间排列的同时,可以进行分析物的电泳转移。因此,由捕获探针捕获的分析物(例如,固定在基材上的捕获探针)保留细胞或生物样品的空间信息。对分析物施加电泳场也可导致温度升高(例如,热)。在一些实施方式中,升高的温度(例如,热)可促进分析物向捕获探针迁移。
在一些示例中,空间可寻址微电极阵列用于通过捕获探针对至少一种感兴趣的带电分析物进行空间受限捕获。微电极阵列可配置为包括高密度的离散位点,其具有小面积,用于施加电场以促进感兴趣的带电分析物的迁移。例如,可以使用空间可寻址微电极阵列在感兴趣区域上进行电泳捕获。
微电极阵列上的高密度离散位点可用于小型装置。该表面可包括离散位置的任何合适密度(例如,适合在给定时间内在导电基材上处理样品的密度)。在一个实施方式中,该表面具有大于或等于每1mm2约500个位点的离散位点密度。在一些实施方式中,表面具有每1mm2约100、约200、约300、约400、约500、约600、约700、约800、约900、约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约20000、约40000、约60000、约80000个,约100000个,或约500000个位点的离散位点密度。在一些实施方式中,表面具有每1mm2至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约2000、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、至少约10000、至少约20000、至少约40000、至少约60000、至少约80000、至少约100000、或至少约500000个位点的离散位点密度。
图14A和图14B示出了配置成将转录物分析物导向空间条码化捕获探针阵列的电泳转移系统的示意图。在电泳系统的该示例性配置中,样品1402夹在阴极1401和空间条码化捕获探针阵列1404、1405之间,并且空间条码化捕获探针阵列1404、1405夹在样品1402和阳极1403之间,使得样品1402、1406与空间条码化捕获探针1407接触。当电场施加到电泳转移系统时,带负电的mRNA分析物1406将被拉向带正电的阳极1403并进入包含空间条码化捕获探针1407的空间条码化阵列1404、1405。空间条码化捕获探针1407然后与mRNA目标分析物1406相互作用/杂交/固定化,使得分析物捕获更高效。根据目标分析物的不同,电泳系统的设置可能会发生变化。例如,根据蛋白质以及其他因素(例如等电点、溶解度等),蛋白质可以是带正电的、带负电的、中性的或极性的。熟练的从业者具有安排电泳转移系统以促进捕获特定目标分析物的知识和经验。
图15是示出利用电泳转移系统的示例性工作流方案的示意图。在该示例中,组图A描绘了与样品接触的柔性空间条码化特征阵列。所述样品可以是柔性阵列,其中所述阵列固定在水凝胶、膜或其他柔性基材上。组图B描绘了阵列与样品的接触以及阵列-样品组件的成像。样品/阵列组件的图像可用于验证样品放置、选择感兴趣区域、或如本文所述对阵列上的样品成像的任何其他原因。组图C描绘了使用电泳转移系统的电场应用,以帮助高效捕获目标分析物。在这里,带负电的mRNA目标分析物向带正电的阳极迁移。组图D描述了逆转录试剂的应用和捕获的目标分析物的第一链cDNA合成。组图E描述了阵列移出和文库构建准备(组图F)和下一代测序(组图G)。
感兴趣区域
生物样品可能会具有显示可能指示疾病的存在或疾病表型的发展的形态特征的区域。例如,肿瘤活检样品内特定部位的形态学特征可指示对象中癌症的侵袭性、治疗买药性、转移潜能、迁移、分期、诊断和/或预后。肿瘤活检样品中特定部位的形态特征变化通常与特定部位细胞中分析物的水平或表达变化相关,而这种变化反过来又可用于提供有关对象的癌症的侵袭性、治疗耐药性、转移潜能、迁移、分期、诊断,和/或预后的信息。生物样品中选择用于特定分析的区域(例如,生物样品中具有感兴趣形态特征的区域)通常被描述为“感兴趣区域”。
生物样品中的感兴趣区域可用于分析生物样品中的特定感兴趣区域,从而将实验和数据收集集中到生物样品的特定区域(而不是整个生物样品)。这就提高了生物样品分析的时间效率。
可以使用各种不同的技术在生物样品中识别感兴趣的区域,例如膨胀显微镜、亮场显微镜、暗场显微镜、相衬显微镜、电子显微镜、荧光显微镜、反射显微镜、干涉显微镜、共焦显微镜、以及视觉识别(例如,通过眼睛)及其组合。例如,可以对生物样品进行染色和成像以识别感兴趣区域。在一些例子中,感兴趣区域可以对应于细胞结构的特定结构。在一些实施方式中,可在可视化之前对生物样品进行染色以在生物样品的不同区域之间提供对比。染色的类型可以根据生物样品的类型和待染色细胞的区域来选择。在一些实施方式中,可使用一种以上染色剂来可视化生物样品的不同方面,例如,样品的不同区域、特定细胞结构(例如细胞器)或不同细胞类型。在其它实施方式中,生物样品可在不染色生物样品的情况下被可视化或成像。
在一些实施方式中,可以使用一个或多个基准标志物来进行成像,即,放置在成像系统的视野中的对象,其出现在所产生的图像中。基准标志物通常用作参考点或测量标度。基准标志物可以包括但不限于可检测的标记物,例如荧光、放射性、化学发光和比色标记物。例如,在Carter等,Applied Optics 46:421-427,2007中描述了使用基准标志物来稳定化和定向生物样品,其全部内容通过引用纳入本文。在一些实施方式中,基准标志物可以是物理颗粒(例如,纳米颗粒、微球、纳米球、珠或本文所述或本领域已知的任何其他示例性物理颗粒)。
在一些实施方式中,基准标志物可存在于基材上以提供生物样品的取向。在一些实施方式中,微球可耦合至基材以帮助生物样品的定向。在一些实例中,耦合至基材的微球可产生光信号(例如,荧光)。在另一实例中,微球可以特定图案或设计(例如六角形设计)附接于阵列的部分(例如角部),以帮助生物样品在基材上的特征阵列上的定向。在一些实施方式中,量子点可耦合到基材以帮助生物样品的定向。在一些例子中,耦合到基材的量子点可以产生光信号。
在一些实施方式中,基准标志物可为固定化分子,可检测信号分子可与之相互作用以产生信号。例如,标志物核酸可连接或耦合到当接受特定波长(或波长范围)的光时能够发出荧光的化学部分。这种标志物核酸分子可以在组织样品染色之前、同时或之后与阵列接触,以使组织切片可视化或成像。尽管不是必需的,但是使用可使用用于检测标记的cDNA的相同条件(例如成像条件)来检测的标志物可能是有利的。
在一些实施方式中,包括基准标志物以促进组织样品或其图像相对于固定在基材上的捕获探针的定向。可以使用任何数量的用于标记阵列的方法,使得仅当对组织切片成像时才可检测到标志物。例如,分子,例如产生信号的荧光分子,可以直接或间接地固定在基材的表面上。可以在基材上以图案(例如,边缘、一行或多行、一条或多条线等)提供标志物。
在一些实施方式中,基准标志物可以随机放置在视野中。例如,含有荧光团的寡核苷酸可在基材上的随机位置随机印刷、压印、合成或附接到基材(例如载玻片)上。组织切片可与基材接触,使得含有荧光团的寡核苷酸接触或接近来自组织切片的细胞或细胞的组分(例如,mRNA或DNA分子)。可以获得基材和组织切片的图像,并且可以确定荧光团在组织切片图像中的位置(例如,通过回顾覆盖有荧光团检测的组织切片的光学图像)。在一些实施方式中,基准标志物可以精确地放置在视野中(例如,在基材上的已知位置)。在这种情况下,基准标志物可以压印、附着或合成在基材上并与生物样品接触。通常,拍摄样品和基准标志物的图像,并且可以通过观看图像来确认基准标志物在基材上的位置。
在一些实施方式中,基准标志物可以是附着到基材的固定化分子(例如,物理颗粒)。例如,基准标志物可以是纳米颗粒,例如纳米棒、纳米线、纳米立方体、纳米金字塔或球形纳米颗粒。在一些例子中,纳米颗粒可以由重金属(例如金)制成。在一些实施方式中,纳米颗粒可由金刚石制成。在一些实施方式中,基准标志物可以通过眼睛看到。
如本文所述,本文所述的任何基准标志物(例如,微球、珠或本文所述的任何其他物理颗粒)可以以特定图案或设计(例如,六边形设计)位于阵列的部分(例如,角),以帮助生物样品在基材上的特征阵列上的定向。在一些实施方式中,位于阵列(例如,基材上的阵列)的部分(例如,角部)的基准标志物可以是至少1个、至少2个、至少3个或至少4个独特的图案。在一些示例中,位于阵列(例如,基材上的阵列)角部的基准标志物可以具有四种独特的基准标志物图案。
在某些示例中,基准标志物可以环绕阵列。在一些实施方式中,基准标志物能够实现例如镜像的检测。在一些实施方式中,基准标志物可以完全包围阵列。在一些实施方式中,基准标志物可以不完全包围阵列。在一些实施方式中,基准标志物识别阵列的角。在一些实施方式中,一个或多个基准标志物标识阵列的中心。在一些实施方式中,基准标志物包括图案化斑点,其中一个或多个图案化斑点基准标志物的直径约为100微米。基准标志物的直径可以是任何有用的直径,包括但不限于50微米到500微米的直径。基准标志物可以这样布置,使得一个基准标志物的中心距阵列周围的一个或多个其他基准标志物的中心在100微米到200微米之间。在一些实施方式中,具有周围基准标志物的阵列约为8mm×8mm。在一些实施方式中,没有周围基准标志物的阵列小于8mm×50mm。
在一些实施方式中,可以将阵列封闭在框架内。换句话说,阵列的周界可以有基准标志物,这样阵列就被封闭或基本封闭。在一些实施方式中,阵列的周界可以是基准标志物(例如,本文描述的任何基准标志物)。在一些实施方式中,阵列的周界可以是均匀的。例如,基准标识(fiducial marking)可以以这样的方式连接或基本上连接阵列的连续角,使得阵列周界的非角部分在阵列的所有侧面(例如,四个侧面)上是相同的。在一些实施方式中,附接到周界的非角部分的基准标志物可以被图案化或设计成有助于生物样品在阵列上的定向。在一些实施方式中,附接到周界的非角部分的颗粒可以至少1个、至少2个、至少3个或至少4个图案来图案化或设计。在一些实施方式中,在阵列周界的非角部分上,所述图案可以具有基准标识的至少2个、至少3个或至少4个独特图案。
在一些实施方式中,阵列在基材表面上的不同位置可包括至少两个基准标志物(例如,至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少12、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100或更多(例如,几百、几千或几万个基准标志物)。可以在基材上以图案(例如,边缘、一行或多行、一条或多条线等)提供基准标志物。
在一些实施方式中,在生物样品与空间阵列接触之前对生物样品进行染色和成像以选择用于空间分析的样品。在一些实施方式中,染色包括应用如上所述的基准标志物,包括荧光、放射性、化学发光或比色可检测标志物。在一些实施方式中,生物样品的染色和成像使用户识别用户希望评估的特定样品(或感兴趣区域)。
在一些实施方式中,查找表(LUT)可用于将特征的一个性质与另一个性质相关联。这些性质包括,例如,位置、条形码(例如,核酸条形码分子)、空间条形码、光学标记物、分子标签和其他性质。
在一些实施方式中,查找表可以将核酸条形码分子与特征相关联。在一些实施方式中,特征的光学标记物可使将特征与生物颗粒(例如,细胞或细胞核)相关联。特征与生物颗粒的关联可进一步允许将生物颗粒的核酸分子的核酸序列与生物颗粒的一个或多个物理性质(例如,细胞的类型或细胞的位置)相关联。例如,基于条形码和光学标记物之间的关系,光学标记物可用于确定特征的位置,从而将特征的位置与特征的条形码序列相关联。后续分析(如测序)可将条形码序列与样品中的分析物相关联。因此,基于位置和条形码序列之间的关系,可以确定生物分析物的位置(例如,在特定类型的细胞中或在生物样品的特定位置的细胞中)。
在一些实施方式中,特征可以具有附接在其上的多个核酸条形码分子。多个核酸条形码分子可以包括条形码序列。附接至给定特征的多个核酸分子可以具有相同的条形码序列,或者具有两个或更多个不同的条形码序列。可以使用不同的条形码序列来提高空间定位精度。
在一些实施方式中,处理基材以最小化或减少特征内或特征之间的非特异性分析物杂交。例如,处理可包括用水凝胶、膜和/或薄膜涂覆基材,其对非特异性杂交形成物理屏障。可以使用任何合适的水凝胶。例如,可以使用根据美国专利号6,391,937、9,512,422和9,889,422以及美国专利申请公开号U.S.2017/0253918和U.S.2018/0052081中所述方法制备的水凝胶基材。上述各文件的全部内容通过引用纳入本文。
处理可包括添加具有反应性或能够被激活的官能团,使得其在接收刺激(例如,光活性)后变得具有反应性。处理可包括使用具有一种或多种物理性质(例如,机械、电气、磁性和/或热)的聚合物进行处理,以最小化非特异性结合(例如,在某些位置激活基材以使在这些位置进行分析物杂交)。
在一些示例中,阵列(例如,本文所述的任何示例性阵列)可仅与生物样品的部分(例如,细胞、特征或感兴趣区域)接触。在一些示例中,生物样品仅与阵列的部分接触(例如,本文所述的任何示例性阵列)。在一些实例中,阵列的部分可失活以使其不与生物样品中的分析物相互作用(例如,光学失活、化学失活、热失活或阵列中捕获探针的阻断(例如,使用阻断性探针))。在一些示例中,可以从生物样品移出感兴趣区域,然后可以将感兴趣区域接触到阵列(例如,本文所述的任何阵列)。可以使用显微手术、激光捕获显微切割、分块、切片机、切割、胰蛋白酶消化、标记和/或荧光辅助细胞分选从生物样品中移出感兴趣区域。
(f)划分
如上所述,在一些实施方式中,可任选地将样品分离成单细胞、细胞群或比原始未破碎样品小的其他片段/碎片。可以分析样品的这些较小部分中的每一个以获得样品的空间分辨分析物信息。
对于已被分离成更小片段的样品-特别是对于已被分解、解离或以其他方式分离成单个细胞的样品-分析片段的一种方法涉及将片段划分进入个体分区(例如液滴),然后分析分区的内容物。通常,每个分区都保持其自身内容物与其他分区的内容物的分离。例如,分区可以是乳液中的液滴。
除分析物外,分区还可包括其它组分,尤其是一个或多个珠。分区可以包括单个凝胶珠、单个细胞珠或单个细胞珠和单个凝胶珠两者。
分区还可以包括一种或多种试剂。诸如条形码之类的独特标识符可在液滴生成之前、之后或与液滴生成同时注入到液滴中,例如经由微胶囊(例如,珠)。微流体通道网络(例如,在芯片上)可用于生成分区。替代机制也可用于个体生物颗粒的划分,包括多孔膜,通过多孔膜,细胞的水性混合物被挤压成非水性流体。
分区可以在流体流中流动。所述分区可包括例如具有围绕内部流体中心或核心的外部屏障的微泡。在某些情况下,分区可包括多孔基质,其能够在其基质内夹带和/或保持物质。所述分区可以是第二相内第一相的液滴,其中所述第一相和第二相是不混溶的。例如,分区可以是非水性连续相(例如油相)内的水性流体液滴。在另一实例中,该分区可为水相中非水性流体的液滴。在一些示例中,分区可以在油包水乳液或水包油乳液中提供。各种不同的容器在例如美国专利申请公开号2014/0155295中描述,其全部内容通过引用纳入本文。例如,在美国专利申请公开号2010/0105112中描述了用于在非水或油连续相中产生稳定液滴的乳液系统,其全部内容通过引用纳入本文。
对于乳液中的液滴,可通过例如将水性流体中的颗粒流动流引入非水性流体的流动流,使得液滴在两个流的接合点处产生来实现将个体颗粒分配到离散分区。可以调整流体性质(例如,流体流速、流体粘度等)、颗粒性质(例如,体积分数、颗粒大小、颗粒浓度等)、微流体结构(例如,通道几何形状等)和其他参数,以控制所得分区的占用率(例如,每个分区的分析物数量,每个分区的珠数等)。例如,可以通过以分析物的特定浓度和/或流速提供水性流来控制分区占用率。
为了生成个体分析物分区,可以选择不混溶流体的相对流速,使得平均而言,分区每个分区可以包含少于一个分析物,以确保被占用的分区主要是单独占用的。在某些情况下,多个分区中的分区最多可包含一个分析物。在一些实施方式中,可以选择或调整各种参数(例如,流体性质、颗粒性质、微流体架构等),使得大多数分区被占用,例如,仅有小百分比的未占用分区。可以控制流和通道架构以确保给定数量的单占用分区、小于某一水平的未占用分区和/或小于某一水平的多占用分区。
本文所述的通道段可以耦合到各种不同的流体源或接收部件中的任何一个,包括储器、管道、歧管或其他系统的流体部件。如将理解的,微流体通道结构可以具有各种几何形状。例如,微流体通道结构可以具有一个或多个通道接合点。作为另一实例,微流体通道结构可具有2、3、4或5个通道段,每个通道段携带在通道接合点相遇的颗粒。流体可以通过一个或多个流体流动单元被引导沿着一个或多个通道或储器流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。流体也可以通过施加的压差、离心力、电动泵、真空、毛细管和/或重力流来控制。
分区可以包括一个或多个独特标识符,例如条形码。条形码可以是在先前、之后或同时传送到容纳被分隔或被划分的生物颗粒的分区。例如,条形码可以在液滴生成之前、之后或同时注入液滴。将条形码递送到特定分区使稍后将个体生物颗粒的特性归因于特定分区。条形码可以例如在核酸分子(例如寡核苷酸)上通过任何合适的机制递送到分区。条形码核酸分子可以通过微胶囊递送到分区。在一些情况中,微胶囊可包括珠。
在一些实施方式中,条形码核酸分子最初可与微胶囊结合,然后从微胶囊释放。条形码核酸分子的释放可以是被动的(例如,通过扩散出微胶囊)。另外或可选择地,可在施加使条码化核酸分子离解或从微胶囊释放的刺激时从微胶囊释放。这种刺激可以破坏微胶囊,这种相互作用使条码化核酸分子与微胶囊或在微胶囊内耦合,或两者。这种刺激可以包括,例如,热刺激、光刺激、化学刺激(例如,pH值的改变或还原剂的使用)、机械刺激、辐射刺激、生物刺激(例如,酶)或其任何组合。
在一些实施方式中,一个或多个条形码(例如,空间条形码、UMI或其组合)可作为分析物的部分引入到分区中。如前所述,条形码可直接结合到分析物,或可形成捕获探针或分析物捕获剂的部分,所述捕获探针或分析物捕获剂与分析物杂交、偶联或以其他方式关联,使得当分析物被引入分区时,条形码也被引入。如上所述,图16示出了用于将个体分析物(例如,细胞)划分进入离散分区的微流体通道结构的示例。
图16示出了用于将个体分析物(例如,细胞)划分进入离散分区的微流体通道结构的示例。通道结构可以包括在通道接合点1605处连通的通道段1601、1602、1603和1604。在操作中,包括悬浮生物颗粒(或细胞)1607的第一水性流体1606可沿通道段1601输送至接合点1605,同时,与水性流体1606不混溶的第二流体1608从通道段1602和1603中的每一个输送到接合点1605以产生第一水性流体1606的离散液滴1609、1610,其流入通道段1604并从接合点1605流出。通道段1604可与出口储器流体耦合,其中可存储和/或收集离散液滴。产生的离散液滴可包括个体生物颗粒1607(例如液滴1609)。产生的离散液滴可包括超过一个的个体生物颗粒1607。离散液滴可不包含生物颗粒1607(例如液滴1610)。每个离散分区可保持其自身内容物(例如,个体生物颗粒1607)与其他分区的内容物的分离。
图17A示出了微流体通道结构1700的另一个示例,该微流体通道结构1700用于将珠递送到液滴。通道结构包括在通道接合点1706处连通的通道段1701、1702、1703、1704和1705。在操作期间,通道段1701可以将包括多个珠1708的水性流体1707沿着通道段1701输送到接合点1706中。多个珠1708可来自珠悬浮液。例如,通道段1701可以连接到包括珠1708的水性悬浮液的储器。通道段1702可将包括多个颗粒1709(例如,细胞)的水性流体1707沿着通道段1702输送到接合点1706中。在一些实施方式中,第一通道段1701或第二通道段1702中或两段中的水性流体1707可包括一种或多种试剂,如下所述。
与水性流体1707(例如,油)不混溶的第二流体1710可以从通道段1703和1704中的每一个递送到接合点1706。当来自通道段1701和1702中的每一个的水性流体1707和来自通道段1703和1704中的每一个的第二流体1710在通道接合点1706相遇时,水性流体1707可以在第二流体1710中被划分为离散液滴1711,并沿着通道段1705从接合点1706流出。通道段1705可以将离散的液滴输送到与通道段1705流体耦合的出口储器,在那里可以收集液滴。
作为替代方案,通道段1701和1702可以在接合点1706的上游的另一个接合点处相遇。在这样的接合点,珠和生物颗粒可以形成混合物,该混合物沿着另一通道被引导到接合点1706以产生液滴1711。所述混合物可以以交替方式提供所述珠和生物颗粒,使得例如,液滴包括单个珠和单个生物颗粒。
第二流体1710可包括油,例如氟化油,其包括用于稳定所得液滴的含氟表面活性剂,例如,用于抑制所得液滴1711的随后聚结。
本文所述的分区可包括小体积,例如,小于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更小。
在前面的讨论中,在不同流体流的接合点处形成了带有珠的液滴。在一些实施方式中,液滴可通过基于重力的划分方法形成。
图17B示出了具有用于受控划分的几何特征的微流体通道结构1750的另一示例的横截面图。通道结构1750可以包括通道段1752,该通道段1752在通道接合点1758(或交叉点)处与储器1754连通。在一些实例中,通道结构1750及其一个或多个组件可对应于通道结构1700及其一个或多个组件。
包含多个颗粒1756的水性流体1760可沿通道段1752输送至接合点1758以与储器1754中与水性流体1760不混溶的第二流体1762(例如,油等)相遇,从而产生流入储器1754的水性流体1760的液滴1764。在水性流体1760和第二流体1762相遇的接合点1758处,可基于诸如接合点处1758处的流体动力、两种流体1760和1762的相对流速、流体性质和通道结构1750的某些几何参数(例如,Δh等)等因素形成液滴。通过从接合点1758处的通道段1752连续注入水性流体1760,可在储器1754中收集多个液滴。
生成的离散液滴可包括多个颗粒1756中的一个或多个颗粒。如本文别处所述,颗粒可以是任何颗粒,例如珠、细胞珠、凝胶珠、生物颗粒、生物颗粒的大分子成分或其它颗粒。或者,生成的离散液滴可以不包括任何颗粒。
在一些实例中,水性流体1760可具有颗粒1756的基本均匀浓度或频率。如本文别处所述,颗粒1756(例如,珠)可从单独通道(图17中未示出)引入通道段1752。通道段1752中颗粒1756的频率可通过控制颗粒1756引入通道段1752的频率和/或通道段1752和单独通道中流体的相对流速来控制。在一些实例中,颗粒1756可以从多个不同的通道引入通道段1752,并且相应地控制频率。在某些情况下,可以通过分开的通道引入不同的颗粒。例如,第一分离通道可以引入珠,第二分离通道可以将生物颗粒引入通道段1752。引入珠的第一分离通道可以在引入生物颗粒的第二分离通道的上游或下游。
在一些实例中,第二流体1762可不经受和/或不导向任何流入或流出储器1754的流。例如,第二流体1762可在储器1754中基本静止。在一些实例中,第二流体1762可在储器1754内的流动,但不流入或流出储器1754,例如通过向储器1754施加压力和/或受接合点1758处水性流体1760的流入的影响。或者,第二流体1762可经受和/或被引导流入或流出储器1754。例如,储器1754可以是将第二流体1762从上游引导到下游、输送所生成液滴的通道。
在接合点1758处或附近的通道结构1750可具有某些几何特征,其至少部分地确定由通道结构1750形成的液滴的尺寸和/或形状。通道段1752可以具有第一横截面高度h1,并且储器1754可以具有第二横截面高度h2。第一横截面高度h1和第二横截面高度h2可能不同,因此在接合点1758处存在Δh的高度差。第二横截面高度h2可能大于第一横截面高度h1。在某些情况下,储器可能随后在横截面高度上逐渐增加,例如,储器距离接合点1758越远时。在某些情况下,储器的横截面高度可能会随着接合点1758处或附近的扩张角β而增加。高度差Δh和/或扩张角β可使舌片(在接合点1758处离开通道段1752和在液滴形成之前进入储器1754的水性流体1760的部分)深度增加,并有助于中间形成液滴的曲率减小。例如,液滴尺寸可随高度差的增大和/或扩张角的增大而减小。
高度差Δh可至少约为1μm。或者,高度差可至少约为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500μm或更大。或者,高度差可以最多约为500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1μm或更小。在一些实例中,扩张角β可在约0.5°至约4°范围内、约0.1°至约10°范围内或约0°至约90°范围内。例如,扩张角可至少约为0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更大。在一些实例中,扩张角最多可为约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。
在一些实例中,进入接合点1758的水性流体1760的流速可在约0.04微升(μL)/分钟(min)与约40μL/分钟之间。在一些实例中,进入接合点1758的水性流体1760的流速可在约0.01微升(μL)/分钟(min)与约100μL/分钟之间。或者,进入接合点1758的水性流体1760的流速可小于约0.01μL/min。或者,进入接合点1758的水性流体1760的流速可大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min,95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更高。在较低流速(例如约小于或等于10微升/分钟的流速)下,液滴半径可不依赖于进入接合点1758的水性流体1760的流速。第二流体1762可在储器1754中静止或基本静止。或者,第二流体1762可以流动,例如以针对水性流体1760描述的上述流速流动。
虽然图17B示出了高度差Δh在接合点1758处是陡变的(例如,阶跃增加),但是高度差可以逐渐增加(例如,从约0μm到最大高度差)。或者,高度差可以从最大高度差逐渐减小(例如,锥度)。本文所使用的高度差的逐渐增加或减少可指高度差的连续增量增加或减少,其中高度剖面的任何一个差分段与高度剖面的紧邻差分段之间的角度大于90°。例如,在接合点1758处,通道底壁和储器底壁可以以大于90°的角度相交。或者或者另外,所述通道的顶壁(例如,顶板)和所述储器的顶壁(例如,顶板)可以大于90°的角度相交。逐渐增加或减少可以是线性或非线性的(例如,指数、正弦等)。或者或另外,高度差可以线性或非线性地可变地增大和/或减小。虽然图17B将扩张的储器横截面高度图示为线性(例如,恒定扩张角β),但横截面高度可以非线性扩张。例如,储器可至少部分地由具有可变扩张角的穹顶状(例如半球形)形状限定。横截面高度可以任意形状扩张。
如上所述,可以将各种不同的珠纳入分区中。在一些实施方式中,例如,可以将非条码化珠纳入分区中。例如,在纳入分区中的生物颗粒(例如,细胞)携带一个或多个条形码(例如,空间条形码、UMI及其组合)的情况下,珠可以是非条码化珠。
在一些实施方式中,携带条形码的珠可以纳入分区中。例如,核酸分子(例如寡核苷酸)可通过可释放连接(例如二硫键接头)耦合到珠。同一珠可与一个或多个其它核酸分子耦合(例如,通过可释放连接)。核酸分子可以是或包括条形码。如本文别处所述,条形码的结构可以包括多个序列元件。
所述核酸分子可包括可用于后续加工的功能域。例如,功能域可包括测序仪特异性流动池附接序列(例如,用于
Figure BDA0003042696400001591
测序系统的P5序列)和测序引物序列(例如,用于
Figure BDA0003042696400001592
测序系统的R1引物)中的一个或多个。核酸分子可包括用于对样品(例如DNA、RNA、蛋白质等)进行条码化的条形码序列。在某些情况下,条形码序列可以是珠特异性的,使得条形码序列对于耦合到同一珠的所有核酸分子是共同的。可选地或另外,条形码序列可以是分区特异性的,使得条形码序列对于耦合到被划分到相同分区中的一个或多个珠的所有核酸分子是共同的。核酸分子可包括特定引发序列(priming sequence),例如mRNA特定引发序列(例如,多聚(T)序列)、靶向的引发序列和/或随机引发序列。核酸分子可包括锚定序列以确保特定引发序列在序列末端(例如,mRNA的)杂交。例如,锚定序列可包括核苷酸的随机短序列,例如1-聚体、2-聚体、3-聚体或更长的序列,其可确保多聚(T)片段更有可能在mRNA的多聚(A)尾的序列末端杂交。
核酸分子可包括独特分子识别序列(例如,独特分子标识符(UMI))。在一些实施方式中,独特分子识别序列可包括约5至约8个核苷酸。或者,独特分子识别序列可包括少于约5个或多于约8个核苷酸。独特分子识别序列可以是在耦合到单个珠的个体核酸分子之间变化的独特序列。
在一些实施方式中,独特分子识别序列可以是随机序列(例如,随机N-聚体序列)。例如,UMI可以提供捕获的起始mRNA分子的独特标识符,以便能够对原始表达RNA的数量进行定量。
一般来说,个体珠可以耦合到任意数量的个体核酸分子,例如,从一个到几十个到几十万个甚至数百万个个体核酸分子。个体核酸分子的相应条形码可以包括共同序列段或相对共同序列段以及耦合到同一珠的不同个体核酸分子之间的可变或独特序列段。
图17C描述了一个工作流,其中细胞与带有条形码的珠1770一起被划分进入液滴。参见图17A。液滴形成一个隔离的反应室,在其中细胞可被裂解1771,然后细胞内的目标分析物可根据先前描述的方法被捕获1772和扩增的1773、1774。在序列文库制备清理1775之后,根据本文所述的方法对材料进行测序和/或定量1776。
应当注意的是,虽然图17C中的示例工作流包括专门用于mRNA分析的步骤,但是可以对多种其他分析物(包括先前描述的任何分析物)实施类似工作流。
举例来说,在如图17C所示分析样品RNA的上下文中,释放的核酸分子之一(例如,来自珠)的多聚(T)片段可与mRNA分子的多聚(A)尾杂交。逆转录可产生mRNA的cDNA转录物,该转录物包括核酸分子的每个序列区段。如果核酸分子包含一个锚定序列,它将更有可能与mRNA的多聚(A)尾的序列末端杂交并起始逆转录。
在任何给定的分区内,个体mRNA分子的所有cDNA转录物都可以包含一个共同的条形码序列区段。然而,由给定分区内的不同mRNA分子产生的转录物可以在独特分子识别序列区段(例如,UMI区段)处变化。有益的是,即使在随后对给定分区的内容物进行任何扩增之后,不同UMI的数目也可以指示源自给定分区的mRNA的量。如上所述,转录物可被扩增、净化和测序以鉴定mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段进行测序。在描述多聚(T)引物序列的同时,其它靶向或随机引发序列也可用于引发逆转录反应。同样地,尽管描述为将条码化寡核苷酸释放到分区中,但在某些情况下,结合到珠的核酸分子可用于杂交并捕获珠固相上的mRNA,例如,以促进RNA与其他细胞内容物的分离。
在一些实施方式中,包括具有反应性或能够被活化以使其变得具有反应性的官能团的前体可与其它前体聚合以生成包括所述活化或可活化官能团的凝胶珠。然后可以使用官能团将其它物质(例如,二硫键接头、引物、其他寡核苷酸等)附接到凝胶珠上。例如,特征为羧酸(COOH)基团的一些前体可与其它前体共聚合以形成也包括COOH官能团的珠。在一些情况中,丙烯酸(包括游离COOH基团的物质)、丙烯酰胺和双(丙烯酰)胱胺可共聚合在一起以产生具有游离COOH基团的珠。珠的COOH基团可被活化(例如,经由1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(DMTMM))以使其具有反应性(例如,与胺官能团反应,其中EDC/NHS或DMTMM用于活化)。活化的COOH基团随后可与适当的物质(例如,包括胺官能团的物质,其中羧酸基团被活化以可与胺官能团反应)反应,其包括连接到珠的部分。
在一些实施方式中,可降解珠可引入到分区中,使得珠在分区内降解,并且当施加适当的刺激时,任何相关物质(例如,寡核苷酸)在液滴内释放。游离物质(例如,寡核苷酸、核酸分子)可以与分区中包含的其他试剂相互作用。例如,特征为胱胺并通过二硫键连接到条形码序列的聚丙烯酰胺珠可与油包水乳液液滴内的还原剂合并。在液滴内,还原剂可以破坏各种二硫键,导致珠降解,条形码序列释放到液滴的水性内部环境中。在另一实例中,加热碱性溶液中的具有珠结合条形码序列的液滴也可导致珠降解并将所附接的条形码序列释放到液滴的水性内部环境中。
任何适当数量的物质(例如,引物,条码化寡核苷酸)可与珠相关联,使得在从珠释放时,物质(例如,引物,例如,条码化寡核苷酸)以预定浓度存在于分区中。可选择该预定浓度以促进某些反应以在分区内产生测序文库(例如扩增)。在某些情况下,引物的预定浓度可通过产生带有核酸分子(例如寡核苷酸)的珠的过程来限制。
可降解珠可包括具有不稳定键的一种或多种物质,使得当珠/物质暴露于适当的刺激物时,键被破坏并且珠降解。不稳定键可以是化学键(例如,共价键、离子键)或者可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些实施方式中,用于生成珠的交联剂可包括不稳定键。当暴露在适当的条件下时,不稳定的键会断裂,珠会降解。例如,当将包含胱胺交联剂的聚丙烯酰胺凝胶珠暴露于还原剂时,半胱胺的二硫键可被破坏且珠降解。
与不降解的珠相比,当对珠施加适当的刺激时,可降解珠可用于更快速地从珠释放附接的物质(例如,核酸分子、条形码序列、引物等)。例如,对于结合到多孔珠的内表面的物质或在包封的物质的情况下,在珠降解时,该物质可对溶液中的其他物质具有更大的移动性和可及性。在一些实施方式中,物质还可经由可降解接头(例如,二硫键接头)附接到可降解珠。所述可降解接头可对与所述可降解珠相同的刺激作出响应,或者所述两种可降解物质可对不同的刺激作出响应。例如,条形码序列可以通过二硫键附接到包含胱胺的聚丙烯酰胺珠。当条码化珠暴露于还原剂时,珠降解并且在条形码序列和珠之间的二硫键和珠中胱胺的二硫键断裂时释放空间条形码序列。
如将从上述描述中了解到的,虽然被称为珠的降解,但在许多实施方式中,降解可指结合或夹带物质与珠的解离,伴随或不伴随物理珠本身的结构降解。例如,由于化学环境的变化,夹带的物质可以通过渗透压差从珠中释放出来。举例来说,由于渗透压差引起的珠孔径的改变通常可以在珠本身没有结构降解的情况下发生。在一些情况中,由于珠的渗透性溶胀导致的孔径增大可使珠内夹带的物质释放。在一些实施方式中,由于孔径收缩,珠的渗透性收缩可导致珠更好地保留夹带的物质。
许多化学触发物可用于触发分区内珠的降解。这些化学变化的实例可包括但不限于pH介导的珠内组分完整性的改变、通过交联键的裂解降解珠的组分以及珠的组分的解聚。
在一些实施方式中,珠可由包括可降解化学交联剂(例如BAC或胱胺)的材料形成。这种可降解交联剂的降解可以通过各种机制来实现。在一些实例中,珠可与可引起氧化、还原或其它化学变化的化学降解剂接触。例如,化学降解剂可以是还原剂,例如二硫苏糖醇(DTT)。还原剂的其他实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可降解形成珠的凝胶前体之间形成的二硫键,从而降解珠。
在某些实施方式中,溶液pH值的变化(例如pH值的增加)可触发珠的降解。在其他实施方式中,暴露于水溶液(例如水)可触发水解降解,从而引发珠的降解。在某些情况下,任何刺激组合都可能引发珠降解。例如,pH值的变化可以使化学试剂(例如DTT)成为有效的还原剂。
在应用热刺激时,也可以诱导珠释放其内容物。温度的变化会引起珠的各种变化。例如,热会使固体珠液化。热的变化会导致珠熔化,使珠的部分降解。在其他情况中,热可增加珠组分的内部压力,使得珠破裂或爆炸。热也可以作用于热敏聚合物作为材料来构建珠。
除了珠和分析物之外,形成的分区可以包括各种不同的试剂和物质。例如,当裂解试剂存在于分区内时,裂解试剂可促进分区内分析物的释放。裂解剂的实例包括生物活性试剂,例如用于裂解不同细胞类型的裂解酶,例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等,例如溶菌酶、无色肽酶、溶葡萄球菌素、Labiase酶、基他酶(kitalase)、溶细胞酶和多种其它市售的裂解酶,例如来自西格玛奥德里奇公司(密苏里州圣路易斯),以及其他市售的裂解酶。其他裂解剂可另外或可选地共划分以使分析物释放到分区中。例如,在某些情况下,基于表面活性剂的裂解溶液可用于裂解细胞,尽管这些溶液对于表面活性剂可干扰稳定乳液的基于乳液的系统可能不太理想。在一些实施方式中,裂解溶液可包括非离子表面活性剂,例如TritonX-100和Tween 20。在一些实施方式中,裂解溶液可包括离子表面活性剂,例如肌氨酰和十二烷基硫酸钠(SDS)。电穿孔、热的、声学的或机械的细胞分裂法也可用于某些实施方式中,例如,基于非乳液的分配,例如可作为液滴划分的补充或替代的分析物的封装法,其中在细胞破裂后,囊膜的任何孔径足够小以保留给定大小的核酸片段。
可与分区中的分析物共划分的其它物质的实例包括但不限于DNA酶和RNA酶失活剂或抑制剂(例如蛋白酶K)、螯合剂(例如EDTA)以及用于去除或以其它方式降低不同细胞裂解物组分对核酸后续加工的负活性或影响的其它试剂。其他试剂也可以被共划分,包括用于片段化DNA的核酸内切酶、DNA聚合酶和用于扩增核酸片段和将条形码分子标签附接到扩增的片段的dNTP。
其他试剂还可包括逆转录酶,包括具有末端转移酶活性的酶、引物和寡核苷酸,以及可用于模板转换的转换寡核苷酸(在本文中也称为“转换寡核苷酸”或“模板转换寡核苷酸”)。在一些实施方式中,模板转换可用于增加cDNA的长度。模板转换可用于将预先定义的核酸序列附加到cDNA。在模板转换的实例中,cDNA可由模板(例如,细胞mRNA)的逆转录产生,其中具有末端转移酶活性的逆转录酶可以非模板依赖的方式向cDNA添加其它的核苷酸(例如,多聚(C))。转换寡核苷酸可以包括与其它核苷酸互补的序列,例如多聚(G)。cDNA上的其它核苷酸(例如,多聚(C))可与转换寡核苷酸上的其它核苷酸(例如,多聚(G))杂交,由此转换寡核苷酸可被逆转录酶用作模板以进一步延伸cDNA。
模板转换寡核苷酸可以包括杂交区和模板区。杂交区可以包括能够与靶标杂交的任何序列。在一些情况中,杂交区包括一系列G碱基以与cDNA分子3′端的突出端C碱基互补。连续G碱基可包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或超过5个G碱基。模板序列可以包括待纳入cDNA的任何序列。在一些情况中,模板区包括至少1个(例如,至少2个、3个、4个、5个或更多)标签序列和/或功能序列。模板转换寡核苷酸可包括脱氧核糖核酸;核糖核酸;桥接核酸,修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2′-脱氧肌苷、超T(5-羟基丁基-2′-脱氧尿苷)、超G(8-氮杂-7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如,UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2′氟碱基(例如,氟C、氟U、氟A和氟G)或上述的任何组合。
在一些实施方式中,伴随分析物划分的珠可包括结合到珠的不同类型的寡核苷酸,其中不同类型的寡核苷酸能够结合到不同类型的分析物。例如,珠可以包括一个或多个第一寡核苷酸(例如,可以是捕获探针)和一个或多个第二寡核苷酸(例如,可以是捕获探针),第一寡核苷酸可以结合或杂交到第一类型的分析物,例如mRNA,第二寡核苷酸可以结合或杂交到第二类型的分析物,例如gDNA。分区还可以包括有助于从共划分的细胞释放核酸的裂解剂,并且还可以包括可以降解珠和/或破坏寡核苷酸和珠之间的共价键的剂(例如还原剂),从而将寡核苷酸释放到分区中。释放的条码化寡核苷酸(也可以条码化)可以与从细胞释放的mRNA以及从细胞释放的gDNA杂交。
由此由杂交形成的条码化构建体可包括第一类构建体,其包括对应于来自珠的原始条形码序列的序列和对应于来自细胞的转录物的序列,以及第二类构建体,其包括对应于来自珠的原始条形码序列的序列和对应于来自细胞的基因组DNA的序列。然后可以从分区中释放/移出条码化构建体,并且在一些实施方式中,进一步加工以添加任何其它序列。然后可以对得到的构建体进行测序,对测序数据进行加工,并将结果用于在空间上表征来自细胞的mRNA和gDNA
在另一实例中,分区包括珠,其包括具有第一条形码序列的第一类寡核苷酸(例如,第一捕获探针)、可与mRNA转录物的多聚(A)尾杂交的多聚(T)引发序列以及可独特地识别给定转录物的UMI条形码序列。该珠还包括具有第二条形码序列的第二类寡核苷酸(例如,第二捕获探针)、能够与结合到划分细胞表面的抗体的第三条码化寡核苷酸(例如,分析物捕获剂)特异性杂交的靶向引发序列。第三条码化寡核苷酸包括独特地识别抗体的UMI条形码序列(因此,它所结合的特定细胞表面特征)。
在该示例中,第一和第二条码化寡核苷酸包括相同的空间条形码序列(例如,第一和第二条形码序列相同),这使条码化核酸与分区的下游关联。然而,在一些实施方式中,第一和第二条码化序列不同。
分区还可以包括有助于从细胞释放核酸的裂解剂,并且还可以包括可以降解珠和/或破坏条码化寡核苷酸和珠之间的共价键的剂(例如还原剂),从而将它们释放到分区中。第一类释放的条码化寡核苷酸可与从细胞释放的mRNA杂交,第二类释放的条码化寡核苷酸可与第三类条码化寡核苷酸杂交,形成条码化构建体。
第一类条码化构建体包括与来自珠的第一条形码序列相对应的空间条形码序列和与来自第一类寡核苷酸的UMI条形码序列相对应的序列,其识别细胞转录物。第二类条码化构建体包括与来自第二类寡核苷酸的第二条形码序列相对应的空间条形码序列和与第三类寡核苷酸(例如,分析物捕获剂)相对应的UMI条形码序列,并用于识别细胞表面特征。然后可以从分区中释放/移出条形码构建体,并且在一些实施方式中,经进一步加工以添加任何其他序列。然后对得到的构建体进行测序,对测序数据进行处理,结果用于表征细胞的mRNA和细胞表面特征。
前面的讨论涉及两个带有寡核苷酸的珠的具体例子,用于分析一个分区内的两种不同分析物。更一般地,被划分的珠可以具有先前描述的任何结构,并且可以包括所描述的用于分析分区内两个或更多个(例如,三个或更多个、四个或更多个、五个或更多个、六个或更多个、八个或更多个、十个或更多个、12个或更多个、15个或更多个、20个或更多个、25个或更多个、30个或更多个,40个或更多个,50个或更多个)的不同类型的分析物的寡核苷酸的任何组合。用于同时分析分区内分析物的不同组合的具有不同类型寡核苷酸(例如,捕获探针)组合的珠的实例包括但不限于:(a)基因组DNA和细胞表面特征(例如,使用本文所述的分析物捕获剂);(b)mRNA和谱系追踪构建体;(c)mRNA和细胞甲基化状态;(d)mRNA和可及染色质(例如,ATAC-seq、DNA酶-seq和/或微球菌酶-seq);(e)mRNA和细胞表面或细胞内蛋白质和/或代谢物;(f)条码化分析物捕获剂(例如,本文所述的MHC多聚体)和免疫细胞受体(例如,T细胞受体)的V(D)J序列;和(g)mRNA和扰动剂(例如,CRISPR-crRNA/sgRNA、TALEN、锌指核酸酶和/或本文所述的反义寡核苷酸)。
另外,在一些实施方式中,如本文所述在分区或液滴内引入和加工的未聚集细胞或分解细胞可从分区移出,与空间阵列接触,并根据本文所述方法进行空间条码化。例如,如本文所述,未聚集细胞样品的单细胞可被划分进入分区或液滴。所述分区或液滴可包括使细胞透化、用细胞条形码对靶向的细胞分析物条码化并扩增条码化分析物的试剂。分区或液滴可与本文所述的任何空间阵列接触。在一些实施方式中,可以溶解分区,使得分区的内容物与空间阵列的捕获探针接触。然后,空间阵列的捕获探针可以从破裂的分区或液滴捕获目标分析物,并通过本文所述的空间工作流进行加工。
(g)捕获的分析物的分析
从阵列移出样品
在一些实施方式中,在将生物样品与包括捕获探针的基材接触之后,可任选地进行移出步骤以从基材移出全部或部分生物样品。在一些实施方式中,移出步骤包括生物样品细胞的酶促和/或化学降解。例如,移出步骤可包括用酶(例如,蛋白酶,例如,蛋白酶K)处理生物样品以从基材去除生物样品的至少部分。在一些实施方式中,移出步骤可包括组织的消融(例如,激光消融)。
在一些实施方式中,本文提供了用于从生物样品(例如,存在于生物样品中)空间检测分析物(例如,检测分析物的位置,例如,生物分析物)的方法,该方法包括:(a)任选地对基材上的生物样品进行染色和/或成像;(b)透化基材上的生物样品(例如,提供一种包含透化试剂的溶液);(c)将生物样品与包含多个捕获探针的阵列接触,其中多个中的捕获探针捕获生物分析物;和(d)分析捕获的生物分析物,从而在空间上检测所述生物分析物;其中所述生物样品全部或部分地从所述基材移出。
在一些实施方式中,不从基材移出生物样品。例如,在从基材释放捕获探针(例如,结合到分析物的捕获探针)之前,不从基材移出生物样品。在一些实施方式中,这种释放包括捕获探针从基材上的裂解(例如,通过裂解域)。在一些实施方式中,这种释放不包括从基材释放捕获探针(例如,可以制备结合到分析物的捕获探针的拷贝,并且可以例如通过变性从基材释放拷贝)。在一些实施方式中,生物样品从基材释放后,在分析结合到捕获探针的分析物之前,不从基材移出生物样品。在一些实施方式中,在从基材移出捕获探针期间和/或在从基材释放后分析结合到捕获探针的分析物期间,生物样品保持在基材上。在一些实施方式中,可以在不使生物样品经受细胞(例如透化的细胞)的酶促和/或化学降解或组织的消融(例如激光消融)的情况下进行对结合到来自基材的捕获探针的分析物的分析。
在一些实施方式中,至少部分生物样品不从基材被移出。例如,在从基材释放捕获探针(例如,与分析物结合的捕获探针)和/或分析从基材释放的与捕获探针结合的分析物之前,生物样品的部分可以保留在基材上。在一些实施方式中,在分析结合到来自基材的捕获探针的分析物之前,生物样品的至少部分不经受细胞(例如透化的细胞)的酶促和/或化学降解或组织的消融(例如激光消融)。
在一些实施方式中,本文提供了用于从生物样品(例如,存在于生物样品中)空间检测分析物(例如,检测分析物的位置,例如,生物分析物)的方法,其包括:(a)任选地对基材上的生物样品进行染色和/或成像;(b)透化基材上的生物样品(例如,提供一种包含透化试剂的溶液);(c)将生物样品与包含多个捕获探针的阵列接触,其中多个中的捕获探针捕获生物分析物;和(d)分析捕获的生物分析物,从而在空间上检测所述生物分析物;其中所述生物样品未从基材移出。
在一些实施方式中,本文提供用于从生物样品空间检测感兴趣的生物分析物的方法,其包括:(a)在基材上对生物样品进行染色和成像;(b)向基材上的生物样品提供包含透化试剂的溶液;(c)使生物样品接触基材上的阵列,其中所述阵列包括一个或多个捕获探针,从而使所述一个或多个捕获探针捕获感兴趣的生物分析物;和(d)分析所捕获的生物分析物,从而在空间上检测感兴趣的生物分析物;其中所述生物样品未从基材上移出。
在一些实施方式中,该方法还包括选择生物样品中的感兴趣区域以进行空间转录组分析。在一些实施方式中,一个或多个捕获探针中的一个或多个包括捕获域。在一些实施方式中,一个或多个捕获探针复数中的一个或多个包含独特分子标识符(UMI)。在一些实施方式中,一个或多个捕获探针中的一个或多个包括裂解域。在一些实施方式中,裂解域包含由尿嘧啶DNA糖基酶、无嘌呤/无嘧啶(AP)核酸内切酶(APE1)、U尿嘧啶特异性切除试剂(USER)和/或核酸内切酶VIII识别和裂解的序列。在一些实施方式中,一个或多个捕获探针不包含裂解域并且不从阵列裂解。
与从基材移出生物样品的类似方法(数据未显示)相比,一组进行不从基材移出生物样品的确定方法的实验产生了更高质量的测序数据、每个细胞更高的中位数基因和每个细胞更高的中位数UMI计数。
在一些实施方式中,捕获探针可以延伸。例如,延伸捕获探针可以包括从捕获的(杂交的)RNA生成cDNA。该过程涉及合成杂交核酸的互补链,例如,基于捕获的RNA模板(与捕获探针的捕获域杂交的RNA)生成cDNA。因此,在延伸捕获探针的初始步骤(例如cDNA生成)中,捕获的(杂交的)核酸(例如RNA)充当延伸的模板(例如逆转录步骤)。
在一些实施方式中,捕获探针使用逆转录延伸。例如,逆转录包括使用逆转录酶从RNA(例如信使RNA)合成cDNA(互补或拷贝DNA)。在一些实施方式中,当组织仍在原位时进行逆转录,产生分析物文库,其中分析物文库包括来自邻近捕获探针的空间条形码。在一些实施方式中,捕获探针使用一种或多种DNA聚合酶延伸。
在一些实施方式中,捕获探针的捕获域包括用于产生与捕获探针杂交的核酸互补链的引物,例如,用于DNA聚合酶和/或逆转录的引物。由延伸反应产生的核酸(例如DNA和/或cDNA)分子包含捕获探针的序列。捕获探针的延伸,例如DNA聚合酶和/或逆转录反应,可以使用各种合适的酶和方案来进行。
在一些实施方式中,产生全长DNA(例如eDNA)分子。在一些实施方式中,“全长”DNA分子是指整个捕获的核酸分子。然而,如果核酸(例如RNA)在组织样品中部分降解,则捕获的核酸分子将与组织样品中的初始RNA长度不同。在一些实施方式中,延伸的探针的3′端(例如第一链cDNA分子)被修饰。例如,接头或衔接子可以连接到延伸的探针的3′端。这可以通过使用单链连接酶如T4 RNA连接酶或CircleGaseTM(可从威斯康星州麦迪逊的艾匹森特生物技术公司(Epicentre Biotechnologies)购得)来实现。在一些实施方式中,模板转换寡核苷酸用于延伸cDNA以产生全长cDNA(或尽可能接近全长cDNA)。在一些实施方式中,第二链合成辅助探针(能够与延伸的捕获探针的3′端杂交的部分双链DNA分子)可以使用双链连接酶(例如T4 DNA连接酶)连接到延伸的探针的3′端,例如第一链cDNA分子。适用于连接步骤的其他酶的其他酶在本领域中是已知的,并且包括例如Tth DNA连接酶、Taq DNA连接酶、热球菌属(菌株9°N)DNA连接酶(9°NTM DNA连接酶,新英格兰生物实验室(New EnglandBiolabs))、AmpligaseTM(可从威斯康星州麦迪逊的艾匹森特生物技术公司(EpicentreBiotechnologies)获得)和SplintR(可从马萨诸塞州伊普斯维奇的新英格兰生物实验室获得)。在一些实施方式中,多核苷酸尾(例如多聚(A)尾)纳入延伸的探针分子的3′端。在一些实施方式中,使用末端转移酶活性酶纳入多核苷酸尾。
在一些实施方式中,处理双链延伸的捕获探针以在扩增和/或分析(例如序列分析)之前去除任何未延伸的捕获探针。这可以通过多种方法实现,例如,使用酶降解未延伸的探针,例如核酸外切酶或纯化柱。
在一些实施方式中,延伸的捕获探针被扩增以产生足以进行分析的量,例如通过DNA测序。在一些实施方式中,延伸的捕获探针的第一链(例如,DNA和/或cDNA分子)用作扩增反应(例如,聚合酶链反应)的模板。
在一些实施方式中,扩增反应使用包括亲和力基团的引物将亲和力基团纳入延伸的捕获探针(例如,RNA-cDNA杂交)上。在一些实施方式中,所述引物包括亲和基团,所述延伸的捕获探针包括亲和基团。亲和基团可以对应于前面描述的任何亲和基团。
在一些实施方式中,包括亲和基团的延伸的捕获探针可以耦合到亲和基团特异性的基材。在一些实施方式中,基材可包括抗体或抗体片段。在一些实施方式中,基材包括亲和素或链霉亲和素,并且亲和基团包括生物素。在一些实施方式中,基材包括麦芽糖,亲和基团包括麦芽糖结合蛋白。在一些实施方式中,基材包括麦芽糖结合蛋白,亲和基团包括麦芽糖。在一些实施方式中,只要延伸的探针的拷贝未固定到基材,则扩增延伸的捕获探针可以起到从基材表面释放延伸的探针的作用。
在一些实施方式中,释放延伸的捕获探针或其互补物或扩增子。从基材的表面释放延伸的捕获探针或其互补物或扩增子的步骤可以通过多种方式实现。在一些实施方式中,通过核酸裂解和/或变性(例如通过加热使双链分子变性)从阵列中释放延伸的捕获探针或其互补物。
在一些实施方式中,通过物理手段从基材的表面(例如阵列)释放延伸的捕获探针或其互补物或扩增子。例如,如果延伸的捕获探针间接固定在阵列基材上,例如通过与表面探针杂交,则足以破坏延伸的捕获探针与表面探针之间的相互作用。破坏核酸分子间相互作用的方法包括变性双链核酸分子。释放DNA分子的一种简单方法(即剥离延伸的探针的阵列)是使用干扰双链分子氢键的溶液。在一些实施方式中,通过施加加热的水(例如至少85℃的水或缓冲液,例如至少90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃或99℃的水)来释放延伸的捕获探针。在一些实施方式中,添加包括盐、表面活性剂等可以进一步使核酸分子之间的相互作用不稳定的溶液以从基材释放延伸的捕获探针。
在一些实施方式中,延伸的捕获探针包括裂解域,延伸的捕获探针通过裂解从基材表面释放。例如,可通过本文所述的任何方法来裂解延伸的捕获探针的裂解域。在一些实施方式中,在扩增延伸的捕获探针的步骤之前,例如通过延伸的捕获探针中的裂解域的裂解,将延伸的捕获探针从基材的表面释放。
捕获探针可以任选地包括“裂解域”,其中捕获探针的一个或多个区段或区域(例如,空间条形码和/或UMI)可以可释放地、可裂解地或可逆地附接到特征或其它基材,使得空间条形码和/或UMI可以通过裂解捕获探针和特征之间的联接来释放或可释放,或者通过降解底层支持物来释放,从而使裂解的捕获探针的空间条形码和/或UMI被其他试剂触及或可触及,或者两者。
在一些实施方式中,捕获探针通过二硫键连接到特征。在一些实施方式中,捕获探针经由丙烯基团(例如,间隔子C3)连接到特征。可添加还原剂以打破各种二硫键,导致包括空间条形码序列的捕获探针的释放。在另一个例子中,加热也会导致附接的捕获探针降解和释放。在一些实施方式中,通过激光(例如,激光消融)进行加热,并且特定位置处的特征可以被降解。除了可热裂解键、二硫键、光敏键和紫外光敏感键之外,可耦合到捕获探针(即,空间条形码)的不稳定键的其他非限制性实例包括酯键(例如,可与酸、碱或羟胺裂解)、邻二醇键(例如,可通过高碘酸钠裂解)、Diels-Alder键(例如,可通过热裂解)、砜键(例如,可通过碱裂解)、硅基醚键(例如,可通过酸裂解)、糖苷键(例如,可通过淀粉酶裂解)、肽键(例如,可通过蛋白酶裂解)或磷酸二酯键(例如,可通过核酸酶裂解(例如,DNA酶))。
在一些实施方式中,裂解域包括由一个或多个能够裂解核酸分子,例如,能够破坏两个或更多个核苷酸之间的磷酸二酯键的酶识别的序列。键可以通过其他核酸分子靶向酶,如限制性酶(如限制性内切酶)进行裂解。例如,裂解域可以包括限制性内切酶(限制性酶)识别序列。限制性内切酶在被称为限制性位点的特定识别核苷酸序列上切开双链或单链DNA。在一些实施方式中,使用罕切限制性酶,即具有长识别位点(长度至少为8个碱基对)的酶,以减少在捕获探针中其他位置裂解的可能性。
在一些实施方式中,裂解域包括多聚(U)序列,其可由尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶内切酶VIII(商业上称为USERTM酶)的混合物裂解。在一些实施方式中,裂解域可以是单个U。在一些实施方式中,裂解域可以是可以用非碱性位点特异性内切酶(例如,内切酶IV或内切酶VIII)裂解的非碱性位点。一旦释放,可释放的捕获探针可用于反应。因此,例如,可以通过从特征释放捕获探针来激活可激活的捕获探针。
在一些实施方式中,捕获探针的裂解域是捕获探针内的核苷酸序列,其例如通过光或热等物理方式、化学或酶促被特异地裂解。裂解域在捕获探针内的位置将取决于捕获探针是否固定在基材上,使得其具有能够作为延伸引物的游离3′端(例如,通过其5′或3′端)。例如,如果捕获探针被其5′端固定,则裂解域将位于空间条形码和/或UMI的5′处,并且所述结构域的裂解导致捕获探针的部分(包括空间条形码和/或UMI)和空间条形码3′的序列,和任选地部分裂解域,从特征释放。或者,如果捕获探针被其3′端固定,则裂解域将位于捕获域(和空间条形码)3′处,并且所述域的裂解导致捕获探针的部分(包括空间条形码和空间条形码3′的序列)从特征释放。在一些实施方式中,裂解导致裂解结构域的部分移出。在一些实施方式中,裂解导致裂解结构域的完全移出,特别是当捕获探针通过其3′端固定时,因为裂解结构域的部分的存在可能会干扰捕获域和目标核酸的杂交和/或其随后的延伸。
在一些实施方式中,当捕获探针例如经由表面探针间接固定到基材时,裂解域包括一个或多个错配核苷酸,使得表面探针和捕获探针的互补部分不是100%互补(例如,错配碱基对的数目可以是一个、两个或三个碱基对)。例如,通过MutY和T7核酸内切酶I酶识别这种错配,其导致错配位置处的核酸分子的裂解。
在一些实施方式中,当捕获探针例如经由表面探针间接地固定到特征时,裂解域包括切口酶识别位点或序列。在这方面,切口酶只切割核酸双链体中的一条链。切口酶是一种仅能切割DNA双链体的单链的核酸内切酶。因此,裂解域可以包括靠近表面探针的5′端(和/或捕获探针的5′端)的切口酶识别位点,使得表面探针或捕获探针的裂解使表面探针和捕获探针之间的双链体失稳,从而从特征中释放捕获探针。
切口酶也可用于捕获探针直接固定到特征的一些实施方式中。例如,基材可与杂交到捕获探针的裂解域的核酸分子接触以提供或重组切口酶识别位点,例如裂解辅助探针。因此,与切口酶接触将导致裂解域的裂解,从而从特征中释放捕获探针。这种裂解辅助探针还可用于为其他裂解酶(例如限制性内切酶)提供或重组裂解识别位点。
有些切口酶通过结合和识别特定的核苷酸识别序列,只在DNA分子的特定位点引入单链切口。已经发现了许多天然切口酶,目前已经确定了至少四个切口酶的序列识别特性。切口酶在美国专利号6,867,028中描述,其在此通过引用整体纳入本文。一般来说,任何合适的切口酶都可用于结合到裂解域的互补切口酶识别位点。使用后,可以从分析中去除切口酶,或在释放捕获探针后使其失活,以防止捕获探针的不必要裂解。
在一些实施方式中,用于从特征中分离空间条形码的裂解域不存在于捕获探针中。例如,具有缺乏裂解域的捕获探针的基材可用于空间分析(例如,参见Macosko等,(2015)Cell 161,1202-1214所述的相应基材和探针,其全部内容通过引用纳入本文中)。
在一些实施方式中,与裂解域相对应的捕获探针区域可用于某些其它功能。例如,用于核酸延伸或扩增的其它区域可以包括在通常将定位裂解域的位置处。在这样的实施方式中,该区域可以补充功能域或者甚至作为其它功能域存在。在一些实施方式中,存在裂解域,但其用途是可选的。
在来自样品的分析物已根据上述与基于一般空间细胞的分析方法相关的任何方法与捕获探针、分析物捕获剂或其他条码化寡核苷酸序列杂交或以其他方式结合之后,杂交/结合产生的条码化构建体通过测序进行分析以鉴定分析物。
在一些实施方式中,如上文所述,通过与和细胞表面杂交、结合或关联或引入细胞的捕获探针或分析物捕获剂杂交直接对样品进行条码化,可对完整样品进行测序。或者,如上文所述,如果条码化样品已被分离成片段、细胞群或个体细胞,则可对个体片段、细胞群或细胞进行测序。如上所述,对于已通过珠划分进行条码化的分析物,可通过打破分区从分区中提取个体分析物(例如,细胞或细胞裂解后的细胞内容物),然后通过测序来分析以识别分析物。
多种不同的测序方法可用于分析条码化的分析物构建体。一般来说,测序的多核苷酸可以是例如核酸分子,例如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括其变体或衍生物(例如,单链DNA或DNA/RNA杂合体,以及具有核苷酸类似物的核酸分子)。
多核苷酸的测序可以通过各种商业系统进行。更一般地,可以使用核酸扩增、聚合酶链反应(PCR)(例如,数字PCR和液滴数字PCR(ddPCR)、定量PCR、实时PCR、多重PCR、基于PCR的单重方法、乳液PCR)和/或等温扩增来进行测序。
对遗传物质进行测序的方法的其他示例包括但不限于DNA杂交方法(例如,Southern印迹法)、限制性酶消化方法、Sanger测序方法、下一代测序方法(例如,单分子实时测序、纳米孔测序和Polony测序),连接法和微阵列法。可使用的测序方法的其他示例包括靶向测序、单分子实时测序、外显子测序、基于电子显微镜的测序、面板测序、晶体管介导测序、直接测序、随机鸟枪测序、Sanger双脱氧终止测序、全基因组测序,杂交测序、焦磷酸测序、毛细管电泳、凝胶电泳、双链体测序、循环测序、单碱基延伸测序、固相测序、高通量测序、大规模平行标记测序、低温共扩增PCR(COLD-PCR)、可逆染料终止子测序、双端测序、近期测序、核酸外切酶测序、连接测序、短读测序、单分子测序、合成测序、实时测序、反向终止子测序、纳米孔测序、454测序、Solexa基因组分析仪测序、SOLiDTM测序、MS-PET测序及其任何组合。
核酸分子(包括条码化核酸分子或其衍生物)的序列分析可以是直接的或间接的。因此,序列分析基材(可被视为经受序列分析步骤或过程的分子)可直接为条码化的核酸分子或其可为从其衍生的分子(例如,其互补物)。因此,例如,在测序反应的序列分析步骤中,测序模板可以是条码化的核酸分子,也可以是从其衍生的分子。例如,第一和/或第二链DNA分子可以直接进行序列分析(例如测序),即可以直接参与序列分析反应或过程(例如测序反应或测序过程,或者是被测序或以其他方式识别的分子)。或者,可在序列分析(例如,通过另一技术进行测序或鉴定)之前对条码化核酸分子进行第二链合成或扩增的步骤。因此,序列分析底物(例如模板)可以是扩增子或条码化核酸分子的第二链。
在一些实施方式中,双链分子的两条链可经序列分析(例如,测序)。在一些实施方式中,可以分析(例如测序)单链分子(例如条码化核酸分子)。为了进行单分子测序,可以在3′末端修饰核酸链。
大规模平行测序技术可用于核酸测序,如上所述。在一个实施方式中,大规模平行测序技术可基于可逆染料终止剂。例如,首先将DNA分子附接到例如玻璃或硅基材上的引物上,并进行扩增以形成局部克隆群体(桥式扩增)。添加四种类型的ddNTP,并冲走未结合的核苷酸。与焦磷酸测序不同,由于阻断基团(例如,ddNTP的糖部分上存在3′阻断基团),DNA一次仅延伸一个核苷酸。检测器获取荧光标记的核苷酸的图像,然后染料连同末端3′阻断基团从DNA中化学去除,作为后续循环的前体。可以重复此过程,直到获得所需的序列数据。
另一个例子是,大规模平行焦磷酸测序技术也可用于核酸测序。在焦磷酸测序中,核酸在油溶液中的水滴内扩增(乳液PCR),每个液滴包含单一的核酸模板,其附接在单一的涂有引物的珠上,然后形成克隆群体。测序系统包含许多皮升体积孔,每个孔包含一个珠和测序酶。焦磷酸测序使用荧光素酶产生光来检测添加到新生核酸中的个体核苷酸,并且组合数据用于产生序列读取结果。
作为焦磷酸测序的另一个示例应用,释放的PPi可通过ATP磺酰化酶立即转化为三磷酸腺苷(ATP)来检测,并且产生的ATP水平可通过荧光素酶产生的光子来检测,如Ronaghi等Anal.Biochem.242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi等,Science 281(5375),363(1998);以及美国专利号6,210,891,6,258,568和6,274,320所述,其全部内容通过引用纳入本文。
在一些实施方式中,通过检测在DNA聚合期间释放的氢离子来进行测序。含有待测序的模板DNA链的微孔可以充满单一类型的核苷酸。如果引入的核苷酸与前导模板核苷酸互补,则它被纳入生长的互补链。这会导致氢离子释放,从而触发超敏离子传感器,这表明发生了反应。若模板系列中存在均聚重复系列,单次循环中会纳入多个核苷酸。这导致对应数量的氢离子释放,和成比例的更高电子信号。
在一些实施方式中,可以原位进行测序。原位测序方法特别有用,例如,当样品表面上的分析物(例如,细胞表面分析物)或样品内的分析物(例如,细胞内分析物)已被条码化后,生物样品保持完整。原位测序通常涉及以连续的、模板依赖的方式将标记的核苷酸(例如,荧光标记的单核苷酸或二核苷酸)纳入或将标记的引物(例如,标记的随机六聚体)杂交到核酸模板上,使得可以确定纳入的核苷酸或标记的引物延伸产物的核苷酸序列的相同性(即,核苷酸序列),从而测定相应模板核酸的核苷酸序列。例如,在Mitra等,(2003)Anal.Biochem.320,55-65,和Lee等,(2014)Science,343(6177),1360-1363中描述了原位测序的各个方面,通过引用将其全部内容纳入本文。
此外,PCT专利申请公开号WO2014/163886、WO2018/045181、WO2018/045186和美国专利号10138509和10179932中描述了用于进行原位测序的方法和系统的示例,其全部内容通过引用纳入本文中。用于原位测序的示例技术包括但不限于STARmap(例如在Wang等,(2018)Science,361(6499)5691中描述)、MERFISH(例如在Moffitt,(2016)Methods inEnzymology,572,1-49中描述)和FISSEQ(例如在美国专利申请公开号2019/0032121中描述)。上述各参考文献的全部内容通过引用纳入本文。
对于已通过划分进行条码化的分析物,条码化核酸分子或其衍生物(例如,已添加一个或多个功能序列的条码化核酸分子,或已从中移出一个或多个特征的条码化核酸分子)可汇集并一起处理以用于后续分析,例如在高分辨率测序仪上测序。可以使用条形码序列实现汇集处理。例如,给定分区的条码化核酸分子可以具有相同的条形码,这与其他空间分区的条形码不同。或者,可以分开处理不同分区的条码化核酸分子以进行后续分析(例如,测序)。
在一些实施方式中,在捕获探针不包含空间条形码的情况下,可以在捕获探针从生物样品捕获分析物之后和分析分析物之前添加空间条形码。当在捕获分析物之后添加空间条形码时,可在扩增分析物之后添加条形码(例如,RNA的逆转录和聚合酶扩增)。在一些实施方式中,分析物分析使用一个或多个捕获的分析物的直接测序,例如杂交的RNA的直接测序。在一些实施方式中,在杂交的RNA的逆转录之后进行直接测序。在一些实施方式中,在杂交的RNA的逆转录的扩增之后进行直接测序。
在一些实施方式中,通过合成测序(SBS)进行捕获的RNA的直接测序。在一些实施方式中,测序引物与捕获探针的一个或多个域(例如,功能域)中的序列互补。在此类实施方式中,通过合成进行测序可包括逆转录和/或扩增以产生模板序列(例如,功能域),其中引物序列可与模板序列结合。
SBS可涉及将适当的引物(有时称为测序引物)与待测序的核酸模板杂交、延伸引物以及检测用于延伸引物的核苷酸。优选地,在进一步的核苷酸添加到生长的核酸链之前检测用于延伸引物的核酸,从而能进行逐碱基原位核酸测序。通过在引物延伸反应中包括一个或多个标记的核苷酸,有助于检测纳入的核苷酸。为了使适当的测序引物与待测序的核酸模板杂交,核酸模板通常应为单链形式。如果构成核酸点的核酸模板以双链形式存在,则可使用本领域公知的方法(例如通过变性,裂解等)对其进行处理以提供单链核酸模板。与核酸模板杂交并用于引物延伸的测序引物优选短寡核苷酸,例如长度为15到25个核苷酸。测序引物可以以溶液或固定形式提供。一旦通过使核酸模板和测序引物经受适当条件将测序引物退火到待测序的核酸模板,则进行引物延伸,例如使用核酸聚合酶和核苷酸供应,其中至少一些以标记形式提供,以及如果提供合适的核苷酸,则适于引物延伸的条件。
优选地,在每个引物延伸步骤之后,包括洗涤步骤以去除可干扰后续步骤的未纳入的核苷酸。一旦进行了引物延伸步骤,就对核酸群体(colony)进行监测,以确定标记的核苷酸是否已被纳入延伸的引物中。然后可以重复引物延伸步骤以确定下一个和随后纳入延伸的引物中的核苷酸。如果所确定的序列未知,应用于给定群体的核苷酸通常以选定的顺序应用,然后在整个分析过程中重复,例如dATP、dTTP、dCTP、dGTP。
可使用的SBS技术描述于例如,但不限于美国专利申请公开号2007/0166705,美国专利申请公开号2006/0188901,美国专利号7,057,026,美国专利申请公开号2006/0240439,美国专利申请公开号2006/0281109,PCT专利申请公开号WO 05/065814,美国专利申请公开号2005/0100900,PCT专利申请公开号WO 06/064199,PCT专利申请公开号WO07/010,251,美国专利申请公开号2012/0270305,美国专利申请公开号2013/0260372,和美国专利申请公开号2013/0079232中的技术,其全部内容通过引用纳入本文。
在一些实施方式中,捕获的RNA的直接测序通过顺序荧光杂交(例如,通过杂交进行测序)来进行。在一些实施方式中,原位进行RNA与捕获探针杂交的杂交反应。在一些实施方式中,捕获的RNA在与测序探针杂交之前不被扩增。在一些实施方式中,RNA在与测序探针杂交之前被扩增(例如,逆转录到cDNA和cDNA的扩增)。在一些实施方式中,使用单分子杂交链式反应进行扩增。在一些实施方式中,使用滚动链扩增来进行扩增。
顺序荧光杂交可包括探针的顺序杂交,包括简并引物序列和可检测的标记物。简并引物序列是能够与独立于所述核酸片段序列的任何核酸片段杂交的短寡核苷酸序列。例如,这种方法可以包括以下步骤:(a)提供包括四个探针的混合物,每个探针在5′端包括A、C、G或T,进一步包括长度为5到11个核苷酸的简并核苷酸序列,并且进一步包括对于在5′端有A、C、G或T的探针而言不同的功能域(例如,荧光分子);(b)将步骤(a)的探针与目标多核苷酸序列相关联,其序列需求将通过该方法确定;(c)测量四个功能域的活性并记录活性的相对空间位置;(d)从目标多核苷酸序列移出来自步骤(a)-(b)的试剂;并且将步骤(a)-(d)重复n个循环,直到确定每个珠的空间域的核苷酸序列,经过修改,步骤(a)中使用的寡核苷酸与靶多核苷酸序列的部分以及所述序列的部分侧接的位置1到n互补。由于条形码序列不同,在一些实施方式中,这些其它侧接序列是简并序列。来自阵列上每个点的循环1到n的荧光信号可用于确定目标多核苷酸序列的序列。
在一些实施方式中,使用顺序荧光杂交对捕获的RNA进行体外直接测序。在一些实施方式中,捕获的RNA在与测序探针杂交之前被扩增(例如,逆转录到cDNA和cDNA的扩增)。在一些实施方式中,含有捕获的RNA的捕获探针暴露于靶向RNA编码区的测序探针。在一些实施方式中,一个或多个测序探针靶向每个编码区域。在一些实施方式中,测序探针被设计成与测序试剂(例如,染料标记的读出寡核苷酸)杂交。然后,测序探针可以与测序试剂杂交。在一些实施方式中,对测序反应的输出进行成像。在一些实施方式中,从测序反应的图像解析cDNA的特定序列。在一些实施方式中,在与测序探针杂交之前进行对捕获的RNA的逆转录。在一些实施方式中,测序探针被设计成靶向RNA编码区的互补序列(例如,靶向cDNA)。
在一些实施方式中,使用基于纳米孔的方法直接对捕获的RNA进行测序。在一些实施方式中,使用纳米孔直接RNA测序进行直接测序,其中捕获的RNA通过纳米孔易位。纳米孔电流可以被记录并转换成碱基序列。在一些实施方式中,捕获的RNA在纳米孔测序期间保持附接到基材。在一些实施方式中,捕获的RNA在纳米孔测序之前从基材释放。在一些实施方式中,其中感兴趣的分析物是蛋白质,可使用基于纳米孔的方法进行蛋白质的直接测序。可使用的基于纳米孔的测序方法的实例描述于Deamer等,Trends Biotechnol.18,147-151(2000);Deamer等,Acc.Chem.Res.35:817-825(2002);Li等,Nat.Mater.2:611-615(2003);Soni等,Clin.Chem.53,1996-2001(2007);Healy等,Nanomed.2,459-481(2007);Cockroft等,J.Am.Chem.Soc.130,818-820(2008);以及美国专利号7,001,792。上述各参考文献的全部内容通过引用纳入本文。
在一些实施方式中,使用通过连接的单分子测序来进行捕获的RNA的直接测序。这种技术利用DNA连接酶纳入寡核苷酸并鉴定这种寡核苷酸的纳入。寡核苷酸通常具有与寡核苷酸杂交的序列中的特定核苷酸的相同性相关的不同标记物。例如,在Shendure等,Science(2005),309:1728-1732和美国专利号5599675、5750341、6969488、6172218和6306597中描述了连接测序所涉及的方面和特征,其全部内容通过引用纳入本文中。
在一些实施方式中,核酸杂交可用于测序。这些方法利用与条形码序列的至少部分互补的标记的核酸解码器探针。多重解码可以使用具有可分辨标签的许多不同探针的集来进行。例如在美国专利号8,460,865,和Gunderson等,Genome Research 14:870-877(2004)中描述了核酸杂交测序的非限制性实例,其全部内容通过引用纳入本文。
在一些实施方式中,商用高通量数字测序技术可用于分析条形码序列,其中DNA模板不是一次测序一个,而是在批量过程中测序,并且许多序列优选地以平行方式读出,或者也可以使用其自身可以平行化的超高通量串行过程。此类技术的实例包括
Figure BDA0003042696400001811
测序(例如,基于流动池的测序技术)、使用修饰核苷酸的合成测序(例如在由加利福尼亚州圣迭戈的Illumina公司的TruSeqTM和HiSeqTM技术市售),由马萨诸塞州剑桥的Helicos生命科学集团提供的HeliScopeTM和加利福尼亚州门罗公园的太平洋生物科学公司提供的PacBioRS)、离子检测技术测序(加利福尼亚州南旧金山的离子激流公司(ion Torrent))和DNA纳米球测序(加利福尼亚州山景城的完全基因组公司(Complete Genomics,Inc.))。
在一些实施方式中,在将核苷酸纳入延伸产物时释放的质子的检测可用于本文所述的方法中。例如,美国专利申请公开号2009/0026082、2009/0127589、2010/0137143和2010/0282617中描述的测序方法和系统可用于直接对条形码进行测序。
在一些实施方式中,可在测序期间使用对DNA聚合酶活性的实时监测。例如,如Levene等,Science(2003),299,682-686,Lundquist等,Opt.Lett.(2008),33,1026-1028,和Korlach等,Proc.Natl.Acad.Sci.USA(2008),105,1176-1181中所述,可通过荧光共振能量转移(FRET)检测核苷酸纳入。上述各参考文献的全部内容通过引用纳入本文。
在一些实施方式中,本文所述方法可用于随时间(例如,在用试剂处理之前或之后或不同分化阶段)评估细胞或生物样品中的分析物水平和/或表达。在一些实例中,本文所述方法可在不同时间点(例如,用试剂治疗之前或之后、不同分化阶段、不同疾病进展阶段、不同年龄的对象,或在对某种试剂产生抗药性之前或之后)对从对象获得的多个类似生物样品或细胞进行。
(h)空间分辨分析物信息
在一些实施方式中,查找表(LUT)可用于将特征的一个特性与另一个特性相关联。这些性质包括,例如,位置、条形码(例如,核酸条形码分子)、空间条形码、光学标记物、分子标签和其他性质。
在一些实施方式中,查找表可以将多个核酸条形码分子与特征相关联。在一些实施方式中,特征的光学标记物可使将特征与生物颗粒(例如,细胞或细胞核)相关联。特征与生物颗粒的关联可进一步使将生物颗粒的核酸分子的核酸序列与生物颗粒的一个或多个物理性质(例如,细胞的类型或细胞的位置)相关联。例如,基于条形码和光学标记物之间的关系,光学标记物可用于确定特征的位置,从而将特征的位置与特征的条形码序列相关联。后续分析(如测序)可将条形码序列与样品中的分析物相关联。因此,基于位置和条形码序列之间的关系,可以确定生物分析物的位置(例如,在特定类型的细胞中,在生物样品的特定位置的细胞中)。
在一些实施方式中,特征可以具有附接在其上的多个核酸条形码分子。多个核酸条形码分子可以包括条形码序列。附接至给定特征的多个核酸分子可以具有相同的条形码序列,或者具有两个或更多个不同的条形码序列。可以使用不同的条形码序列来提高空间定位精度。
如上所述,可以进一步处理从样品获得的分析物,例如RNA、DNA、肽、脂质和蛋白质。特别地,来自样品的个体细胞的内容物可以提供独特空间条形码序列,使得在对分析物进行表征时,可以将分析物归因于来自同一细胞。更一般而言,空间条形码可用于将分析物归因于样品中相应的空间位置。例如,多重空间条形码的分层空间定位可用于识别和表征样品特定空间区域上的分析物。在一些实施方式中,空间区域对应于先前识别的特定感兴趣空间区域,例如,先前识别的细胞结构的特定结构。在一些实施方式中,空间区域对应于肉眼看不到的小结构或细胞群。在一些实施方式中,独特分子标识符可用于在单细胞水平上识别和表征分析物。
所述分析物可以包括核酸分子,所述核酸分子可以用核酸条形码分子的条形码序列进行条码化。在一些实施方式中,可对条码化的分析物进行测序以获得核酸序列。在一些实施方式中,核酸序列可包括与样品相关联的遗传信息。核酸序列可包括条形码序列或其互补物。核酸序列的条形码序列或其互补物可以电子方式与分析物的性质(例如,颜色和/或强度)相关联,使用LUT以识别阵列中的相关特征。
在一些实施方式中,存在于生物样品中的一个或多个分析物的二维或三维空间概况分析可使用邻近捕获反应来进行,该反应是检测在空间上彼此接近和/或相互作用的两个分析物的反应。例如,邻近捕获反应可用于检测在空间上彼此接近的DNA序列,例如,DNA序列可在同一染色体内,但相隔约700bp或更小。作为另一实例,邻近捕获反应可用于检测蛋白质关联,例如,相互作用的两种蛋白质。可在原位进行邻近捕获反应以检测在空间上彼此接近和/或在细胞内彼此相互作用的两种分析物。邻近捕获反应的非限制性实例包括DNA纳米镜、DNA显微镜和染色体构象捕获方法。染色体构象捕获(3C)和衍生实验程序可用于估计不同基因组元件之间的空间接近性。染色质捕获方法的非限制性示例包括染色体构象捕获(3-C)、芯片构象捕获(4-C)、5-C、ChIA-PET、Hi-C、靶向染色质捕获(T2C)。例如,在Miele等,Methods Mol Biol.(2009),464,Simonis等,Nat.Genet.(2006),38(11):1348-54,Raab等,Embo.J.(2012),31(2):330-350,和Eagen等,Trends Biochem.Sci.(2018)43(6):469-478中描述了此类方法的实例,其全部内容通过引用纳入本文。
在一些实施方式中,邻近捕获反应包括邻近连接。在一些实施方式中,邻近连接可包括使用具有可参与连接、复制和序列解码反应的附接的DNA链的抗体。例如,邻近连接反应可包括附接到抗体对上的寡核苷酸,如果抗体已接近每一寡核苷酸(例如通过结合相同的靶蛋白(复合物))则可通过连接将其接合,并且形成的DNA连接产物随后用于模板PCR扩增,如
Figure BDA0003042696400001841
等,Methods.(2008),45(3):227-32所述,其全部内容通过引用纳入本文。在一些实施方式中,邻近连接可包括染色体构象捕获方法。
在一些实施方式中,对彼此之间约400nm距离(例如,约300nm、约200nm、约150nm、约100nm、约50nm、约25nm、约10nm或约5nm)内的分析物进行接近捕获反应。一般来说,邻近捕获反应可以是可逆的或不可逆的。
III.一般基于空间细胞的分析方法
(a)条码化生物样品
在一些实施方式中,本文提供用于将具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接和/或引入生物样品(例如,生物样品中的细胞)以用于空间分析的方法和材料。在一些实施方式中,将具有多个条形码(例如,多个空间条形码)的多个分子(例如,多个核酸分子)引入生物样品(例如,引入生物样品中的多个细胞)以用于空间分析。
图18是描绘利用分析物结合部分与细胞表面的共价偶联或与细胞膜元件的非共价相互作用的细胞标记(cell tagging)的示意图。图18列出共价分析物结合部分/细胞表面相互作用的非穷举实例,包括蛋白质靶向、使用NHS化学的胺接合、三聚氯氰、经由马来酰亚胺加成的硫醇接合,以及经由点击化学靶向在细胞表面上表达的糖蛋白/糖脂。与细胞膜元件的非共价相互作用的非穷举实例包括脂质修饰的寡核苷酸、细胞膜的生物相容性锚定物(油烯基-PEG-NHS)、脂质修饰的阳性中性聚合物和膜蛋白抗体。细胞标签可与分析物捕获剂和可裂解或不可裂解的空间条形码捕获探针结合使用,用于空间和多重化应用。
在一些实施方式中,将具有多个条形码(例如,多个空间条形码)的多个分子(例如,多个核酸分子)引入生物样品(例如,引入生物样品中的多个细胞)以用于空间分析,其中所述多个分子以阵列形式引入所述生物样品。在一些实施方式中,具有多个条形码的多个分子(例如,多个核酸分子)以本文所述的各种阵列格式中的任何一种提供在基材(例如,本文所述的各种基材中的任何一种)上,所述生物样品与所述基材上的分子接触,从而将所述分子引入所述生物样品中。在一些实施方式中,引入到生物样品的分子可裂解地附接到基材上,并且当与生物样品接触时从基材上裂解并释放到生物样品。在一些实施方式中,引入到生物样品中的分子在裂解之前共价附接到基材。在一些实施方式中,引入到生物样品的分子非共价附接到基材上(例如,通过杂交),并且当与生物样品接触时从基材上释放到生物样品。
在一些实施方式中,具有多个条形码(例如,多个空间条形码)的多个分子(例如,多个核酸分子)从基材迁移或转移到生物样品的细胞。在一些实施方式中,将多个分子从基材迁移到生物样品的细胞包括向基材和/或生物样品施加力(例如,机械力、离心力或电泳力),以促进多个分子从基材迁移到生物样品。
在本文所描述的任何空间分析方法的一些实施方式中,物理力用于促进将具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接或引入生物样品(例如,生物样品中存在的细胞)中。如本文所用,“物理力”指使用物理力来抵消细胞膜屏障以促进分子的细胞内递送。可根据本文所描述的材料和方法使用的物理力仪器和方法的实例包括使用针、弹道DNA(ballistic DNA)、电穿孔、声穿孔、光穿孔、磁感染、水穿孔及其组合。
在一些实施方式中,可使用细胞标记剂对生物样品(例如,生物样品中的细胞)进行标记,其中细胞标记剂有助于将具有条形码(例如,空间条形码)的分子(例如,核酸分子)引入生物样品(例如,引入生物样品中的细胞)。如本文所用,术语“细胞标记剂”是指具有能够附接到细胞表面(例如,由此将条形码附着到细胞表面)和/或透化和穿过细胞膜(例如,由此将条形码引入细胞内部)的部分的分子。在一些实施方式中,细胞标记剂包括条形码(例如,空间条形码)。条码化细胞标记剂的条形码可以是本文所述的各种条形码中的任何一种。在一些实施方式中,条码化细胞标记剂的条形码是空间条形码。在一些实施方式中,细胞标记剂包含包含条形码(例如,空间条形码)的核酸分子。在一些实施方式中,条码化细胞标记剂的条形码识别相关分子,其中每个空间条形码与特定分子相关。在一些实施方式中,将一个或多个分子施加到样品上。在一些实施方式中,包括条形码的核酸分子共价附接到细胞标记剂。在一些实施方式中,包括条形码的核酸分子非共价附接到细胞标记剂。非共价附接的非限制性示例包括将包括条形码的核酸分子与细胞标记剂上的核酸分子杂交(细胞标记剂上的核酸分子可共价或非共价结合到细胞标记剂)。在一些实施方式中,附接到包括条形码(例如,空间条形码)的细胞标记剂的核酸分子还包括一个或多个其它域。这种其它域包括但不限于PCR柄、测序引发位点、用于与另一核酸分子杂交的结构域及其组合。
在一些实施方式中,细胞标记剂附接到细胞表面。当细胞标记剂包括条形码(例如,包括空间条形码的核酸)时,条形码也附接到细胞的表面。在本文所述的任何空间分析方法的一些实施方式中,细胞标记剂共价附接到细胞表面以促进空间概况分析试剂的引入。在本文所述的任何空间分析方法的一些实施方式中,细胞标记剂非共价附接到细胞表面以促进空间概况分析试剂的引入。
在一些实施方式中,一旦用细胞标记剂对生物样品中的一个或多个细胞进行空间标记,就进行生物样品中存在的分析物的空间分析。在一些实施方式中,这种空间分析包括解离生物样品的空间标记细胞(或生物样品的空间标记细胞的子集)并逐个细胞分析存在于这些细胞中的分析物。可以使用各种方法中的任何一种来逐个细胞分析细胞中存在的分析物。非限制性示例包括本文所述的各种方法中的任何一种以及PCT申请公开号WO 2019/113533A1中所述的方法,其内容通过引用全部纳入本文。例如,空间标记的细胞可以用包含一个或多个具有条形码(例如,细胞条形码)(例如,乳液)的核酸分子的珠包封。存在于珠上的核酸可具有与存在于标记细胞上的核酸上的结构域杂交的结构域(例如,附接于细胞标记剂的核酸上的结构域),从而将细胞的空间条形码连接到珠的细胞条形码。一旦细胞的空间条形码和珠的细胞条形码连接起来,就可以使用捕获探针(例如,珠上存在的捕获探针)分析细胞中存在的分析物。这使(使用这些方法)从特定细胞产生的核酸被单独扩增和测序(例如在单独的分区或液滴内)。
在一些实施方式中,一旦用细胞标记剂对生物样品中的一个或多个细胞进行空间标记,就进行生物样品中存在的分析物的空间分析,其中生物样品的细胞不解离成单细胞。在这样的实施方式中,可以采用诸如本文提供的那些中的任何一种的各种空间分析方法。例如,一旦用细胞标记剂对生物样品中的一个或多个细胞进行空间标记,就可以捕获和分析细胞中的分析物。在一些实施方式中,细胞标记剂包括可用于捕获细胞中存在的分析物的空间条形码和捕获域。例如,包括空间条形码和捕获域两者的细胞标记剂可以以使细胞标记剂的位置已知的方式引入生物样品的细胞(或者可以在将它们引入细胞之后确定)。将细胞标记剂引入生物样品的一个非限制性示例是以阵列形式提供细胞标记剂(例如,阵列在诸如本文所提供的各种基材和阵列中的任何一种的基材上),其中细胞标记剂在阵列上的位置在引入时已知(或者可以在引入后确定)。细胞可根据需要被透化(例如,使用本文所述的透化试剂和方法),可向细胞提供用于分析物分析的试剂(例如,在分析物是结合到捕获探针的核酸的情况下,逆转录酶、聚合酶、核苷酸等),并且分析物可以被分析。在一些实施方式中,经分析的分析物(和/或其拷贝)可从基材释放并分析。在一些实施方式中,原位分析测定的分析物(和/或其拷贝)。
将细胞标记剂引入细胞的表面
可根据本文提供的用于对生物样品中的一个或多个分析物进行空间概况分析的材料和方法使用的附接在细胞表面的细胞标记剂和系统的非限制性示例(例如,因此,引入细胞标记剂和附接在细胞外部的任何条形码)包括:脂标记引物/亲脂标记部分,阳性或中性寡核苷酸偶联聚合物、抗体标记引物、链霉亲和素偶联寡核苷酸、染料标记寡核苷酸、点击化学、受体-配体系统、通过胺或巯基官能团的共价结合系统及其组合。
脂质标记引物/亲脂性标记部分
在本文描述的任何空间概况分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合到亲脂性分子。在一些实施方式中,亲脂性分子能够将分子输送到细胞膜或核膜。在一些实施方式中,具有耦合到亲脂性分子的条形码(例如,空间条形码)的分子(例如,核酸分子)可与脂膜(例如,细胞膜和核膜)结合和/或插入脂膜中。在某些情况下,插入可以是可逆的。在某些情况下,亲脂性分子与细胞之间的结合可使得细胞在随后的处理(例如,划分、细胞透化、扩增、汇集等)期间保留亲脂性分子(例如,和相关组分,例如核酸条形码分子)。在一些实施方式中,具有耦合到亲脂性分子的条形码(例如,空间条形码)的分子(例如,核酸分子)可进入细胞内空间和/或细胞核。
可在本文所述实施方式中使用的亲脂性分子的非限制性实例包括甾醇脂质,例如胆固醇、生育酚、甾醇棕榈酸酯(steryl,palmitate)、木酚酸及其衍生物。在一些实施方式中,亲脂性分子是偶联到疏水部分(例如,胆固醇、角鲨烯或脂肪酸)的中性脂质(参见Raouane等,Bioconjugate Chem.,23(6):1091-1104(2012),其全文通过引用纳入本文)。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可经由接头(例如,四乙二醇(TEG)接头)附接到亲脂性部分。其他示例性接头包括但不限于氨基接头C6、氨基接头C12、间隔子C3、间隔子C6、间隔子C12、间隔子9和间隔子18。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)间接耦合(例如,通过杂交或配体-配体相互作用,例如生物素-链霉亲和素)到亲脂性分子。可根据本文所提供的方法使用的其他亲脂性分子包括两亲性分子,其中头基(例如,电荷、脂肪族含量和/或芳香族含量)和/或脂肪酸链长度(例如,C12、C14、C16或C18)可以改变。例如,脂肪酸侧链(例如,C12、C14、C16或C18)可与甘油或甘油衍生物(例如,3-叔丁基二苯基硅基甘油)耦合,甘油或甘油衍生物还可包含例如阳离子头基。在一些实施方式中,具有本文公开的条形码(例如,空间条形码)的分子(例如,核酸分子)随后可(直接或间接)耦合到这些两亲性分子。在一些实施方式中,具有耦合到两亲性分子的条形码(例如,空间条形码)的分子(例如,核酸分子)可与膜(例如,细胞、细胞珠或核膜)结合和/或插入膜中。在一些情况下,两亲性或亲脂性部分可穿过细胞膜并向细胞和/或细胞珠的内部区域提供具有条形码(例如,空间条形码)的分子(例如,核酸分子)。
在一些实施方式中,其中分子(例如,具有核酸序列)在分子内具有氨基,具有条形码(例如,空间条形码)和氨基的分子(例如,核酸分子)可耦合到胺反应性亲脂性分子。例如,具有条形码(例如,空间条形码)和氨基的分子(例如,核酸分子)可与DSPE-PEG(2000)-三聚氯氰(1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-N-[三聚氰(聚乙二醇)-2000])偶联。
在一些实施方式中,细胞标记剂可通过亲脂性和共价附接的组合附接到细胞表面。例如,细胞标记剂可包括附接到脂质以将寡核苷酸靶向细胞膜的寡核苷酸,以及可经由本文所述的任何数目的化学物共价连接到细胞表面蛋白质的胺基。在这些实施方式中,脂质可增加寡核苷酸的表面浓度并可促进共价反应。
带正电或中性寡核苷酸偶联的聚合物
在本文描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到乙二醇-壳聚糖衍生物。乙二醇-壳聚糖衍生物(例如乙二醇-壳聚糖-胆固醇)可作为疏水锚定物(参见Wang等,J.Mater.Chem.B.,30:6165(2015),其全文通过引用纳入本文)。可与具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合的壳聚糖衍生物的非限制性示例可在Cheung等,Marine Drugs,13(8):5156-5186(2015)中找到,其全文通过引用纳入本文。
抗体标记引物
在本文所述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可以以促进具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接至细胞表面的方式耦合至抗体或其抗原结合片段。在一些实施方式中,促进附接到细胞表面有助于将具有条形码(例如,空间条形码)的分子(例如,核酸分子)引入细胞。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到针对存在于细胞表面的抗原的抗体。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到针对存在于多个细胞(例如,生物样品中的多个细胞)表面上的抗原的抗体。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到针对存在于生物样品中的所有或基本上所有细胞表面上的抗原的抗体。可以使用本文描述的将具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接到另一分子(例如,细胞标记剂)的任何示例性方法。
链霉亲和素偶联的寡核苷酸
在本文描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可以使用生物素-链霉亲和素附接到细胞表面。在一些实施方式中,用NHS活化生物素试剂标记细胞表面多肽的赖氨酸残基侧链中的伯胺。例如,多肽的N-末端可以与NHS活化的生物素试剂反应形成稳定的酰胺键。在一些实施方式中,细胞标记剂包括具有与链霉亲和素偶联的条形码(例如,空间条形码)的分子(例如,核酸分子)。在一些情况下,可使用如本文所述的点击化学(例如马来酰亚胺修饰)将链霉亲和素偶联到具有条形码(例如空间条形码)的分子(例如核酸分子)。在一些实施方式中,含有纳入细胞表面蛋白质的赖氨酸侧链的NHS活化生物素的细胞与偶联到具有条形码(例如空间条形码)的分子(例如核酸分子)的链霉亲和素形成非共价键。在一些实施方式中,具有与链霉亲和素偶联的条形码(例如,空间条形码)的分子(例如,核酸分子)本身是细胞标记剂的部分。
染料标记的寡核苷酸
在本文描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)直接联接到荧光标签。在一些实施方式中,带荧光标签的物理性质(例如疏水性质)可克服具有条形码(例如空间条形码)的分子(例如核酸分子)的亲水性质。例如,在一些实施方式中,其中分子是核酸分子,荧光标记(例如,BODIPY、Cy3、Atto647N和罗丹明红C2)可耦合到具有条形码(例如,空间条形码)的核酸分子的5′端。在一些实施方式中,其中所述分子是核酸分子,具有疏水性的任何荧光标记可以以克服所述核酸分子的亲水性的方式耦合到具有条形码(例如,空间条形码)的核酸分子。具有疏水性的荧光标签的非限制性示例包括BODIPY、Cy3、Atto 647N和罗丹明红C2。
点击化学
在本文描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合到点击化学部分。如本文所使用的,术语“点击化学”通常指模块化的、范围广的、给出高产率的、仅产生无害副产物(例如那些可通过非色谱方法去除的副产物)并且具有立体特异性(但不一定具有对映选择性)的反应(参见例如Angew.Chem.Int.Ed.,2001,40(11):2004-2021,通过引用将其全部纳入本文)。在某些情况下,点击化学可以描述成对的官能团,它们可以在温和的水性条件下选择性地相互反应。
点击化学反应的一个实例是叠氮化物和炔烃的Huisgen 1,3-偶极环加成,即叠氮化物与炔烃的铜催化反应以形成5元杂原子环1,2,3-三唑。该反应也称为Cu(I)催化的叠氮化物-炔烃环加成反应(CuAAC)、Cu(I)点击化学或Cu+点击化学。点击化学的催化剂包括但不限于Cu(I)盐,或通过使用还原试剂将Cu(II)试剂还原为Cu(I)试剂而原位制备的Cu(I)盐(Pharm Res.2008,25(10):2216-2230,其通过引用整体纳入本文)。用于点击化学的已知Cu(II)试剂可包括但不限于Cu(II)-(TBTA)络合物和Cu(II)(THPTA)络合物。TBTA是三-(1-苄基-1H-1,2,3-三唑-4-基)甲基]胺,也称为三-(苄基三唑基甲基)胺,可以作为Cu(I)盐的稳定配体。THPTA是三-(羟丙基三唑基甲基)胺,是Cu(I)的稳定剂的另一实例。其他条件也可用于使用无铜点击化学从叠氮化物和炔烃构建1,2,3-三唑环,例如菌株促进的叠氮化物-炔烃点击化学反应(SPAAC)(参见,例如,Chem.Commun.,2011,47:6257-6259和Nature,2015,519(7544):486-90,其各自都通过引用整体纳入本文)。
受体-配体系统
在本文所描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到配体,其中配体是细胞表面上的受体-配体相互作用的部分。例如,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到与细胞表面受体选择性地相互作用的配体,从而将具有条形码(例如,空间条形码)的分子(例如,核酸分子)靶向特定细胞。可使用的受体-配体系统的非限制性实例包括整合素-受体-配体相互作用、GPCR-受体-配体相互作用、RTK-受体-配体相互作用和TLR-配体相互作用(参见Juliano,Nucleic Acids Res.,44(14):6518-6548(2016),其全文通过引用纳入本文)。可以使用本文描述的用于将具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接到配体的任何方法(例如,本文描述的与将具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接到抗体有关的任何方法)。
通过胺或巯基官能团的共价结合系统
在本文所描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可在分子内的位点(例如,具有核酸序列)纳入反应性官能团。在这种情况下,反应性官能团可促进与配体和/或表面的偶联。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可包括设计成与广泛的活化的接受基团(例如,马来酰亚胺和金微球)反应的巯基修饰剂。例如,具有具有巯基修饰剂的条形码(例如,空间条形码)的分子(例如,核酸分子)可与马来酰亚胺偶联肽相互作用,从而产生肽的标记。在一些实施方式中,马来酰亚胺偶联肽存在于细胞表面上,由此与具有条形码(例如,空间条形码)的巯基修饰分子(例如,核酸分子)相互作用,具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合到细胞表面。巯基修饰剂的非限制性实例包括:5′巯基修饰剂C6 S-S、3′巯基修饰剂C3 S-S、二巯基、3′巯基修饰剂氧杂6-S-S和二巯基丝氨酸。
在本文所描述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可包括胺修饰剂,例如,设计用于在酰化剂存在下附接到另一分子的胺修饰剂。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可包括胺修饰剂,所述胺修饰剂被设计为附接到广泛的连接基团阵列(例如,羰基酰胺、硫脲、磺酰胺和甲酰胺)。例如,具有条形码(例如,空间条形码)和胺修饰剂的分子(例如,核酸分子)可与磺酰胺偶联肽相互作用,从而产生肽的标记。在一些实施方式中,磺胺偶联肽存在于细胞表面上,由此与具有条形码(例如,空间条形码)的胺修饰分子(例如,核酸分子)相互作用,具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合到细胞表面。胺修饰剂的非限制性实例包括:DMS(O)MT-氨基-修饰剂-C6、氨基-修饰剂-C3-TFA、氨基-修饰剂-C12、氨基-修饰剂-C6-TFA、氨基-dT、氨基-修饰剂-5、氨基-修饰剂-C2-dT、氨基-修饰剂-C6-dT和3’-氨基-修饰剂-C7。
作为另一实例,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可在分子内的位点(例如,具有核酸序列)纳入反应性官能团,例如N-羟基琥珀酰亚胺(NHS)。在一些实施方式中,胺(例如,含胺肽)存在于细胞表面上,由此与具有条形码(例如,空间条形码)的NHS修饰分子(例如,核酸分子)相互作用,具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合到细胞表面。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)与双功能NHS接头反应以形成具有条形码(例如,空间条形码)的NHS修饰分子(例如,核酸分子)。
在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可耦合到用于细胞膜(BAM)的生物相容性锚定物。例如,BAM可以包括包含油烯基和PEG的分子。油烯基可促进将具有条形码(例如空间条形码)的分子(例如核酸分子)锚定到细胞,并且PEG可增加水溶性。在一些实施方式中,油烯基-PEG-NHS可使用NHS化学与具有条形码(例如,空间条形码)的分子(例如,核酸分子)耦合。
基于叠氮化物的系统
在一些实施方式中,其中分子(例如,具有核酸序列)在分子内的位点处纳入反应性官能团,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可与细胞表面上的叠氮化物基团耦合。在一些实施方式中,反应性官能团是炔基。在一些实施方式中,如本文所述的点击化学可用于将具有条形码(例如,空间条形码)的炔基修饰分子(例如,核酸分子)附接到细胞表面上的叠氮化物基团。叠氮化物基团可以通过多种方法附接到细胞表面。例如,NHS化学可用于将叠氮化物基团附接到细胞表面。在一些实施方式中,含有叠氮化物基团的N-叠氮乙酰基甘露糖胺四酰化(Ac4ManNAz)可与细胞表面上的唾液酸反应以将叠氮化物附接到细胞表面。在一些实施方式中,叠氮化物通过叠氮化物的生物正交表达附接到细胞表面。
基于凝集素的系统
在本文所述的任何空间分析方法的一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)可以耦合至凝集素,其促进具有条形码(例如,空间条形码)的分子(例如,核酸分子)附接细胞表面。凝集素能与聚糖结合,例如细胞表面上的聚糖。在一些实施方式中,具有条形码(例如,空间条形码)的分子(例如,核酸分子)具有纳入的反应性官能团,例如叠氮化物基团。在一些实施方式中,具有条形码(例如,空间条形码)和叠氮化物基团的分子(例如,核酸分子)与修饰的凝集素(例如,使用NHS化学修饰的凝集素)反应以引入叠氮化物反应性基团。在一些实施方式中,用具有条形码(例如,空间条形码)的凝集素修饰分子(例如,核酸分子)标记活细胞。在一些实施方式中,用具有条形码(例如,空间条形码)的凝集素修饰分子(例如,核酸分子)标记固定的细胞。在一些实施方式中,用具有条形码(例如,空间条形码)的凝集素修饰分子(例如,核酸分子)标记透化的细胞。在一些实施方式中,可用具有条形码(例如,空间条形码)的凝集素修饰分子(例如,核酸分子)标记分泌途径中的细胞器。
(b)将细胞标记剂引入细胞的内部
可根据本文提供的材料和方法使用的用于对生物样品中的分析物进行空间概况分析的穿透和/或穿过细胞膜的细胞标记剂和系统的非限制性示例(例如,因此将细胞标记剂和与其附接的任何条形码引入细胞内部)包括:细胞穿透剂(例如,细胞穿透肽)、纳米颗粒、脂质体,多聚体、基于肽的化学载体、电穿孔、声穿孔、慢病毒载体、逆转录病毒载体及其组合。
图19是显示示例性细胞标记方法的示意图。寡核苷酸递送载体的非穷举实例可包括细胞穿透肽或纳米颗粒。所述递送系统的非穷举实例可包括基于脂质的聚合物和金属纳米颗粒或寡聚物,其可偶联或包封在递送系统内。细胞标签可与捕获剂条形码结构域和可裂解或不可裂解的空间条形码捕获探针结合使用,用于空间和多重化应用。
细胞穿透剂
在本文描述的任何空间概况分析方法的一些实施方式中,通过细胞穿透剂促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。在一些实施方式中,具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)耦合到细胞穿透剂,并且细胞穿透剂使分子与细胞内的分析物相互作用。本文所用的“细胞穿透剂”是指能够促进将具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)引入生物样品的细胞中的试剂(参见,例如,Lovatt等,Nat Methods.2014年2月;11(2):190-6,全文通过引用纳入本文)。在一些实施方式中,细胞穿透剂是细胞穿透肽。本文所用的“细胞穿透肽”是指具有穿过细胞膜的能力的肽(例如短肽,例如通常不超过30个残基的肽)。
在本文所描述的任何空间概况分析方法的一些实施方式中,耦合到具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)的细胞穿透肽可以使用能量依赖或能量非依赖机制穿过细胞膜。例如,细胞穿透肽可通过质膜的物理扰动、内吞、适应性易位、孔形成、电穿孔样透化和/或进入微域边界的直接易位穿过细胞膜。细胞穿透肽的非限制性实例包括:穿透蛋白、tat肽、pVEC、转运肽、MPG、Pep-1、多精氨酸肽、MAP、R6W3、(D-Arg)9、Cys(Npys)-(D-Arg)9、抗βγ(MPS-磷脱氧蛋白样蛋白C末端)、Cys(Npys)触角足、Cys(Npys)-(Arg)9、Cys(Npys)-TAT(47-57)、HIV-1Tat(48-60)、KALA、黄蜂毒素、透皮素Arg、pep-1-半胱胺、TAT(47-57)GGG-Cys(Npys)、Tat-NR2Bct、透皮肽、SynB1、SynB3、PTD-4、PTD-5、FHV Coat-(35-49)、BMV Gag-(7-25)、HTLV-II Rex-(4-16)、R9-tat、SBP、FBP、MPG、MPG(ΔNLS)、Pep-2、MTS、plsl和聚赖氨酸肽(参见例如,Bechara等,FEBS Lett.2013年6月19日;587(12):1693-702,通过引用将其全部纳入本文)。
纳米颗粒
在本文描述的任何空间概况分析方法的一些实施方式中,通过无机颗粒(例如纳米颗粒)促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。在一些实施方式中,具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)耦合到无机颗粒(例如,纳米颗粒),并且具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)使用纳米颗粒以触及细胞内的分析物。可在本文实施方式中用于将具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)递送到细胞和/或细胞珠中的纳米颗粒的非限制性示例包括由金属(例如,铁、金和银)、无机盐和陶瓷(例如,钙、镁或硅的磷酸盐或碳酸盐)制成的无机纳米颗粒。纳米颗粒的表面可被被覆以促进具有条形码(例如,空间条形码)的分子(例如,核酸分子)和捕获域的结合,或者该表面可被化学修饰以促进具有条形码(例如,空间条形码)和捕获域的分子的附接。还可以使用磁性纳米颗粒(例如,超磁性氧化铁)、富勒烯(例如,可溶性碳分子)、碳纳米管(例如,圆柱形富勒烯)、量子点和超分子系统。
脂质体
在本文描述的任何空间分析方法的一些实施方式中,通过脂质体促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。各种类型的脂质,包括阳离子脂质,可用于脂质体递送。在一些情况下,具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)经由脂质纳米乳液递送到细胞。脂肪乳液是指一种不混溶液体在另一种由乳化剂稳定的液体中的分散体。标记细胞可包括使用固体脂质纳米颗粒。
聚合体
在本文描述的任何空间分析方法的一些实施方式中,通过聚合体促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。在一些实施方式中,具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)包含在聚合体中,并且具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)使用聚合体以触及细胞内的分析物。本文所指的“聚合体(polymersome)”是人工囊泡。例如,聚合体可以是类似于脂质体的囊泡,但是膜包含两亲性合成嵌段共聚物(参见,例如,Rideau等,Chem.Soc.Rev.,2018,47,8572-8610,通过引用将其全部纳入本文)。在一些实施方式中,聚合物体包含二-(AB)或三嵌段共聚物(例如ABA或ABC),其中A和C是亲水性嵌段,B是疏水性嵌段。在一些实施方式中,聚合体包含聚(丁二烯)-b-聚(环氧乙烷)、聚(乙基乙烯)-b-聚(环氧乙烷)、聚苯乙烯-b-聚(环氧乙烷)、聚(2-乙烯基吡啶)-b-聚(环氧乙烷)、聚二甲基硅氧烷-b-聚(环氧乙烷)、聚二甲基硅氧烷-g-聚(环氧乙烷)、聚己内酯-b-聚(环氧乙烷),聚异丁烯-b-聚(环氧乙烷)、聚苯乙烯-b-聚丙烯酸、聚二甲基硅氧烷-b-聚-2-甲基-2-噁唑啉或其组合(其中b=嵌段且g=接枝)。
基于肽的化学载体
在本文描述的任何空间分析方法的一些实施方式中,通过基于肽的化学载体(例如,基于阳离子肽的化学载体)促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。阳离子肽富含赖氨酸和/或精氨酸等碱性残基。在本文描述的任何空间分析方法的一些实施方式中,通过基于肽的化学载体促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。阳离子聚合物与具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)混合时,可形成称为多聚体(polyplexes)的纳米复合物。基于聚合物的载体可包含天然蛋白质、肽和/或多糖。基于聚合物的载体可包含合成聚合物。在一些实施方式中,基于聚合物的载体包含聚乙烯亚胺(PEI)。PEI能将DNA凝聚成带正电的颗粒,与细胞表面的阴离子残基结合,通过内吞作用进入细胞。在一些实施方式中,基于聚合物的化学载体包含聚(L)-赖氨酸(PLL)、聚(DL-乳酸)(PLA)、聚(DL-丙交酯-共-糖苷)(PLGA)、聚鸟氨酸、聚精氨酸、组蛋白、鱼精蛋白或其组合。基于聚合物的载体可以包括聚合物的混合物,例如PEG和PLL。聚合物的其他非限制性实例包括树状聚合物、壳聚糖、葡聚糖的合成氨基衍生物和阳离子丙烯酸聚合物。
电穿孔
在本文描述的任何空间分析方法的一些实施方式中,通过电穿孔促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。利用电穿孔,通过具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子),生物分析物可以通过由外加电形成的细胞膜中的一个或多个孔进入细胞。根据外加电场强度和脉冲持续时间,膜的孔隙可以是可逆的。
声孔效应
在本文描述的任何空间分析方法的一些实施方式中,通过声孔效应促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。细胞膜可以使用声波暂时透化,使细胞通过具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)摄取生物分析物。
慢病毒载体和逆转录病毒载体
在本文描述的任何空间分析方法的一些实施方式中,通过载体促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。例如,如本文所述的载体可以是表达载体,其中表达载体包括可操作地连接到编码具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)的序列的启动子序列。载体的非限制性实例包括质粒、转座子、粘粒和病毒载体(例如,任何腺病毒载体(例如,pSV或pCMV载体)、腺相关病毒(AAV)载体、慢病毒载体和逆转录病毒载体)和任何
Figure BDA0003042696400002001
载体。例如,载体可以包括足够的用于表达的顺式作用元件,其中用于表达的其它元件可以由宿主哺乳动物细胞或在体外表达系统中提供。熟练的从业者将能够选择合适的载体和哺乳动物细胞以引入本文所述的任何空间概况分析试剂。
用于细胞内引入分子的其他方法和细胞标记剂
在本文描述的任何空间分析方法的一些实施方式中,通过使用针(例如,注射(例如,微量注射)、颗粒轰击、光穿孔、磁转染和/或水穿孔促进由具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)捕获生物分析物。例如,通过颗粒轰击,具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)可以被重金属颗粒包被并以高速递送到细胞。在光穿孔中,可使用激光脉冲在细胞膜中产生瞬时孔,使细胞摄取具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)。在磁转染中,具有条形码(例如,空间条形码)和捕获域的分子(例如,核酸分子)可以耦合到磁性颗粒(例如,磁性纳米颗粒、纳米线等)并通过外加磁场定位到目标细胞。在水穿孔中,具有条形码(例如,空间条形码)和捕获结构域的分子(例如,核酸分子)可以通过流体压力被递送到细胞和/或细胞珠。
(c)将样品分离成单细胞或细胞群的方法
本文所描述的任何方法的一些实施方式可包括将生物样品分离成单细胞、细胞群、细胞类型或一个或多个感兴趣区域。例如,在与一个或多个捕获探针接触之前,可将生物样品分离成单细胞、细胞群、细胞类型或一个或多个感兴趣的区域。在其它示例中,首先将生物样品与一个或多个捕获探针接触,然后将其分离成单细胞、细胞群、细胞类型或一个或多个感兴趣的区域。
在一些实施方式中,可以使用像素化将生物样品分离成卡盘(chucks)。像素化可以包括提供生物样品和冲孔出生物样品的一个或多个部分的步骤。生物样品的冲孔部分随后可用于进行本文所述的任何方法。在一些实施方式中,生物样品的冲孔部分可以是随机模式或设计模式。在一些实施方式中,生物样品的冲孔部分可聚焦于生物样品中的感兴趣区域或亚细胞结构。
图20A是说明用于“像素化”样品的示范性、非限制性、非穷尽性步骤的工作流示意图,其中样品通过空心针或微针切割、压印、显微解剖或转移,将样品的一小部分移动到个体分区或孔中。
图20B是描绘多针像素化的示意图,其中一组针头穿过支架上的样品并穿入下面含有凝胶珠和试剂的纳米孔中。一旦针进入纳米孔,细胞就会弹出。
在一些实施方式中,在进行本文所述的任何空间分析方法之前,将生物样品分成卡盘。在一些实施方式中,所述方法可包括经由以空间上明确定义的图案应用的条形码(如在DNA微阵列打印中)对FFPE“卡盘”进行空间条码化。DNA条形码很长,因此在后续步骤中不会扩散出去,或者共价应用于FFPE样品。为了使条形码嵌入FFPE载玻片中,可以加热蜡,在冷却前将条形码添加到载玻片中,然后切割卡盘。切割可以通过多种方式进行,如使用激光显微切割,或通过机械或声学手段。另一种方法是嵌入一些荧光团/Qdot等,以便在样品中保留空间信息。这一步骤的条码化能够在保留局部空间信息(例如,肿瘤与正常细胞)的同时大规模地平行随机封装卡盘。
在一些实施方式中,可以使用激光捕获显微切割(例如,高度多重化的激光捕获显微切割)来分割或划分生物样品。
(d)分析物的释放和扩增
在一些实施方式中,可将裂解试剂添加到样品中以促进从样品中释放分析物。裂解剂的实例包括但不限于生物活性试剂,例如用于裂解不同细胞类型的裂解酶,例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物,例如溶菌酶、无色肽酶、溶葡萄球菌素、唇膏酶、基他酶、溶细胞酶和多种其它市售的裂解酶。
其他裂解剂可额外地或可选择地与生物样品共划分以使样品的内容物释放到分区中。在一些实施方式中,基于表面活性剂的裂解溶液可用于裂解细胞,尽管这些溶液对于表面活性剂可干扰稳定乳液的基于乳液的系统可能不太理想。裂解溶液可包括离子表面活性剂,例如肌氨酰和十二烷基硫酸钠(SDS)。电穿孔、热的、声学的或机械的细胞分裂也可用于某些实施方式中,例如,基于非乳液的分配,例如可作为液滴划分的补充或代替液滴划分的生物样品的封装,在细胞破裂后,囊膜的任何孔径足够小以保留给定大小的核酸片段。
除透化剂外,还可添加其它试剂以与生物样品相互作用,包括例如DNA酶和RNA酶失活剂或抑制剂(例如蛋白酶K)、螯合剂(例如EDTA)和其它试剂以使随后处理来自样品的分析物。
可以添加至样品的其他试剂包括,例如,用于片段化DNA的核酸内切酶、DNA聚合酶和用于扩增核酸的dNTP。也可添加到样品中的其他酶包括但不限于聚合酶、转座酶、连接酶、蛋白酶K和DNA酶等。其它试剂还可以包括逆转录酶,包括具有末端转移酶活性的酶、引物和转换寡核苷酸。在一些实施方式中,模板转换可用于增加cDNA的长度,例如,通过将预定义的核酸序列附加到eDNA。
如果组织样品透化不够,则在基材上捕获的分析物的量可能过低,无法进行充分的分析。相反,如果组织样品透化性太强,则分析物可从其在组织样品中的来源扩散出去,从而失去组织样品中分析物的相对空间关系。因此,在充分透化组织样品以获得良好信号强度同时仍保持组织样品中分析物分布的空间分辨率之间的平衡是理想的。
在一些实施方式中,在生物样品包括活细胞的情况下,可修改透化条件以使活细胞仅经历短暂的透化(例如,通过短时间重复脉冲的电场施加),从而使一个或多个分析物从活细胞迁移到基材,同时保留细胞活力。
在一些实施方式中,在将生物样品与包括捕获探针的基材接触之后,进行移出步骤以从基材移出全部或部分生物样品。在一些实施方式中,移出步骤包括生物样品的透化的细胞的酶促或化学降解。例如,移出步骤可包括用酶(例如,蛋白酶K)处理生物样品以从第一基材去除生物样品的至少部分。在一些实施方式中,移出步骤可包括组织的消融(例如,激光消融)。
在一些实施方式中,其中RNA是捕获自样品中的细胞的分析物,可以选择性地富集一种或多种感兴趣的RNA物质。例如,可以通过添加一个或多个寡核苷酸来选择一种或多种感兴趣的RNA。可以使用多种方法中的任何一种来选择性地向下选择(例如,去除)一种或多种RNA。例如,可以将探针给予选择性地与核糖体RNA(rRNA)杂交的样品,从而减少样品中rRNA的集和浓度。随后将捕获探针应用于样品可导致由于样品中存在的非特异性RNA的减少而改善RNA捕获。在一些实施方式中,其它寡核苷酸是用于通过聚合酶引发反应的序列。例如,与一种或多种感兴趣的RNA具有序列互补性的一种或多种引物序列可用于扩增一种或多种感兴趣的RNA,从而选择性地富集这些RNA。在一些实施方式中,与捕获的RNA(例如cDNA)的互补链具有序列互补性的寡核苷酸可结合到cDNA。在一个非限制性实例中,具有与一种或多种感兴趣的eDNA互补的序列的生物素化寡核苷酸结合到cDNA并且可以使用生物素化-链霉亲和素亲和力,使用任意数量的本领域已知的方法(例如,链霉亲和素珠)来选择。
核酸分析物可使用聚合酶链反应(例如,数字PCR、定量PCR或实时PCR)、等温扩增或本文所述的任何核酸扩增或延伸反应来扩增。
(e)划分
如上所述,在一些实施方式中,可任选地将样品分离成单细胞、细胞群或比原始未破碎样品小的其他片段/碎片。可以分析样品的这些较小部分中的每一个以从样品获得空间分辨分析物信息。本文描述非限制性划分方法。
对于已被分离成更小片段的样品-特别是对于已被分解、解离或以其他方式分离成个体细胞的样品-分析片段的一种方法涉及将片段划分进入个体分区(例如液滴),然后分析分区的内容物。通常,每个分区都保持其自身内容物与其他分区的内容物的分离。例如,分区可以是乳液中的液滴。
除分析物外,分区可包括其它组分,尤其是一个或多个珠。分区可以包括单个凝胶珠、单个细胞珠或单个细胞珠和单个凝胶珠两者。
分区还可以包括一种或多种试剂。诸如条形码之类的独特标识符可在液滴生成之前、之后或与液滴生成同时注入到液滴中,例如经由微胶囊(例如,珠)。微流体通道网络(例如,在芯片上)可用于生成分区。替代机制也可用于个体生物颗粒的划分,包括多孔膜,通过多孔膜,细胞的水性混合物被挤压成非水流体。
分区可以在流体流中流动。所述分区可包括例如具有围绕内部流体中心或核心的外部屏障的微泡。在某些情况下,分区可包括多孔基材,其能够在其基材内夹带和/或保持材料。所述分区可以是第二相内第一相的液滴,其中所述第一相和第二相是不混溶的。例如,分区可以是非水性连续相(例如油相)内的水性流体液滴。在另一实例中,该分区可为水相中非水性流体的液滴。在一些示例中,分区可以在油包水乳液或水包油乳液中提供。各种不同的容器在例如美国专利申请公开号2014/0155295中描述,其全部内容通过引用纳入本文。例如,在美国专利申请公开号2010/0105112中描述了用于在非水或油连续相中产生稳定液滴的乳液系统,其全部内容通过引用纳入本文。
对于乳液中的液滴,可通过例如将水性流体中的颗粒流动流引入非水性流体的流动流,使得液滴在两个流的接合处产生来实现将个体颗粒分配到离散分区。可以调整流体性质(例如,流体流速、流体粘度等)、颗粒性质(例如,体积分数、颗粒大小、颗粒浓度等)、微流体结构(例如,通道几何形状等)和其他参数,以控制所得分区的占用率(例如,每个分区的分析物数量,每个分区的珠数等)。例如,可以通过以分析物的特定浓度和/或流速提供水性流来控制分区占用率。
为了生成单个分析物分区,可以选择不混溶流体的相对流速,使得平均而言,分区每个分区可以包含少于一个分析物,以确保被占用的分区主要是单独占用的。在某些情况下,多个分区中的分区最多可包含一个分析物。在一些实施方式中,可以选择或调整各种参数(例如,流体性质、颗粒性质、微流体结构等),使得大多数分区被占用,例如,仅有小百分比的未占用分区。可以控制流和信道架构以确保给定数量的单占用分区、小于某一水平的未占用分区和/或小于某一水平的多占用分区。
本文所述的通道段可以耦合到各种不同的流体源或接收部件中的任何一个,包括储层、管道、歧管或其他系统的流体部件。如将理解的,微流体通道结构可以具有各种几何形状。例如,微流体通道结构可以具有一个或多个通道连接。作为另一实例,微流体通道结构可具有2、3、4或5个通道段,每个通道段携带在通道接合处相遇的颗粒。流体可以通过一个或多个流体流动单元被引导沿着一个或多个通道或储层流动。流体流动单元可包括压缩机(例如,提供正压力)、泵(例如,提供负压)、致动器等以控制流体的流动。流体也可以通过施加的压差、离心力、电动泵、真空、毛细管和/或重力流来控制。
分区可以包括一个或多个独特标识符,例如条形码。条形码可以是先前的、随后的或同时传送到容纳被分隔或被划分的生物颗粒的分区。例如,条形码可以在液滴生成之前、之后或同时注入液滴。将条形码传递到特定分区使稍后将个体生物颗粒的特性归因于特定分区。条形码可以例如在核酸分子(例如寡核苷酸)上通过任何合适的机制传递到分区。条形码核酸分子可以通过微胶囊传递到分区。在一些情况中,微胶囊可包括珠。
在一些实施方式中,条形码核酸分子最初可与微胶囊结合,然后从微胶囊释放。条形码核酸分子的释放可以是被动的(例如,通过扩散出微胶囊)。另外或可选择地,可在施加使条码化核酸分子离解或从微胶囊释放的刺激物时从微胶囊释放。这种刺激可以破坏微胶囊,这种相互作用使条码化核酸分子与微胶囊或在微胶囊内耦合,或两者结合。这种刺激可以包括,例如,热刺激、光刺激、化学刺激(例如,pH值的改变或还原剂的使用)、机械刺激、辐射刺激、生物刺激(例如,酶)或其任何组合。
在一些实施方式中,一个或多个条形码(例如,空间条形码、UMI或其组合)可作为分析物的部分引入到分区中。如前所述,条形码可直接结合到分析物,或可形成捕获探针或分析物捕获剂的部分,所述捕获探针或分析物捕获剂与分析物杂交、偶联或以其他方式关联,使得当分析物被引入分区时,条形码也被引入。
图21描述了示例性工作流,其中样品与空间条码化捕获探针阵列接触,并且样品被固定、染色和成像2101,如本文别处所述。捕获探针可使用本文所述的任何方法从阵列2102裂解。如本文别处所述,捕获探针可通过被动或主动迁移向细胞扩散。然后可将捕获探针引入本文别处所述的样品2103,其中捕获探针能够使用本文所述的细胞穿透肽或脂质递送系统之一在没有细胞透化的情况下进入细胞。然后可任选地对样品成像,以便经由纳入捕获探针2104内的报告分子来确认探针摄取。然后样品可从阵列中分离并经历解离2105,其中样品被分离成单细胞或小细胞群。一旦样品被解离,可将单细胞引入水包油液滴2106中,其中单细胞与液滴内的试剂结合并处理以使得穿透细胞的空间条形码标记液滴内该细胞的内容物。其他的细胞同时进行划分的反应。然后对液滴的内容物2107进行测序,以便将一个或多个特定细胞与样品2108内的特定空间位置相关联。
如上所述,图16示出了用于将个体分析物(例如,细胞)划分进入离散分区的微流体通道结构的示例。图17A和17C还展示了可用于将珠输送到液滴的微流体通道结构的其他示例。
如上所述,可以将各种不同的珠合并到分区中。在一些实施方式中,例如,可以将非条码化珠纳入分区中。例如,在纳入分区中的生物颗粒(例如,细胞)携带一个或多个条形码(例如,空间条形码、UMI及其组合)的情况下,珠可以是非条码化珠。
在一些实施方式中,携带条形码的珠可以纳入分区中。例如,核酸分子(例如寡核苷酸)可通过可释放连接(例如二硫键接头)耦合到珠。同一珠可与一个或多个其它核酸分子耦合(例如,通过可释放连接)。核酸分子可以是或包括条形码。如本文别处所述,条形码的结构可以包括多个序列元件。
所述核酸分子可包括可用于后续加工的功能域。例如,功能域可包括测序仪特异性流动池附接序列(例如,用于
Figure BDA0003042696400002071
测序系统的P5序列)和测序引物序列(例如,用于
Figure BDA0003042696400002072
测序系统的R1引物)中的一个或多个。核酸分子可包括用于对样品(例如DNA、RNA、蛋白质等)进行条码化的条形码序列。在某些情况下,条形码序列可以是珠特异性的,使得条形码序列对于耦合到同一珠的所有核酸分子是共同的。可选地或另外,条形码序列可以是分区特异性的,使得条形码序列对于耦合到被划分到相同分区中的一个或多个珠的所有核酸分子是共同的。核酸分子可包括特定引发序列,例如mRNA特定引发序列(例如,多聚(T)序列)、靶向的引发序列和/或随机引发序列。核酸分子可包括锚定序列以确保特定引发序列在序列末端(例如,mRNA的)杂交。例如,锚定序列可包括核苷酸的随机短序列,例如1-聚体、2-聚体、3-聚体或更长的序列,其可确保多聚(T)片段更有可能在mRNA的多聚(A)尾的序列末端杂交。
核酸分子可包括独特分子识别序列(例如,独特分子标识符(UMI))。在一些实施方式中,独特分子识别序列可包括约5至约8个核苷酸。或者,独特分子识别序列可包括少于约5个或多于约8个核苷酸。独特分子识别序列可以是在耦合到单个珠的个体核酸分子之间变化的独特序列。
在一些实施方式中,独特分子识别序列可以是随机序列(例如,随机N-聚体序列)。例如,UMI可以提供捕获的起始mRNA分子的独特标识符,以便能够对原始表达RNA的数量进行定量。
一般来说,个体珠可以耦合到任意数量的个体核酸分子,例如,从一个到几十个到几十万个甚至数百万个个体核酸分子。个体核酸分子的相应条形码可以包括共同序列段或相对共同序列段以及耦合到同一珠的不同个体核酸分子之间的可变或独特序列段。
在任何给定的分区内,个体mRNA分子的所有cDNA转录物都可以包含一个共同的条形码序列区段。然而,由给定分区内的不同mRNA分子产生的转录物可以在独特分子识别序列区段(例如,UMI区段)处变化。有益的是,即使在随后对给定分区的内容物进行任何扩增之后,不同UMI的数目也可以指示源自给定分区的mRNA的量。如上所述,转录物可被扩增、净化和测序以鉴定mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段进行测序。在描述多聚(T)引物序列的同时,其它靶向或随机引发序列也可用于起始逆转录反应。同样地,尽管描述为将条码化寡核苷酸释放到分区中,但在某些情况下,结合到珠的核酸分子可用于杂交并捕获珠固相上的mRNA,例如,以促进RNA与其他细胞内容物的分离。
在一些实施方式中,包括具有反应性或能够被活化以使其变得具有反应性的官能团的前体可与其它前体聚合以生成包括所述活化或可活化官能团的凝胶珠。然后可以使用官能团将其它物质(例如,二硫键接头、引物、其他寡核苷酸等)附接到凝胶珠上。例如,特征为羧酸(COOH)基团的一些前体可与其它前体共聚合以形成也包括COOH官能团的珠。在一些情况中,丙烯酸(包括游离COOH基团的物质)、丙烯酰胺和双(丙烯酰)胱胺可共聚合在一起以产生包括游离COOH基团的珠。珠的COOH基团可被活化(例如,经由1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉氯化物(DMTMM))以使其具有反应性(例如,与胺官能团反应,其中EDC/NHS或DMTMM用于活化)。活化的COOH基团随后可与连接到珠的部分的适当的物质(例如,包括胺官能团的物质,其中羧酸基团被活化以可与胺官能团反应)反应。
在一些实施方式中,可降解珠可引入到分区中,使得珠在分区内降解并且当施加适当的刺激时,任何相关物质(例如,寡核苷酸)在液滴内释放。游离物质(例如,寡核苷酸、核酸分子)可以与分区中包含的其他试剂相互作用。例如,特征为胱胺并通过二硫键连接到条形码序列的聚丙烯酰胺珠可与油包水乳液液滴内的还原剂结合。在液滴内,还原剂可以破坏各种二硫键,导致珠降解,条形码序列释放到液滴的水性内部环境中。在另一实例中,在碱性溶液中加热具有珠结合条形码序列的液滴也可导致珠降解并将所附接的条形码序列释放到液滴的水性内部环境中。
任何适当数量的物质(例如,引物,条码化寡核苷酸)可与珠粒相关联,使得在从珠释放时,物质(例如,引物,例如,条码化寡核苷酸)以预定浓度存在于分区中。可选择该预定浓度以促进某些反应以在分区内产生测序文库(例如扩增)。在某些情况下,引物的预定浓度可通过产生带有核酸分子(例如寡核苷酸)的珠的过程来限制。
可降解珠可包括具有不稳定键的一种或多种物质,使得当珠/物质暴露于适当的刺激物时,键被破坏并且珠降解。不稳定键可以是化学键(例如,共价键、离子键)或者可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些实施方式中,用于生成珠的交联剂可包括不稳定键。当暴露在适当的条件下时,不稳定的键会断裂,珠会降解。例如,当将包含胱胺交联剂的聚丙烯酰胺凝胶珠暴露于还原剂时,胱胺的二硫键可被破坏且珠降解。
与不降解的珠相比,当对珠施加适当的刺激时,可降解珠可用于更快速地从珠释放附接的物质(例如,核酸分子、条形码序列、引物等)。例如,对于结合到多孔珠的内表面的物质或在包封的物质的情况下,在珠降解时,该物质可对溶液中的其他物质具有更大的移动性和可及性。在一些实施方式中,物质还可经由可降解接头(例如,二硫键接头)附接到可降解珠。所述可降解接头可对与所述可降解珠相同的刺激作出响应,或者所述两种可降解物质可对不同的刺激作出响应。例如,条形码序列可以通过二硫键附接到包含胱胺的聚丙烯酰胺珠。当条码化珠暴露于还原剂时,珠降解并且在条形码序列和珠之间的二硫键和珠中胱胺的二硫键断裂时释放空间条形码序列。
如将从上述描述中了解到的,虽然被称为珠的降解,但在许多实施方式中,降解可指结合或夹带物质与珠的解离,具有或不具有物理珠本身的结构降解。例如,由于化学环境的变化,夹带的物质可以通过渗透压差从珠中释放出来。举例来说,由于渗透压差引起的珠孔径的改变通常可以在珠本身没有结构降解的情况下发生。在一些情况中,由于珠的透化溶胀导致的孔径增大可使珠内夹带的物质释放。在一些实施方式中,由于孔径收缩,珠的透化收缩可导致珠更好地保留夹带的物质。
许多化学触发物可用于触发分区内珠的降解。这些化学变化的实例可包括但不限于pH介导的珠内组分完整性的改变、通过交联键的裂解降解珠的组分以及珠的组分的解聚。
在一些实施方式中,珠可由包括可降解化学交联剂(例如BAC或胱胺)的材料形成。这种可降解交联剂的降解可以通过各种机制来实现。在一些实例中,珠可与可引起氧化、还原或其它化学变化的化学降解剂接触。例如,化学降解剂可以是还原剂,例如二硫苏糖醇(DTT)。还原剂的其他实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可降解形成珠的凝胶前体之间形成的二硫键,从而降解珠。
在某些实施方式中,溶液pH值的变化(例如pH值的增加)可触发珠的降解。在其他实施方式中,暴露于水溶液(例如水)可触发水解降解,从而引发珠的降解。在某些情况下,任何刺激组合都可能引发珠降解。例如,pH值的变化可以使化学试剂(例如DTT)成为有效的还原剂。
在应用热刺激时,也可以诱导珠释放其内容物。温度的变化会引起珠的各种变化。例如,热会使固体珠液化。热的变化会导致珠熔化,使珠的部分降解。在其他情况中,热可增加珠组分的内部压力,使得珠破裂或爆炸。热也可以作用于热敏聚合物作为材料来构建珠。
除了珠和分析物之外,形成的分区可以包括各种不同的试剂和物质。例如,当裂解试剂存在于分区内时,裂解试剂可促进分区内分析物的释放。裂解剂的实例包括生物活性试剂,例如用于裂解不同细胞类型的裂解酶,例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等,例如溶菌酶、无色肽酶、溶葡萄球菌素、唇膏酶、基他酶、溶细胞酶和多种其它市售的裂解酶,例如来自西格玛奥德里奇公司(密苏里州圣路易斯),以及其他市售的裂解酶。其他裂解剂可另外或可选地共划分以使分析物释放到分区中。例如,在某些情况下,基于表面活性剂的裂解溶液可用于裂解细胞,尽管这些溶液对于表面活性剂可干扰稳定乳液的基于乳液的系统可能不太理想。在一些实施方式中,裂解溶液可包括非离子表面活性剂,例如TritonX-100和Tween 20。在一些实施方式中,裂解溶液可包括离子表面活性剂,例如肌氨酰和十二烷基硫酸钠(SDS)。电穿孔、热的、声学的或机械的细胞分裂也可用于某些实施方式中,例如,基于非乳液的分配,例如可作为液滴划分的补充或代替液滴划分的分析物的封装,在细胞破裂后,囊膜的任何孔径足够小以保留给定大小的核酸片段。
可与分区中的分析物共划分的其它物质的实例包括但不限于DNA酶和RNA酶失活剂或抑制剂(例如蛋白酶K)、螯合剂(例如EDTA)以及用于去除或以其它方式降低不同细胞裂解物组分对核酸后续加工的负活性或影响的其它试剂。其他试剂也可以被共划分,包括用于片段化DNA的核酸内切酶、DNA聚合酶和用于扩增核酸片段和将条形码分子标签附接到扩增的片段的dNTP。
其他试剂还可包括逆转录酶,包括具有末端转移酶活性的酶、引物和寡核苷酸,以及可用于模板转换的转换寡核苷酸(在本文中也称为“转换寡核苷酸”或“模板转换寡核苷酸”)。在一些实施方式中,模板转换可用于增加cDNA的长度。模板转换可用于将预先定义的核酸序列附加到cDNA。在模板转换的实例中,cDNA可由模板(例如,细胞mRNA)的逆转录产生,其中具有末端转移酶活性的逆转录酶可以非模板依赖的方式向cDNA添加其它的核苷酸(例如,多聚(C))。转换寡核苷酸可以包括与其它核苷酸互补的序列,例如多聚(G)。cDNA上的其它核苷酸(例如,多聚(C))可与转换寡核苷酸上的其它核苷酸(例如,多聚(G))杂交,由此转换寡核苷酸可被逆转录酶用作模板以进一步延伸cDNA。
模板转换寡核苷酸可以包括杂交区和模板区。杂交区可以包括能够与靶标杂交的任何序列。在一些情况中,杂交区包括一系列G碱基以与cDNA分子3′端的突出端C碱基互补。连续G碱基可包括1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或超过5个G碱基。模板序列可以包括待纳入cDNA的任何序列。在一些情况中,模板区包括至少1个(例如,至少2个、3个、4个、5个或更多)标签序列和/或功能序列。模板转换寡核苷酸可包括脱氧核糖核酸;核糖核酸;修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2′-脱氧肌苷、超T(5-羟基丁基-2′-脱氧尿苷)、超G(8-氮杂-7-脱氮鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如,UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2′氟碱基(例如,氟C、氟U、氟A和氟G)和上述的任何组合。
在一些实施方式中,与分析物划分的珠可包括结合到珠的不同类型的寡核苷酸,其中不同类型的寡核苷酸结合到不同类型的分析物。例如,珠可以包括一个或多个第一寡核苷酸(例如,可以是捕获探针)和一个或多个第二寡核苷酸(例如,可以是捕获探针),第一寡核苷酸可以结合或杂交到第一类型的分析物,例如mRNA,第二寡核苷酸可以结合或杂交到第二类型的分析物,例如gDNA。分区还可以包括有助于从共划分的细胞释放核酸的裂解剂,并且还可以包括可以降解珠和/或破坏寡核苷酸和珠之间的共价键的剂(例如还原剂),从而将寡核苷酸释放到分区中。释放的条码化寡核苷酸(也可以条码化)可以与从细胞释放的mRNA以及从细胞释放的gDNA杂交。
由此由杂交形成的条码化构建体可包括第一类构建体,其包括对应于来自珠的原始条形码序列的序列和对应于来自细胞的转录物的序列,以及第二类构建体,其包括对应于来自珠的原始条形码序列的序列和对应于来自细胞的基因组DNA的序列。然后可以从分区中释放/移出条形码构建体,并且在一些实施方式中,进一步加工以添加任何其他序列。然后可以对得到的构建体进行测序,对测序数据进行加工,并将结果用于在空间上表征来自细胞的mRNA和gDNA
在另一实例中,分区包括珠,其包括具有第一条形码序列的第一类寡核苷酸(例如,第一捕获探针)、可与mRNA转录物的多聚(A)尾杂交的多聚(T)引发序列以及可独特地识别给定转录物的UMI条形码序列。该珠还包括具有第二条形码序列的第二类寡核苷酸(例如,第二捕获探针)、能够与结合到划分细胞表面的抗体的第三条码化寡核苷酸(例如,分析物捕获剂)特异性杂交的靶向引发序列。第三条码化寡核苷酸包括独特地识别抗体的UMI条形码序列(因此,它所结合的特定细胞表面特征)。
在该示例中,第一和第二条码化寡核苷酸包括相同的空间条形码序列(例如,第一和第二条形码序列相同),这使条码化核酸与分区的下游关联。然而,在一些实施方式中,第一和第二条码化序列不同。
分区还可以包括有助于从细胞释放核酸的裂解剂,并且还可以包括可以降解珠和/或破坏条码化寡核苷酸和珠之间的共价键的剂(例如还原剂),从而将它们释放到分区中。第一类释放的条码化寡核苷酸可与从细胞释放的mRNA杂交,第二类释放的条码化寡核苷酸可与第三类条码化寡核苷酸杂交,形成条码化构建体。
第一类条码化构建体包括与来自珠的第一条形码序列相对应的空间条形码序列和与来自第一类寡核苷酸的UMI条形码序列相对应的序列,其识别细胞转录物。第二类条码化构建体包括与来自第二类寡核苷酸的第二条形码序列相对应的空间条形码序列和与第三类寡核苷酸(例如,分析物捕获剂)相对应的UMI条形码序列,并用于识别细胞表面特征。然后可以从分区中释放/移出条形码构建体,并且在一些实施方式中,进一步加工以添加任何其他序列。然后对得到的构建体进行测序,对测序数据进行处理,结果用于表征细胞的mRNA和细胞表面特征。
前面的讨论涉及两个带有寡核苷酸的珠的具体例子,用于分析一个分区内的两种不同分析物。更一般地,被划分的珠可以具有先前描述的任何结构,并且可以包括所描述的用于分析分区内两个或更多个(例如,三个或更多个、四个或更多个、五个或更多个、六个或更多个、八个或更多个、十个或更多个、12个或更多个、15个或更多个、20个或更多个、25个或更多个、30个或更多个,40个或更多个,50个或更多个)的不同类型的分析物的寡核苷酸的任何组合。用于同时分析分区内分析物的不同组合的具有不同类型寡核苷酸(例如,捕获探针)组合的珠的实例包括但不限于:(a)基因组DNA和细胞表面特征(例如,使用本文所述的分析物捕获剂);(b)mRNA和谱系追踪构建体;(c)mRNA和细胞甲基化状态;(d)mRNA和可及染色质(例如,ATAC-seq、DnA酶-seq和/或微球菌酶-seq);(e)mRNA和细胞表面或细胞内蛋白质和/或代谢物;(f)条码化分析物捕获剂(例如,本文所述的MHC多聚体)和免疫细胞受体(例如,T细胞受体)的V(D)J序列;和(g)mRNA和扰动剂(例如,CRISPR-crRNA/sgRNA、TALEN、锌指核酸酶和/或本文所述的反义寡核苷酸)。
(f)测序分析
在来自样品的分析物已根据上述与基于一般空间细胞的分析方法相关的任何方法与捕获探针、分析物捕获剂或其他条码化寡核苷酸序列杂交或以其他方式结合之后,杂交/结合产生的条码化构建体通过测序进行分析以鉴定分析物。
在一些实施方式中,如上文所述,通过和与细胞表面杂交、结合或关联或引入细胞的捕获探针或分析物捕获剂杂交直接对样品进行条码化,可对完整样品进行测序。或者,如上文所述,如果条码化样品已被分离成片段、细胞群或个体细胞,则可对个体片段、细胞群或细胞进行测序。如上所述,对于已通过珠划分进行条码化的分析物,可通过打破分区从分区中提取个体分析物(例如,细胞或细胞裂解后的细胞内容物),然后通过测序来分析以识别分析物。
多种不同的测序方法可用于分析条码化的分析物构建体。一般来说,测序的多核苷酸可以是例如核酸分子,例如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括其变体或衍生物(例如,单链DNA或DNA/RNA杂合体,以及具有核苷酸类似物的核酸分子)。
多核苷酸的测序可以通过各种商业系统进行。更一般地,可以使用核酸扩增、聚合酶链反应(PCR)(例如,数字PCR和液滴数字PCR(ddPCR)、定量PCR、实时PCR、多重PCR、基于PCR的单重方法、乳液PCR)和/或等温扩增来进行测序。
对遗传物质进行测序的方法的其他示例包括但不限于DNA杂交方法(例如,Southern印迹法)、限制性酶消化方法、Sanger测序方法、下一代测序方法(例如,单分子实时测序、纳米孔测序和Polony测序),连接法和微阵列法。可使用的测序方法的其他示例包括靶向测序、单分子实时测序、外显子测序、基于电子显微镜的测序、面板测序、晶体管介导测序、直接测序、随机鸟枪测序、Sanger双脱氧终止测序、全基因组测序,杂交测序、焦磷酸测序、毛细管电泳、凝胶电泳、双链体测序、循环测序、单碱基延伸测序、固相测序、高通量测序、大规模平行标记测序、低温共扩增PCR(COLD-PCR)、可逆染料终止子测序、双端测序、近期测序、核酸外切酶测序、连接测序、短读测序、单分子测序、合成测序、实时测序、反向终止子测序、纳米孔测序、454测序、Solexa基因组分析仪测序、SOLiDTM测序、MS-PET测序及其任何组合。
核酸分子(包括条码化核酸分子或其衍生物)的序列分析可以是直接的或间接的。因此,序列分析基材(可被视为经受序列分析步骤或过程的分子)可直接为条码化的核酸分子或其可为从其衍生的分子(例如,其互补物)。因此,例如,在测序反应的序列分析步骤中,测序模板可以是条码化的核酸分子,也可以是从其衍生的分子。例如,第一和/或第二链DNA分子可以直接进行序列分析(例如测序),即可以直接参与序列分析反应或过程(例如测序反应或测序过程,或者是被测序或以其他方式识别的分子)。或者,可在序列分析(例如,通过另一技术进行测序或鉴定)之前对条码化核酸分子进行第二链合成或扩增的步骤。因此,序列分析底物(例如模板)可以是扩增子或条码化核酸分子的第二链。
在一些实施方式中,双链分子的两条链可经序列分析(例如,测序)。在一些实施方式中,可以分析(例如测序)单链分子(例如条码化核酸分子)。为了进行单分子测序,可以在3′末端修饰核酸链。
大规模平行测序技术可用于核酸测序,如上所述。在一个实施方式中,大规模平行测序技术可基于可逆染料终止剂。例如,首先将DNA分子附接到例如玻璃或硅基材上的引物上,并进行扩增以形成局部克隆群体(桥式扩增)。添加四种类型的ddNTP,并冲走未结合的核苷酸。与焦磷酸测序不同,由于阻断基团(例如,ddNTP的糖部分上存在3′阻断基团),DNA一次仅延伸一个核苷酸。检测器获取荧光标记的核苷酸的图像,然后染料连同末端3′阻断基团从DNA中化学去除,作为后续循环的前体。可以重复此过程,直到获得所需的序列数据。
另一个例子是,大规模平行焦磷酸测序技术也可用于核酸测序。在焦磷酸测序中,核酸在油溶液中的水滴内扩增(乳液PCR),每个液滴包含单一的核酸模板,其附接在单一的涂有引物的珠上,然后形成克隆群体。测序系统包含许多皮升体积孔,每个孔包含一个珠和测序酶。焦磷酸测序使用荧光素酶产生光来检测添加到新生核酸中的个体核苷酸,并且组合数据用于产生序列读取。
作为焦磷酸测序的另一个示例应用,释放的PPi可通过ATP磺酰化酶立即转化为三磷酸腺苷(ATP)来检测,并且产生的ATP水平可通过荧光素酶产生的光子来检测,如Ronaghi等Anal.Biochem.242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi等,Science 281(5375),363(1998);以及美国专利号6,210,891,6,258,568和6,274,320所述,其全部内容通过引用纳入本文。
在一些实施方式中,通过检测在DNA聚合期间释放的氢离子来进行测序。含有待测序的模板DNA链的微孔可以充满单一类型的核苷酸。如果引入的核苷酸与前导模板核苷酸互补,则它被纳入生长的互补链。这会导致氢离子释放,从而触发超敏离子传感器,这表明发生了反应。若模板系列中存在均聚重复系列,单次循环中会纳入多个核苷酸。这导致对应数量的氢离子释放,和成比例的更高电子信号。
在一些实施方式中,可以原位进行测序。原位测序方法特别有用,例如,当样品表面上的分析物(例如,细胞表面分析物)或样品内的分析物(例如,细胞内分析物)已被条码化后,生物样品保持完整。原位测序通常涉及以连续的、模板依赖的方式将标记的核苷酸(例如,荧光标记的单核苷酸或二核苷酸)纳入或将标记的引物(例如,标记的随机六聚体)杂交到核酸模板上,使得可以确定纳入的核苷酸或标记的引物延伸产物的核苷酸序列的相同性(即,核苷酸序列),从而测定相应模板核酸的核苷酸序列。例如,在Mitra等,(2003)Anal.Biochem.320,55-65,和Lee等,(2014)Science,343(6177),1360-1363中描述了原位测序的各个方面,通过引用将其全部内容纳入本文。
此外,PCT专利申请公开号WO2014/163886、WO2018/045181、WO2018/045186和美国专利号10138509和10179932中描述了用于进行原位测序的方法和系统的示例,其全部内容通过引用纳入本文中。用于原位测序的示例技术包括但不限于STARmap(例如在Wang等,(2018)Science,361(6499)5691中描述)、MERFISH(例如在Moffitt,(2016)Methods inEnzymology,572,1-49中描述)和FISSEQ(例如在美国专利申请公开号2019/0032121中描述)。上述各参考文献的全部内容通过引用纳入本文。
对于已通过划分进行条码化的分析物,条码化核酸分子或其衍生物(例如,已添加一个或多个功能序列的条码化核酸分子,或已从中移出一个或多个特征的条码化核酸分子)可汇集并一起加工以用于后续分析,例如在高分辨率测序仪上测序。可以使用条形码序列实现汇集处理。例如,给定分区的条码化核酸分子可以具有相同的条形码,这与其他空间分区的条形码不同。或者,可以分开处理不同分区的条码化核酸分子以进行后续分析(例如,测序)。
在一些实施方式中,在捕获探针不包含空间条形码的情况下,可以在捕获探针从生物样品捕获分析物之后和分析分析物之前添加空间条形码。当在捕获分析物之后添加空间条形码时,可在扩增分析物之后添加条形码(例如,RNA的逆转录和聚合酶扩增)。在一些实施方式中,分析物分析使用一个或多个捕获的分析物的直接测序,例如杂交的RNA的直接测序。在一些实施方式中,在杂交的RNA的逆转录之后进行直接测序。在一些实施方式中,在杂交的RNA的逆转录的扩增之后进行直接测序。
在一些实施方式中,通过合成测序(SBS)进行捕获的RNA的直接测序。在一些实施方式中,测序引物与捕获探针的一个或多个域(例如,功能域)中的序列互补。在此类实施方式中,通过合成进行测序可包括逆转录和/或扩增以产生模板序列(例如,功能域),其中引物序列可与模板序列结合。
SBS可涉及将适当的引物(有时称为测序引物)与待测序的核酸模板杂交、延伸引物以及检测用于延伸引物的核苷酸。优选地,在进一步的核苷酸添加到生长的核酸链之前检测用于延伸引物的核酸,从而能进行逐碱基原位核酸测序。通过在引物延伸反应中包括一个或多个标记的核苷酸,有助于检测纳入的核苷酸。为了使适当的测序引物与待测序的核酸模板杂交,核酸模板通常应为单链形式。如果构成核酸点的核酸模板以双链形式存在,则可使用本领域公知的方法(例如通过变性,裂解等)对其进行处理以提供单链核酸模板。与核酸模板杂交并用于引物延伸的测序引物优选短寡核苷酸,例如长度为15到25个核苷酸。测序引物的长度也可以超过25个核苷酸。例如,测序引物的长度可以是大约20到大约60个核苷酸,或者超过60个核苷酸。测序引物可以以溶液或固定形式提供。一旦通过使核酸模板和测序引物经受适当条件将测序引物退火到待测序的核酸模板,则进行引物延伸,例如使用核酸聚合酶和核苷酸供应,其中至少一些以标记形式提供,以及如果提供合适的核苷酸,则适于引物延伸的条件。
优选地,在每个引物延伸步骤之后,包括洗涤步骤以去除可干扰后续步骤的未纳入的核苷酸。一旦进行了引物延伸步骤,就对核酸群体进行监测,以确定标记的核苷酸是否已被纳入延伸的引物中。然后可以重复引物延伸步骤以确定下一个和随后纳入延伸的引物中的核苷酸。如果所确定的序列未知,应用于给定群体的核苷酸通常以选定的顺序应用,然后在整个分析过程中重复,例如dATP、dTTP、dCTP、dGTP。
可使用的SBS技术描述于例如,但不限于美国专利申请公开号2007/0166705,美国专利申请公开号2006/0188901,U.S.Patent 7,057,026,美国专利申请公开号2006/0240439,美国专利申请公开号2006/0281109,PCT专利申请公开号WO 05/065814,美国专利申请公开号2005/0100900,PCT专利申请公开号WO 06/064199,PCT专利申请公开号WO07/010,251,美国专利申请公开号2012/0270305,美国专利申请公开号2013/0260372,和美国专利申请公开号2013/0079232中的技术,其全部内容通过引用纳入本文。
在一些实施方式中,捕获的RNA的直接测序通过顺序荧光杂交(例如,通过杂交进行测序)来进行。在一些实施方式中,原位进行RNA与捕获探针杂交的杂交反应。在一些实施方式中,捕获的RNA在与测序探针杂交之前不被扩增。在一些实施方式中,RNA在与测序探针杂交之前被扩增(例如,逆转录到cDNA和cDNA的扩增)。在一些实施方式中,使用单分子杂交链式反应进行扩增。在一些实施方式中,使用滚动链扩增来进行扩增。
顺序荧光杂交可包括探针的顺序杂交,包括简并引物序列和可检测的标记物。简并引物序列是能够与独立于所述核酸片段序列的任何核酸片段杂交的短寡核苷酸序列。例如,这种方法可以包括以下步骤:(a)提供包括四个探针的混合物,每个探针在5′端包括A、C、G或T,进一步包括长度为5到11个核苷酸的简并核苷酸序列,并且进一步包括对于在5′端有A、C、G或T的探针而言不同的功能域(例如,荧光分子);(b)将步骤(a)的探针与目标多核苷酸序列相关联,其序列需求将通过该方法确定;(c)测量四个功能域的活性并记录活性的相对空间位置;(d)从目标多核苷酸序列移出来自步骤(a)-(b)中的试剂;并且将步骤(a)-(d)重复n个循环,直到确定每个珠的空间域的核苷酸序列,经过修改,步骤(a)中使用的寡核苷酸与靶多核苷酸序列的部分以及所述序列的部分侧接的位置1到n互补。由于条形码序列不同,在一些实施方式中,这些其它侧接序列是简并序列。来自阵列上每个点的循环1到n的荧光信号可用于确定目标多核苷酸序列的序列。
在一些实施方式中,使用顺序荧光杂交对捕获的RNA进行体外直接测序。在一些实施方式中,捕获的RNA在与测序探针杂交之前被扩增(例如,逆转录到cDNA和cDNA的扩增)。在一些实施方式中,含有捕获的RNA的捕获探针暴露于靶向RNA编码区的测序探针。在一些实施方式中,一个或多个测序探针靶向每个编码区域。在一些实施方式中,测序探针被设计成与测序试剂(例如,染料标记的读出寡核苷酸)杂交。然后,测序探针可以与测序试剂杂交。在一些实施方式中,对测序反应的输出进行成像。在一些实施方式中,从测序反应的图像解析cDNA的特定序列。在一些实施方式中,在与测序探针杂交之前进行对捕获的RNA的逆转录。在一些实施方式中,测序探针被设计成靶向RNA编码区的互补序列(例如,靶向cDNA)。
在一些实施方式中,使用基于纳米孔的方法直接对捕获的RNA进行测序。在一些实施方式中,使用纳米孔直接RNA测序进行直接测序,其中捕获的RNA通过纳米孔易位。纳米孔电流可以被记录并转换成碱基序列。在一些实施方式中,捕获的RNA在纳米孔测序期间保持附接到基材。在一些实施方式中,捕获的RNA在纳米孔测序之前从基材释放。在一些实施方式中,其中感兴趣的分析物是蛋白质,可使用基于纳米孔的方法进行蛋白质的直接测序。可使用的基于纳米孔的测序方法的实例描述于Deamer等,Trends Biotechnol.18,147-151(2000);Deamer等,Acc.Chem.Res.35:817-825(2002);Li等,Nat.Mater.2:611-615(2003);Soni等,Clin.Chem.53,1996-2001(2007);Healy等,Nanomed.2,459-481(2007);Cockroft等,J.Am.Chem.Soc.130,818-820(2008);以及美国专利号7,001,792。上述各参考文献的全部内容通过引用纳入本文。
在一些实施方式中,使用通过连接的单分子测序来进行捕获的RNA的直接测序。这种技术利用DNA连接酶纳入寡核苷酸并鉴定这种寡核苷酸的纳入。寡核苷酸通常具有与寡核苷酸杂交的序列中的特定核苷酸的相同性相关的不同标记物。例如,在Shendure等,Science(2005),309:1728-1732和美国专利号5599675、5750341、6969488、6172218和6306597中描述了连接测序所涉及的方面和特征,其全部内容通过引用纳入本文中。
在一些实施方式中,核酸杂交可用于测序。这些方法利用与条形码序列的至少部分互补的标记的核酸解码器探针。多重解码可以使用具有可分辨标签的许多不同探针的集来进行。例如在美国专利号8,460,865,和Gunderson等,Genome Research 14:870-877(2004)中描述了核酸杂交测序的非限制性实例,其全部内容通过引用纳入本文。
在一些实施方式中,商用高通量数字测序技术可用于分析条形码序列,其中DNA模板不是一次测序一个,而是在批量过程中测序,并且许多序列优选地以平行方式读出,或者也可以使用其自身可以平行化的超高通量串行过程。此类技术的实例包括
Figure BDA0003042696400002211
测序(例如,基于流动池的测序技术)、使用修饰核苷酸的合成测序(例如在由加利福尼亚州圣迭戈的Illumina公司的TruSeqTM和HiSeqTM技术市售),由马萨诸塞州剑桥的Helicos生命科学集团提供的HeliScopeTM和加利福尼亚州门罗公园的太平洋生物科学公司提供的PacBioRS)、离子检测技术测序(加利福尼亚州南旧金山的离子激流公司)和DNA纳米球测序(加利福尼亚州山景城的完全基因组公司(Complete Genomics,Inc.))。
在一些实施方式中,在将核苷酸纳入延伸产物时释放的质子的检测可用于本文所述的方法中。例如,美国专利申请公开号2009/0026082、2009/0127589、2010/0137143和2010/0282617中描述的测序方法和系统可用于直接对条形码进行测序。上述各参考文献的全部内容通过引用纳入本文。
在一些实施方式中,可在测序期间使用对DNA聚合酶活性的实时监测。例如,如Levene等,Science(2003),299,682-686,Lundquist等,Opt.Lett.(2008),33,1026-1028,和Korlach等,Proc.Natl.Acad.Sci.USA(2008),105,1176-1181中所述,可通过荧光共振能量转移(FRET)检测核苷酸纳入。上述各参考文献的全部内容通过引用纳入本文。
IV.多重化
(a)一般多重化
在如本文所述的空间分析的各种实施方式中,特征可以包括用于分析个体细胞的内在和外在信息的不同类型的捕获探针。例如,特征可以包括以下一个或多个:1)具有能够结合到细胞中的一个或多个内源性核酸的捕获域的捕获探针;2)具有能够结合到细胞中的一个或多个外源性核酸的捕获域的捕获探针(例如,来自感染细胞的微生物(例如,病毒,细菌)的核酸、引入细胞的核酸(例如质粒或从中衍生的核酸)、用于基因编辑的核酸(例如CRISPR相关RNA,例如crRNA、导向RNA);3)具有能够结合到分析物捕获剂的捕获域的捕获探针(例如,与寡核苷酸偶联的抗体,该寡核苷酸包括具有结合捕获域的分析物捕获序列的捕获剂条形码结构域),和4)具有能够结合到蛋白质(例如,在细胞中表达的外源性蛋白质、来自感染细胞的微生物(例如,病毒、细菌)的蛋白质)的结构域的捕获部分,或所述细胞蛋白质的结合伴侣(例如,免疫细胞受体的抗原)。
在如本文所述的任何空间分析方法的一些实施方式中,空间概况分析包括对两种不同类型的分析物的同时分析。特征可以是凝胶珠,其耦合(例如,可逆耦合)到一个或多个捕获探针。捕获探针可包括空间条形码序列和可与mRNA转录物的多聚(A)尾杂交的多聚(T)引发序列。捕获探针还可以包括能够独特地识别给定转录物的UMI序列。捕获探针还可以包括空间条形码序列和能够与gDNA随机杂交的随机N-聚体引发序列。在这种配置中,捕获探针可以包括相同的空间条形码序列,这使下游测序读取与特征相关联。
在如本文所述的任何空间分析方法的一些实施方式中,特征可以是凝胶珠,其耦合(例如,可逆耦合)至捕获探针。捕获探针可包括空间条形码序列和可与mRNA转录物的多聚(A)尾杂交的多聚(T)引发序列614。捕获探针还可以包括能够独特地识别给定转录物的UMI序列。捕获探针可以包括空间条形码序列和能够与分析物捕获剂特异性杂交的捕获域。所述分析物捕获剂可包括寡核苷酸,所述寡核苷酸包括与耦合到所述特征的捕获域相互作用的分析物捕获序列。分析物捕获剂的寡核苷酸可与结合到细胞表面的抗体耦合。寡核苷酸包括独特地识别抗体(和因此,其结合到的特定细胞表面特征)的条形码序列(因此,它所结合的特定细胞表面特征)。在该配置中,捕获探针包括相同的空间条形码序列,其使条码化核酸与空间阵列上的位置的下游关联。在本文所描述的任何空间概况分析方法的一些实施方式中,可通过任何合适的路线产生分析物捕获剂,包括经由本文别处所描述的示例性耦合方案。
在本文所述的任何空间分析方法的一些实施方式中,可同时测量的两个或更多个生物分析物的其他组合包括但不限于:(a)基因组DNA和细胞表面特征(例如,通过结合到细胞表面特征的分析物捕获剂),(b)mRNA和谱系追踪结构,(c)mRNA和细胞甲基化状态,(d)mRNA和可及染色质(例如ATAC-seq、DNA酶-seq和/或微球菌酶-seq),(e)mRNA和细胞表面或细胞内蛋白质和/或代谢物,(f)mRNA和染色质(细胞中染色质的空间组织),(g)分析物捕获剂(例如,本文所述的任何MHC多聚体)和免疫细胞受体(例如T细胞受体)的V(D)J序列,(h)mRNA和扰动剂(例如CRISPR crRNA/sgRNA、TALEN、锌指核酸酶和/或本文所述的反义寡核苷酸),(i)基因组DNA和扰动剂,(j)分析物捕获剂和扰动剂,(k)可及染色质和扰动剂,(l)染色质(例如,细胞中染色质的空间组织)和扰动剂,和(m)细胞表面或细胞内蛋白质和/或代谢物和扰动剂,或其任何组合。
在本文所描述的任何空间分析方法的一些实施方式中,第一分析物可包括具有编码免疫细胞受体(例如TCR或BCR)的V(D)J序列的至少部分的核酸序列(例如,mRNA,源自mRNA逆转录的互补DNA)的核酸分子。在一些实施方式中,具有编码免疫细胞受体的V(D)J序列的至少部分的核酸序列的核酸分子是首先使用含多聚(T)的引物从相应mRNA的逆转录产生的cDNA。然后可以使用引物对所生成的cDNA进行条码化,所述引物的特征为与所生成的cDNA的至少部分杂交的空间条形码序列(和可选的UMI序列)。在一些实施方式中,结合末端转移酶或具有末端转移酶活性的逆转录酶的模板转换寡核苷酸可用于在cDNA上产生引发区,条码化引物可在cDNA产生期间与其杂交。末端转移酶活性可例如将多聚(C)尾添加至cDNA的3′端,使得模板转换寡核苷酸可经由多聚(G)引发序列结合且cDNA的3′端可进一步延伸。原始mRNA模板和模板转换寡核苷酸随后可从cDNA变性,并且包含与cDNA上所生成的引发区的至少部分互补的序列的条码化引物随后可与cDNA和包含条形码序列(和任何可选的UMI序列)和产生的cDNA互补物的条码化构建体杂交。在PCT专利申请号WO 2018/075693和美国专利申请公开号2018/0105808中描述了适用于对从mRNA转录物生成的cDNA进行条码化的其他方法和组合物,所述mRNA转录物包括编码免疫细胞受体的V(D)J区域的那些,和/或包括模板转换寡核苷酸的组合物和条码化方法,各自均通过引用全文纳入本文。
在一些实施方式中,可以使用类似于本文所述的方法来进行V(D)J分析。例如,V(D)J分析可以通过使用一种或多种与免疫细胞特定表面特征结合并与条形码序列(例如,分析物结合部分条形码)相关联的分析物捕获剂来完成。一种或多种分析物捕获剂可包括MHC或MHC多聚体。与可用于V(D)J分析的珠耦合的条码化寡核苷酸。寡核苷酸通过可释放的连接(例如二硫键接头)耦合到珠。寡核苷酸可包括对后续处理有用的功能性序列,例如功能性序列,其可包括测序仪特异性流动池附接序列,例如P5序列,以及功能性序列,其可包括测序引物序列,例如R1引物结合位点。在一些实施方式中,该序列可包括P7序列和R2引物结合位点。条形码序列可包括在所述结构内以用于对模板多核苷酸进行条码化。可选择功能性序列可以与各种不同测序系统中的任何一种兼容,例如454测序、离子激流质子或PGM、Illumina X10等及其要求。在一些实施方式中,条形码序列、功能性序列(例如,流动池附接序列)和其他序列(例如,测序引物序列)可以是附接到给定珠的所有寡核苷酸所共用的。条码化寡核苷酸还可以包括促进模板转换的序列(例如,多聚(G)序列)。在一些实施方式中,如本文别处所述,其他序列提供独特分子标识符(UMI)序列区段。
在使用条形码寡核苷酸的细胞多核苷酸分析的示例性方法中,将细胞与带有条码化寡核苷酸和诸如逆转录酶、引物、寡核苷酸(例如,模板转换寡核苷酸)、dNTP和还原剂的其他试剂的珠一起共划分到分区中(例如,乳液中的液滴)。在该分区内,细胞可被裂解以产生多个模板多核苷酸(例如,DNA例如基因组DNA、RNA例如mRNA等)。
具有来自细胞的模板多核苷酸和(i)具有朝向3′末端的序列的引物的反应混合物,该序列与模板多核苷酸杂交(例如,多聚(T))和(ii)模板转换寡核苷酸,其包括朝向5′末端的第一寡核苷酸,可经受扩增反应以产生第一扩增产物。在一些实施方式中,模板多核苷酸是具有多聚(A)尾的mRNA,并且与模板多核苷酸杂交的引物包括朝向3′末端的多聚(T)序列,其与多聚(A)区段互补。第一寡核苷酸可包括以下的至少一个:衔接子序列、条形码序列、独特分子标识符(UMI)序列、引物结合位点和测序引物结合位点或其任何组合。在一些情况下,第一寡核苷酸是可对多个分区的所有分区共有的序列。例如,第一寡核苷酸可包括流动池附接序列、扩增引物结合位点或测序引物结合位点,并且第一扩增反应促进寡核苷酸与来自细胞的模板多核苷酸的附接。在一些实施方式中,第一寡核苷酸包括引物结合位点。在一些实施方式中,第一寡核苷酸包括测序引物结合位点。
朝向引物3′端(例如,多聚(T))的序列与模板多核苷酸杂交。在第一扩增反应中,延伸反应试剂,例如逆转录酶、三磷酸核苷、辅因子(例如Mg2+或Mn2+),其也被共划分,可以使用细胞的核酸作为模板来延伸引物序列,以产生转录物,例如cDNA,具有与引物退火到的细胞核酸链互补的片段。在一些实施方式中,逆转录酶具有末端转移酶活性,并且逆转录酶以非模板依赖的方式向cDNA添加其它的核苷酸,例如多聚(C)。
模板转换寡核苷酸,例如包括多聚(G)序列的模板转换寡核苷酸,可与cDNA杂交并促进第一扩增反应中的模板转换。因此,转录物可包括引物序列、与来自细胞的模板多核苷酸互补的序列以及与模板转换寡核苷酸互补的序列。
在本文描述的任何空间分析方法的一些实施方式中,在第一扩增反应之后,第一扩增产物或转录物可经受第二扩增反应以产生第二扩增产物。在一些实施方式中,其他序列(例如,诸如流动池附接序列、测序引物结合序列、条形码序列等的功能性序列)被附接。第一和第二扩增反应可以在相同体积中进行,例如在液滴中。在一些实施方式中,第一扩增产物在条码化寡核苷酸存在下经受第二扩增反应以产生具有条形码序列的第二扩增产物。条形码序列对于分区可以是独特的,即每个分区可以具有独特条形码序列。条码化寡核苷酸可包括模板转换寡核苷酸的至少一个区段和至少第二寡核苷酸的序列。条码化寡核苷酸上的模板转换寡核苷酸区段可促进条码化寡核苷酸与转录物(例如cDNA)的杂交,以促进第二扩增产物的产生。除了条形码序列之外,条码化寡核苷酸可包括第二寡核苷酸,例如以下的至少一个:衔接子序列、独特分子标识符(UMI)序列、引物结合位点和测序引物结合位点,或其任何组合。
在本文所描述的任何空间分析方法的一些实施方式中,第二扩增反应使用第一扩增产物作为模板并且使用条码化寡核苷酸作为引物。在一些实施方式中,条码化寡核苷酸上的模板转换寡核苷酸的区段可与cDNA或互补片段的部分杂交,所述cDNA或互补片段具有与模板转换寡核苷酸互补的序列或从模板转换寡核苷酸复制的序列。在第二扩增反应中,延伸反应试剂,例如聚合酶、三磷酸核苷、辅因子(例如Mg2+或Mn2+)(其也是被共划分的),可以使用第一扩增产物作为模板来延伸引物序列。第二扩增产物可包括第二寡核苷酸、模板多核苷酸区段的序列(例如,mRNA)和与引物互补的序列。
在本文所描述的任何空间分析方法的一些实施方式中,第二扩增反应使用条码化寡核苷酸作为模板并且使用第一扩增产物的部分作为引物。具有与模板转换寡核苷酸互补的序列的第一扩增产物的区段(例如cDNA)可与包含模板转换寡核苷酸的至少一个区段的序列的条码化寡核苷酸的区段杂交。在第二扩增反应中,延伸反应试剂,例如聚合酶、三磷酸核苷、辅因子(例如Mg2+或Mn2+)(其也是被共同划分的),可以使用条码化寡核苷酸作为模板来延伸引物序列。第二扩增产物可包括引物序列、与模板多核苷酸(例如,mRNA)序列互补的序列和与第二寡核苷酸互补的序列。
在本文描述的任何空间分析方法的一些实施方式中,可以同时测量三类或更多类的生物分析物。例如,特征可以包括捕获探针,其可以通过三个不同的捕获域参与至少三种不同类型分析物的分析。珠可耦合到条码化寡核苷酸,所述条码化寡核苷酸包括包含用于mRNA分析的多聚(T)引发序列的捕获域;条码化寡核苷酸,所述条码化寡核苷酸包括包含用于gDNA分析的随机N-聚体引发序列的捕获域;以及条码化寡核苷酸,所述条码化寡核苷酸包括可特异性地通过其分析物捕获序列与分析物捕获剂(例如,带有空间条形码的抗体)结合。
在本文所述的任何空间分析方法的一些实施方式中,可同时测量的三种或更多生物分析物的其他组合包括但不限于:(a)mRNA,谱系追踪构建体,以及细胞表面和/或细胞内蛋白质和/或代谢物;(b)mRNA,可及染色质(例如,ATAC-seq,DNA酶-seq和/或微球菌酶-seq)和细胞表面和/或细胞内蛋白质和/或代谢物;(c)mRNA、基因组DNA和扰动剂(例如,如本文所述的CRISPR-crRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸);(d)mRNA,可及染色质和扰动剂;(e)mRNA,分析物捕获试剂(例如,本文所述的任何MHC多聚体)和扰动剂;(f)mRNA,细胞表面和/或细胞内蛋白质和/或代谢物和扰动剂;(g)mRNA,免疫细胞受体(例如,T细胞受体)的V(D)J序列和扰动剂;(h)mRNA,分析物捕获剂和免疫细胞受体的V(D)J序列;(i)细胞表面和/或细胞内蛋白质和/或代谢物,分析物捕获剂(例如,本文所述MHC多聚体)和免疫细胞受体的V(D)J序列;(j)甲基化状态,mRNA和细胞表面和/或细胞内蛋白质和/或代谢物;(k)mRNA,染色质(例如,细胞中染色质的空间组织)和扰动剂;(l)免疫细胞受体的V(D)J序列,染色质(例如,细胞中染色质的空间组织);和扰动剂;和(m)mRNA,免疫细胞受体的V(D)J序列和染色质(例如,细胞中染色质的空间组织),或其任何组合。
在本文描述的任何空间分析方法的一些实施方式中,可以同时测量四类或更多类的生物分析物。特征可以是与条码化引物耦合的珠,每个引物都可以参与不同类型分析物的分析。所述特征耦合(例如,可逆耦合)到捕获探针,所述捕获探针包括用于mRNA分析的多聚(T)引发序列的捕获域,并且还耦合(例如,可逆耦合)到捕获探针,所述捕获探针包括用于gDNA分析的随机N-聚体引发序列的捕获域。此外,该特征还耦合(例如可逆耦合)到捕获探针,该捕获探针通过其捕获域结合分析物捕获剂的分析物捕获序列。该特征还可经由其捕获域耦合(例如,可逆耦合)到捕获探针,该捕获探针可特异性结合可作为扰动剂发挥作用的核酸分子(例如,如本文所述的CRISPR crRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸)。
在本文描述的任何空间分析方法的一些实施方式中,存在于给定特征或给定珠上的各种空间条码化捕获探针中的每一个包括相同的空间条形码序列。在一些实施方式中,每个条码化捕获探针可以以适合于分析其各自分析物的方式从特征中释放。例如,条码化构建体A、B、C和D可以如本文别处所述生成并分析。条码化构建体A可包括与来自珠的条形码序列相对应的序列(例如,空间条形码)和与目标mRNA相对应的DNA序列。条码化构建体B可包括与来自珠的条形码序列相对应的序列(例如,空间条形码)和与基因组DNA相对应的序列。条码化构建体C可包括与来自珠的条形码序列相对应的序列(例如,空间条形码)和与分析物捕获剂相关联的条形码序列相对应的序列(例如,分析物结合部分条形码)。条码化构建体D可包括与来自珠的条形码序列相对应的序列(例如,空间条形码)和与CRISPR核酸相对应的序列(在一些实施方式中,其还包括条形码序列)。可以分析每个构建体(例如,通过各种测序方法中的任何一种),并且结果可以与各种分析物来源的给定细胞相关联。条码化(或甚至非条码化)构建体可定制用于与核酸相关的任何给定分析物的分析,并且能够与这种构建体结合。
在本文所述的任何空间分析方法的一些实施方式中,可同时测量的四种或更多生物分析物的其他组合包括但不限于:(a)mRNA,谱系追踪构建物,细胞表面和/或细胞内蛋白质和/或代谢物,以及gDNA;(b)mRNA,可获得的染色质(例如,ATAC-seq、DNA酶-seq和/或微球菌酶-seq),细胞表面和/或细胞内蛋白质和/或代谢物以及扰动剂(例如,如本文所述的CRISPR-crRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸);(c)mRNA、细胞表面和/或细胞内蛋白质和/或代谢物,分析物捕获剂(例如免疫细胞受体(例如,T细胞受体)的V(D)J序列;(d)mRNA,基因组DNA,扰动剂和可及染色质;(e)mRNA,细胞表面和/或细胞内蛋白质和/或代谢物,分析物捕获剂(例如,本文所述MHC多聚体)和扰动剂;(f)mRNA,细胞表面和/或细胞内蛋白质和/或代谢物,扰动剂和免疫细胞受体(例如T细胞受体)的V(D)J序列;(g)mRNA,扰动剂,分析物捕获剂(例如本文所述的MHC多聚体)和免疫细胞受体(例如T细胞受体)的V(D)J序列;(h)mRNA,染色质(例如,细胞中染色质的空间组织)和扰动剂;(i)免疫细胞受体的V(D)J序列,染色质(例如,细胞中染色质的空间组织);和扰动剂;(J)mRNA,免疫细胞受体的V(D)J序列,染色质(例如,细胞中染色质的空间组织)和基因组DNA;(k)mRNA,免疫细胞受体的V(D)J序列,染色质(例如,细胞中染色质的空间组织)和扰动剂,或其任何组合。
(b)用于多分析物分析的空间阵列的构建
本发明还提供用于构建能够进行多分析物分析的空间阵列的方法和材料。在一些实施方式中,空间阵列包括基材上的多个特征,其中多个特征的一个或多个成员包括具有第一类型功能性序列的多个寡核苷酸和具有第二不同类型功能性序列的寡核苷酸。在一些实施方式中,特征可包括具有两种类型的功能性序列的寡核苷酸。特征可与包含TruSeq功能性序列的寡核苷酸以及包含Nextera功能性序列的寡核苷酸耦合。在一些实施方式中,多个特征的一个或多个成员包括两种类型的功能性序列。在一些实施方式中,多个特征的一个或多个成员包括第一类型的功能性序列。在一些实施方式中,多个特征的一个或多个成员包括第二类型的功能性序列。在一些实施方式中,可将其他寡核苷酸添加到功能性序列以产生全寡核苷酸,其中全寡核苷酸包括空间条形码序列、可选UMI序列、引发序列和捕获域。这些序列的附接可以通过连接(包括通过夹板连接,如美国专利申请公开号20140378345中所述,其全部内容通过引用纳入本文中)或任何其他合适的路径。如本文所讨论的,寡核苷酸可与夹板序列杂交,夹板序列可有助于构建完整的全寡核苷酸(例如,能够进行空间分析的寡核苷酸)。
在一些实施方式中,与位于特征上的功能序列(例如,TruSeq和Nextera)杂交的寡核苷酸包括能够捕获不同类型的分析物(例如,mRNA、基因组DNA、细胞表面蛋白质或可及染色质)的捕获域。在一些示例中,可以结合到TruSeq功能性序列的寡核苷酸可以包括包括多聚(T)捕获序列的捕获域。除了多聚(T)捕获序列之外,可结合TruSeq官能团的寡核苷酸还可包括捕获域,其包括用于捕获基因组DNA的随机N-聚体序列(例如,或如本文所述的能够捕获本文所述的任何生物分析物的任何其他序列或结构域)。在这种情况下,可以通过将TruSeq-多聚(T)和TruSeq-N-聚体寡核苷酸的比率应用于包含功能性TruSeq序列的特征来构建空间阵列。这可以产生空间阵列,其中部分寡核苷酸可以捕获mRNA,另一不同部分寡核苷酸可以捕获基因组DNA。在一些实施方式中,多个特征的一个或多个成员包括TruSeq和Nextera功能性序列。在这种情况下,包括两种类型的功能性序列的特征能够结合每个功能性序列特异性的寡核苷酸。例如,能够结合到TruSeq功能性序列的寡核苷酸可用于递送包括多聚(T)捕获域的寡核苷酸,并且能够结合到Nextera功能性序列的寡核苷酸可用于递送包括用于捕获基因组DNA的N-聚体捕获域的寡核苷酸。本领域普通技术人员将认识到,捕获域(例如,具有本文所述的能够结合到本文所述的任何不同类型的分析物的各种捕获序列中的任何一种的捕获域,如本文所述)的任何组合可与能够结合到TruSeq和Nextera功能性序列的寡核苷酸组合以构建空间阵列。
在一些实施方式中,包括捕获域(例如,能够耦合到分析物的寡核苷酸)或分析物捕获剂的寡核苷酸可包括能够结合或连接到分析引物的寡核苷酸序列。衔接子可以使捕获探针或分析物捕获剂附接到任何合适的分析引物上,并在任何合适的分析中使用。所述分析引物可以包括引发区和能够结合或连接到衔接子的序列。在一些实施方式中,衔接子可以是非特异性引物(例如,5′突出端),并且分析引物可以包括可以连接到5′突出端的3′突出端。分析引物上的引发区可以是本文所述的任何引物,例如多聚(T)引物、随机N-聚体引物、靶向特异性引物或分析物捕获剂捕获序列。
在一些实例中,寡核苷酸可包括衔接子,例如具有10个核苷酸的5′突出端。衔接子可以连接到分析引物上,每个分析引物包括具有10个核苷酸的3′突出端,其与衔接子的5′突出端互补。捕获探针可通过附接到为该分析设计的分析引物用于任何分析。
衔接子和分析引物可用于使捕获探针或分析物捕获剂附接到任何合适的分析引物上并用于任何合适的分析。包括空间条形码的捕获探针可以附接到包括多聚(dT)序列的珠。包括空间条形码和多聚(T)序列的捕获探针可用于分析如本文一般所述的多种生物分析物(例如,生物分析物包括多聚(A)序列或耦合到或以其他方式与包含多聚(A)序列作为分析物捕获序列的分析物捕获剂相关联)。
具有多聚(A)序列的夹板寡核苷酸可用于促进耦合到捕获探针,捕获探针包括空间条形码和促进耦合到分析引物的第二序列。分析引物包括与夹板寡核苷酸第二序列互补的序列和确定分析引物功能性的分析特异性序列(例如,如本文所述的多聚(T)引物、随机N-聚体引物、目标特异性引物或分析物捕获剂捕获序列)。
在本文所描述的任何空间概况分析方法的一些实施方式中,特征可以包括捕获探针,其包括包括例如具有3′末端3rG的转换寡核苷酸的空间条形码。例如,具有用3rG序列官能化的空间条形码的特征(例如,凝胶珠)可用于实现模板转换(例如,逆转录酶模板转换),但对于任何特定分析不是特异性的。在一些实施方式中,添加到反应中的分析引物可确定分析哪种类型的分析物。例如,分析引物可包括能够结合到目标生物分析物的结合域(例如,用于mRNA的多聚(T)、用于基因组DNA的N-聚体等)。捕获探针(例如,能够进行空间概况分析的寡核苷酸)可以通过使用逆转录酶/聚合酶进行延伸来产生,随后模板转换到条码化衔接子寡核苷酸上以纳入条形码和其他功能性序列。在一些实施方式中,所述分析引物包括能够结合到用于mRNA分析的多聚(T)序列的捕获域、用于基因组DNA分析的随机引物或能够结合耦合到分析物结合部分的核酸分子的捕获序列(例如,分析物捕获剂的分析物捕获序列)或可作为扰动剂发挥作用的核酸分子(例如,如本文所述的CRISPR-crRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸)。
V.样品分析系统
上述用于分析生物样品的方法可以使用各种硬件组件来实现。在本节中,将描述此类组件的示例。然而,应当理解,一般来说,本文讨论的各种步骤和技术可以使用各种不同的装置和系统组件来进行,并非所有这些都被明确地阐述。
图46A是示出示例样品处理设备4600的示意图。样品处理设备4600包括样品室4602,其在关闭或密封时是流体密封的。在室4602内,第一保持器4604保持样品4608所在的第一基材4606。样品室4602还包括第二保持器4610,其保持具有特征阵列4614的第二基材4612,如上所述。
流体储器4616经由流体入口4618连接到样品室4602的内部体积。流体出口4620还连接到样品室4602的内部体积和阀4622。反过来,阀4622连接到废物储器4624,并且可选地连接到分析设备4626。控制单元4628电连接到第二保持器4610、阀4622、废物储器4624和流体储器4616。
在设备4600的操作期间,上述任何试剂、溶液和其它生化组分可经由流体入口4618从流体储器4616输送到样品室4602。控制单元4628连接到流体储器4616,可以控制试剂、溶液和组分的递送,并根据各种样品类型和分析程序的编程分析方案调整体积和流速。在一些实施方式中,流体储器4616包括可由控制单元4628控制的泵,以便于将物质输送到样品室4602中。
在某些实施方式中,流体储器4616包括多个室,每个室通过歧管(未示出)连接到流体入口4618。控制单元4628可以通过调节歧管来选择性地将来自多个室中的任何一个或多个室的物质输送到样品室4602中,以确保所选择的室在流体上连接到流体入口4618。
一般而言,控制单元4628可被配置成在第一基材4606上的样品4608与第一基材4612上的特征阵列4614相互作用之前、之后或之前和之后将物质从流体储器4614引入样品室4602。前面已经描述了许多此类物质的例子。此类物质的实例包括但不限于透化剂、缓冲剂、固定剂、染色溶液、洗涤溶液和各种生物试剂的溶液(例如,酶、肽、寡核苷酸、引物)。
为了起始样品4608和特征阵列4614之间的相互作用,样品和阵列在空间上接近。为了便于该步骤,第二保持器4610在控制单元4628的控制下可以在x、y和z坐标方向中的任一方向上平移第二基材4612。具体地,控制单元4628可以指示第二保持器4610在z方向上平移第二基材4612,使得样品4608接触或接近接触特征阵列4614。
在一些实施方式中,设备4600可以任选地包括对准子系统4630,其可以电连接到控制单元4628。对准子系统4630的功能是确保样品4608和特征阵列4614在z方向上平移第二基材4612之前在x-y平面上对齐,以便样品4608接触或接近接触特征阵列4614。
对准子系统4630可以以多种方式实现。在一些实施方式中,例如,对准子系统4630包括成像单元,其获得显示第一基材4606和/或第二基材4612上的基准标识(marking)的一个或多个图像。控制单元4618分析图像以确定第二基材4612在x坐标和/或y坐标方向上的适当平移,以确保样品4608和特征阵列4614在z坐标方向上的平移之前对齐。
在某些实施方式中,控制单元4628可任选地调节从样品室4602移出物质。例如,控制单元4628可以选择性地调整阀4622,使得从流体储器4616引入样品室4602的物质被引导到废物储器4624。在一些实施方式中,废物储器4624可以包括电连接到控制单元4628的减压源(未示出)。控制单元4628可调节流体出口4620中的流体压力,以控制流体从样品室4602移入废物储器4624的速率。
在一些实施方式中,来自样品4608或来自特征阵列4614的分析物可通过控制单元4628对阀4622的适当调节选择性地输送到分析设备4626。如上所述,在一些实施方式中,分析设备4626包括电连接到控制单元4628的减压源(未示出),以便控制单元4628可以调整将分析物输送到分析设备4626的速率。因此,流体出口4620有效地起到分析物收集器的作用,而分析物的分析由分析设备4626进行。应当注意,并非本文所描述的所有工作流和方法都经由分析装置4626来实现。例如,在一些实施方式中,由特征阵列4614捕获的分析物保持与阵列结合(即,不从阵列上裂解),并且直接分析特征阵列4614以识别特定结合的样品组分。
除了上述组件之外,设备4600还可以任选地包括其它特征。在一些实施方式中,例如,样品室4602包括电连接到控制单元4628的加热子系统4632。控制单元4628可激活加热子系统4632以加热样品4608和/或特征阵列4614,这可有助于促进本文所述方法的某些步骤。
在某些实施方式中,样品室4602包括与控制单元4628电连接的电极4634。控制单元4628可以任选地激活电极4634,从而在第一和第二基材之间建立电场。例如,此类场可用于促进分析物从样品4608向特征阵列4614迁移。
在本文描述的一些方法中,获取样品和/或特征阵列的一个或多个图像。通常可以以各种方式实现用于获得这种图像的成像设备。图46B示出了成像设备4650的一个示例。成像设备4650包括光源4652、光调节光学元件4654、光传送光学元件4656、光收集光学元件4660、光调节光学元件4662和检测子系统4664。上述每个部件可以可选地连接到控制单元4628,或者可选地连接到另一个控制单元。为了下面的说明,假设控制单元4628连接到成像设备4650的部件。
在成像设备4650的操作期间,光源4652产生光。通常,由光源4652产生的光可以包括电磁光谱的紫外线、可见光和/或红外区域中的任何一个或多个区域中的光。可以使用各种不同的光源元件来产生光,包括(但不限于)发光二极管、激光二极管、激光源、荧光源、白炽灯源和辉光放电源。
光源4652产生的光由光调节光学元件4654接收。一般而言,光调节光学元件4654针对特定成像应用修改光源4652产生的光。例如,在一些实施方式中,光调节光学元件4654例如通过滤除光的某些波长来修改光的光谱特性。为此,光调节光学元件4654可以包括各种光谱光学元件,例如滤光片、光栅、棱镜和色差分束器。
在某些实施方式中,光调节光学元件4654修改由光源4652产生的光的空间特性。可用于此目的的组件的示例包括(但不限于)孔径、相位掩模、变迹元件和扩散器。
在通过光调节光学器件4654进行修改之后,光被光传送光学器件4656接收并且被引导到样品4608或特征阵列4614上,其中任一样品4608或特征阵列4614被定位在支架4658上。光调节光学元件4654通常用于收集光并将光引导到样品或阵列的表面上。各种不同的光学元件可用于此目的,且此类元件的实例包括但不限于透镜、镜、分束器及具有非零光功率的各种其它元件。
从样品4608或特征阵列4614射出的光由光收集光学元件4660收集。一般而言,光收集光学元件4660可以包括与上述与光传送光学元件4656相关的那些元件中的任何元件类似的元件。然后可以任选地通过光调节光学元件4662来修改收集的光,光调节光学元件4662通常可以包括上述与光调节光学元件4654相关的任何元件。
然后由检测子系统4664检测光。通常,检测子系统4664通过检测来自样品或特征阵列的光来生成样品4608或特征阵列4614的一个或多个图像。检测子系统4664中可以使用各种不同的成像元件,包括CCD检测器和其他图像捕获装置。
如图46B所示,上述每个组件可以任选地连接到控制单元4628,使得控制单元4628可以调整成像设备的各种特性。例如,控制单元4628可以相对于入射光的位置并且也相对于入射光的焦平面(如果入射光被聚焦)来调整样品4608或特征阵列4614的位置。控制单元4628还可以选择性地过滤入射光和从样品中射出的光。
成像设备4650通常可以获得各种不同成像模式的图像。在一些实施方式中,例如,图像是透射光图像,如图46B所示。在某些实施方式中,设备4650被配置为获得反射图像。在一些实施方式中,设备4650可以被配置成获得双折射图像、荧光图像、磷光图像、多光子吸收图像,以及更一般地,任何已知的图像类型。
一般而言,控制单元4628可以通过向样品处理设备4600和/或成像设备4650的组件发送适当的控制信号来进行本文中描述的不明确要求用户干预的任何方法步骤。为了进行这些步骤,控制单元4628通常包括软件指令,当进行这些指令时,使控制单元4628进行特定步骤。在一些实施方式中,控制单元4628包括电子处理器和电子处理器可读的软件指令,并使处理器进行本文描述的步骤。在某些实施方式中,控制单元4628包括一个或多个应用特定的集成电路,所述集成电路具有有效地用作软件指令的电路配置。
控制单元4628可以以多种方式实现。图46C是示出包括电子处理器4680、存储单元4682、存储设备4684和输入/输出界面4686的控制单元4628的一个示例的示意图。处理器4680能够处理存储在存储器单元4682或存储设备4684中的指令,并且在输入/输出界面4686上显示信息。
存储器单元4682存储信息。在一些实施方式中,存储单元4682是计算机可读介质。存储单元4682可以包括易失性存储器和/或非易失性存储器。存储设备4684能够提供大容量存储,并且在一些实施方式中,存储设备4684是计算机可读介质。在某些实施方式中,存储设备4684可以是软盘设备、硬盘设备、光盘设备、磁带设备、固态设备或另一种类型的可写介质。
输入/输出界面4686实现输入/输出操作。在一些实施方式中,输入/输出界面4686包括键盘和/或指针设备。在一些实施方式中,输入/输出界面4686包括用于显示图形用户界面和/或显示信息的显示单元。
进行并使控制单元4628进行本文所述的任何步骤或过程的指令可以在数字电子电路、或计算机硬件、固件或这些的组合中实现。这些指令可以在有形地体现在信息载体(例如,在机器可读存储设备)中的计算机程序产品中实现,以便由可编程处理器(例如,处理器4680)进行。计算机程序可以用任何形式的编程语言编写,包括编译或解释语言,并且可以用任何形式部署,包括作为独立程序或作为模块、组件、子程序或适合在计算环境中使用的其他单元。适于有形地体现计算机程序指令和数据的存储设备包括所有形式的非易失性存储器,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘和可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM光盘。处理器和存储器可由ASIC(专用集成电路)补充或纳入ASIC中。
处理器4680可以包括各种合适的处理器中的任何一个或多个。例如,用于进行指令程序的合适处理器包括通用和专用微处理器,以及任何类型的计算机或计算设备的唯一处理器或多个处理器中的一个。
VI.用于生物样品中转座酶介导的空间标记和分析基因组DNA的方法的系统、方法和组合物
人体包括大量不同类型的细胞,每一种细胞都具有特定的功能。了解细胞的染色质结构可以揭示有关细胞功能的信息。开放的染色质,或可及染色质,通常表示特定细胞中转录活性序列,例如基因。进一步了解染色质内的转录活性区域将有助于确定哪些基因对细胞的功能和/或表型有贡献。
已经开发了研究表观基因组的方法,例如染色质可及性分析(ATAC-seq)或识别与染色质相关联的蛋白质(例如ChIP-seq)。这些分析有助于识别贡献于动态细胞表型的调节因子(如顺式调节因子和/或反式调节因子)。虽然ATAC-Seq和ChIP-Seq在确定细胞群体内的表观遗传变异性方面是非常宝贵的,但是这些方法的传统应用在空间上解析促进细胞变异的三维结构和相关联基因的能力有限。
因此,本发明一般涉及核酸的空间标记和分析。在一些实施方式中,本文提供的方法利用转座酶来促进片段化DNA的捕获并使得能够同时捕获来自生物样品的DNA和RNA,从而揭示关于贡献于细胞调节的结构特征的表观基因组见解。
在一些实施方式中,本文提供用于生物样品中核酸(例如,基因组DNA、mRNA)的空间分析的方法。在一些实施方式中,提供基材,其中基材包括多个捕获探针。在一些实施方式中,捕获探针可直接附接到基材。在一些实施方式中,捕获探针可间接附接到基材。例如,捕获探针可以附接到基材上的特征。在一些实施方式中,捕获探针包括空间条形码和捕获域。在一些实施方式中,捕获探针可以是部分双链的。在一些实施方式中,捕获探针能结合互补寡核苷酸。在一些实施方式中,互补寡核苷酸(例如,夹板寡核苷酸)可具有单链捕获域。在一些实施方式中,单链捕获域能结合片段化(例如,标签化的)DNA。在一些实施方式中,具有单链捕获域的互补寡核苷酸可以是夹板寡核苷酸。在一些实施方式中,生物样品在足以使生物样品的细胞中的核酸(例如,基因组DNA)可发生转座子插入的条件下处理。在一些实施方式中,向生物样品提供转座子序列和转座酶,使得转座子序列可以插入生物样品中存在的细胞的基因组DNA中。在一些实施方式中,转座酶可从核酸(例如,基因组DNA)切除(例如,切出、移出)插入的转座子序列,从而使基因组DNA片段化。
在一些实施方式中,将包含核酸(例如,基因组DNA、mRNA)的生物样品与基材接触,使得捕获探针可与片段化(例如,标签化的)基因组DNA相互作用。在一些实施方式中,包含核酸(例如,基因组DNA,mRNA)的生物样品与基材接触,使得捕获探针可以与生物样品中存在的mRNA和片段化的基因组DNA两者相互作用。
在一些实施方式中,捕获探针在基材上的位置可与生物样品中的位置相关,从而在空间上分析片段化的(例如,标签化的)基因组DNA。在一些实施方式中,捕获探针在基材上的位置可与生物样品中的位置相关,从而在空间上分析片段化的基因组DNA和mRNA。
空间ATAC-seq
在一些实施方式中,在本文描述的任何空间分析方法中,ATAC-seq用于生成全基因组染色质可及性图谱。这些全基因组可及性图谱可与额外的全基因组分析数据(例如,RNA-seq、ChIP-seq、Methyl-seq)整合,以产生有助于理解转录调控的基因调控相互作用图谱。例如,对全基因组可及性图谱的询问可以揭示潜在的转录因子和在给定的基因组位置负责染色质可及性的转录因子基序。将染色质可及性的变化与基因表达的变化(RNA-seq)、TF结合的变化(例如,ChIP-seq)和/或DNA甲基化水平的变化(例如,Methyl-seq)相关联可以识别驱动这些变化的转录调控。在疾病状态下,这种转录调控常常是不平衡的。因此,使用空间分析方法分析染色质可及性和例如基因表达,可以识别转录调控失衡的潜在原因。
在一些实施方式中,在空间概况分析包括来自单个细胞或生物样品(例如,组织切片)内的细胞亚群的不同类型分析物的并行分析的情况下,其它空间信息层可以整合到基因组调控相互作用图谱中。在一些实施方式中,可以对整个基因组进行空间概况分析。在一些实施方式中,可在固定的生物样品(例如,固定生物样品)上进行空间概况分析。
在一些实施方式中,由空间ATAC-seq生成的全基因组染色质可及性图谱可用于细胞类型识别。例如,传统的细胞类型分类依赖于mRNA的表达水平,但染色质的可及性可以更善于捕捉细胞的特性。此外,在一些实施方式中,可以空间方式确定转录活性区域(例如,开放染色质)与表达谱(例如,mRNA的表达谱)之间的相关性。
透化生物样品
本发明一般描述了对基因组DNA进行片段化(例如,标签化)以在生物样品中产生DNA片段的方法。一般来说,生物样品需要在足够接触基因组DNA的条件下被透化。然而,细胞制备物(例如IGEPAL、洋地黄素、NP-40、吐温或曲通-X-100)中DNA标签化反应中通常使用的透化条件不足以使固定在基材(例如,载体、阵列)上的生物样品中成功片段化(例如,标签化)。如在下面的实施例中进一步描述的,固定在基材上的生物样品的化学或酶“预透化”可用于使生物样品中的DNA可被转座酶(例如转座体)访问。在一些实施方式中,透化生物样品可以是两步过程(例如,预透化处理,然后是透化处理)。在一些实施方式中,透化生物样品可以是一步过程(例如,足以透化生物样品中的细胞膜和核膜的单一透化处理)。在一些实施方式中,“预透化”条件可适于产生均一的DNA片段化以使得能够捕获DNA标签化物而不管染色质可及性如何,或产生具有明显核小体模式的片段。
在一些实施方式中,预透化可包括酶或化学条件。在一些实施方式中,可使用酶(例如,蛋白酶)进行预透化。在一些实施方式中,以非限制性方式,蛋白酶可包括胰蛋白酶、胃蛋白酶、分散酶、木瓜蛋白酶、蛋白酶(accuses)或胶原酶。在一些实施方式中,预透化可包括用胃蛋白酶进行酶处理。在一些实施方式中,预透化可包括0.5M乙酸中的胃蛋白酶。在一些实施方式中,预透化可包括在核酸外切酶-1缓冲液中的胃蛋白酶。在一些实施方式中,缓冲液的pH可为酸性。在一些实施方式中,预透化可包括用胶原酶进行酶处理。在一些实施方式中,预透化可包括HBSS缓冲液中的胶原酶。在一些实施方式中,HBSS缓冲液可包括牛血清白蛋白(BSA)。在一些实施方式中,预透化可包括PKD缓冲液中的蛋白酶K。在一些实施方式中,蛋白酶K与PKD缓冲液的比率可在约1∶1至约1∶20之间。在一些实施方式中,蛋白酶K与PKD缓冲液的比率可在约1∶5至约1∶15之间。在一些实施方式中,蛋白酶K与PKD缓冲液的比率可为约1∶8。在一些实施方式中,用蛋白酶K的酶处理可在约37℃进行。在一些实施方式中,预透化可包括用胰蛋白酶的酶处理。在一些实施方式中,用胰蛋白酶的酶处理可在约20℃、约30℃或约40℃进行。在一些实施方式中,用胰蛋白酶的酶处理可在约37℃进行。在一些实施方式中,预透化可持续约1分钟至约20分钟。在一些实施方式中,预透化可持续约2分钟、约3分钟、约4分钟、约5分钟、约6分钟、约7分钟、约8分钟、约9分钟、约10分钟、约11分钟、约12分钟、约13分钟、约14分钟、约15分钟、约16分钟、约17分钟、约18分钟或约19分钟。在一些实施方式中,预透化可持续约10分钟至约1小时。例如,在一些实施方式中,预透化可持续约20、约30、约40或约50分钟。
在一些实施方式中,透化生物样品包括酶处理。在一些实施方式中,酶处理可为胃蛋白酶或胃蛋白酶样酶处理。在一些实施方式中,酶处理可为蛋白酶处理。在一些实施方式中,可在试剂存在下进行酶处理。在一些实施方式中,酶处理(例如,预透化)可包括将生物试样与包括蛋白酶的酸性溶液接触。在一些实施方式中,试剂可以是HCl。在一些实施方式中,试剂可以是乙酸。在一些实施方式中,HCl的浓度可为约100mM。在一些实施方式中,约100mM HCl可具有约1.0或1.0左右的pH。在一些实施方式中,其它试剂可为0.5M乙酸,其pH约为2.5或2.5左右。值得注意的是,生物样品的酶处理可以对标签化产生不同的影响。例如,用胃蛋白酶和100mH HCl酶处理可导致染色质的标签化,无论染色质的可及性如何。在一些实施方式中,用胃蛋白酶和0.5M乙酸进行酶处理可导致染色质的标签化,其可保留指示标签化的核小体图案。
在一些实施方式中,酶处理可包括使生物样品与包含酸性缓冲液中的天冬氨酰蛋白酶(例如胃蛋白酶)的反应混合物(例如溶液)接触,例如,所述缓冲液的pH值为约4.0或更小,例如约3.0或更小,例如约0.5至约3.0,或约1.0至约2.5。在一些实施方式中,天冬氨酰蛋白酶是胃蛋白酶、胃蛋白酶样酶或其功能等效物。因此,酶委员会编号为3.4.23.1的任何酶或酶的组合。
在一些实施方式中,用胃蛋白酶或胃蛋白酶样酶的酶处理可选自以下(UniProtKB/Swiss-Prot登录号):P03954/PEPA1_MACFU;P28712/PEPA1_RABIT;P27677/PEPA2_MACFU;P27821/PEPA2_RABIT;P0DJD8/PEPA3_HUMAN;P27822/PEPA3_RABIT;P0DJD7/PEPA4_HUMAN;P27678/PEPA4_MACFU;P28713/PEPA4_RABIT;P0DJD9/PEPA5_HUMAN;Q9D106/PEPA5_MOUSE;P27823/PEPAF_RABIT;P00792/PEPA_BOVIN;Q9N2D4/PEPA_CALJA;Q9GMY6/PEPA_CANLF;P00793/PEPA_CHICK;P11489/PEPA_MACMU;P00791/PEPA_PIG;Q9GMY7/PEPA_RHIFE;Q9GMY8/PEPA_SORUN;P81497/PEPA_SUNMU,及其功能性变体和衍生物,或其组合。在一些实施方式中,胃蛋白酶选自(UniProtKB/Swiss-Prot登录号):P00791/PEPA_PIG;P00792/PEPA_BOVIN及其功能性变体和衍生物或其组合。
在一些实施方式中,胃蛋白酶或其功能性变体或衍生物包含与SEQ ID NO:3或4中所示序列具有至少80%序列相同性的氨基酸序列。优选地,所述多肽包括与所比较的序列(例如,SEQ ID NO:3或4)具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。
在一些实施方式中,酶处理(例如,预透化)可以是蛋白酶K或蛋白酶K样处理。在一些实施方式中,用蛋白酶K的酶处理可导致生物样品中可及染色质的标签化。在一些实施方式中,用蛋白酶K的酶处理(例如,预透化和透化)可导致不可及染色质(例如,核小体DNA)的标签化。在一些实施方式中,酶处理包括在适宜于蛋白水解活性的条件下将生物样品与丝氨酸蛋白酶(例如,蛋白酶K)与试剂接触。例如,丝氨酸蛋白酶在广泛的pH条件(例如,从约6.5到约9.5)、变性条件(例如,SDS、尿素的存在)、金属螯合剂(例如,EDTA)和温度(例如,约45°到约65°)下具有功能。在一些实施方式中,用抑制剂停止丝氨酸蛋白酶(例如,蛋白酶K)的酶活性是有用的。例如,经过酶处理后,蛋白酶K可被小分子(例如Sigma目录号:539470)抑制。
在一些实施方式中,丝氨酸蛋白酶是蛋白酶K酶、蛋白酶K样酶或其功能等效物。例如,可以使用酶委员会编号3.4.21.64中的任何酶或酶的组合。在一些实施方式中,蛋白酶K为P06873/PRTK_PARAQ(UniProtKB/Swiss-Prot登录号),或其功能变体或衍生物(如本文所述),或其组合。
在一些实施方式中,蛋白酶K或其功能性变体或衍生物包含与SEQ ID NO:7中所示序列具有至少80%序列相同性的氨基酸序列。在一些实施方式中,多肽序列是与所比较的序列(例如,SEQ ID NO:7)具有约至少90、91、92、93、94、95、96、97、98或99%序列相同性的氨基酸序列。
在一些实施方式中,可使用胶原酶进行酶处理(例如,预透化)。在一些实施方式中,用胶原酶的酶处理可提供转座酶对基因组DNA的可及性,同时保持核完整性。在一些实施方式中,用胶原酶的预透化(例如,酶处理)产生通常与标签化相关的核小体模式。胶原酶可以从溶组织梭菌(Clostridium histolyticum)中分离出来。在一些实施方式中,在适合于蛋白水解活性的条件下用试剂和锌内肽酶(例如胶原酶)进行酶处理包括pH为约7.0至约8.0(例如,约7.4)的缓冲溶液。胶原酶是锌内肽酶,可被EDTA或EGTA或两者抑制。因此,在一些实施方式中,在不存在二价阳离子螯合剂(例如EDTA、EGTA)的情况下,生物样品可与锌内肽酶(例如胶原酶)接触。在一些实施方式中,停止锌内肽酶(例如,胶原酶)是有用的,并且可通过使生物样品与二价阳离子的螯合剂(例如,EDTA、EGTA)接触来停止(例如,抑制)透化步骤。
在一些实施方式中,锌内肽酶是胶原酶、胶原酶样酶或其功能等效物。在这些实施方式中,酶委员会编号3.4.23.3中的任何酶或酶的组合可根据本文所述的材料和方法使用。在一些实施方式中,胶原酶是来自以下组的一种或多种胶原酶,(UniProtKB/Swiss-Prot登录号):P43153/COLA_CLOPE;P43154/COLA_VIBAL;Q9KRJ0/COLA_VIBCH;Q56696/COLA_VIBPA;Q8D4Y9/COLA_VIBVU;Q9X721/COLG_HATHI;Q46085/COLH_HATHI;Q899Y1/COLT_CLOTE URSTH及其功能性变体和衍生物(本文所述),或其组合。
在一些实施方式中,胶原酶或其功能性变体或衍生物包含与SEQ ID NO:5或6中所示序列具有至少80%序列相同性的氨基酸序列。在一些实施方式中,所述多肽序列是与所比较的序列(例如,SEQ ID NO:5或6)具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。
透化生物样品的方法在本领域是众所周知的。本领域技术人员将知道,可使用不同试剂(例如,蛋白酶、RNA酶、洗涤剂、缓冲剂)并在不同条件(例如,压力、温度、浓度、pH、时间)下处理不同来源的生物样品。在一些实施方式中,透化生物样品可包括试剂和条件以充分破坏生物样品的细胞膜以捕获核酸(例如,mRNA)。在一些实施方式中,透化生物样品可包括试剂和条件以充分破坏生物样品的核膜以捕获核酸(例如,基因组RNA)。在一些实施方式中,可使用从其天然环境(例如,动物、微生物源)分离的市售蛋白酶。在一些实施方式中,可使用重组产生的蛋白酶(例如,细菌表达系统)。在一些实施方式中,预透化和透化生物样品可以是一步过程(例如,酶处理)。在一些实施方式中,预透化和透化生物样品可以是两步过程(例如,酶处理,随后是化学或洗涤剂处理)。
在一些实施方式中,化学透化条件包括将生物样品与碱溶液(例如pH值约为8.0至约11.0,例如约8.5至约10.5或约9.0至约10.0,例如约9.5的缓冲溶液)接触。在一些实施方式中,缓冲液是甘氨酸-KOH缓冲液。其它缓冲液是本领域已知的。
在一些实施方式中,生物样品可在酶处理之后用洗涤剂处理(例如,在预透化步骤之后的透化)。洗涤剂是本领域已知的。可以使用任何合适的洗涤剂,以非限制性方式包括NP-40或等效物、洋地黄苷、吐温-20、IGEPAL-40或等效物、皂甙、SDS、Pitsop2或其组合。在一些实施方式中,生物样品可以用其他已知的可透化细胞膜的化学品处理。如在以下实例中进一步举例说明,本文所述洗涤剂可在约0.01%至约0.1%之间的浓度下使用。在一些实施方式中,本文所述洗涤剂可在约0.2%、约0.3%、约0.4%、约0.5%、约0.6%、约0.7%、约0.8%或约0.9%的浓度下使用。在一些实施方式中,本文所述的洗涤剂可在约1.1%至约10%或更高的浓度下使用。在一些实施方式中,本文所述洗涤剂可在约2%、约3%、约4%、约5%、约6%、约7%、约8%或约9%的浓度下使用。
例如,在Jamur等,Method Mol.Biol.588:63-66,2010中描述了样品透化的其他方法,其全部内容通过引用纳入本文。用于生物样品透化的任何合适方法通常可结合本文所述生物样品使用。
不同来源的生物样品可以用不同的试剂(如蛋白酶、RNA酶、洗涤剂、缓冲剂)和在不同的适宜条件(如压力、温度、浓度、pH值、时间)下处理,以获得足够的预透化和透化以捕获核酸(如基因组DNA、mRNA)。例如,酶处理(例如,胃蛋白酶、胶原酶、蛋白酶K)可在约0.05mg/ml至约1mg/ml(例如,约0.1mg/ml至约0.5mg/ml)的浓度下使用。在一些实施方式中,酶处理可在约1.1mg/ml至约1.9mg/ml的浓度下使用。在一些实施方式中,生物样品可与蛋白酶和/或化学试剂(例如碱性缓冲液)一起孵育约1-10分钟,例如约2、约3、约4、约5、约6、约7、约8或约9分钟。在一些实施方式中,生物样品可与蛋白酶和/或化学试剂(例如碱性缓冲液)一起孵育至少约5分钟,例如至少约10分钟、约12分钟、约15分钟、约18分钟或约20分钟。例如,胶原酶(或其功能等效物)可与生物样品一起孵育约10至约30分钟,例如约20分钟。
在一些实施方式中,生物样品可与蛋白酶和/或化学试剂(例如碱性缓冲液)一起孵育最多约1小时,例如最多约10分钟、约20分钟、约30分钟、约40分钟或约50分钟。在一些实施方式中,生物样品可与蛋白酶和/或化学试剂(例如碱性缓冲液)一起孵育最多约4小时,例如最多约2小时或约3小时。孵育期可取决于酶的浓度和使用条件,例如缓冲液、温度等。在一些实施方式中,蛋白酶可与生物样品一起孵育多于或少于上述时间。
在一些实施方式中,预透化和透化条件可受到各种温度的影响。例如,预透化和透化步骤的代表性温度条件包括在约10℃至约70℃培养,取决于酶。例如,胃蛋白酶和胶原酶可在约10至约44℃、约11至约43℃、约12至约42℃、约13至约41℃、约14至约40℃、约15至约39℃、约16至约38℃、约17至约37℃,例如,约10℃、约12℃、约15℃、约18℃、约20℃、约22℃、约25℃、约28℃,约30°、约33°、约35°或约37℃,例如约30至约40℃,例如约37℃下使用。蛋白酶K可在约40至约70℃,例如约50至约70℃,约60至约70℃,例如约65℃下使用。
在一些实施方式中,可通过任何合适的方式停止预透化和透化步骤(例如,可停止蛋白酶活性)。例如,包含蛋白酶和/或化学试剂的反应混合物(例如,溶液)可从基材(例如,支持物)中移除并从生物样品中分离。或者或者另外,蛋白酶可被抑制(例如,通过添加抑制剂,例如针对胶原酶的EDTA)或变性(例如,通过添加变性剂或提高温度)。
在一些实施方式中,包括本文所述蛋白酶的反应混合物(例如,溶液)可包含足以确保蛋白酶具有功能性的其他试剂(例如,缓冲液、盐等)。例如,反应混合物可进一步包括白蛋白蛋白质(例如,BSA)。在一些实施方式中,包括胶原酶(或其功能变体或衍生物)的反应混合物(例如,溶液)包括白蛋白蛋白质(例如,BSA)。
标签化(Tagmentation)
转座酶和转座子可用于空间基因组分析的方法。一般来说,转座是一个特定的基因序列(如转座子序列)从基因组中的一个位置重新定位到另一个位置的过程。本领域已知许多转座方法和可转座元件(例如,DNA转座子、逆转录转座子、自主转座子、非自主转座子)。转座事件的一个非限制性示例是保守转座。保守转座是一种非复制性转座模式,其中转座子从基因组中完全移除并重新整合到一个新的基因座中,从而使转座子序列是保守的(例如,保守转座事件可以被认为是“剪切粘贴”事件)(参见Griffiths A.J.等,原核生物转座的机制(Mechanism of transposition in prokaryotes)。遗传分析导论(第7版)。纽约:WHF出版公司(W.H.Freeman)(2000年))。
在一个实例中,当转座酶结合侧接转座体末端的序列(例如,识别序列,例如,嵌合端序列)时,可发生剪切粘贴转座。转座体(例如,转座复合物)形成,并且内源性DNA可以被操纵成切除前(pre-excision)复合物,使得两种转座酶可以相互作用。在一些实施方式中,当转座酶相互作用时,双链断裂引入DNA中,导致转座子序列的切除。转座酶可以定位和结合DNA中的靶位点,产生双链断裂,并插入转座子序列(参见Skipper,K.A.等,进化驱动中基于DNA转座子的基因载体(DNA transposon-based gene vehicles-scenes from anevolutionary drive),J Biomed Sci.,20:92(2013)doi:10.1186/1423-0127-20-92)。可供选择的剪切粘贴转座酶包括Tn552(College等,J.BacterioL,183:2384-8,2001;Kirby C等,Mol.Microbiol,43:173-86,2002),Tyl(Devine和Boeke,Nucleic Acids Res.,22:3765-72,1994和国际公开号WO 95/23875),转座子Tn7(Craig,N L,Science.271:1512,1996;Craig,N L,Review in:Curr Top Microbiol Immunol,204:27-48,1996),Tn/O和IS10(Kleckner N等,Curr Top Microbiol Immunol,204:49-82,1996),Mariner转作酶(Lampe D J等,EMBO J.,15:5470-9,1996),Tel(Plasterk R H,Curr.TopicsMicrobiol.Immunol,204:125-43,1996),P Element(Gloor,G B,Methods Mol.Biol,260:97-114,2004),Tn3(Ichikawa和Ohtsubo,JBiol.Chem.265:18829-32,1990),细菌插入序列(Ohtsubo和Sekine,Curr.Top.Microbiol.Immunol.204:1-26,1996),逆转录病毒(Brown等,Proc Natl Acad Sci USA,86:2525-9,1989),和酵母逆转录转座子(Boeke和Corces,Annu Rev Microbiol.43:403-34,1989)。更多的例子包括IS5、TnlO、Tn903、IS911和转座酶家族酶的工程版本(Zhang等,(2009)PLoS Genet.5:el000689.2009年10月16日线上公开;Wilson C.等,(2007)J.Microbiol.Methods 71:332-5)。
在空间基因组分析的一些方法中,DNA片段化的方式使得与捕获探针的捕获域(例如夹板寡核苷酸的捕获域)互补的序列附接到片段化的DNA(例如,片段化的DNA被“加标签(tagged)”),使得附接的序列(例如,衔接子,例如,Nextera衔接子)可以与捕获探针杂交。在一些实施方式中,捕获探针存在于基材上。在一些实施方式中,捕获探针(例如,表面探针和夹板寡核苷酸)存在于特征上。转座体介导的片段化(“标记”)是转座酶介导的DNA片段化和标签化的过程。转座体是转座酶和DNA的复合物,包含转座子末端序列(也称为“转座酶识别序列”或“嵌合端”(ME))。转座体二聚体能够根据其转座体识别序列同时将DNA片段化,并将DNA从转座体连接到片段化的DNA(例如标签化的DNA)。该系统已使用高活性转座酶和修饰的DNA分子(衔接子)进行了调整,包括ME,以片段化DNA,并用功能性DNA分子对DNA双链体片段的两条链加标签(例如,引物结合位点)。例如,Tn5转座酶可以作为纯化的蛋白质单体产生。Tn5转座酶也可在市场上买到(例如,制造商Illumina,Illumina.com,目录号15027865,TD标签化物DNA缓冲液目录号15027866)。这些可随后装载有感兴趣的寡核苷酸,例如,含有用于Tn5识别的ME的ssDNA寡核苷酸和其它功能序列(例如,Nextera衔接子,例如,引物结合位点)经退火以形成在二聚体组装期间被Tn5识别的dsDNA嵌合端寡核苷酸(MEDS)(例如,转座体二聚体)。在一些实施方式中,高活性Tn5转座酶可装载有衔接子(例如,感兴趣的寡核苷酸),其可同时用衔接子序列片段化和标记基因组。
如本文所用,术语“标签化”是指使用测序(ATAC-seq)对转座酶可及染色质进行分析中的步骤。(参见,例如,Buenrostro,J.D.,Giresi,P.G.,Zaba,L.C,Chang,H.Y.,Greenleaf,W.J.,天然染色质转座用于开放染色质、DNA结合蛋白和核小体位置的快速和敏感的表基因组概况分析(Transposition of native chromatin for fast and sensitiveepi genomic profiling of open chromatin,DNA-binding proteins and nucleosomeposition),Nature Methods,10(12):1213-1218(2013))。ATAC-seq使用高活性原核Tn5转座酶识别开放染色质区域,该转座酶优先插入到可及染色质中,并用衔接子标记位点(Buenrostro,J.D.等,天然染色质转座用于开放染色质、DNA结合蛋白和核小体位置的快速和敏感的表基因组概况分析(Transposition of native chromatin for fast andsensitive epigenomic profiling of open chromatin,DNA-binding proteins andnucleosome position).Nat Methods,10:1213-1218(2013))。
在一些实施方式中,将生物样品细胞中的基因组DNA片段化的步骤包括在任何适当条件下将含有基因组DNA的生物样品与转座酶(例如转座体,例如反应混合物(例如溶液))接触(包括转座酶)。在一些实施方式中,这种合适的条件导致生物样品中存在的细胞的基因组DNA的片段化(例如标签化)。一般条件将取决于所使用的转座酶,并且可以使用本领域已知的常规方法来确定。因此,合适的条件可以是转座酶发挥功能的条件(例如缓冲液、盐、浓度、pH、温度、时间条件),例如转座酶在生物样品中显示转座酶活性,特别是标签化活性的条件。
如本文参考转座酶所使用的术语“功能性”意指包括其中转座酶可在对酶最适宜的条件下(例如在制造商建议的缓冲液、盐和温度条件中)显示相对于转座酶活性的一些降低的活性的实施方式。因此,如果转座酶相对于在最适合转座酶的条件下的转座酶的活性具有至少约50%,例如至少约60、约70、约80、约85、约90、约95、约96、约97、约98、约99或约100%的活性,则可认为转座酶具有“功能性”。
在一个非限制性实例中,反应混合物包含缓冲溶液(例如,Tris-乙酸盐)中的转座酶,该缓冲溶液具有约6.5至约8.5(例如,约7.0至约8.0,例如约7.5)的pH。另外或可选择地,反应混合物可在任何适宜温度下使用,例如约10°至约55℃,例如约10°至约54°,约11°至约53°,约12°至约52°,约13°至约51°,约14°至约50°,约15°至约49°,约16°至约48°,约17°至约47℃,例如,约10°、约12°、约15°、约18°、约20°、约22°、约25°、约28°、约30°、约33°、约35°、约37℃或37℃,优选约30°至约40℃,例如约37℃。在一些实施方式中,转座酶可与生物样品接触约10分钟至约1小时。在一些实施方式中,转座酶可与生物样品接触约20、约30、约40或约50分钟。在一些实施方式中,转座酶可与生物样品接触约1小时至约4小时。
在一些实施方式中,转座酶是Tn5转座酶或其功能性衍生物或变体。(参见,例如,Reznikoff等,WO 2001/009363,美国专利号5925545、5965443、7083980和7608434,以及Goryshin和Reznikoff,J.Biol.Chem.273:7367,(1998),通过引用并入本文)。例如,Tn5转座酶可以是融合蛋白(例如,Tn5融合蛋白)。Tn5是RNA酶蛋白质超家族的一员。Tn5转座子是一个复合转座子,其中两个几乎相同的插入序列(IS50L和IS50R)侧接三个抗生素耐药基因。各IS50包含2个反向19-bp末端序列(ES),外侧端(outside end,OE)和内侧端(insideend,IE)。野生型Tn5转座酶通常不活跃(例如,低转座事件活性)。然而,氨基酸取代可以导致高活性变体或衍生物。在一个非限制性实例中,氨基酸取代L372P用亮氨酸氨基酸取代脯氨酸氨基酸,其导致α-螺旋断裂,从而诱导C-末端结构域的构象改变。α螺旋断裂将C端结构域和N端结构域充分分离,以促进更高的转座事件活性(参见Reznikoff,W.S.,Tn5作为理解DNA转座的模型(Tn5 as a model for understanding DNA transposition),MolMicrobiol,47(5):1199-1206(2003))。本领域已知导致高活性Tn5的其它氨基酸取代。例如,可通过提供氨基酸54处的赖氨酸残基(其在野生型Tn5转座酶中为谷氨酸)来实现经修饰转座酶(例如,经修饰的Tn5转座酶)对OE末端重复序列(类别(1)突变)的亲和力的改进(参见美国专利号5925545)。突变强力地改变了修饰转座酶(例如,修饰的Tn5转座酶)对OE末端的偏好(而不是IE末端)。这种突变(称为EK54)与OE末端的较高结合导致转座率比野生型转座酶(例如野生型Tn5转座酶)所看到的高约10倍。54位到缬氨酸的类似变化(例如,EV54)也会导致OE末端的结合/转座有所增加,47位苏氨酸到脯氨酸的变化也是如此(例如,TP47;大约高出10倍)(参见美国专利号5925545)。
已知经修饰转座酶(例如,经修饰的Tn5转座酶)的其它实例。例如,与野生型Tn5转座酶不同的经修饰的Tn5转座酶,其以比野生型Tn5转座酶更大的亲和力结合到供体DNA的重复序列,并且比野生型转座酶更不可能呈现非活性多聚体形式(美国专利号5925545,其全文通过引用并入)。此外,通常描述从供体DNA(例如,衔接子序列,例如Nextera衔接子(例如,顶部和底部衔接子))引入任何可转座元件(例如,Tn5)到靶中的技术在本领域是已知的。(参见例如,美国专利号5,925,545)。进一步的研究已经确定了导致修饰转座酶(例如,修饰的Tn5转座酶)的突变类别(参见美国专利号5965443,其全文通过引用并入)。例如,具有“1类突变”的修饰转座酶(例如,修饰的Tn5转座酶)以比野生型Tn5转座酶更大的亲和力结合到供体DNA的重复序列。此外,具有“2类突变”的经修饰转座酶(例如,经修饰的Tn5转座酶)比野生型Tn5转座酶呈现非活性多聚体形式的可能性更小。已经证明,当结合Weinreich,M.D.,“Tn5转座酶的顺式偏好是由非生产性多聚作用引起的证据(Evidencethat the cis Preference of the Tn5 Transposase is Caused by NonproductiveMultimerization)”,Genes and Development 8:2363-2374(1994)所述的体内偶联试验进行测试时,含有1类和2类突变的修饰转座酶可诱导比野生型转座酶多至少约100倍(+10%)的转座,通过引用并入本文(例如,参见美国专利号5965443)。此外,在充分条件下,使用经修饰的转座酶(例如,经修饰的Tn5转座酶)的转座情况可能更高。仅含有1类突变的修饰转座酶可以比野生型Tn5转座酶更大的亲和力结合到重复序列,使得当在体内测量时,Tn5转座酶诱导的转座比野生型转座酶多约5到约50倍。一种仅含有2类突变的修饰转座酶(例如,使Tn5转座酶(假定为非活性形式)减少的突变比野生型Tn5转座酶(假定为多聚体形式)的可能性小得多,在体内测量时,这样的Tn5转座酶也比野生型转座酶多诱导约5到50倍的转座(见美国专利号5965443)。
在美国专利号5965443中进一步概括地描述了使用经修饰转座酶(例如,经修饰的Tn5转座酶)的其它方法。例如,经修饰的转座酶可为靶DNA提供选择性标记、提供与靶DNA同源的可移植区域、促进将专门的DNA序列插入靶DNA、提供用于DNA测序的引物结合位点或标记或促进用于基因表达的遗传融合的产生。研究和蛋白质结构域作图,以及将其他所需的DNA序列组合在一起(组合遗传学)(美国专利号5965443)。
在染色体或染色体外核酸的随机或半随机位置插入可转座元件(例如,转座子)的其它方法是已知的。例如,包括在生物样品中结合核酸(例如,基因组DNA)与突触复合物的步骤的方法,所述突触复合物包含Tn5转座酶,所述突触复合物与包含适于与Tn5转座酶和可转座元件(例如,转座子)可操作地相互作用的一对核苷酸序列的序列,在介导进入基因组DNA的转座事件的条件下。在这种方法中,突触复合物可以在不利于或阻止突触复合体经历转座事件的条件下在体外形成。转座(例如,转座事件)的频率可以通过使用高活性转座酶(例如,突变的转座酶)或可转座元件(例如,转座子)来增加,其包含在存在高活性转座酶(例如,高活性Tn5转座酶)的情况下适于高效转座事件的序列,或两者(美国专利号6159736,通过引用并入本文)。
美国专利申请公开号US 2010/0120098、美国专利申请公开号US2011/0287435和Satthy,A.T.等,人类免疫细胞发育和肿瘤内T细胞衰竭的大规模平行单细胞染色质景观(Massively parallel single-cell chromatin landscapes of human immune celldevelopment and intratumoral T-cell exhaustion),Nat Biotechnol.,37,925-936(2019)中详细描述了用于处理核酸的方法、组合物和试剂盒,尤其是用于使用转座子组合物对DNA进行片段化和加标签的方法和组合物,其内容通过引用并入本文中。
可以使用任何具有标签化活性的转座酶,例如,任何能够将DNA片段化并将寡核苷酸(例如,衔接子,例如Nextera索引衔接子)连接到片段化(例如,标记的)DNA末端的转座酶。在一些实施方式中,转座酶是能够进行保守转座的任何转座。在一些实施方式中,转座酶是剪切粘贴转座酶。其他种类的转座酶是本领域已知的并且在本发明的范围内。例如,合适的转座酶包括但不限于Mos-1、HyperMuTM,Ts-Tn5,Ts-Tn5059,Hermes,Tn7,或先前所列转座酶的任何功能性变体或衍生物。
在一些实施方式中,Tn5转座酶的高活性变体能够在短时间(例如,约5分钟)的反应中介导双链DNA的片段化和在DNA的两个5′端处的合成寡核苷酸(例如,Nextera衔接子)的连接。然而,由于野生型末端序列具有相对较低的活性,它们有时在体外被高活性嵌合端(ME)序列所取代。Tn5转座酶与19bp ME的复合物有助于转座,前提是插入的DNA足够长,使其中两个序列紧密结合,形成活性的Tn5转座酶同二聚体。
在一些实施方式中,Tn5转座酶或其功能性变体或衍生物包含与SEQ ID NO:1具有至少80%序列相同性的氨基酸序列。在一些实施方式中,Tn5转座酶或其功能性变体或衍生物包含与SEQ ID NO:1具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的氨基酸序列。
在一些实施方式中,转座酶是Mu转座酶或其功能性变体或衍生物。在一些实施方式中,Mu转座酶或其功能性变体或衍生物包含与SEQ ID NO:2具有至少80%序列相同性的氨基酸序列。在一些实施方式中,Mu转座酶或其功能性变体或衍生物包含与SEQ ID NO:2具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的氨基酸序列。
与转座酶(例如,形成转座体的部分的,例如,本文所述的MEDS)的复合物中的衔接子(例如,Nextera衔接子)可包括部分双链寡核苷酸。在一些实施方式中,存在第一衔接子和第二衔接子。在一些实施方式中,第一衔接子可与第一单体复合。在一些实施方式中,第二衔接子可与第二单体复合。在一些实施方式中,与第一衔接子复合的第一单体和与第二单体复合的第二单体可被组装以形成二聚体。在一些实施方式中,衔接子的双链部分包含嵌合端(ME)序列。在一些实施方式中,衔接子(例如,Nextera索引衔接子)的单链部分(5′突出端)包含要并入片段化(例如,标签化的)DNA中的功能域或序列。在一些实施方式中,衔接子可以是Nextera衔接子(例如,索引衔接子)(例如,试剂包括:用于ATAC-seq的NexteraDNA文库准备试剂盒(不再可购)、TDE-1标签化物DNA酶(目录号15027865)、TD标签化物DNA缓冲液(目录号15027866),可从制造商Illumina获得,Illumina.com)。在一些实施方式中,并入片段化(例如,标签化的)DNA的序列是与捕获探针的捕获域互补的序列。在一些实施方式中,与捕获探针的捕获域互补的序列是第一衔接子。在这些实施方式中,功能域位于将被连接到捕获探针的衔接子的链上。换句话说,功能域可以位于ME序列的上游(例如,5′至),例如,在衔接子的5′突出端中。
连接到片段化(例如,标签化的)DNA的衔接子(例如,Nextera索引衔接子,例如,第一和第二衔接子)可以是任何合适的序列。例如,序列可以是病毒序列。在一些实施方式中,序列可以是CRISPR序列。在一些实施方式中,连接到片段化DNA(例如,标签化的DNA)的衔接子(例如,寡核苷酸)可以是CRISPR引导序列。在一些实施方式中,CRISPR引导序列可靶向感兴趣的序列(例如,感兴趣的基因组基因座,例如,基因特异性)。
在一些实施方式中,ME序列是Tn5转座酶识别序列,其与SEQ ID NO.8具有至少80%的序列相同性。在一些实施方式中,Tn5转座酶识别序列包括与SEQ ID NO:8具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列,只要Tn5转座酶、或其变体或衍生物可识别Tn5转座酶序列以诱导转座事件即可。
在一些实施方式中,嵌合端(例如,ME)序列是Mu转座酶识别序列,其与SEQ ID NO:9-14中的任何一个具有至少80%的相同性。在一些实施方式中,Mu转座酶识别序列包括与其比较的序列中的任何一个(例如,SEQ ID NO:9-14中的任何一个)具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列,只要Mu5转座酶或其变体或衍生物可以识别Mu5转座酶序列来诱导转座事件。
在一些实施方式中,在用于在生物样品中空间标记核酸的方法中使用包含与包含转座子末端序列(例如,嵌合端序列)的衔接子(例如,分别与第一和第二单体复合的第一和第二衔接子)复合的转座酶(例如,本文所述的任何转座酶)的组合物。在一些实施方式中,包含转座酶的组合物进一步包含能结合到如本文所述的捕获探针的域(例如,Nextera衔接子,例如,第一衔接子),并且第二衔接子用于空间标记生物样品中的核酸的方法中,例如本文所述的任何方法。
在一些实施方式中,转座酶可以是转座体的形式,转座体包含衔接子(MEDS),其中5′突出端可以磷酸化。在一些实施方式中,所述衔接子(例如Nextera衔接子,例如第一和第二衔接子)可在其与转座酶组装以形成转座体之前被磷酸化。在一些实施方式中,当与转座酶复合时可发生衔接子的磷酸化(例如,转座体中的原位磷酸化)。
如本文提供的示例所示,转座体可包括衔接子(例如,MEDS,例如,包括5′突出端的衔接子,例如Nextera衔接子)。在一些实施方式中,衔接子的5′突出端在其组装在转座体中之前不被磷酸化。在这些实施方式中,5′突出端可具有嵌合端转座酶序列之外的可及5′羟基。在一些实施方式中,可通过在ATP存在下将转座体复合物的这些5′端暴露于多核苷酸激酶(例如,T4-多核苷酸激酶(T4-PNK))来实现组装的转座体复合物的5′突出端的磷酸化。
在一些实施方式中,用转座体(例如,本文所述的任何转座体)对生物样品的基因组DNA进行片段化(例如,标签化)可包括使转座体复合物中的衔接子的5′末端(例如,Nextera衔接子的5′突出端,例如,MEDS)磷酸化的进一步步骤。
在一些实施方式中,本文提供的方法包括提供经处理以磷酸化转座体复合物中的衔接子的5′末端(例如,Nextera衔接子(例如,第一和第二衔接子),例如MEDS,的5′突出端)的转座体的步骤,从而用经处理以使转座体复合物中的衔接子的5′端磷酸化的转座体来片段化生物样品。
任何合适的酶和/或条件可用于磷酸化转座体复合物(例如T4-PNK或T7-PNK)中的衔接子的5′末端(例如衔接子的5′突出端,例如MEDS)。在一些实施方式中,可通过将转座体与缓冲溶液(例如,Tris-HCl,pH约7.0至约8.0,例如,约7.6)中的多核苷酸激酶(例如,T4-PNK或T7-PNK)在约20至约40℃(例如,约25至约37℃)下接触约1至约60分钟(例如,约5到50分钟,大约10到40分钟,大约20到30分钟)来进行磷酸化反应。在一些实施方式中,可在片段化(例如,标签化的)DNA上进行间隙填充和断裂连接。
在一些实施方式中,可通过使用本文所述的衔接子将转座子序列插入基因组DNA中来进行对基因组DNA的空间标记。在一些实施方式中,转座子序列不从基因组DNA中切除。扩增步骤可通过用针对衔接子的引物来进行(例如,将衔接子插入基因组DNA)。扩增产物可包含可通过本文所述方法在空间上标记的可及基因组DNA。
在一些实施方式中,可通过固定在基材表面上的转座体复合物来进行对基因组DNA的空间标记。在一些实施方式中,可通过固定在特征(例如珠)上的转座体复合物来进行对基因组DNA的空间标记。在一些实施方式中,在将生物样品添加到基材或特征之前组装转座体复合物。在一些实施方式中,在将生物样品添加到基材或基材上的特征之后组装转座体复合物。例如,空间条形码基材(例如,阵列)可以包括包括嵌合端序列(例如,转座酶识别序列)的多个捕获探针。嵌合端序列可位于捕获探针的3′端(例如,捕获探针由其5′端固定,嵌合端序列位于捕获探针的3′最末端)。嵌合端序列可以是本文所述转座酶的任何一种的嵌合端序列。嵌合端序列(例如转座酶识别序列)可与反向互补序列(例如寡核苷酸)杂交。例如,反向互补序列(例如,嵌合端序列的反向互补物)可以与嵌合端序列杂交,从而在捕获探针上产生双链DNA的一部分。在将生物样品提供给基材之前,可将嵌合端序列(例如寡核苷酸)的反向互补物提供给空间条码化阵列。在一些实施方式中,可在已将生物样品提供给基材之后提供对嵌合端序列的反向互补物。转座酶可提供给基材并在捕获探针的双链部分处组装(例如,相互杂交的反向互补寡核苷酸和嵌合端序列),由此产生转座体复合物。例如,在捕获探针的双链部分可以形成转座体同二聚体。可将生物样品提供给基材,使得基材上的捕获探针的位置可与生物样品中的位置(例如,位置)相关。转座体复合物可以片段化(例如标签化)并在空间上标记基因组DNA。
在一些实施方式中,可通过将单链捕获探针与片段化(例如,标签化的)DNA杂交来进行空间标记基因组DNA。在一些实施方式中,单链捕获探针可以是简并序列。在一些实施方式中,单链捕获可以是随机序列。单链捕获探针可具有功能域、空间条形码、独特分子标识符、裂解域或其组合。单链捕获探针(例如,随机序列、简并序列)可以非特异性地杂交标记的基因组DNA,从而在空间上捕获片段化(例如,标签化的)DNA。本领域已知用于延伸反应的方法,并且可以进行本文所述的任何合适的延伸反应方法。
夹板寡核苷酸
如本文所用,术语“夹板寡核苷酸(splint oligonucleotide)”是一种寡核苷酸,当与其他多核苷酸杂交时,它起到“夹板”的作用(例如,夹板辅助探针),使多核苷酸彼此相邻,以便它们可以连接在一起。在一些实施方式中,夹板寡核苷酸是DNA或RNA。夹板寡核苷酸可以包括与来自两个或更多个不同寡核苷酸的核苷酸序列部分互补的核苷酸序列。在一些实施方式中,夹板寡核苷酸协助连接“供体”寡核苷酸和“受体”寡核苷酸。在一些实施方式中,RNA连接酶、DNA连接酶或其他连接酶可用于将两个核苷酸序列连接在一起。
在一些实施方式中,夹板寡核苷酸的长度可在约10至约50个核苷酸之间,例如,在约10至约45个核苷酸之间、约10至约40个核苷酸之间、约10至约35个核苷酸之间、约10至约30个核苷酸之间、约10至约25个核苷酸之间或约10至约20个核苷酸之间。在一些实施方式中,夹板寡核苷酸的长度可在约15至约50、约15至约45、约15至约40、约15至约35、约15至约30、约15至约30或约15至约25个核苷酸之间。在一些实施方式中,片段化DNA可包括在DNA片段化期间添加(例如,连接)的序列。例如,在转座事件(例如,Tn5转座事件)期间,可以将其它序列附接(例如,共价附接,例如,通过连接事件)到片段化DNA(例如,片段化基因组DNA,例如,标签化基因组DNA)。在一些实施方式中,夹板寡核苷酸可具有与片段化DNA(例如片段化基因组DNA,例如包括在DNA片段化期间添加的序列,在DNA片段化期间附接的第一衔接子的片段化基因组DNA)互补的序列(例如,捕获域),和与表面探针互补的序列(例如,捕获探针的部分)。在一些实施方式中,夹板寡核苷酸可被视为捕获探针的部分。例如,捕获探针可以是部分双链的,其中捕获探针的部分可以作为夹板寡核苷酸起作用,该夹板寡核苷酸结合捕获探针的部分(例如,dsDNA部分),并且可以具有单链部分,该单链部分可以结合(例如,捕获域)片段化DNA(例如,片段化基因组DNA,例如,标签化的,例如,DNA片段化过程中附接的衔接子,例如Nextera衔接子)。第一衔接子序列(例如,附接到与捕获域互补的片段化DNA的序列,例如Nextera衔接子)可以是任何合适的序列。在一些实施方式中,衔接子序列的长度可在约15至25个核苷酸之间。在一些实施方式中,衔接子序列的长度可为约16、约17、约18、约19、约20、约21、约22、约23或约24个核苷酸。在一些实施方式中,第一衔接子序列(例如,Nextera衔接子)(例如,第一衔接子)包括序列GTCTCGTGGGCTCGG(SEQ ID NO:16)。在一些实施方式中,附接到片段化(例如,标签化的)DNA的其它序列包括与SEQ ID NO:16具有至少80%序列相同性的序列。在一些实施方式中,附接到片段化DNA的其它序列(例如Nextera衔接子)包括与SEQ ID NO:16具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。在一些实施方式中,第二衔接子序列(例如Nextera衔接子)可附接到片段化DNA(例如标签化的DNA),其包括序列TCGTCGGCGTC(SEQ ID NO:20)。在一些实施方式中,附接到片段化DNA(例如,标签化的DNA)的第二衔接子序列(例如,Nextera衔接子)包括与SEQ ID NO:20具有至少80%序列相同性的序列。在一些实施方式中,附接到片段化(例如,标签化的)DNA的第二衔接子序列(例如Nextera衔接子)包括与SEQ ID NO:20具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。在一些实施方式中,夹板寡核苷酸可包括与附接到片段化DNA(例如,标签化的DNA)的第一衔接子互补的序列(例如,捕获域)。在一些实施方式中,夹板寡核苷酸(例如,捕获探针的夹板寡核苷酸)的捕获域(例如,与第一衔接子(例如,Nextera衔接子)互补)可包括序列CCGAGCCCACGAGAC(参见图40;SEQID NO:17)。在一些实施方式中,捕获域包括与SEQ ID NO:17具有至少80%相同性的序列。在一些实施方式中,捕获域(例如,与第一衔接子,例如Nextera衔接子互补的序列)包括与SEQ ID NO:17具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。在一些实施方式中,夹板寡核苷酸包括与附接到片段化DNA(例如,标签化的DNA)的第一衔接子(例如,Nextera衔接子)不完全互补,但是仍然能够杂交连接到片段化DNA的第一衔接子序列(例如,与捕获域互补的序列)(例如Nextera衔接子)的序列。
具有与夹板寡核苷酸杂交的杂交结构域的各种捕获探针中的任何一种可根据本文所述的材料和方法使用。如本文所述,杂交结构域是表面探针上的结构域,其能够杂交夹板寡核苷酸以形成部分双链捕获探针。例如,单链表面探针可具有与夹板寡核苷酸的部分互补的序列(例如杂交结构域),使得形成具有单链捕获结构域(例如夹板寡核苷酸上的捕获结构域)的部分双链捕获探针。在一些实施方式中,表面探针(例如,捕获探针的)可包括杂交结构域,其包括序列TGCACGCGGTGTACAGACGT(SEQ ID NO:18)。在一些实施方式中,表面探针(例如,捕获探针的)可包括杂交结构域,该杂交结构域包括与SEQ ID NO:18具有至少80%相同性的序列。在一些实施方式中,捕获域包括与SEQ ID NO:18具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。在一些实施方式中,夹板寡核苷酸包括与表面探针的杂交结构域互补(例如,至少部分互补)的序列。在一些实施方式中,与表面探针的杂交结构域互补的夹板寡核苷酸(例如捕获探针的)的序列(SEQ ID NO:18)包括序列ACGTCTGTACACCGCGTGCA(SEQ ID NO:19)。在一些实施方式中,与捕获的捕获域互补的夹板寡核苷酸的序列包括与SEQ ID NO:19具有至少80%序列相同性的序列。在一些实施方式中,与表面探针的杂交结构域互补(例如,至少部分互补)的夹板寡核苷酸的序列包括与SEQID NO:19具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。在一些实施方式中,夹板寡核苷酸包括与表面探针的杂交结构域不完全互补,但仍然能够与表面探针的杂交结构域杂交的序列。在一些实施方式中,夹板寡核苷酸可通过其捕获域与第一衔接子(例如,附接到片段化DNA的其它序列,例如,标签化的DNA)并通过其与杂交结构域互补的序列与表面探针的杂交结构域杂交。在这样的实施方式中,如果夹板寡核苷酸可以与第一衔接子(例如Nextera衔接子,附接到片段化DNA的其它序列,例如标签化的DNA)和表面探针的杂交结构域杂交,则夹板寡核苷酸可以被视为捕获探针的部分。在一些实施方式中,引物可具有能够杂交表面探针(例如,捕获探针的表面探针)序列的序列。例如,引物可以具有包括序列ACACGACGCTCTTCCGATCT(SEQ ID NO:21)的序列。在一些实施方式中,能够杂交捕获探针的表面探针的部分的序列(例如,A-short正向,参见图40)包括与SEQ ID NO:21具有至少80%序列相同性的序列。在一些实施方式中,与捕获探针的部分互补(例如,至少部分互补)的序列(例如,A-short正向)包括与SEQ ID NO:21具有至少约90、91、92、93、94、95、96、97、98或99%序列相同性的序列。
在一些实施方式中,夹板寡核苷酸可具有均聚的捕获域。例如,捕获域可以是多聚(T)捕获域。
在一些实施方式中,夹板寡核苷酸可促进片段化DNA(例如标签化的DNA)和表面探针的连接。可以使用本领域已知或本文所述的任何种类的合适连接酶。在一些实施方式中,连接酶为T4 DNA连接酶。在一些实施方式中,连接反应可持续约1至约5小时。在一些实施方式中,连接反应可持续约2小时、约3小时或约4小时。在一些实施方式中,在连接之后,可以进行链置换聚合。在一些实施方式中,DNA聚合酶可用于进行链置换聚合。在一些实施方式中,DNA聚合酶是DNA聚合酶I。
多重化分析
本发明描述了用于在足以允许基因组DNA片段化(例如标签化)的条件下透化生物样品的方法。片段化的(例如,标签化的)DNA可通过捕获探针(例如,表面探针和夹板寡核苷酸)捕获,然而,有时同时捕获片段化的(例如,标签化的DNA)和其他核酸(例如,mRNA)是有用的。例如,转录本的表达谱可以与开放染色质相关(或不相关)。换句话说,转录本的存在可以与对应于转录转录本的基因(如基因组DNA)的开放染色质(如可及染色质)相关。
本发明描述关于在空间条码化阵列上同时捕获片段化DNA(例如,标签化的DNA)和mRNA的方法。例如,空间条码化阵列可以具有固定在基材表面上的多个捕获探针。或者,空间条码化阵列可以具有固定在特征上的多个捕获探针。在一些实施方式中,具有多个捕获探针的特征可以在基材上。捕获探针可以具有与基材上的位置(例如,位置)相对应的独特空间条形码。在一些实施方式中,捕获探针可进一步具有独特分子标识符、功能域和裂解域或其组合。在一些实施方式中,捕获探针可以具有捕获域。在一些实施方式中,捕获探针可以是均聚序列。例如,以非限制性方式,均聚物序列可以是多聚(T)序列。在一些实施方式中,核酸(例如,mRNA)可通过结合(例如,杂交)mRNA转录本的多聚(A)尾被捕获域捕获。在一些实施方式中,片段化DNA(例如,标签化的DNA)可通过结合(例如,杂交)多聚(A)尾片段化DNA(例如,标签化的DNA)由捕获探针的捕获域捕获。例如,基因组DNA片段化后,间隙填充(如无链置换)聚合酶和连接酶可以修复片段化(如标签化的DNA)中的间隙和连接断裂。在一些实施方式中,可将与捕获域互补的序列引入片段化DNA。例如,可将多聚(A)尾添加到片段化(例如,标签化的)DNA,使得捕获探针的捕获域(例如,多聚(T)序列)可结合(例如,杂交)到多聚(A)尾片段化(例如,标签化的DNA)(参见,例如,通过引用并入本文的WO 2012/140224)。在一些实施方式中,可通过末端转移酶将多聚(A)尾添加到片段化DNA(例如,标签化)中。在一些实施方式中,末端转移酶可以是末端脱氧核苷酸转移酶(TDT)或其突变变体。TDT是一种独立的聚合酶(例如,它不需要模板分子),其可以催化脱氧核苷酸添加到DNA分子的3′羟基末端。本领域已知其它与模板无关的聚合酶。例如,聚合酶θ或其突变体可用作末端转移酶(参见,例如,Kent,T.,聚合酶θ是末端连接期间在三种不同机制之间摆动的强力末端转移酶(Polymerase θ is a robust terminal transferase that oscillatesbetween three different mechanisms during end-joining),eLIFE,5:e13740 doi:10.7554/eLife.13740,(2016))。本领域已知引入多聚(A)尾的其它方法。在一些实施方式中,可通过非校对聚合酶将多聚(A)尾引入片段化DNA(例如,标签化的DNA)。在一些实施方式中,可通过多核苷酸激酶将多聚(A)尾引入片段化DNA。
在一些实施方式中,TDT酶将产生具有3′多聚(A)尾的片段(例如标签化物),从而模仿mRNA的多聚(A)尾。在一些实施方式中,捕获探针的捕获域(例如,多聚(T)序列)将与mRNA的多聚(A)尾和添加到片段化(例如,标签化的)DNA的生成(例如,合成)多聚(A)尾相互作用,从而同时捕获片段化DNA(例如,标签化的DNA)和mRNA转录本。片段化DNA(例如,标签化的DNA)上产生的(例如,合成的)多聚(A)尾的长度可以在约10个核苷酸到约30个核苷酸之间。片段化DNA(例如,标签化的DNA)上生成的(例如,合成的)多聚(A)尾的长度可以是约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28或约29个核苷酸。
此外或或者,片段化(例如标签化的)DNA可以与聚合酶接触,而不是顺序(例如两步)反应(例如,间隙填充和连接,然后是末端转移酶)。例如,聚合酶可以是DNA聚合酶,其可以对片段化(例如,标签化的)DNA进行延伸反应。可以使用本领域已知或本文所述的任何种类的DNA聚合酶。可通过本文所述的任何方法捕获和处理延伸产物(例如,扩增和测序)。
杂交后的步骤与
Figure BDA0003042696400002621
P.L.等,通过空间转录组学可视化和分析组织切片中的基因表达(Visualization and analysis of gene expression in tissue sections byspatial transcriptomics),Science,卷353,6294,第78-82页(2016)中所述的步骤相同,其通过引用并入本文中)。
qPCR和分析
本文还提供了用于定量捕获效率的方法和材料。在一些实施方式中,捕获效率的定量包括对来自本文所述的任何空间分析方法的捕获的片段(例如,基因组DNA片段,例如,标签化的DNA片段)的定量。在一些实施方式中,定量包括PCR、qPCR、电泳、毛细管电泳、荧光光谱和/或紫外分光光度法。在一些实施方式中,qPCR包括插入荧光染料(例如SYBR绿)和/或荧光标记探针(例如但不限于Taqman探针或PrimeTime探针)。在一些实施方式中,NGS库定量试剂盒用于定量。例如,可以使用KAPA库定量试剂盒(KAPA Biosystems)、qPCR NGS库定量试剂盒(安捷伦(Agilent))、GeneRead库定量系统(凯杰(Qiagen))和/或PerfeCTa NGS定量试剂盒(Quantabio)进行定量。在使用qPCR进行定量的一些实施方式中,qPCR可以包括但不限于数字PCR、液滴数字(ddPCR)和ddPCR尾。在使用电泳进行定量的一些实施方式中,电泳可包括但不限于自动电泳(例如TapeStation系统,安捷伦和/或Bioanalzyer,安捷伦)和毛细管电泳(例如片段分析器,应用生物系统公司(Applied Biosystems))。在使用光谱进行定量的一些实施方式中,光谱可以包括但不限于荧光光谱(例如,Qubit,赛默飞世尔(Thermo Fisher))。在一些实施方式中,NGS可用于定量捕获效率。
在一些实施方式中,对捕获的标签化物进行定量PCR(qPCR)。在一些实施方式中,在捕获之前,通过本文所述的任何方法扩增片段化(例如,标签化的)DNA。例如,在捕获片段化DNA(例如,标签化的DNA)之后,可以进行连接和链置换杂交qPCR。在一些实施方式中,DNA聚合酶可用于进行链置换聚合。可以使用本领域已知的任何合适的链置换聚合酶。在一些实施方式中,DNA聚合酶是DNA聚合酶I。如实施方式中所例示,DNA聚合酶I可与试剂(例如BSA、dNTP、缓冲液)一起孵育用于片段化DNA(例如标签化的DNA)的链置换。在一些实施方式中,DNA聚合酶I可与试剂在基材上(例如,在特征上,例如,孔上)孵育约30分钟至约2小时。在一些实施方式中,DNA聚合酶I可与基材上的试剂一起孵育约40分钟、约50分钟、约60分钟、约70分钟、约80分钟、约90分钟、约100分钟或约110分钟。在一些实施方式中,DNA聚合酶I可在约35℃至约40℃的温度下与试剂在基材上(例如,在特征上,例如,孔上)孵育。在一些实施方式中,DNA聚合酶I可在约36℃、约37℃、约38℃或约38℃或约39℃的温度下与试剂在基材上孵育。在一些实施方式中,DNA聚合酶I可在约37℃与试剂在基材上孵育约1小时。
链置换杂交完成后,可以进行qPCR反应。如以下示例所示,连接到片段化DNA(例如,标签化的DNA)的捕获探针可从基材(例如,特征)的表面释放。在一些实施方式中,溶液(例如释放混合物)可与基材一起孵育以从基材表面释放捕获探针。释放混合物可包含试剂(例如BSA、酶、缓冲液)。本文描述从基材(例如,特征)释放捕获探针的方法。在一些实施方式中,酶可切割捕获探针。在一些实施方式中,该酶可以是USER(尿嘧啶特异性切除试剂)酶。在一些实施方式中,USER酶可与试剂在基材上(例如,特征,例如,孔)孵育约30分钟至约2小时。在一些实施方式中,USER酶可与基材上的试剂一起孵育约40分钟、约50分钟、约60分钟、约70分钟、约80分钟、约90分钟、约100分钟或约110分钟。在一些实施方式中,USER酶可在约35℃至约40℃的温度下与试剂在基材上(例如,特征,例如,孔)孵育。在一些实施方式中,USER酶可在约36℃、约37℃、约38℃或约39℃的温度下与试剂在基材上孵育。在一些实施方式中,USER酶可在约37℃与试剂在基材上孵育约1小时。
在与USER酶孵育后,可以收集样品(例如,连接到释放混合物中的片段化DNA(例如,标签化的DNA)或其部分的释放的捕获探针)。在一些实施方式中,可以减小样品体积。本领域已知减小样品体积的方法,并且可以使用任何合适的方法。在一些实施方式中,减小样品体积可以用速度真空(例如,SpeedVac)来进行。在一些实施方式中,减小样品体积可为减小约50、约55、约60、约65、约70、约75、约80、约85或约90%样品体积。在一些实施方式中,减小样品体积可以是大约80%到90%样品体积减小。在一些实施方式中,减小样品体积可为减小约81、约82、约83、约84、约85、约86、约87、约88或约89%样品体积。在一些实施方式中,减小样品体积可为约85%(例如,减小样品体积后约10μL)。
在一些实施方式中,可以使用减少的样品体积来进行qPCR反应。如本文所述,可以进行qPCR的任何合适方法。如示例所示,可以使用1xKAPA HiFI HotStart Ready、1x EVA绿和引物。可以根据本领域的已知方法进行扩增。例如,可以相应地进行扩增:72℃10分钟,98℃3分钟,然后在98℃20秒,60℃30秒,72℃30秒下循环。
在一些实施方式中,一个或多个引物对可在qPCR反应期间使用。如本文实施例中所述,引物对可覆盖连接部分(例如,捕获探针和衔接子序列(例如,连接到片段化DNA,例如,标签化的DNA的序列)所在的连接位点)。例如,引物对(A-short正向和Nextera反向(图40);分别为SEQ ID NO:21和20)覆盖连接部分和捕获探针。一个扩增产物将只在连接时被检测到,而不仅仅是杂交已经发生。在一些实施方式中,不同的引物对(例如Nextera正向和Nextera反向(图40);分别为SEQ ID NO:16和20)可以仅覆盖片段化DNA(例如标签化的DNA)。在一些实施方式中,仅覆盖片段化DNA(例如,标签化的DNA)的引物对是连接的对照。在一些实施方式中,可使用本文所述的任何标记核苷酸来进行qPCR。
在一些实施方式中,可以纯化样品。在一些实施方式中,样品可根据Lundin等,通过平行化用于大规模测序的文库制备来增加通量(Increased Throughput byParallelization of Library Preparation for Massive Sequencing),PLOS ONE,5(4),doi.org/10.1371/journal.pone.0010029(2010)所述纯化,其通过引用并入本文。
在一些实施方式中,可确定捕获的片段化DNA(例如,标签化的DNA)的平均长度。在一些实施方式中,可使用生物分析仪(例如,2100生物分析仪(安捷伦))。可以使用本领域已知的任何合适的生物分析仪。在一些实施方式中,qPCR和生物分析仪分析可在全基因组上进行(例如,纯化的片段化DNA,例如,标签化的DNA)。在一些实施方式中,qPCR和生物分析仪分析可在固定的生物样品(例如,固定生物样品)上进行。例如,可以进行本文所述的方法(例如,预透化、透化)以捕获片段化DNA(例如,标签化的DNA)并针对不同生物样品优化qPCR和生物分析仪分析。
在一些实施方式中,在连接之后,可以进行基于表面的变性步骤。换言之,在将片段化DNA(例如,标签化的DNA)连接到捕获探针之后,接着进行本文所述的链置换杂交(例如,DNA聚合酶I),可以在平行工作流中进行基于表面的变性步骤。在一些实施方式中,碱性溶液可进行基于表面的变性。例如,碱性溶液可使捕获的双链片段化DNA(例如,标签化的DNA)变性,从而产生连接到片段化DNA(例如,标签化的DNA)的捕获的单链捕获探针。在一些实施方式中,碱性溶液可为约1M NaOH。其他碱性溶液可用于本文所述的方法中。在一些实施方式中,碱性溶液可施用约1分钟至约1小时。在一些实施方式中,碱性溶液可施用约10、约20、约30、约40或约50分钟。在一些实施方式中,碱性溶液可施用约1分钟至约20分钟。在一些实施方式中,碱性溶液可施用约2分钟、约3分钟、约4分钟、约5分钟、约6分钟、约7分钟、约8分钟、约9分钟、约10分钟、约11分钟、约12分钟、约13分钟、约14分钟、约15分钟、约16分钟、约17分钟、约18分钟或约19分钟。在一些实施方式中,可在约30℃至约40℃的温度下施用碱性溶液。在一些实施方式中,可在约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃或约39℃下施用碱性溶液。在一些实施方式中,可在约37℃下施用碱性溶液约10分钟。
在一些实施方式中,变性步骤可通过探针使片段化DNA(例如标记的DNA)暴露于杂交。在一些实施方式中,探针可以是寡核苷酸探针。在一些实施方式中,寡核苷酸探针可具有可检测标签(例如,本文所述的各种可检测标签中的任何一种)。在一些实施方式中,可检测标签可以是Cy5。在一些实施方式中,寡核苷酸探针可被Cy5标记。在一些实施方式中,Cy5标记的寡核苷酸探针可与片段化DNA(例如,标签化的DNA)中的互补序列杂交。在一些实施方式中,Cy5标记的寡核苷酸可与附接到片段化DNA(例如标签化的DNA)的序列(例如Nextera衔接子,例如第一衔接子或第二衔接子)杂交。在一些实施方式中,可以检测Cy5标签。例如,检测寡核苷酸探针中的Cy5标签可以揭示DNA标签化物的空间位置。在一些实施方式中,可对生物样品进行染色(例如,苏木精和伊红染色)。对生物样品进行染色的方法在本领域中是已知的并且在本文中描述。在一些实施方式中,可以对生物样品成像。
实施方式
因此,在一个实施方式中,本发明提供了一种用于对生物试样的核酸进行空间标记的方法,包括:
(a)提供一种固体基材,其上固定有多种捕获探针,使得每种捕获探针占据固体基材上的不同位置,其中所述捕获探针用于延伸或连接反应,并且其中所述捕获探针的每种包含核酸分子,所述核酸分子包括:
(i)与固体基材上的捕获探针的位置相对应的位置域,以及
(iii)捕获域;
(b)将所述固体基材与生物试样接触;
(c)在足以使生物试样中的DNA可接触转座酶的条件下透化生物试样;
(d)用转座酶将所述生物试验中的DNA片段化;
(e)将存在于来自(d)中的生物试样中的片段化DNA与捕获探针的捕获域杂交;以及
(f)延伸捕获探针:
(i)使用与所述捕获探针杂交的DNA作为延伸或连接模板来产生延伸探针,所述延伸探针包含位置域的序列和与所述捕获探针的捕获域杂交的DNA互补的序列;或
(ii)使用捕获探针作为连接模板来产生包含位置域或其互补物的序列和与捕获探针的捕获域杂交的DNA序列的延伸的探针,从而在空间上标记生物试样的DNA。
如下面更详细地讨论的,本发明的方法可以包括分析延伸的探针的附加步骤。在这方面,显而易见的是,来自生物试样的核酸的空间标记和随后对所述标记的核酸的分析的组合有助于对生物试样(例如组织样品)中的核酸的定位检测。因此,在一个实施方式中,本发明的方法可用于测定和/或分析生物试样的所有基因组或基因组和转录组。然而,该方法不限于此,并且包括测定和/或分析全部或部分基因组或全部部分基因组和转录组。因此,该方法可涉及确定和/或分析基因组或基因组和转录组的部分或子集,例如对应于基因子集的基因组,例如一组特定基因,例如与特定疾病或病症、组织类型等相关。
在其它实施方式中,本发明提供了一种用于对生物试样的核酸进行空间标记的方法,包括:
(a)提供一种固体基材,其包括附接到所述固体基材的多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域和位置域,其中所述位置域对应于所述固体基材上的不同位置;
(b)将所述固体基材与生物试样接触;
(c)在足以使生物试样中的DNA可接触转座酶的条件下透化生物试样;
(d)用转座酶将所述生物试验中的DNA片段化;
(e)将存在于来自(d)中的生物试样中的片段化DNA与捕获探针的捕获域接触;以及
(f)延伸捕获探针,
从而对生物试样的DNA进行空间标记。
在一些实施方式中,接触片段化DNA的步骤(e)包括(i)使用与所述捕获探针接触的DNA作为延伸或连接模板来产生延伸的探针,所述延伸的探针包含位置域的序列和与所述捕获探针的捕获域杂交的DNA互补的序列,(ii)使用捕获探针作为连接模板来产生延伸的探针,其包含位置域或其互补物的序列和与捕获探针的捕获域杂交的DNA的序列。
从另一方面来看,上述方法步骤可被视为提供获得空间上定义的基因组或基因组和转录组的方法,尤其是获得生物试样(例如组织样品)的空间上确定的基因组或基因组和转录组的方法。
或者,本发明的方法可被视为用于对生物试样(例如组织样品)中的核酸(无论是DNA还是DNA和RNA两者)进行定位或空间检测的方法,或者用于对组织样品中的核酸(DNA或DNA和RNA两者)进行定位或空间测定和/或分析的方法。具体而言,该方法可用于组织样品中的基因组变异或基因组变异和基因表达的局部或空间检测或测定和/或分析。定位/空间检测/测定/分析意味着DNA或DNA和RNA两者可定位于其在组织样品中的细胞或组织内的天然定位或位置。因此,例如,DNA或DNA和RNA两者可定位于样品中的一个细胞或一组细胞或细胞类型,或定位于组织样品内区域的特定区域。可以确定DNA或DNA和RNA的天然定位或位置(或者换句话说,DNA或DNA和RNA在组织样品中的定位或位置),例如基因组基因座或基因组基因座和表达的基因。
因此,在一些实施方式中,本发明提供一种用于生物样品中核酸的定位检测的方法,包括:
(a)提供一种固体基材,其上固定有多种捕获探针,使得每种捕获探针占据固体基材上的不同位置,其中所述捕获探针用于延伸或连接反应,并且其中所述捕获探针的每种包含核酸分子,所述核酸分子包括:
(i)与固体基材上的捕获探针的位置相对应的位置域,以及
(ii)捕获域;
(b)将所述固体基材与生物试样接触;
(c)在足以使生物试样中的DNA可接触转座酶的条件下透化生物试样;
(d)用转座酶将所述生物试验中的DNA片段化;
(e)将存在于来自(d)中的生物试样中的片段化DNA与捕获探针的捕获域杂交;以及
(f)延伸捕获探针:
(i)使用与所述捕获探针杂交的DNA作为延伸或连接模板来产生延伸探针,所述延伸探针包含位置域的序列和与所述捕获探针的捕获域杂交的DNA互补的序列;或
(ii)使用捕获探针作为连接模板来产生延伸的探针,所述延伸的探针包含位置域或其互补物的序列以及与捕获探针的捕获域杂交的DNA的序列,
从而在空间上标记生物试样的DNA;以及
(g)分析(f)的延伸的探针,即分析生物试样的空间标记的核酸。
所述方法还可包括从所述固体基材的表面释放(f)的延伸探针的步骤,所述延伸的探针包括所述位置域的序列和与所述捕获探针的捕获域杂交的核酸互补的序列或所述延伸的探针包括所述位置域的序列或其互补物以及与捕获探针的捕获域杂交的DNA的序列。如下文更详细地讨论的,可通过任何合适的方式将延伸的探针从基材表面释放。在一些实施方式中,可在分析步骤(步骤(g))之前释放延伸的探针,但这不是必需的。例如,作为分析步骤的部分,延伸的探针可从基材表面释放。
可以在分析步骤(步骤(g))中使用任何核酸分析方法。通常,这可能涉及测序,即分析延伸的探针的序列,但不必进行实际的序列测定。例如,可以使用序列特异性的分析方法。例如,序列特异性扩增反应可例如使用对位置域和/或特定靶序列(例如待检测的特定靶DNA)(即对应于特定cDNA/RNA和/或基因、基因间或基因内区域等)特异性的引物来进行。示例性分析方法是序列特异性PCR反应。
在步骤(g)中获得的序列分析信息可用于获得关于生物试样(例如组织样品)中的DNA和/或RNA的空间信息。换句话说,序列分析信息可以提供关于DNA和/或RNA在生物试样(例如组织样品)中的位置的信息。该空间信息可源自所确定的序列分析信息的性质,例如,其可揭示特定DNA和/或RNA的存在,其本身可在所使用的生物试样(例如,组织样品)的上下文中提供空间信息,和/或空间信息(例如,空间定位)可衍生自生物试样(如组织样品)在固体基材(如阵列)上的位置,结合测序信息。因此,该方法可涉及简单地将序列分析信息与生物试样(例如组织样品)中的位置相关,例如借助于位置标记及其与生物试样(例如组织样品)中的位置相关。然而,在一些实施方式中,可以通过将序列分析数据与生物试样(例如组织样品)的图像相关来方便地获得空间信息。因此,在优选实施方式中,该方法还包括以下步骤:
(h)将所述序列分析信息与所述生物试样的图像相关,其中所述生物试样在步骤(b)之后成像。在一些实施方式中,在步骤(c)或(d)之前对生物试样成像。
因此可以看出,本发明的阵列可用于捕获与所述固体基材(例如阵列)接触的生物试样(例如组织样品)的DNA(例如基因组DNA)或DNA和RNA(例如mRNA)。因此,本发明的方法可被视为定量组织样品中一种或多种基因的空间变异(例如,拷贝数变异)的方法。以另一种方式表示,本发明的方法可用于检测生物试样(例如组织样品)中的一种或多种基因的空间变异。以另一种方式,本发明的方法可用于同时确定生物试样(例如组织样品)内一个或多个位置处的一种或多种基因的变异。更进一步地,所述方法可被视为用于以二维空间分辨率对生物试样(例如组织样品)进行部分或全局基因组或基因组和转录组分析的方法。
显而易见,当本发明的方法用于分析生物试样的组织切片中的DNA或DNA和RNA两者以产生二维基因组或基因组和转录组时,来自同一生物试样(组织样品)的其他组织切片(特别是相邻组织切片)的分析的数据可以经编辑以提供生物试样的三维基因组或基因组和转录组。
因此,在最广泛的范围内,本发明可被视为在固定的生物试样(例如,固体基材上的组织切片)中应用标签化以促进生物试样中DNA的空间标记(加标签),优选地使用如本文所定义的方法。
在另一方面中,本发明提供用于本文所述方法中的试剂盒。该试剂盒可包括以下任何两项或更多项:
(i)固体基材(例如阵列),其上固定有多种捕获探针,如上文所定义;
(ii)用于透化生物试样以使其可接触转座酶的手段,特别是本文所定义的酶或化学手段;
(iii)标签化生物试样中DNA的手段,特别是本文定义的转座体;
(iv)用于延伸捕获探针的手段,例如逆转录酶、DNA聚合酶、DNA连接酶或上述定义的其混合物;和
(v)用于从固体基材释放延伸的探针的手段,特别是上述定义的裂解酶或其混合物。
在一些实施方式中,试剂盒可另外或替代地包含用于与上文定义的手段一起使用的组分,例如适合于上文定义的酶的缓冲液和基材(例如dNTP)。在一些实施方式中,试剂盒可包括用于产生第二链DNA分子(例如辅助探针、引物、衔接子等)和/或用于扩增延伸的探针(例如DNA聚合酶、引物、基材、缓冲液等)的手段。
在一些实施方式中,试剂盒可包括用于产生固体基材的组件。例如,固体基材可提供有表面探针,并且试剂盒可包含用于产生本发明捕获探针的试剂,例如捕获域寡核苷酸。在一些实施方式中,如上文所述,试剂盒包括固体基材和用于使用桥式扩增产生捕获探针的手段。在一些实施方式中,试剂盒可包括用于生成用于上述本发明方法中的珠阵列的手段,例如,可将珠固定在其上的固体基材和将本发明捕获探针固定在其上的珠。在一些实施方式中,试剂盒可包括用于解码阵列的手段,例如如上所述的解码器探针。
在一些实施方式中,试剂盒可包括用于固定和/或染色生物试样的手段。
在一些实施方式中,试剂盒可包括用于纯化已从基材表面释放的延伸的探针和/或其扩增子的手段。
“标签化(tagmentation)”是指转座酶介导的DNA片段化和标记的过程。标签化通常涉及到转座体复合物对DNA的修饰,并导致“标签化物(tagment)”或带标签的DNA片段的形成。
“转座体”或“转座体复合物”是转座酶和DNA的复合物,包含转座子末端序列(也称为“转座酶识别序列”或“嵌合端”(ME))。
与转座酶形成复合物的DNA(即转座体的DNA)包含部分双链(例如DNA)寡核苷酸,其中每条链包含转座酶的特异性ME,其形成寡核苷酸的双链部分。所述寡核苷酸的单链部分位于所述寡核苷酸的5′端(即形成5′突出端),并且可包含功能性序列(例如,捕获探针结合位点)。因此,转座体中的部分双链寡核苷酸可被视为可连接到片段化DNA的衔接子。因此,或者观察转座体包含转座酶与包含转座子末端序列(或嵌合端)的衔接子复合,并且标签化导致DNA的同时片段化和衔接子与DNA双链片段的两条链的5′末端的连接。
因此,可选地,将步骤(d)视为标签化生物试样的DNA,包括将生物试样与转座体接触,即在足以导致标记DNA的条件下。
显而易见,标签化可用于提供片段化DNA,其具有能够结合(杂交)到本发明捕获探针的捕获域的结合域。此外,可以直接或间接地提供结合域。
因此,在一些实施方式中,步骤(d)可被视为对生物试样的DNA进行片段化,并为DNA片段提供能够结合(杂交)到本发明捕获探针的捕获域的结合域。
例如,在一些实施方式中,转座体的衔接子包括功能域或序列,其可被配置为耦合到捕获域的全部或部分。功能结构域或序列可以是能够结合(杂交)到本发明捕获探针的捕获域的结合域(例如均聚序列,例如多聚-A序列,定义如下)。换句话说,衔接子的单链部分(5′突出端)包括能够结合到本发明的捕获探针的捕获域的结合域。因此,标签化导致生物试样的DNA的片段化和能够结合到本发明捕获探针的捕获域的结合域与生物试样的DNA的连接,即直接提供具有结合域的生物试样的DNA。
在一个实施方式中,功能域或序列被配置成通过点击化学耦合到或附接到捕获域的部分。如本文所使用的,术语“点击化学”通常指模块化的、范围广的、给出高产率的、仅产生无害副产物(例如那些可通过非色谱方法去除的副产物)并且具有立体特异性(但不一定具有对映选择性)的反应。例如,见Angew,Chem.Int.Ed.,2001,40(11):2004-2021,出于所有目的,通过引用将其完全并入本文。在某些情况下,点击化学可以描述成对的官能团,它们可以在温和的水性条件下选择性地相互反应。
点击化学反应的一个实例可以是叠氮化物和炔烃的Huisgen 1,3-偶极环加成,即叠氮化物与炔烃的铜催化反应以形成5元杂原子环1,2,3-三唑。该反应也可以称为Cu(I)催化的叠氮化物-炔烃环加成反应(CuAAC)、Cu(I)点击化学或Cu+点击化学。点击化学的催化剂可以是Cu(I)盐,或通过使用还原试剂将Cu(II)试剂还原为Cu(I)试剂原位制备的Cu(I)盐(Pharm Res.2008,25(10):2216-2230)。用于点击化学的已知Cu(II)试剂可包括但不限于Cu(II)-(TBTA)络合物和Cu(II)(THPTA)络合物。TBTA是三-(1-苄基-1H-1,2,3-三唑-4-基)甲基]胺,也称为三-(苄基三唑基甲基)胺,可以作为Cu(I)盐的稳定配体。THPTA是三-(羟丙基三唑基甲基)胺,可以是Cu(I)的稳定剂的另一实例。其他条件也可用于使用无铜点击化学从叠氮化物和炔烃构建1,2,3-三唑环,例如菌株促进的叠氮化物-炔烃点击化学反应(SPAAC)(参见,例如,Chem.Commun.,2011,47:6257-6259和Nature,2015,519(7544):486-90,其各自都通过引用整体纳入本文为了所有目的)。
因此,在一些实施方式中,步骤(d)可视为将生物试样与转座酶接触,转座酶与包含转座子末端(例如嵌合端)序列(即转座体)和与捕获探针的捕获域互补的核苷酸序列的衔接子复合,并且其中转座酶将衔接子连接到片段化DNA,即片段化DNA的5′末端。
在其它实施方式中,步骤(d)可视为将生物试样与转座酶接触,转座酶与包含转座子末端(例如嵌合端)序列(即转座体)和点击化学部分(与捕获探针的捕获域上的另一点击化学部分兼容的点击化学部分)的衔接子复合,并且其中转座酶将衔接子连接到片段化DNA,即片段化DNA的5′末端。
在一些实施方式中,转座体的衔接子包括(i)能够(即适于)促进引入能够结合(杂交)到本发明捕获探针的捕获域的结合域的结构域,或(ii)能够(即适于)促进引入配置为与本发明的捕获探针的捕获域上的另一点击化学部分相互作用的点击化学部分的结构域。
因此,在一些实施方式中,步骤(d)可被视为对生物试样的DNA进行片段化,并为DNA片段提供能够(即适合)促进引入能够结合(杂交)到本发明捕获探针的捕获域的结合域的结构域。
在代表性实施方式中,转座体的衔接子可包含具有核苷酸序列的结构域,该核苷酸序列作为通用衔接子与标签化的DNA连接的模板。通用衔接子包括能够结合(杂交)到本发明捕获探针的捕获域的结合域。因此,在一些实施方式中,标签化为生物试样的DNA间接提供结合域。
在另一代表性实施方式中,转座体的衔接子可包含具有核苷酸序列的结构域,该核苷酸序列是将通用衔接子引入标签化的DNA的连接反应中的底物,例如通用衔接子可结合到的结构域。例如,通用衔接子可以是部分双链寡核苷酸,其第一链包含单链部分,所述单链部分包含与连接到片段化(即标签化的)DNA的衔接子序列结合的结构域,第二链包含与第一链结合的结构域和能够结合(杂交)本发明捕获探针的捕获域的结构域。将通用衔接子连接到片段化(即标签化的)DNA向标签化的DNA提供结合到本发明的捕获探针的捕获域的结构域。因此,在一些实施方式中,标签化为生物试样的DNA间接提供结合域。
由于标签化产生的DNA包含生物试样的DNA的3′端和衔接子的双链部分的5′端之间的间隙(即含有ME的衔接子的5′端没有连接到生物试样的片段化DNA的3′端),因此具有能够结合(杂交)到本发明捕获探针的捕获结构域的结构域的标签化的DNA可能需要“间隙填充”标签化的DNA的步骤。
可以使用合适的聚合酶,即DNA聚合酶(例如,从下面的列表中选择)来实现间隙填充。在这方面,标记的DNA的3′端使用标签化的DNA的互补链作为模板延伸。一旦间隙被填满,标签化的DNA的3′端通过连接步骤,使用合适的连接酶(例如,从下面的列表中选择)连接到衔接子的5′端。
在这方面可以理解,含有ME的衔接子的5′端被磷酸化以使连接发生。转座体可包含其中一个或两个5′末端被磷酸化的衔接子。在转座体包含其中含有ME的转座体的5′端未磷酸化的转座体的实施方式中,间隙填充过程可包括例如使用激酶酶(例如T4多核苷酸激酶)磷酸化转座体的5′端的进一步步骤。
在一些实施方式中,可使用具有链置换活性的DNA聚合酶(使用标签化的DNA的互补链作为模板)延伸标签化的DNA的3′末端。这导致没有连接到片段化DNA的衔接子链移位,并产生完全双链DNA分子。这些分子可以具有能够通过任何合适的手段结合到捕获探针的捕获域的结构域,例如连接衔接子,用末端转移酶“加尾”等。
因此,在一些实施方式中,该方法包括使用具有链置换活性的聚合酶延伸片段化(即标签化的)DNA的3′末端以产生完全双链DNA分子的步骤。
在一些实施方式中,完全双链DNA分子可具有能够结合到捕获探针的捕获域的结合域。在一些实施方式中,可通过将衔接子连接到双链DNA分子或通过使用末端转移酶活性酶在双链DNA分子的3′端纳入多核苷酸尾(例如均聚物序列(例如多聚-A尾))来提供结合域。
因此,在优选实施方式中,步骤(d)直接或间接地产生含有片段化DNA(即标签化的DNA)的生物试样,所述片段化DNA包含结合到本发明捕获探针的捕获域的结构域。从WO2012/140224(本文通过引用并入)中的公开将显而易见,根据步骤(f),可使用各种手段对片段化DNA进行空间标记。下面更详细地描述步骤(f)的代表性实施方式。
“转座酶”指这样的酶,其通过剪切和粘贴机制或复制转座机制来结合转座子末端并催化转座子向基因组的另一部分移动。
转座酶Tn5是RNA酶蛋白质超家族的一员。Tn5转座子是一个复合转座子,其中两个几乎相同的插入序列(IS50L和IS50R)侧接三个抗生素耐药基因。各IS50包含2个反向19-bp末端序列(ES),外侧端(outside end,OE)和内侧端(inside end,IE)。
Tn5转座酶的一个高活性变体能够介导双链DNA的片段化和在DNA的两个5′末端的合成寡核苷酸(衔接子)的连接,这个反应大约需要5分钟。然而,由于野生型末端序列具有相对较低的活性,它们优选在体外被高活性嵌合端(ME)序列所取代。因此,Tn5转座酶与19bp ME的复合物是发生转座所必需的,前提是插入DNA足够长,使其中两个序列紧密结合以形成活性Tn5转座酶同二聚体。
在US2010/0120098和US2011/0287435中详细描述了用于处理核酸的方法、组合物和试剂盒,尤其是用于使用转座子组合物对DNA进行片段化和标记的方法和组合物,其全文通过引用并入本文中。
因此,任何具有标签化活性的转座酶,即能够将DNA片段化并将寡核苷酸连接到片段化DNA的末端的转座酶,可用于本发明的方法中。在一些实施方式中,转座酶是Tn5或Mu转座酶或其功能性变体或衍生物。
因此,在一些实施方式中,转座酶,例如Tn5或Mu或其功能性变体或衍生物包含与SEQ ID NO:1或2中所示序列具有至少80%序列相同性的氨基酸序列。在一些实施方式中,功能性变体或衍生物是高活性变体或衍生物,即相对于天然存在的蛋白质具有增加转座酶活性的变体或衍生物。
优选地,所述多肽序列与所比较的序列至少90、91、92、93、94、95、96、97、98或99%相同。
多肽分子的序列相同性可通过例如使用使用FASTA-pep-cmp和可变pamfactor的SWISS-PROT蛋白质序列数据库,并将间隙产生惩罚设置为12.0和间隙延伸惩罚设置为4.0以及2个氨基酸的窗口来确定。优选地,所述比较是在序列的全长上进行的,但是可以在较小的比较窗口上进行,例如,小于600、500、400、300、200、100或50个连续氨基酸。
优选地,这种序列相同性相关的多肽在功能上等同于SEQ ID NO:1或2中所述的多肽之一。因此,具有如SEQ ID NO:1或2中所述序列的多肽可在不影响多肽序列的情况下被修饰。
不影响多肽序列的修饰包括例如化学修饰,包括通过去糖基化或糖基化。这种多肽可以通过多肽的合成后/分离修饰来制备,而不影响特定残基的功能性,例如某些糖基化、甲基化等。
如本文所述,为了实现“功能等效”,多肽可相对于母体分子(即,例如通过氨基酸取代从中衍生出它的分子)在转座酶(例如标签化)活性方面表现出一些增加或减少的功效,但优选地是同样高效或更高效。因此,功能等效性涉及一种具有转座酶活性的多肽,该转座酶活性能够将DNA片段化并将寡核苷酸连接到DNA片段。这可以通过比较衍生多肽相对于衍生其的多肽的转座酶活性以定量方式进行测试。在本发明的方法中,该衍生物优选与母体多肽至少30%、50%、70%或90%有效。如上所述,在一些优选实施方式中,所述多肽相对于上文例示的母体多肽是高活性的,即在本发明的方法中与母体多肽至少约为110、120、130、140、150、200、250或300%有效。
与天然存在的蛋白质相关或衍生自天然存在的蛋白质的功能等效蛋白质可通过通过单个或多个氨基酸取代、添加和/或删除(前提是它们满足上述序列相同性要求)来修饰天然氨基酸序列而获得,但不破坏分子的功能。优选地,天然序列具有少于20个取代、添加或删除,例如少于10个、5个、4个、3个、2个或1个这样的修饰。这些蛋白质由“功能等效的核酸分子”编码,这些核酸分子通过一个或多个碱基的适当取代、添加和/或删除而产生。如上所述,发明人已经确定,当生物试样(例如组织切片)固定在固体基材(例如阵列)上时,典型的基于洗涤剂的透化条件不足以使转座酶(例如转座体)能够接近其底物,即DNA(例如基因组DNA)。因此,“在足以使生物样品中的DNA可接近转座酶的条件下透化生物试样”的步骤是指使用使转座酶可接近其底物的任何条件,即DNA(例如基因组DNA),当生物试样(如组织切片)固定在固体基材(如阵列)上时。
很明显,来自不同来源的生物试样,例如组织样品,可能需要不同的处理,以使它们能够接触转座酶(即使转座酶能够接触并作用于其底物)。如果组织样品没有充分透化,转座酶将不会与生物试样的DNA相互作用,标签化的量可能太低,无法进行进一步分析。相反,如果生物样品,例如组织样品,透化性太强,标签化的DNA(和其他核酸,例如RNA)可能从生物试样,例如组织样品中其来源扩散出去,即由捕获探针捕获的标记的DNA(和其他核酸,例如RNA)可能与其在生物试样(例如组织样品)中的原始空间分布不准确相关。因此,必须在透化生物试样(例如组织样品)之间保持平衡,以足以获得转座酶和DNA之间的高效相互作用,同时保持生物试样(例如组织样品)中核酸分布的空间分辨率。
因此,步骤(c)中的透化条件可适于生物试样的特性。例如,可根据组织类型选择步骤(c)中使用的酶和/或化学品(例如缓冲液)。
此外,发明人已确定步骤(c)中的透化条件可适于使均一的DNA片段化以使无论染色质可及性如何都能捕获DNA标签化物或产生具有明显核小体图案的片段。因此,步骤(c)中的通透性条件可根据所需的片段化水平或感兴趣的DNA分子(即根据本发明的方法被空间标记的DNA分子)来选择。
典型的透化条件如下所述。显而易见,这些代表性条件可被修改或适应以适合生物试样、转座酶和DNA片段化,并且此类修改在本领域技术人员的权限内。
步骤(c)中的透化条件可包括使生物试样经历化学和/或酶透化条件。
在一些实施方式中,化学透化条件包括将生物样品与碱溶液(例如pH值约为8.0至约11.0,例如约8.5至约10.5或约9.0至10.0,例如约9.5的缓冲溶液)接触。在一些实施方式中,缓冲液是甘氨酸-KOH缓冲液。
如实施例中所示,发明人已发现可使用胃蛋白酶来进行透化。值得注意的是,通过改变胃蛋白酶透化条件,可以控制转座酶处理后的DNA片段化水平。例如,在100mm HCl存在下使用胃蛋白酶的透化(即pH值约为1.0)诱导均一的DNA片段化,并且可用于捕获DNA标签化物,而不考虑染色质的可及性。或者,在0.5M乙酸存在下(即pH值约为2.5)使用胃蛋白酶的透化提供通常与可及的染色质相关的核小体模式的部分恢复。
因此,在一些实施方式中,步骤(c)中的透化条件可包括将生物试样与包含蛋白酶的酸性溶液接触。
在一些实施方式中,步骤(c)中的透化条件可包括使生物试样与包含天冬氨酰蛋白酶(例如胃蛋白酶)的反应混合物(例如溶液)接触,所述反应混合物位于酸性缓冲液中,所述缓冲液的pH值为约4.0或更小,例如约3.0或更小,例如约0.5-3.0或约1.0-2.5。
在优选实施方式中,天冬氨酰蛋白酶是胃蛋白酶、胃蛋白酶样酶或其功能等效物。因此,酶委员会编号3.4.23.1中的任何酶或酶的组合可用于本发明。
在一些实施方式中,胃蛋白酶选自以下(UniProtKB/Swiss-Prot登录号):P03954/PEPA1_MACFU;P28712/PEPA1_RABIT;P27677/PEPA2_MACFU;P27821/PEPA2_RABIT;P0DJD8/PEPA3_HUMAN;P27822/PEPA3_RABIT;P0DJD7/PEPA4_HUMAN;P27678/PEPA4_MACFU;P28713/PEPA4_RABIT;P0DJD9/PEPA5_HUMAN;Q9D106/PEPA5_MOUSE;P27823/PEPAF_RABIT;P00792/PEPA_BOVIN;Q9N2D4/PEPA_CALJA;Q9GMY6/PEPA_CANLF;P00793/PEPA_CHICK;P11489/PEPA_MACMU;P00791/PEPA_PIG;Q9GMY7/PEPA_RHIFE;Q9GMY8/PEPA_SORUN;P81497/PEPA_SUNMU,及其功能性变体和衍生物,或其组合。
在一些实施方式中,胃蛋白酶选自(UniProtKB/Swiss-Prot登录号):P00791/PEPA_PIG;P00792/PEPA_BOVIN及其功能性变体和衍生物或其组合。
“功能变体或衍生物”是指突变体或修饰的蛋白酶(即,含有一个或多个与从其衍生的蛋白酶相关的氨基酸取代、缺失或添加),在最适合酶的条件下,例如在制造商推荐的缓冲液、盐和温度条件下,相对于衍生蛋白酶的活性,该突变体或修饰的蛋白酶可显示出一些降低的蛋白酶活性。因此,变体或衍生蛋白酶可被认为是功能性的,如果它具有相对于在最适合酶的条件下从中衍生出它的蛋白酶的活性至少50%的活性,例如至少60、70、80、85、90、95、96、97、98、99或100%的活性。
因此,在一些实施方式中,胃蛋白酶或其功能性变体或衍生物包含与SEQ ID NO:3或4中所示序列具有至少80%序列相同性的氨基酸序列。
优选地,所述多肽序列与所比较的序列至少90、91、92、93、94、95、96、97、98或99%相同。
发明人还发现可以使用胶原酶进行透化,胶原酶在保持核完整性的同时提供对转座酶的高效基因组可及性。值得注意的是,用胶原酶的透化产生明显的核小体模式,通常与染色质标签化有关。胶原酶是锌内肽酶,通常被EDTA和EGTA抑制。胶原酶可以从溶组织梭菌(Clostridium histolyticum)中分离出来。
因此,在一些优选实施方式中,步骤(c)包括在适合蛋白水解(例如胶原酶)活性的条件下,例如在pH约为7.0-8.0(例如约7.4)的缓冲溶液中,使生物试样与锌内肽酶(例如胶原酶)接触。
因此,在一些实施方式中,在不存在二价阳离子螯合剂(例如EDTA或EGTA)的情况下,将生物试样与锌内肽酶(例如胶原酶)接触。在一些实施方式中,通过将生物试样与二价阳离子的螯合剂(例如EDTA或EGTA)接触来停止锌内肽酶(例如胶原酶)透化步骤可能是有用的。
在优选实施方式中,锌内肽酶是胶原酶、胶原酶样酶或其功能等效物。因此,酶委员会编号3.4.23.3中的任何酶或酶的组合可用于本发明。
在一些实施方式中,胶原酶选自下组(UniProtKB/Swiss-Prot登录号):P43153/COLA_CLOPE;P43154/COLA_VIBAL;Q9KRJ0/COLA_VIBCH;Q56696/COLA_VIBPA;Q8D4Y9/COLA_VIBVU;Q9X721/COLG_HATHI;Q46085/COLH_HATHI;Q899Y1/COLT_CLOTE URSTH及其功能性变体和衍生物(上述定义),或其组合。
在一些实施方式中,胃蛋白酶选自(UniProtKB/Swiss-Prot登录号):Q9X721/COLG_HATHI;Q46085/COLH_HATHI及其功能性变体和衍生物或其组合。
因此,在一些实施方式中,胶原酶或其功能性变体或衍生物包含与SEQ ID NO:5或6中所示序列具有至少80%序列相同性的氨基酸序列。
优选地,所述多肽序列与所比较的序列至少90、91、92、93、94、95、96、97、98或99%相同。
发明人还发现可使用蛋白酶K进行透化,其允许回收未受保护的DNA标签化物,即可使用蛋白酶K的透化来捕获DNA标记,而不管染色质可及性如何。
因此,在一些优选实施方式中,步骤(c)包括在适于蛋白水解(例如蛋白酶K)活性的条件下使生物试样与丝氨酸蛋白酶(例如蛋白酶K)接触。有利地,丝氨酸蛋白酶(例如,蛋白酶K)在变性条件(例如,在SDS或尿素存在下)、在金属螯合剂(例如,EDTA)存在下以及在相对较高的温度(例如,约45℃到约65℃)下在宽pH范围(例如,从约6.5到9.5)上具有活性。
在优选实施方式中,丝氨酸蛋白酶是蛋白酶K酶、蛋白酶K样酶或其功能等效物。因此,酶委员会编号3.4.21.64中的任何酶或酶的组合可用于本发明。
因此,在一些实施方式中,蛋白酶K是P06873/PRTK_PARAQ,其指UniProtKB/Swiss-Prot登录号或其功能变体或衍生物(上文定义)或其组合。
因此,在一些实施方式中,蛋白酶K或其功能性变体或衍生物包含与SEQ ID NO:7中所示序列具有至少80%序列相同性的氨基酸序列。
优选地,所述多肽序列与所比较的序列至少90、91、92、93、94、95、96、97、98或99%相同。
市售的蛋白酶通常是从它们的天然来源分离出来的,例如动物或微生物来源。然而,蛋白酶可例如从微生物(例如细菌)表达系统重组产生。用于本发明的蛋白酶的来源不是特别重要,并且预期在本文所述的方法中使用天然和重组蛋白酶。
使用上述化学和/或酶试剂透化生物试样的步骤可以在任何合适的条件下进行,例如浓度、时间、温度等,这些条件可以根据生物试样的来源(例如从中获得生物试样的生物体和/或器官)以及化学和/或酶试剂进行调整。
在一些实施方式中,蛋白酶可在约0.05mg/ml至约1mg/ml(例如约0.1mg/ml至约0.5mg/ml)的浓度下使用。
在一些实施方式中,生物试样可与蛋白酶和/或化学试剂(例如碱性缓冲液)一起孵育约1-5分钟,例如约1、2、3、4、5分钟。例如,胃蛋白酶和蛋白酶K酶(或功能等效物等)可与生物试样一起孵育约2-4分钟,例如约3分钟。很明显,孵育期可取决于酶的浓度和使用条件,例如缓冲液、温度等。因此,在一些实施方式中,蛋白酶可与生物样品一起孵育多于或少于上述时间。此类修改在技术人员的权限范围内。
因此,在一些实施方式中,生物试样可与蛋白酶和/或化学试剂(例如碱性缓冲液)一起孵育至少约5分钟,例如至少约10分钟、约12分钟、约15分钟、约18分钟或约20分钟。例如,胶原酶(或功能等效物等)可与生物试样一起孵育约10-30分钟,例如约20分钟。
可通过任何合适的方法停止透化步骤(例如,可停止蛋白酶活性)。例如,包含蛋白酶和/或化学试剂的反应混合物(例如,溶液)可从固体基材(例如,支持物)中移除并从生物试样中分离。或者或者另外,蛋白酶可被抑制(例如,通过添加抑制剂,例如针对胶原酶的EDTA)或变性(例如,通过添加变性剂或提高温度)。
透化步骤的代表性温度条件包括根据酶在约10-70℃孵育。例如,胃蛋白酶和胶原酶可在约10-44、11-43、12-42、13-41、14-40、15-39、16-38、17-37℃使用,例如约10、12、15、18、20、22、25、28、30、33、35或37℃,优选约30-40℃,例如约37℃。蛋白酶K可在约40-70℃,例如约50-70、60-70,例如约65℃使用。
在一些实施方式中,包含上述蛋白酶的反应混合物(例如溶液)可包含足以确保蛋白酶发挥功能的其他组分,例如缓冲液、盐等。例如,在一些实施方式中,反应混合物进一步包含白蛋白蛋白质,例如BSA。在一些优选实施方式中,包括胶原酶(或其功能变体或衍生物)的反应混合物(例如,溶液)包括白蛋白蛋白质(例如,BSA)。
将生物试样中的DNA片段化的步骤包括将含有DNA的生物试样与转座酶(例如转座体)接触,即在任何适当条件,即导致所述生物试样片段化(例如标签化)的条件下,将含有转座酶(例如转座体)的反应混合物(例如溶液)与本文中定义的转座酶(例如转座体)接触。一般条件将取决于所使用的转座酶,并且可以使用本领域已知的常规方法来确定。因此,可选地,合适的条件可以是转座酶起作用的条件(例如缓冲液、盐、温度条件),例如显示转座酶活性,特别是生物试样中的标签化活性。
“功能性”是指转座酶在最适合酶的条件下,例如在制造商推荐的缓冲液、盐和温度条件下,相对于转座酶的活性,可显示出一些降低的活性。因此,转座酶可被认为是功能性的,如果它具有相对于在最适合酶的条件下转座酶的活性至少50%的活性,例如至少60、70、80、85、90、95、96、97、98、99或100%的活性。
在一些实施方式中,包含转座酶的反应混合物(溶液)可包含足以确保转座酶具有功能性的其它组分,例如缓冲液、盐等。例如,在一些实施方式中,反应混合物进一步包含亚精胺。
在代表性实例中,反应混合物包含缓冲溶液(例如,Tris-乙酸盐)中的转座酶,该缓冲溶液具有约6.5至约8.5(例如,约7.0至约8.0,例如约7.5)的pH。另外或可选择地,反应混合物可在任何适宜温度下使用,例如约10-45℃,例如约10-44、11-43、12-42、13-41、14-40、15-39、16-38、17-37℃,例如约10、12、15、18、20、22、25、28、30、33、35或37℃,优选约30-40℃,例如约37℃。
与转座酶复合物中的“衔接子”或“寡核苷酸”(即形成转座体的部分,如上所述的MEDS)包含部分双链寡核苷酸。衔接子的双链部分包含嵌合端(ME)序列。衔接子的单链部分(5′突出端)包含要并入片段化(例如,标签化的)DNA中的功能域或序列。因此,功能域位于将被连接到片段化DNA的衔接子的链上。换句话说,功能域位于ME序列的上游(例如,5′至),例如,在衔接子的5′突出端中。
如上所述,在一些实施方式中,功能域可以是结合到本发明捕获探针的捕获域的结构域。
在一些实施方式中,功能结构域可以是有助于引入结合到本发明捕获探针的捕获域的结合域的结构域,即与通用衔接子杂交的结构域或作为通用衔接子与标签化的DNA的连接的模板的结构域。
在一些实施方式中,ME序列是Tn5转座酶识别序列(例如,如SEQ ID NO:8所示)。在一些实施方式中,ME序列是Mu转座酶识别序列(例如,如SEQ ID NO:9-14中任一个所示)。
因此,在另一方面,本发明可被视为提供一种组合物,其包含与包含转座子末端序列(或如本文所定义的嵌合端)的衔接子和结合到如本文所定义的捕获探针(例如均聚物序列)的结构域复合的转座酶(例如,如本文所定义)以用于空间标记生物试样的核酸的方法,如本文定义的方法。
转座体可通过将转座酶(例如纯化酶)装载上述衔接子而产生。从本文所述的代表性实施方式可以明显看出,转座体的衔接子的单链部分可能需要磷酸化的5′端,例如,以使标签化的DNA能够连接到捕获探针。
因此,在一些实施方式中,步骤(d)中使用的转座酶(或在上面定义的组合物中使用的转座酶)是转座体的形式,该转座体包含衔接子(MEDS),其中5′突出端被磷酸化。
虽然在与转座酶组装形成转座体之前,转座体可能被磷酸化,但是在溶液中组装转座体是低效的。在这方面,发明人已确定当与转座酶复合时,转座体的磷酸化(即转座体中的原位磷酸化)导致改进的标签化,例如相对于通过与具有磷酸化5′突出端的衔接子(MEDS)的溶液内组装产生的转座体。
如实施例中所述,转座体包含上文所述的衔接子(MEDS)(即,包含5′突出端)。如果衔接子的5′突出端在组装到转座体之前未被磷酸化,则其在嵌合端转座酶结合位点之外将具有可及的5′羟基。因此,可通过在ATP存在下将转座体复合物的这些5′端暴露于多核苷酸激酶(例如,T4-多核苷酸激酶(T4-PNK))来实现组装的转座体复合物的5′突出端的磷酸化。
因此,在一些实施方式中,步骤(d)包括用如本文所定义的转座体对生物试样的DNA进行片段化,并且可以包括使转座体复合物中的衔接子的5′末端(特别是衔接子的5′突出端,即MEDS)磷酸化的进一步步骤。
或者,在一些实施方式中,所述方法包括提供转座体的步骤,所述转座体经处理以磷酸化转座体复合物中的衔接子的5′末端(特别是转座体的5′突出端,即MEDS),即步骤(d)包括用转座体使生物试样片段化,该转座体已被处理以磷酸化转座体复合物中的衔接子的5′末端(特别是转座体的5′突出端,即MEDS)。
任何合适的酶和条件可用于磷酸化转座体复合物(例如T4-PNK或T7-PNK)中的衔接子的5′末端(尤其是衔接子的5′突出端,例如MEDS)。在代表性实施方式中,可通过将转座体与缓冲溶液(例如Tris-HCl,pH约7.0-8.0,例如约7.6)中的多核苷酸激酶(例如T4-PNK或T7-PNK)在约20-40℃(例如约25-37℃)接触约1-60分钟(例如约5-50、10-40、20-30分钟)来实施磷酸化反应。
在一些实施方式中,步骤(d)包括形成多个转座酶-DNA片段复合物,其中多个转座酶-DNA片段复合物的转座酶-DNA片段复合物包括DNA片段。在另一实施方式中,在步骤(e)之前,处理多个转座酶DNA片段复合物以将转座酶从多个转座酶DNA片段复合物的转座酶DNA片段复合物解离。在另一实施方式中,DNA片段从解离的转座酶释放。在一个实施方式中,通过将转座酶DNA片段复合物与刺激物接触来实现转座酶与DNA片段的解离。在其它实施方式中,刺激物可以是化学刺激物(例如EDTA)或温度刺激物。
在一个实施方式中,(d)的片段化DNA经历一个或多个核酸反应。在另一个实施方式中,在(e)片段之前,(c)的片段化DNA经历一个或多个核酸反应。在其它实施方式中,一个或多个核酸反应包含核酸扩增和/或核酸修饰。在另一实施方式中,通过RNA聚合酶或DNA聚合酶进行核酸扩增。
上述方法中的步骤(f)(i)可涉及使用与捕获探针杂交的核酸分子(即被捕获探针“捕获”)作为延伸模板来延伸捕获探针,以产生延伸探针,从而在空间上标记生物试样的核酸(例如标签化物)。
在DNA的上下文中,步骤(f)(i)可被视为从捕获的DNA生成DNA(特别是标记的DNA),例如,与DNA互补链的合成有关。这可能涉及DNA聚合的一个步骤,延伸捕获探针,使用捕获的DNA(例如标签化物)作为模板,产生与捕获探针杂交的互补DNA链。
如上所述,该方法的步骤(d)涉及直接或间接地向片段化DNA提供结合到捕获探针中的捕获域的结构域。因此,在步骤(f)(i)的实施方式中,使用杂交到捕获探针的DNA作为延伸模板来延伸捕获探针,结合到捕获探针中捕获域的结构域被提供在片段化(即标签化的)DNA的3′末端(参见例如图13)。由于标签化导致衔接子序列连接到片段化DNA的5′端,因此在本实施方式中,必须间接提供与捕获探针中的捕获域结合的结构域。
在一些实施方式中,与捕获探针中的捕获域结合的结构域在标签化的DNA的3′末端形成单链结构域,即3′突出端,例如均聚序列(例如多聚-A序列)。因此,3′突出端结合到捕获探针的捕获域(步骤(e)),并且结合的DNA链通过聚合反应作为延伸捕获探针的模板。如果与捕获探针杂交的DNA部分为双链,则延伸反应可使用具有如下所述的链置换活性的DNA聚合酶。
在一些实施方式中,将标签化的DNA做成单链可能是有利的或必要的,例如在结合到捕获探针中的捕获域的结构域不形成3′突出端的情况下。例如,结合到捕获探针中的捕获域的结构域可以通过延伸标记的DNA的3′端来形成,以产生与连接到标签化的DNA的衔接子中的功能域互补的序列。在代表性实施方式中,连接到DNA的衔接子的功能域可包含均聚序列(例如,多聚-T序列),并且延伸标签化的DNA的3′末端导致产生互补的均聚序列(例如,多聚-A序列),其结合到捕获探针的捕获域。因此,在一些实施方式中,步骤(e)可包括使标签化的DNA单链化的步骤,例如使DNA变性。本领域已知产生单链DNA的合适方法,例如加热。
上述方法中的步骤(f)(i)的其他实施方式可涉及使用与捕获探针杂交的核酸分子(例如,标签化物)(即被捕获探针“捕获”)作为连接模板来延伸捕获探针,以产生延伸探针,从而在空间上对生物试样的核酸加标签。
因此,在DNA的上下文中,步骤(f)(i)可被视为从与DNA的连接有关的捕获DNA产生DNA(特别是标记的DNA)。这可能涉及DNA连接的一个步骤,延伸捕获探针,使用捕获的DNA作为连接模板,将捕获探针连接到与捕获探针杂交的DNA的互补链。
显然,标签化的DNA连接到捕获探针的方式将取决于捕获探针在阵列上的方向,例如,它是通过其3′端还是5′端固定,以及捕获探针是直接还是间接固定在固体基材(例如阵列)上(例如通过与直接固定在阵列上的寡核苷酸,例如表面探针探针杂交))。
虽然预期本发明的捕获探针可通过其3′端固定,使得其具有可连接到标签化的DNA的自由5′端,但优选地,捕获探针通过其5′端固定,即,使它们有一个可以参与连接或延伸反应的自由3′端。
因此,在步骤(f)(i)的代表性实施方式中,如上文所述,标签化的DNA具有结合到片段化(即标签化的)DNA的3′末端的捕获探针中的捕获域的结构域,即3′突出端,例如均聚序列(例如多聚-A序列)。因此,3′突出端结合到捕获探针的捕获域(步骤(e)),并且结合的DNA链作为将捕获探针连接到与结合的DNA链互补的链的模板。如上所述,优选转座体的衔接子(即衔接子的功能域)包含磷酸化的5′端以使标签化的DNA能够连接到捕获探针。然而,在一些实施方式中,衔接子可不包含磷酸化的5′末端,因此标签化的DNA可在步骤(d)之后磷酸化。
步骤(f)(ii)可被视为从捕获的DNA产生DNA(特别是带标签的DNA),涉及DNA连接的步骤,延伸捕获探针,其使用捕获探针作为连接模板连接到杂交到捕获探针的DNA链。
显然,标签化的DNA连接到捕获探针的方式将取决于捕获探针在阵列上的方向,例如,它是通过其3′端还是5′端固定,以及捕获探针是直接或间接固定在上(例如通过与直接固定在阵列上的寡核苷酸,例如表面探针杂交))。
在一些实施方式中,捕获探针可通过与所谓表面探针杂交而间接固定在阵列上。因此,在一些实施方式中,捕获探针可被视为部分双链探针,其中至少捕获探针的捕获域为单链。
因此,在代表性实施方式中,捕获探针是部分双链探针,其包含包含捕获域和位置域的第一链(“捕获域寡核苷酸”)和包含与位置域互补的序列的第二链(“表面探针”),其中所述位置域和与所述位置域互补的序列形成所述捕获探针的双链部分。第二链可进一步包含如下所述的扩增结构域和/或裂解域。因此,部分双链探针的第二链是所谓的表面探针。
在一些实施方式中,表面探针(即捕获探针的第二链)通过其5′端固定在阵列上,并且标签化的DNA具有直接结合到捕获探针的捕获域的结构域,即,转座体的衔接子包括ME序列和与捕获探针的捕获域(即部分双链捕获探针的第一链)互补的核苷酸序列(功能域)。因此,步骤(f)(ii)包括使用捕获域寡核苷酸作为连接模板延伸部分双链捕获探针的第二链(表面探针)的步骤,以将与捕获探针的捕获域杂交的核酸连接到部分双链捕获探针的第二链(表面探针)从而延伸捕获探针(部分双链捕获探针的第二链(表面探针))以产生延伸的探针(即,包含与捕获探针的捕获域杂交的核酸的探针和与捕获探针的位置域互补的序列),从而对生物试样的核酸进行空间标记。
显而易见,在本文所述方法的所有步骤期间,部分双链捕获探针的第一链(捕获域寡核苷酸)不需要与第二链(表面探针)杂交。只需要在该方法的步骤(e)和(f)中存在第一链,即使标签化的DNA与捕获探针杂交并作为连接反应的模板。因此,在一些实施方式中,该方法可包括将捕获域寡核苷酸与固定在阵列上的表面探针杂交的进一步步骤。在一些实施方式中,该步骤作为步骤(e)的部分发生。
尽管优选部分双链捕获探针的第一链包含捕获域和位置域,使得部分双链捕获探针的第一和第二链经由位置域杂交,显而易见,这对于在上述实施方式中空间标记核酸而言不是必需的。在这方面,在部分双链捕获探针的不同链上提供捕获域和位置域可能是有利的。例如,表面探针可包括位置域和与捕获结构域寡核苷酸中的结构域互补的结构域。当表面探针通过其5′端固定时,与捕获域寡核苷酸结合的结构域位于位置域的结构域的下游(即3′处)。因此,在一些实施方式中,捕获域和位置域被提供在部分双链捕获探针的分离链上。当在如上所述的步骤(e)期间提供部分双链捕获探针的第一链(即,包含捕获域,“捕获域寡核苷酸”)时,此实施方式尤其有利。例如,形成捕获探针的第一和第二链的双链部分的结构域可以是所有表面探针和捕获域寡核苷酸所共有的,使得相同的捕获域寡核苷酸与所有表面探针杂交以产生本发明的部分双链捕获探针。
应理解,可进行等效实施方式,其中“表面探针”经由其3′端固定。在这些实施方式中,可能需要将捕获探针(表面探针)的第二链的5′端磷酸化以使连接发生。
本发明的方法能够捕获来自同一生物试样的DNA和RNA,例如同时捕获。
因此,上述方法中的步骤(f)(i)将被视为涉及使用DNA或与捕获探针杂交的DNA和RNA两者作为延伸模板,来产生延伸的探针。在一些实施方式中,步骤(f)(i)可涉及仅使用标签化的DNA作为延伸模板,来产生延伸的捕获探针,即步骤(f)(i)涉及DNA聚合酶反应以产生DNA。在一些实施方式中,步骤(f)(i)可涉及使用RNA和DNA两者作为延伸模板来产生延伸的捕获探针,即步骤(f)(i)涉及产生cDNA的逆转录反应和产生DNA的DNA聚合酶反应。
在一些实施方式中,可能希望对要检测的每种类型的核酸进行单独的延伸反应。例如,本领域众所周知,RNA不如DNA稳定。因此,在一些实施方式中,步骤(f)(i)可包括第一延伸反应,其为逆转录反应(以产生eDNA的第一链),接着是第二延伸反应,其为DNA聚合酶反应(以产生与杂交到探针的DNA链互补的DNA链)。在一些实施方式中,第一延伸反应是DNA聚合酶反应,第二延伸反应是逆转录反应。
在一些实施方式中,可能需要通过延伸反应捕获RNA和通过连接反应捕获DNA。例如,在一些实施方式中,步骤(f)可包括延伸反应,其为逆转录反应(以产生cDNA第一链),随后为连接反应。因此,在一些实施方式中,该方法包括通过将DNA片段连接到表面探针来对DNA(例如gDNA)进行空间标记,以及通过产生包含如下所述cDNA的延伸的探针来对RNA进行空间标记。
如上所述,该方法可涉及提供具有能够与捕获探针的捕获域杂交的结合域的DNA片段的步骤。在一些实施方式中,结合域是用于将生物试样中的RNA与捕获探针杂交的相同结构域,例如多聚-A结构域。在一些实施方式中,捕获域可以是随机序列,例如随机六聚体序列。
在一些实施方式中,同时进行延伸反应可能是有利的。例如,延伸反应可通过将用于实现所述捕获探针的RNA模板化延伸的手段(例如逆转录酶)与用于实现捕获探针的DNA模板化延伸或连接的手段(例如DNA聚合酶或DNA连接酶)组合来同时进行。
本领域已确定某些逆转录酶(例如禽成髓细胞增多症病毒(AMV)逆转录酶和莫罗尼鼠白血病病毒(M-MuLV,MMLV)逆转录酶)可以使用RNA(cDNA合成)和单链DNA(ssDNA)作为模板来合成互补DNA链。因此,在一些实施方式中,逆转录反应可使用能够使用RNA和ssDNA两者作为延伸反应模板的酶(逆转录酶),例如AMV或MMLV逆转录酶。同时延伸反应并不一定意味着所有捕获探针将同时延伸,而是用于延伸捕获探针的手段同时(即在基本上相同的时间)应用于固体基材(例如阵列)。
短语“同时”意指基本上相同的时间,即一种组分可在另一种组分之前与固体基材接触,例如在几秒内(例如在15、30、45、60、90、120或180秒内)或几分钟内(例如在1、2、3、4、5、6、7、8、9、10、12或15分钟内),但允许反应进行一起进行。如果一个组分在另一组分之前与固体基材接触,则优选首先接触用于实现所述捕获探针的RNA模板化延伸的手段(例如逆转录酶),并且在上述规定的几秒钟或几分钟内接触用于实现所述捕获探针的DNA模板化延伸的手段(例如DNA聚合酶或DNA连接酶)。然而,在一些实施方式中,可能需要首先接触用于实现所述捕获探针的DNA模板化延伸的手段,并且如上文所定义的在几秒或几分钟内接触用于实现所述捕获探针的RNA模板化延伸的手段。
鉴于步骤(f)可包括顺序延伸反应,显而易见,分别通过将固体基材与用于实现所述捕获探针的RNA模板化延伸的手段和用于实现所述捕获探针的DNA模板化延伸或连接的手段接触,可以实现顺序延伸反应。
因此,在一些实施方式中,步骤(f)可被视为包括将所述固体基材(例如阵列)与用于实现所述捕获探针的RNA模板化延伸的手段接触,并且随后将所述固体基材(例如阵列)与用于实现所述捕获探针的DNA模板化延伸或连接的手段接触。
术语“随后”是指在用于实现所述捕获探针的RNA模板化延伸的手段与固体基材接触之后,用于实现所述捕获探针的DNA模板延伸或连接的手段与固体基材接触,反之亦然。允许第一和第二反应之间的延时的时间长度没有特别的限制。然而,如果第一反应包括所述捕获探针的DNA模板化延伸或连接,则优选在所述RNA分子基本上降解之前进行第二反应(即,所述捕获探针的RNA模板化延伸的手段与固体基材接触)。因此,在一些实施方式中,“随后”意指在第一延伸反应完成后数分钟或数小时进行第二反应。例如,第二反应可在第一反应完成后至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟进行,例如在第一反应完成后120、90或60分钟内,即在1-120、5-90、10-60分钟之间进行。在一些实施方式中,第二反应可在第一反应完成后至少1、2、3、4、5、6、7、8、9、10、12、18、24、36或48小时进行,例如在第一反应完成后72、48或24小时内,即在1-72、6-48、12-24小时之间进行。
在一些实施方式中,用于实现所述捕获探针的RNA模板化延伸的手段(例如逆转录酶)和用于实现所述捕获探针的DNA模板化延伸或连接的手段(例如DNA聚合酶或DNA连接酶)组合在单个反应混合物中,该混合物与固体基材(例如阵列)接触,例如逆转录酶和DNA聚合酶的活性由不同的酶提供。因此,在一些实施方式中,步骤(f)包括使所述固体基材(例如阵列)与反应混合物接触,所述反应混合物包括:
(i)能够使用杂交到捕获探针的DNA作为延伸模板延伸所述捕获探针的DNA聚合酶或能够使用杂交到捕获探针的DNA或捕获探针作为连接模板延伸所述捕获探针的DNA连接酶;以及
(ii)能够使用与捕获探针杂交的RNA作为延伸模板延伸所述捕获探针的逆转录酶。
因此,可以看出本发明提供了反应混合物,所述反应混合物包括:
(i)能够使用杂交到捕获探针的DNA作为延伸模板延伸所述捕获探针的DNA聚合酶或能够使用杂交到捕获探针的DNA或捕获探针作为连接模板延伸所述捕获探针的DNA连接酶;以及
(ii)能够使用与捕获探针杂交的RNA作为延伸模板延伸所述捕获探针的逆转录酶,
在用于对生物试样的核酸进行空间标记的方法(例如本文定义的方法)中的用途。
在步骤(f)包括使用包含DNA聚合酶或DNA连接酶和逆转录酶的反应混合物的实施方式中,这些酶必须在相同的条件下发挥功能,例如在相同的缓冲液、盐、温度条件下发挥功能。
“功能性”是指酶相对于在最适合酶的条件下(例如在制造商推荐的缓冲液、盐和温度条件下)的活性,可显示出一些降低的聚合酶或连接酶活性(靶模板化延伸或连接)。因此,酶可被认为是功能性的,如果它具有相对于在最适合酶的条件下聚合酶的活性至少50%的活性,例如至少60、70、80、85、90、95、96、97、98、99或100%的活性。
如上所述,在一些实施方式中,用于实现所述捕获探针的RNA模板化延伸的手段(例如逆转录酶)和用于实现所述捕获探针的DNA模板化延伸的手段(例如DNA聚合酶)由能够使用RNA和ssDNA作为延伸反应模板的单一酶提供,例如,AMV或MMLV逆转录酶。
本发明的方法可用于捕获(即空间标记)DNA(例如基因组DNA)或DNA和RNA两者。
在捕获DNA的实施方式中,DNA可以是细胞中可能出现的任何DNA分子。因此,它可能是基因组的,即核DNA、线粒体DNA或质体DNA,如叶绿体DNA。在优选实施方式中,DNA是基因组DNA。
在捕获RNA的实施方式中,RNA可以是细胞中可能出现的任何RNA分子。因此,它可能是mRNA、tRNA、rRNA、病毒RNA、小核RNA(snRNA)、小核仁RNA(snoRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、piwi相互作用RNA(piRNA)、核酶RNA、反义RNA或非编码RNA。但最好是mRNA。
在RNA的上下文中,步骤(f)可被视为从捕获的RNA生成cDNA(特别是带标签的cDNA),即与cDNA的合成有关。这将涉及反转录(RT)捕获的RNA的步骤,延伸捕获探针,作为RT引物,使用捕获的RNA作为模板。这样的步骤产生所谓的第一链cDNA,即延伸的探针。
在DNA的上下文中,步骤(f)可被视为从捕获的DNA生成DNA(特别是标记的DNA),即与DNA互补链的合成或其中一条DNA链与捕获探针的连接有关。这可能涉及DNA聚合的步骤,延伸捕获探针,该探针可作为延伸的引物,使用捕获的DNA作为模板产生与捕获探针杂交的互补DNA链。或者,这可能涉及DNA连接的步骤,延伸捕获探针,其可在连接反应中用作底物和任选模板。
如下面将更详细地描述的,生成延伸探针的互补物(例如,第二链cDNA合成)可以在分析延伸的探针的步骤(例如,延伸的探针的序列)之前在单独的步骤中发生,或者可以作为分析步骤的部分发生。因此,例如,生成延伸的探针的互补物(例如,第二链合成)可发生在扩增延伸的探针的第一步骤中。在一些实施方式中,生成延伸的探针的互补物(例如第二链合成)可以与捕获探针的延伸(例如第一链合成)同时发生,或者可以在捕获探针的延伸(例如第一链合成反应)之后立即进行。例如,当模板切换反应用于第二链合成时,第二链合成可与第一链合成反应同时发生。下面详细描述模板切换反应。
因此,在一些实施方式中(即,当所述方法用于捕获RNA时),所述延伸反应包括使用逆转录酶。期望的逆转录酶活性可由一种或多种不同的逆转录酶提供,其合适实例是:M-MLV、MuLV、AMV、HIV、ArrayScriptTM、MultiScribeTM、ThermoScriptTM、和
Figure BDA0003042696400002921
I、II和III酶。如本文所用,术语“逆转录酶”不仅包括天然存在的酶,而且还包括所有此类修饰的衍生物,还包括天然存在的逆转录酶的衍生物。
在本申请的方法中使用的特别优选的逆转录酶包括M-MLV、MuLV、AMV和HIV逆转录酶和衍生物,例如序列修饰的衍生物或其突变体。
M-MLV、MuLV、AMV和HIV逆转录酶的序列修饰衍生物或突变体包括至少保留野生型序列的至少一些功能性(例如逆转录酶)活性的突变体。在不同的反应条件下,如温度、模板浓度、引物浓度等,突变可影响酶的活性概况,如提高或降低聚合速率。突变或序列修饰也可影响酶的RNA酶活性和/或热稳定性。所述逆转录酶可作为包含其他组分的组合物的部分提供,例如增强或改善所述逆转录酶活性的稳定组分,例如RNA酶抑制剂、DNA依赖性DNA合成的抑制剂,例如,放线菌素D。许多逆转录酶的序列修饰衍生物或突变体,例如M-MLV,以及包括未修饰和修饰酶的组合物是本领域已知的,例如ArrayScriptTM、MultiScribeTM、ThermoScriptTM、和
Figure BDA0003042696400002931
I、II、III和IV酶是市售可得的,并且所有这些酶被认为在本发明的方法中是有用的。
在一些实施方式中(即,当所述方法用于捕获DNA时),所述延伸反应包括使用DNA聚合酶。所需DNA聚合酶活性可由一种或多种不同的DNA聚合酶提供。在某些实施方式中,DNA聚合酶来自细菌,即,DNA聚合酶是细菌DNA聚合酶。例如,DNA聚合酶可以来自大肠杆菌属、芽孢杆菌属、嗜热杆菌属或热球菌属的细菌。
可在本发明的方法中发现实用的DNA聚合酶的合适实例包括:大肠杆菌DNA聚合酶I、Bsu DNA聚合酶、Bst DNA聚合酶、Taq DNA聚合酶、Klenow片段、Pwo DNA聚合酶、Pfu DNA聚合酶、T4 DNA聚合酶和T7 DNA聚合酶。如本文所用,术语“DNA聚合酶”不仅包括天然存在的酶,而且还包括所有此类修饰的衍生物,还包括天然存在的DNA聚合酶的衍生物。例如,在一些实施方式中,DNA聚合酶可经修饰以去除5′-3′核酸外切酶活性。
在本申请的方法中使用的特别优选的DNA聚合酶包括大肠杆菌DNA聚合酶I、BsuDNA聚合酶和Klenow片段酶和衍生物,例如序列修饰的衍生物或其突变体。
DNA聚合酶的序列修饰衍生物或突变体包括至少保留野生型序列的一些功能(例如逆转录酶)活性的突变体。在不同的反应条件下,如温度、模板浓度、引物浓度等,突变可影响酶的活性概况,如提高或降低聚合速率。突变或序列修饰也可影响酶的核酸外切酶活性和/或热稳定性。
在一些实施方式中(即,当所述方法用于捕获DNA时),所述延伸反应包括使用DNA连接酶。所需DNA连接酶活性可由一种或多种不同的DNA连接酶提供。在一些实施方式中,DNA连接酶来自细菌,即,DNA连接酶是细菌DNA连接酶。例如,DNA连接酶可以是T4 DNA连接酶。适用于连接步骤的其他酶的其他酶在本领域中是已知的,并且包括例如Tth DNA连接酶、Taq DNA连接酶、热球菌属(菌株9°N)DNA连接酶(9°NTMDNA连接酶,新英格兰生物实验室(New England Biolabs))、和AmpligaseTM(艾匹森特生物技术公司(EpicentreBiotechnologies))。衍生物,例如序列修饰的衍生物或其突变体(定义见上文)也可在本发明的方法中找到实用性。
如上所述,WO 2018/091676(通过引用并入本文)公开了一种方法,其结合了从固体基材(例如阵列)表面释放探针的步骤和使用捕获的核酸作为延伸模板延伸探针的步骤。因此,预期本发明方法的步骤(f)可与从固体基材释放延伸的探针的步骤组合。
在延伸和释放步骤组合的实施方式中,捕获探针不限于阵列上的特定方向。在这方面,释放和延伸步骤的组合消除了对固体基材上捕获探针的特定方向的要求。然而,在一些实施方式中,优选将捕获探针固定在固体基材上,使得其具有能够用作延伸引物的自由3′端。
因此,在优选实施方式中,捕获探针通过其5′端固定在阵列上(优选直接地),并且从5′到3′包含具有以下的核酸分子:
(i)与阵列上的捕获探针的位置相对应的位置域,以及
(ii)捕获域。
此外,由于捕获探针可定向在固体基材上,使得捕获域不自由或不可与生物试样中的核酸分子相互作用(即结合或杂交)(即捕获探针可通过其3′端固定),因此步骤(d)可与步骤(e)同时发生,即步骤(e)可在允许(即适合或促进)生物试样的核酸与所述捕获探针中的捕获域杂交的条件下进行。然而,在优选实施方式中(例如,捕获探针固定在固体基材上,使得它们具有能够作为延伸引物的自由3′端,例如通过它们的5′端)步骤(e)(和可选的步骤(b),(c)和/或(d))可在允许生物试样的核酸与所述捕获探针中的捕获域杂交的条件下进行。
因此,在本发明方法的步骤(f)与从固体基材释放捕获(例如延伸的)探针的步骤相结合,并且捕获探针固定在固体基材上以使其具有能够作为延伸引物的自由3′端(例如通过其5′端)的实施方式中,一些俘获探针可在其延伸之前从固体基材释放,即一些俘获探针被释放并随后延伸。此外,一些捕获探针可以在它们从固体基材释放的同时延伸,即,一些捕获探针同时从固体基材延伸和释放。
从固体基材表面释放捕获探针(例如延伸的探针)的步骤可以通过多种方式实现。释放步骤的主要目的是产生结合(或包括)捕获探针(或其互补物)的位置域的分子,使得DNA(例如cDNA分子或其扩增子)根据其在阵列上的特征(或位置)被“标记”。因此,释放步骤从固体基材(阵列)解离或移除DNA,例如cDNA分子(延伸的探针)或其扩增子。DNA,例如cDNA分子(延伸的探针)或扩增子包括位置域或其互补物(由于它是延伸的探针的部分,例如通过捕获探针的延伸的第一链DNA,如果在阵列上发生互补/第二链合成,则选择性地在延伸的探针的互补链(即第二链DNA)中复制,或者如果在阵列上发生扩增,则复制到扩增子中)。因此,为了产生可与组织样品中的各种区域相关的序列分析数据,延伸的探针(例如,释放的延伸的探针或其互补物)必须包括捕获探针(或其互补物)的位置域。
实施例
实施例1
在使用WO 2012/140224中描述的方法研究转座酶介导的片段化在从生物样品捕获和空间对DNA加标签的方法中的效用时,确定通常用于细胞悬浮液中标签化反应的透化条件(例如,如所述(Corces等,2016,同上)不适用于固定在基材(如阵列)上的生物样品(如组织切片)。
使用图27所示的工作流程,比较了预透化步骤中洗涤剂的效果。简言之,来自冷冻组织样品的组织切片在1%或4%甲醛溶液中在25℃交联10分钟,并且通过添加0.125M甘氨酸使甲醛淬火并且在25℃培养5分钟。组织切片在DPBS中漂洗以去除交联试剂。组织切片随后用异丙醇脱水并风干。这些组织切片适合组织学分析。在预透化之前,组织切片在D-PBS中再水化。
预透化包括在洗涤剂、0.1%Triton-X-100、IGEPAL 0.1%或吐温0.1%、洋地黄素0.01%和NP-400.1%中在25℃孵育再水合组织切片10分钟。
Tn5转座体的组装如Picelli等,2014(上文)所述,并且标签化使用与Corces,M.R.等,改良的ATAC-seq方案减少背景并使冷冻组织的考察成为可能(An improved ATAC-seqprotocol reduces background and enables interrogation of frozen tissues),NatMethods,卷14(10):959-962(2017)相似的条件进行。特别是,从组织切片中去除预透化溶液,并向组织切片中添加50μl的标签化混合物(标记混合物):
2x TD缓冲液25μl
洋地黄素1%0.5μl
Tween-20 10%0.5μl
DPBS 16.5μl
H2O 6.25μl
Tn5(MEDS-40μM)1.25μl.
2X TD缓冲液:
母液体积(针对100ml)最终浓度1M
Tris HCl pH7.6 2ml 20mM
1M MgCl21ml 10mM
二甲基甲酰胺(DMF)20ml 20%
无菌H2O直至100ml NA
在添加DMF之前,用乙酸将TD缓冲液的pH值调节到7.6。
组织切片在37℃温度下在标签化混合物中孵育30分钟,同时以300转/分的转速摇动(提供一个粘合剂盖以防止标签化混合物丢失)。例如用安捷伦生物分析仪(安捷伦)分析从组织样品中获得的核酸样品的片段大小分布。
图30结果表明,被测试的洗涤剂均没有产生通常与标签化相关联的核小体模式。虽然不希望受到理论的约束,但假设在固定的组织切片中,考虑到较大的片段大小分布,使用的洗涤剂对于Tn5转座酶都不足以高效地接近核。
为了使核膜在随后的反应中可被酶接近,组织切片随后经历各种化学或酶的预透化条件。
图32结果表明,胃蛋白酶在0.5M乙酸或核酸外切酶-1缓冲液中可获得成功的预透化。发现胃蛋白酶消化所需的缓冲液的酸度可诱导基因组片段化(图31A-C)。
在保留细胞核完整性的同时,最高效的基因组可及性是在BSA存在下使用胶原酶获得的。37℃的消化时间可根据组织的性质进行调整。例如,小鼠脑组织可在胶原酶溶液中预透化20分钟,以获得最佳可及性(图32C)。胶原酶、胃蛋白酶或蛋白酶-K(图31D)中较长的透化孵育时间可用于捕获基因组DNA片段,而不考虑其染色质可及性。
实施例2
转座体组装
Tn5转座酶可如前所述产生(Picelli等,2014,同上)。简言之,Tn5转座酶蛋白质单体被生产和纯化,随后加载感兴趣的寡核苷酸。ssDNA寡核苷酸包含用于Tn5识别的嵌合端,并且退火以形成在二聚体组装期间被Tn5识别的dsDNA嵌合端寡核苷酸(MEDS)。所述寡核苷酸可含有所需的5′突出端,用于标签化的DNA的功能化。寡核苷酸还可以包含其它单链结构域。
5’磷酸化对标签化的作用
如上所述,MEDS的功能域可采用磷酸化的5′端以允许标签化的DNA连接到捕获探针。这可以通过在溶液中将Tn5与5′磷酸化MEDS寡核苷酸组装来实现。
发现用5′磷酸化的MEDS向Tn5蛋白上溶液内组装(in-solution assembly)的标签化是低效的(图33C)。由于具有5′突出端的未磷酸化MEDS寡核苷酸在嵌合端Tn5结合位点之外具有可及5′羟基,因此通过在ATP存在下将MEDS-Tn5复合物的这些5′端暴露于T4多核苷酸激酶(T4-PNK)来磷酸化组装的复合物。具体而言,将2.5μl Tn5组装的复合物添加到含有以下物质的反应混合物中:
T4 PNK反应缓冲液(10x)1μl
ATP(10mM)1μl
T4 PNK(10U/μl)0.5μl
无核酸酶H2O 5μl
反应在37℃进行30分钟,磷酸化的Tn5复合物被称为“磷酸-Tn5”。
如实施例1所述进行标签化,其中在包含“磷酸-Tn5”(PNK-MEDS-Tn5)的反应混合物中包含:
2x TD缓冲液25μl
洋地黄苷1%0.5μl
Tween-20 10%0.5μl
DPBS 16.5μl
H2O 2.5μl
“磷酸-Tn5”5μl
发现磷酸化MEDS-Tn5复合物(PNK-MEDS-Tn5)保留了大部分转座活性,这与存在过量MEDS情况下的溶液内产生的MEDS-Tn5组装物不同(图34和35)。
实施例3
将标签化物捕获到基材上,空间条码化阵列,可以使用两种主要捕获策略,杂交和连接来进行。策略可能取决于实验的目的,例如,标签化物是单独捕获还是与mRNA转录本同时捕获。下面描述每个捕获策略的代表性实施方式。
使用杂交同时捕获标签化物和mRNA
利用mRNA转录本的多聚(A)尾和多聚(A)加尾标签化的DNA与捕获探针上的多聚T序列杂交,在标准空间条码化阵列上同时捕获标签化物和mRNA(参见例如WO 2012/140224)。这可以通过在标签化物上添加多聚(A)尾来实现,例如,通过在标签化的DNA中填充间隙和连接断裂,然后用末端转移酶(例如末端转移酶脱氧核苷酸转移酶)添加多聚(A)尾。这将产生具有3’-多聚(A)粘性末端的标签化物,模仿mRNA的多聚(A)尾,从而允许同时捕获标签化的DNA和mRNA转录本(图37)。最理想的情况是,所获得的多聚-A粘性端的长度应为18碱基或更长。或者,可以进行与聚合酶(例如DNA聚合酶)的单一反应,而不是顺序反应(例如,间隙填充接着是末端转移酶)。杂交后的步骤与
Figure BDA0003042696400002991
P.L.等,通过空间转录组学可视化和分析组织切片中的基因表达(Visualization and analysis of gene expressionin tissue sections by spatial transcriptomics),Science,卷353,6294,第78-82页(2016)中所述的步骤相同)。
使用连接捕获标签化物
在用Tn5标签化后,进行进一步的透化步骤以允许核内标签化物扩散出组织切片并连接到阵列上的表面探针。连接使用部分双链捕获探针,包括捕获域寡核苷酸(例如夹板寡核苷酸)和表面探针。捕获域寡核苷酸可被视为“夹板寡核苷酸”,其通过高活性Tn5转座酶和表面探针上的互补序列与连接到标签化的DNA的衔接子序列(SEQ ID NO:18)杂交(图38)。连接孵育混合物包含1x T4 DNA连接酶缓冲液、0.02μM夹板寡核苷酸、0.01μM BSA、无核酸酶水和T4 DNA连接酶,体积为T4 DNA连接酶缓冲液的一半。将该混合物添加到每个阵列孔中并在室温下孵育过夜。
实施例4
将来自全人类基因组的纯化的DNA标签化物连接到基材表面上的捕获探针(例如,包括表面探针和带有捕获域的夹板寡核苷酸的部分双链捕获探针),然后进行qPCR和生物分析仪分析(图39)。
根据制造商的说明,在Codelink激活的显微镜载玻片(DN01-0025,Surmodics)表面固定捕获探针(IDT)的表面探针部分以实现连接。固定在表面上的寡核苷酸(例如,表面探针)如下所示(SEQ ID NO:15):
[AmC6]UUUUUGACTCGTAATACGACTCACTATAGGGACACGACGCTCTTCCGATCTNNNNNNNNTGCACGCGGTGTACAGACGT
夹板寡核苷酸(在PBS中稀释2μM)与表面探针在44℃杂交30分钟(图40),从而产生捕获探针。
连接和链胃换杂交
在37℃(0.005weiss U/μl T4 DNA连接酶,0.2mg/ml BSA,1x T4 DNA连接酶缓冲液,8.75ng/μl标签化物),通过向每个孔中添加70μl进行连接2小时(图41A)。连接后,通过在37℃孵育1小时进行链置换聚合(0.27U/μl DNA聚合酶I(#18010-017,英杰公司(Invitrogen)),0.27μg/μl BSA,0.6mM dNTP,1x DNA pol 1反应缓冲液)。
捕获探针的释放和下游分析
对于每个孔,添加70μl释放混合物(0.20μg/μl BSA,0.1U/μl USER酶(#M5505,NEB),并在37℃孵育1小时,从每个孔收集65μl。使用SpeedVac将体积降低至约10μl。然后进行qPCR反应,总反应体积为10μl(1xKAPA HiFi HotStart ReadyMix(#KK2601,KAPABiosystems)、1x EVA绿(#31000,Biotium)和引物(25μM))。按照以下方案进行扩增:72℃10分钟,98℃3分钟,然后在98℃20秒,60℃30秒,72℃30秒进行循环。两对引物用于qPCR,一对包括A-short正向和Nextera反向(包括连接的部分+捕获探针;分别为SEQ ID NO:21和20),另一对包括Nextera正向和Nextera反向(仅包括标签化物部分)。第二对(Nextera正向和Nextera反向;分别为SEQ ID NO:16和20)作为连接的对照,因为只需要将标签化物与夹板寡核苷酸杂交,而不需要连接(图40)。
样品如别处所述进行纯化(Lundin等,通过大规模测序文库制备的并行化提高通量(Increased Throughput by Parallelization of Library Preparation for MassiveSequencing),PLOS ONE,5(4),doi.org/10.1371/journal.pone.0010029(2010),其通过引用纳入本文),然后在20μl洗脱缓冲液中稀释(#19086,凯杰)。根据制造商的方案,使用DNAHS试剂盒(安捷伦)和2100生物分析仪测定平均片段长度(图41B-C)。这些结果表明,不局限于开放染色质,成功地从DNA捕获了片段,并且阴性对照(在两个水平上)是真阴性。
实施例5
根据图42所示的工作流程,将固定的组织切片中纯化的DNA标签化物连接至基材表面上的捕获探针,然后进行qPCR和生物分析仪分析。如实施例4所述,实施夹板寡核苷酸的捕获探针(例如,捕获探针的表面探针)固定和杂交。本实施例中描述了组织处理和附加透化优化条件。
固定,透化和DNA标签化
将组织切片(10μm)置于阵列上,在37℃孵育1分钟,然后在25℃在4%甲醛溶液中交联10分钟。然后组织切片在PBS中漂洗以去除交联试剂。用胶原酶在HBSS缓冲液(0.2U/μl胶原酶,0.2mg/μl BSA)中在37℃预透化20分钟。
使用蛋白酶K(#19131,凯杰)和PKD缓冲液(#1034963,凯杰)以1:8的比例在37℃预透化10分钟,或使用15%胰蛋白酶在37℃预透化10分钟。程序按照图42所示的工作流程进行,包括qPCR和生物分析仪分析,结果如图43所示,
这些结果表明,标签化、连接和下游分析(如qPCR和生物分析仪分析)可在固定的(如固定)生物样品(如组织切片)上进行。
实施例6
将来自固定的组织切片的纯化的DNA标签化物(通过衔接子)连接到基材表面上的表面探针,然后进行qPCR和Cy5标记的寡核苷酸杂交。工作流遵循实施例5,但有以下更改:
仅使用蛋白酶K(#19131,凯杰)和PKD缓冲液(#1034963,凯杰)以1∶8的比例在37℃进行预透化和透化处理10分钟,标签化时间从30分钟延长到45分钟。
此外,组织切除后的平行下游分析包括在室温对连接的标签化物进行基于表面的变性(1M NaOH)10分钟,然后进行Cy5标记的寡核苷酸杂交。图45显示了来自两个实验(图45A-B)和阴性对照(未磷酸化的标签化物)(图45C)的qPCR数据。图45D显示了带有Cy5标记的寡核苷酸的DNA标签化物的空间捕获模式的图像。生物分析仪的结果显示,组织切片2中的信号减弱(图45B),并且出现更零星的峰型。图45D显示Cy5-图像(右)类似于苏木精-伊红图像(左)。
SEQ ID NO:1-Tn5转座酶
Figure BDA0003042696400003021
SEQ ID NO:2-噬菌体Mu转座酶
Figure BDA0003042696400003031
SEQ ID NO:3-胃蛋白酶
Figure BDA0003042696400003032
SEQ ID NO:4-胃蛋白酶
Figure BDA0003042696400003033
Figure BDA0003042696400003041
SEQ ID NO:5-胶原酶
Figure BDA0003042696400003042
SEQ ID NO:6-胶原酶
Figure BDA0003042696400003051
SEQ ID NO:7-蛋白酶K
Figure BDA0003042696400003052
Figure BDA0003042696400003061
SEQ ID NO:8Tn5嵌合端序列
Figure BDA0003042696400003062
SEQ ID NO:9-Mu转座酶识别序列
Figure BDA0003042696400003063
SEQ ID NO 10-Mu转座酶识别序列
Figure BDA0003042696400003064
SEQ ID NO:11-Mu转座酶识别序列
Figure BDA0003042696400003065
SEQ ID NO:12-Mu转座酶识别序列
Figure BDA0003042696400003066
SEQ ID NO:13-Mu转座酶识别序列
Figure BDA0003042696400003067
SEQ ID NO:14-Mu转座酶识别序列
Figure BDA0003042696400003071
SEQ ID NO:15-捕获探针的表面探针
Figure BDA0003042696400003072
SEQ ID NO:16-第一衔接子
Figure BDA0003042696400003073
SEQ ID NO:17-捕获域
Figure BDA0003042696400003074
SEQ ID NO:18-杂交域
Figure BDA0003042696400003075
SEQ ID NO:19-与杂交域互补的夹板寡核苷酸
ACGTCTGTAC ACCGCGTGCA
SEQ ID NO:20-第二衔接子
Figure BDA0003042696400003076
SEQ ID NO:21-A-short正向
Figure BDA0003042696400003077
权利要求书(按照条约第19条的修改)
1.一种用于对生物样品中存在的基因组DNA进行空间分析的方法,所述方法包括:
提供包括多个捕获探针的阵列,其中所述多个捕获探针的捕获探针包含空间条形码和捕获域;
在足以使生物样品中的基因组DNA发生转座子插入的条件下透化所述生物样品;
在其中转座子序列被插入基因组DNA的条件下向所述生物样品提供转座子序列和转座酶;
允许转座酶从基因组DNA中切除插入的转座子序列,从而产生片段化的基因组DNA;
在其中捕获探针与片段化的基因组DNA相互作用的条件下,将包含片段化的基因组DNA的生物样品与阵列接触;并且
将阵列上的捕获探针的位置与生物样品中的位置相关联,从而在空间上分析片段化的基因组DNA。
2.如权利要求1所述的方法,其中在基材上提供包含多个捕获探针的阵列。
3.如权利要求1所述的方法,其中在特征上提供包含多个捕获探针的阵列。
4.如权利要求1-3中任一项所述的方法,其中所述捕获探针直接或间接附接。
5.如权利要求1-4中任一项所述的方法,其中在基材上的特征上提供包含多个捕获探针的阵列。
6.如权利要求1-5中任一项所述的方法,其中所述基材包括微流体通道。
7.如权利要求1-6中任一项所述的方法,其中所述捕获探针还包括裂解域、功能域和独特标识符中的一个或多个,或其组合。
8.如权利要求1-7中任一项所述的方法,还包括迁移步骤,其中使片段化的基因组DNA迁移到基材。
9.如权利要求8所述的方法,其中所述迁移步骤是主动迁移步骤,包括向片段化的基因组DNA施加电场。
10.如权利要求8所述的方法,其中所述迁移步骤是包括扩散的被动迁移步骤。
11.如权利要求8-10中任一项所述的所述的方法,其中来自生物样品的片段化的基因组DNA的迁移包括将生物样品和特征暴露于热中。
12.如权利要求1-11中任一项所述的方法,其中所述生物样品固定在所述基材上。
13.如权利要求1-12中任一项所述的方法,其中所述转座酶是二聚体,其包含第一单体,所述第一单体与包括转座子末端序列和与捕获域互补的序列的第一衔接子复合,其中第二单体与包括转座子末端序列和第二衔接子序列的第二衔接子复合,其中转座酶将第一衔接子和第二衔接子连接到片段化的基因组DNA。
14.如权利要求13所述的方法,其中第一衔接子和第二衔接子具有5′端和3′端,其中5′端原位磷酸化。
15.如权利要求13或14所述的方法,其中在片段化DNA之前,与第一单体复合的第一衔接子的5′端和与第二单体复合的第二衔接子的5′端被磷酸化。
16.如权利要求14或15所述的方法,其中磷酸化与第一单体复合的第一衔接子和与第二单体复合的第二衔接子的5′端的步骤包括在ATP存在下使第一单体:第一衔接子复合物和第二单体:第二衔接子复合物与多核苷酸激酶接触。
17.如权利要求1-16中任一项所述的方法,其中所述捕获探针的捕获域包括与和第一衔接子的捕获域互补的序列杂交的序列。
18.如权利要求13-17中任一项所述的方法,其中所述捕获探针是部分双链分子,其包含第一链,所述第一链包含杂交到第二链的捕获域,并且其中所述第一链作为将所述第一衔接子连接到所述第二链的模板。
19.如权利要求13-18中任一项所述的方法,其中与捕获探针杂交的与捕获域或其部分互补的第一衔接子序列作为连接并将第一衔接子的5′端连接到捕获探针的3′端的模板。
20.如权利要求1-19中任一项所述的方法,其中所述捕获探针包括表面探针和夹板寡核苷酸,并且其中所述夹板寡核苷酸包括与表面探针的杂交域或其部分互补的序列。
21.如权利要求20所述的方法,其中所述夹板寡核苷酸包含具有与第一衔接子或其部分互补的序列的捕获域。
22.如权利要求20或21所述的方法,其中所述夹板寡核苷酸与第一衔接子或其部分杂交,并且与表面探针的杂交域或其部分杂交。
23.如权利要求20-22中任一项所述的方法,其中在夹板寡核苷酸存在下进行连接,从而连接捕获探针的表面探针和第一衔接子。
24.如权利要求13-23中任一项所述的方法,其中通过第一衔接子与捕获探针杂交的片段化的基因组DNA是用于产生延伸的捕获探针的延伸模板,该延伸的捕获探针包括空间条形码的序列和与片段化的基因组DNA互补的序列。
25.如权利要求24所述的方法,其中用DNA聚合酶延伸与片段化的基因组DNA杂交的捕获探针。
26.如权利要求25所述的方法,其中所述DNA聚合酶具有链置换活性。
27.如权利要求1-26中任一项所述的方法,还包括对片段化的基因组DNA中的单链断裂进行间隙修复。
28.如权利要求13-26中任一项所述的方法,其中与所述捕获探针互补的序列是独特序列。
29.如权利要求1-28中任一项所述的方法,其中所述捕获探针通过DNA连接酶连接到片段化的基因组DNA。
30.如权利要求1-29中任一项所述的方法,其中所述转座酶是Tn5转座酶或其功能性衍生物。
31.如权利要求30所述的方法,其中所述Tn5转座酶包含与SEQ ID NO:1具有至少80%相同性的序列。
32.如权利要求1-29中任一项所述的方法,其中所述转座酶是Mu转座酶或其功能性衍生物。
33.如权利要求32所述的方法,其中所述Mu转座酶包含与SEQ ID NO:2具有至少80%相同性的序列。
34.如权利要求13所述的方法,其中所述转座子末端序列包含与SEQ ID NO:8具有至少80%相同性的序列。
35.如权利要求13所述的方法,其中所述转座子末端序列包含与SEQ ID NO:9-14中的任一个具有至少80%相同性的序列。
36.如权利要求1-35中任一项所述的方法,其中在化学透化条件、酶透化条件或两者下进行生物样品透化。
37.如权利要求36所述的方法,其中所述化学透化条件包括将生物样品与碱性溶液接触。
38.如权利要求36或37所述的方法,其中所述酶透化条件包括将生物样品与包含蛋白酶的酸性溶液接触。
39.如权利要求38所述的方法,其中所述蛋白酶是天冬氨酰蛋白酶、优选胃蛋白酶、胃蛋白酶样酶或其功能等效物。
40.如权利要求39所述的方法,其中所述胃蛋白酶、胃蛋白酶样酶或其功能等效物包含与SEQ ID NO:3或4具有至少80%相同性的序列。
41.如权利要求36-40中任一项所述的方法,其中所述酶透化条件包括将所述生物样品与以下接触:
(i)锌内肽酶,胶原酶,胶原酶样酶或其功能等效物;
(ii)丝氨酸蛋白酶,蛋白酶K酶,蛋白酶K样酶或其功能等效物;或
(iii)两者。
42.如权利要求41所述的方法,其中所述胶原酶、胶原酶样酶或其功能等效物包含与SEQ ID NO:5或6具有至少80%相同性的序列。
43.如权利要求41或42所述的方法,其中所述蛋白酶K酶、蛋白酶K样酶或其功能等效物包含与SEQ ID NO:7具有至少80%相同性的序列。
44.如权利要求25或26所述的方法,其中使用与捕获探针杂交的片段化的基因组DNA作为延伸模板产生DNA分子。
45.如权利要求18或19所述的方法,其中使用与捕获探针杂交的片段化的基因组DNA作为连接模板产生DNA分子。
46.如权利要求44或45所述的方法,包括分析DNA分子的步骤。
47.如权利要求46所述的方法,其中分析DNA分子的步骤包括测序。
48.如权利要求1-47中任一项所述的方法,其中将捕获探针的空间条形码和与捕获探针相关联的片段化的基因组DNA相关联的步骤在空间上分析片段化的基因组DNA。
49.如权利要求1-48中任一项所述的方法,还包括其中生物样品在所述生物样品与基材接触之前或之后成像的步骤。
50.一种用于如权利要求1-49中任一项所定义的用于对生物样品的核酸进行空间分析的方法的试剂盒,其中所述试剂盒包括以下的任意两个或更多个:
(i)其上存在多个捕获探针的阵列;
(ii)一种或多种生物样品透化试剂;
(iii)一种或多种转座酶;
(iv)一种或多种逆转录酶;并且
(v)一种或多种裂解酶。
51.一种用于对生物样品中存在的基因组DNA和RNA进行空间分析的方法,所述方法包括:
提供阵列,其中所述阵列包括多个捕获探针,其中,所述多个捕获探针中的第一捕获探针包括空间条形码和第一捕获域,并且其中所述多个捕获探针中的第二捕获探针包括空间条形码和第二捕获域;
在足以使生物样品中的基因组DNA发生转座子插入的条件下透化所述生物样品;
在其中转座子序列被插入基因组DNA的条件下向所述生物样品提供转座子序列和转座酶;
允许转座酶从基因组DNA中切除插入的转座子序列,从而产生片段化的基因组DNA;
在其中第一捕获域与片段化的基因组DNA相互作用并且第二捕获域与RNA相互作用的条件下,将包含片段化的基因组DNA和RNA的生物样品与阵列接触;并且
将阵列上的第一捕获探针的位置与生物样品中的位置相关联,并且将阵列上的第二捕获探针的位置与生物样品中的位置相关联,从而在空间上分析生物样品中位置处的片段化的基因组DNA和RNA。
52.如权利要求51所述的方法,其中所述RNA是mRNA。
53.如权利要求51或52所述的方法,其中所述第一捕获域和第二捕获域是相同的。
54.如权利要求53所述的方法,其中所述第一捕获域和第二捕获域包含均聚多聚(T)序列。
55.如权利要求51-54中任一项所述的方法,其中所述第一捕获域和第二捕获域是不同的。
56.如权利要求55所述的方法,其中所述第一捕获域包括随机序列,第二捕获域包括多聚(T)序列。
57.如权利要求51-56中任一项所述的方法,其中在基材上提供包含多个捕获探针的阵列。
58.如权利要求51-56中任一项所述的方法,其中在特征上提供包含多个捕获探针的阵列。
59.如权利要求58所述的方法,其中所述特征包括第一捕获探针、第二捕获探针或两者。
60.如权利要求51-59中任一项所述的方法,其中所述第一捕获探针、第二捕获探针或两者直接或间接地附接。
61.如权利要求51-60中任一项所述的方法,其中在基材上的特征上提供包含多个捕获探针的阵列。
62.如权利要求51-61中任一项所述的方法,其中所述基材包括微流体通道。
63.如权利要求51-62中任一项所述的方法,其中所述第一捕获探针、第二捕获探针或两者包括裂解域、功能域和独特标识符中的一个或多个,或其组合。
64.如权利要求51-63中任一项所述的方法,包括迁移步骤,其中片段化的基因组DNA和RNA迁移到基材。
65.如权利要求64所述的方法,其中所述迁移步骤是主动迁移步骤。
66.如权利要求64所述的方法,其中所述迁移步骤是被动迁移步骤。
67.如权利要求64-66所述的方法,其中来自生物样品的片段化的基因组DNA和RNA的迁移包括将生物样品暴露于热中。
68.如权利要求51-67中任一项所述的方法,其中所述生物样品固定在所述基材上。
69.如权利要求51-68中任一项所述的方法,其中通过用连接酶连接断裂来修复片段化的基因组DNA。
70.如权利要求51-69中任一项所述的方法,还包括对片段化的基因组DNA中的单链断裂进行间隙修复。
71.如权利要求51-70中任一项所述的方法,其中将与第一捕获探针的第一捕获域互补的序列引至片段化的基因组DNA。
72.如权利要求51-71中任一项所述的方法,其中第一捕获探针的第一捕获域和与引至片段化的基因组DNA的捕获域互补的序列杂交。
73.如权利要求57所述的方法,其中第一捕获域的随机序列与片段化的基因组DNA杂交。
74.如权利要求51-73中任一项所述的方法,其中二捕获探针的第二捕获结构域与mRNA中的互补序列杂交。
75.如权利要求71-74中任一项所述的方法,其中与第一捕获域互补的序列和mRNA中的互补序列是均聚序列。
76.如权利要求75所述的方法,其中所述均聚序列是多聚(A)序列。
77.如权利要求51-76中任一项所述的方法,包括使用片段化的基因组DNA作为延伸模板来延伸第一捕获探针,并且使用RNA作为延伸模板来延伸第二捕获探针。
78.如权利要求77所述的方法,其中用DNA聚合酶延伸第一捕获探针。
79.如权利要求78所述的方法,其中用逆转录酶延伸第二捕获探针。
80.如权利要求51-79中任一项所述的方法,其中所述转座酶是Tn5转座酶或其功能性衍生物。
81.如权利要求80所述的方法,其中所述Tn5转座酶包含与SEQ ID NO:1具有至少80%相同性的序列。
82.如权利要求51-79中任一项所述的方法,其中所述转座酶是Mu转座酶或其功能性衍生物。
83.如权利要求82所述的方法,其中所述Mu转座酶包含与SEQ ID NO:2具有至少80%相同性的序列。
84.如权利要求51-83中任一项所述的方法,其中所述转座酶与包含转座子末端序列的衔接子复合。
85.如权利要求84所述的方法,其中所述转座子末端序列包含与SEQ ID NO:8具有至少80%相同性的序列。
86.如权利要求84所述的方法,其中所述转座子末端序列包含与SEQ ID NO:9-14中的任一个具有至少80%相同性的序列。
87.如权利要求51-86中任一项所述的方法,其中在化学透化条件、酶透化条件或两者下进行生物样品透化。
88.如权利要求87所述的方法,其中所述化学透化条件包括将生物样品与碱性溶液接触。
89.如权利要求86或87所述的方法,其中所述酶透化条件包括将生物样品与包含蛋白酶的酸性溶液接触。
90.如权利要求89所述的方法,其中所述蛋白酶是天冬氨酰蛋白酶、优选胃蛋白酶、胃蛋白酶样酶或其功能等效物。
91.如权利要求90所述的方法,其中所述胃蛋白酶、胃蛋白酶样酶或其功能等效物包含与SEQ ID NO:3或4具有至少80%相同性的序列。
92.如权利要求86-91中任一项所述的方法,其中所述酶透化条件包括将所述生物样品与以下接触:
(i)锌内肽酶,胶原酶,胶原酶样酶或其功能等效物;
(ii)丝氨酸蛋白酶,蛋白酶K酶,蛋白酶K样酶或其功能等效物;或
(iii)两者。
93.如权利要求92所述的方法,其中所述胶原酶、胶原酶样酶或其功能等效物包含与SEQ ID NO:5或6具有至少80%相同性的序列。
94.如权利要求92或93所述的方法,其中所述蛋白酶K酶、蛋白酶K样酶或其功能等效物包含与SEQ ID NO:7具有至少80%相同性的序列。
95.如权利要求51-94中任一项所述的方法,其中分析DNA分子的步骤包括测序。
96.如权利要求51-95中任一项所述的方法,其中将第一捕获探针的空间条形码和与第一捕获探针相关联的片段化的基因组DNA相关联的步骤在空间上分析片段化的基因组DNA。
97.如权利要求51-96中任一项所述的方法,其中将第二捕获探针的空间条形码和与第二捕获探针相关联的mRNA相关联在空间上分析mRNA。
98.如权利要求51-97中任一项所述的方法,还包括其中生物样品在所述生物样品与基材接触之前或之后成像的步骤。
99.一种用于确定生物样品中分析物的位置的方法,包括:
(a)使生物样品接触包括多个捕获探针的基材,其中所述多个的捕获探针包括空间条形码和与来自所述生物样品的分析物特异性结合的捕获域;并且
(b)确定(i)与所述捕获域特异性结合的分析物序列的全部或部分,或其互补物;和(ii)所述空间条形码的全部或部分,或其互补物,并且使用(i)或(ii)的确定的序列来确定生物样品中分析物的位置,其中所述生物样品是细胞培养物,生物体或类器官。
100.如权利要求99所述的方法,其中在步骤(b)之前透化所述生物样品。
101.如权利要求99所述的方法,还包括在步骤(b)之前透化所述生物样品。
102.如权利要求101所述的方法,还包括在透化所述生物样品的步骤之前固定所述生物样品。
103.如权利要求99-102中任一项所述的方法,其中所述生物体是线虫、植物、真菌、昆虫、蛛形纲动物、鱼类、两栖类或爬行类。
104.如权利要求99-102中任一项所述的方法,其中所述细胞培养物包括多个细胞。
105.如权利要求104所述的方法,其中所述多个细胞是非贴壁细胞。
106.如权利要求104或105所述的方法,其中所述多个细胞来自解离的组织或组织切片。
107.如权利要求104-106中任一项所述的方法,其中在所述细胞分布到基材上之后,所述多个细胞的细胞固定在所述基材上。
108.如权利要求107所述的方法,其中所述多个细胞的细胞通过聚合物涂层固定在所述基材上。
109.如权利要求107所述的方法,其中所述多个细胞的细胞通过凝集素、聚-赖氨酸、抗体或多糖固定在所述基材上。
110.如权利要求104所述的方法,其中所述多个细胞是贴壁细胞。
111.如权利要求110所述的方法,其中所述贴壁细胞来自选自下组的细胞系:BT549、HS578T、MCF7、MDA-MB-231、MDAMB-468、T-47D、SF268、SF295、SF539、SNB-19、SNB-75、U251、Colo205、HCC 2998、HCT-116、HCT-15、HT29、KM12、SW620、786-O、A498、ACHN、CAKI、RXF 393、SN12C、TK-10、UO-31、A549、EKVX、HOP-62、HOP-92,NCI-H226、NCI-H23、NCI-H460、NCI-H522、LOXIMVI、M14、MALME-3M、MDA-MB-435、SK-、EL-2、SK-MEL-28、SK-MEL-5、UACC-257、UACC-62、IGROV1、OVCAR-3、OVCAR-4、OVCAR-5、OVCAR-8、SK-OV-3、NCI-ADR-RES、DU145、PC-3、DU145、H295R、HeLa、KBM-7、LNCaP、MCF-7、MDA-MB-468、PC3、SaOS-2、SH-SY5Y、T-47D、THP-1、U87、vero、MC3T3、GH3、PC12、狗MDCK肾上皮、爪蟾A6肾上皮、斑马鱼AB9和Sf9昆虫上皮细胞系。
112.如权利要求99-111中任一项所述的方法,还包括对所述生物样品进行成像。
113.如权利要求112所述的方法,其中所述成像用于确定生物样品中的感兴趣区域。
114.如权利要求112所述的方法,其中所述成像用于确定生物样品或所述生物样品的区域的形态。
115.如权利要求114所述的方法,还包括将所述生物样品或所述生物样品的区域的形态与所述生物样品中分析物的位置相关联。
116.如权利要求99-115中任一项所述的方法,其中所述分析物是DNA。
117.如权利要求99-115中任一项所述的方法,其中所述分析物是RNA。
118.如权利要求117所述的方法,其中所述捕获域包括多聚-dT序列。
119.如权利要求99-118中任一项所述的方法,其中所述捕获探针还包括独特分子标识符(UMI)。
120.如权利要求99-119中任一项所述的方法,其中所述捕获探针还包括功能域。
121.如权利要求99-120中任一项所述的方法,其中所述捕获探针还包括裂解域。
122.一种用于对生物样品中的核酸进行空间分析的方法,所述方法包括:
(a)使所述生物样品与包括固定在阵列上的多个捕获探针的阵列接触,其中所述多个捕获探针的捕获探针包含空间条形码和捕获域;
(b)使聚合物材料与所述生物样品接触,并活化所述聚合物材料以形成水凝胶包埋的生物样品;
(c)在足以使所述生物样品中的核酸特异性结合所述捕获域的条件下透化所述水凝胶包埋的生物样品;
(d)扩增与所述捕获域特异性结合的RNA以生成具有序列的扩增子,其中所述扩增子包含空间条形码的全部或部分或其互补物,和所述核酸序列的全部或部分或其互补物;并且
(e)通过用多个标记的探针依次杂交和检测来确定所述扩增子的序列,并使用确定的扩增子序列来鉴定所述生物样品中核酸的位置。
123.如权利要求122所述的方法,其中步骤(d)包括扩增与所述捕获域原位特异性结合的核酸。
124.如权利要求122或123所述的方法,其中步骤(e)包括对所述扩增子进行测序。
125.如权利要求122-124中任一项所述的方法,其中所述多个标记的探针是多个荧光标记的探针。
126.如权利要求122-125中任一项所述的方法,其中在化学透化条件、酶透化条件或两者下进行步骤(c)中的透化。
127.如权利要求122-126中任一项所述的方法,其中所述生物样品包括组织切片。
128.如权利要求122-127中任一项所述的方法,其中所述核酸是RNA。
129.如权利要求122-127中任一项所述的方法,其中所述核酸是DNA。
130.一种核酸,其包括:
(a)第一单链寡核苷酸,其包括:
空间条形码;
引物结合位点;
独特分子标识符;和
第一杂交序列;以及
(b)夹板寡核苷酸,其包含:
与所述第一杂交序列特异性结合的第二杂交序列;和
捕获域。
131.如权利要求130所述的核酸,其中所述第一单链寡核苷酸在5’到3’方向上包含:
空间条形码;
引物结合位点;
独特分子标识符;和
第一杂交序列。
132.如权利要求131所述的核酸,其中所述第一单链寡核苷酸的5’末端附接至基材。
133.如权利要求130-132中任一项所述的核酸,其中所述夹板寡核苷酸在5’到3’方向上包含捕获域和第二杂交序列。
134.如权利要求133所述的核酸,其中所述捕获域包括能够与单链标签化物中存在的序列特异性结合的序列。
135.如权利要求134所述的核酸,其中所述单链标签化物中存在的序列是第一衔接子中存在的序列。
136.一种组合物,其包含:
(a)如权利要求130-133中任一项所述的核酸;和
(b)包含第一衔接子的单链标签化物,所述第一衔接子包含能够与捕获域特异性结合的序列。
137.如权利要求136所述的组合物,其中所述单链标签化物在其5’末端包括第一衔接子序列。
138.如权利要求136或137所述的组合物,其中所述第一衔接子序列还包含第一衔接子转座子末端序列。
139.如权利要求138所述的组合物,其中所述第一衔接子序列在5’到3’方向上包括能够与所述捕获域特异性结合的序列和第一衔接子转座子末端序列。
140.如权利要求136-139中任一项所述的组合物,其中所述单链标签化物还包括第二衔接子。
141.如权利要求136-138中任一项所述的方法,其中所述单链标签化物在其3’末端包括第二衔接子。
142.如权利要求141所述的方法,其中所述第二衔接子序列包括第二衔接子转座子末端序列和引物结合位点或其互补物。
143.一种组合物,其包含:
(a)如权利要求130-133中任一项所述的核酸;
(b)来自生物样品的DNA;和
(c)转座酶二聚体,其包含:
(i)与第一衔接子复合的第一转座酶单体,所述第一衔接子包含第一转座子末端序列和能够与捕获域特异性结合的序列;
(ii)与第二衔接子复合的第二转座酶单体,所述第二衔接子包含第二转座子末端序列和引物结合位点或其互补物。
144.如权利要求143所述的组合物,其中所述第一衔接子的5’端被磷酸化。
145.如权利要求143所述的组合物,其中所述第二衔接子的5’端被磷酸化。
146.一种组合物,其包含:
(a)如权利要求130-133中任一项所述的核酸;
(b)来自生物样品的DNA;和
(c)与第一衔接子复合的第一转座酶单体,所述第一衔接子包含第一转座子末端序列和能够与捕获域特异性结合的序列;和
(d)与第二衔接子复合的第二转座酶单体,所述第二衔接子包含第二转座子末端序列和引物结合位点或其互补物。
147.如权利要求146所述的组合物,其中所述第一衔接子的5’端被磷酸化。
148.如权利要求146所述的组合物,其中所述第二衔接子的5’端被磷酸化。

Claims (98)

1.一种用于对生物样品中存在的基因组DNA进行空间分析的方法,所述方法包括:
提供包括多个捕获探针的阵列,其中所述多个捕获探针的捕获探针包含空间条形码和捕获域;
在足以使生物样品中的基因组DNA发生转座子插入的条件下透化所述生物样品;
在其中转座子序列被插入基因组DNA的条件下向所述生物样品提供所述转座子序列和转座酶;
允许转座酶从基因组DNA中切除插入的转座子序列,从而产生片段化的基因组DNA;
在其中捕获探针与片段化的基因组DNA相互作用的条件下,将包含片段化的基因组DNA的生物样品与所述阵列接触;并且
将所述阵列上的捕获探针的位置与生物样品中的位置相关联,从而在空间上分析片段化的基因组DNA。
2.如权利要求1所述的方法,其中在基材上提供包含多个捕获探针的阵列。
3.如权利要求1所述的方法,其中在特征上提供包含多个捕获探针的阵列。
4.如权利要求1-3中任一项所述的方法,其中所述捕获探针直接或间接附接。
5.如权利要求1-4中任一项所述的方法,其中在基材上的特征上提供包含多个捕获探针的阵列。
6.如权利要求1-5中任一项所述的方法,其中所述基材包括微流体通道。
7.如权利要求1-6中任一项所述的方法,其中所述捕获探针还包括裂解域、功能域和独特标识符中的一个或多个,或其组合。
8.如权利要求1-7中任一项所述的方法,还包括迁移步骤,其中使片段化的基因组DNA迁移到基材。
9.如权利要求8所述的方法,其中所述迁移步骤是主动迁移步骤,包括向片段化的基因组DNA施加电场。
10.如权利要求8所述的方法,其中所述迁移步骤是包括扩散的被动迁移步骤。
11.如权利要求8-10中任一项所述的方法,其中来自生物样品的片段化的基因组DNA的迁移包括将生物样品和特征暴露于热中。
12.如权利要求1-11中任一项所述的方法,其中所述生物样品固定在所述基材上。
13.如权利要求1-12中任一项所述的方法,其中所述转座酶是二聚体,其包含第一单体,所述第一单体与包括转座子末端序列和与捕获域互补的序列的第一衔接子复合,其中第二单体与包括转座子末端序列和第二衔接子序列的第二衔接子复合,其中转座酶将第一衔接子和第二衔接子连接到片段化的基因组DNA。
14.如权利要求13所述的方法,其中第一衔接子和第二衔接子具有5′端和3′端,其中5′端原位磷酸化。
15.如权利要求13或14所述的方法,其中在片段化DNA之前,与第一单体复合的第一衔接子的5′端和与第二单体复合的第二衔接子的5′端被磷酸化。
16.如权利要求14或15所述的方法,其中磷酸化与第一单体复合的第一衔接子和与第二单体复合的第二衔接子的5′端的步骤包括在ATP存在下使第一单体:第一衔接子复合物和第二单体:第二衔接子复合物与多核苷酸激酶接触。
17.如权利要求1-16中任一项所述的方法,其中所述捕获探针的捕获域包括与和第一衔接子的捕获域互补的序列杂交的序列。
18.如权利要求13-17中任一项所述的方法,其中所述捕获探针是部分双链分子,其包含第一链,所述第一链包含杂交到第二链的捕获域,并且其中所述第一链作为将所述第一衔接子连接到所述第二链的模板。
19.如权利要求13-18中任一项所述的方法,其中与捕获探针杂交的、与捕获域或其部分互补的第一衔接子序列作为连接并将第一衔接子的5′端连接到捕获探针的3′端的模板。
20.如权利要求1-19中任一项所述的方法,其中所述捕获探针包括表面探针和夹板寡核苷酸,并且其中所述夹板寡核苷酸包括与表面探针的杂交域或其部分互补的序列。
21.如权利要求20所述的方法,其中所述夹板寡核苷酸包含具有与第一衔接子或其部分互补的序列的捕获域。
22.如权利要求20或21所述的方法,其中所述夹板寡核苷酸与第一衔接子或其部分杂交,并且与表面探针的杂交域或其部分杂交。
23.如权利要求20-22中任一项所述的方法,其中在夹板寡核苷酸存在下进行连接,从而连接捕获探针的表面探针和第一衔接子。
24.如权利要求13-23中任一项所述的方法,其中通过第一衔接子与捕获探针杂交的片段化的基因组DNA是用于产生延伸的捕获探针的延伸模板,该延伸的捕获探针包括空间条形码的序列和与片段化的基因组DNA互补的序列。
25.如权利要求24所述的方法,其中用DNA聚合酶延伸与片段化的基因组DNA杂交的捕获探针。
26.如权利要求25所述的方法,其中所述DNA聚合酶具有链置换活性。
27.如权利要求1-26中任一项所述的方法,还包括对片段化的基因组DNA中的单链断裂进行间隙修复。
28.如权利要求13-26中任一项所述的方法,其中与所述捕获探针互补的序列是独特序列。
29.如权利要求1-28中任一项所述的方法,其中所述捕获探针通过DNA连接酶连接到片段化的基因组DNA。
30.如权利要求1-29中任一项所述的方法,其中所述转座酶是Tn5转座酶或其功能性衍生物。
31.如权利要求30所述的方法,其中所述Tn5转座酶包含与SEQ ID NO:1具有至少80%相同性的序列。
32.如权利要求1-29中任一项所述的方法,其中所述转座酶是Mu转座酶或其功能性衍生物。
33.如权利要求32所述的方法,其中所述Mu转座酶包含与SEQ ID NO:2具有至少80%相同性的序列。
34.如权利要求13所述的方法,其中所述转座子末端序列包含与SEQ ID NO:8具有至少80%相同性的序列。
35.如权利要求13所述的方法,其中所述转座子末端序列包含与SEQ ID NO:9-14中的任一个具有至少80%相同性的序列。
36.如权利要求1-35中任一项所述的方法,其中在化学透化条件、酶透化条件或两者下进行生物样品透化。
37.如权利要求36所述的方法,其中所述化学透化条件包括将生物样品与碱性溶液接触。
38.如权利要求36或37所述的方法,其中所述酶透化条件包括将生物样品与包含蛋白酶的酸性溶液接触。
39.如权利要求38所述的方法,其中所述蛋白酶是天冬氨酰蛋白酶、优选胃蛋白酶、胃蛋白酶样酶或其功能等效物。
40.如权利要求39所述的方法,其中所述胃蛋白酶、胃蛋白酶样酶或其功能等效物包含与SEQ ID NO:3或4具有至少80%相同性的序列。
41.如权利要求36-40中任一项所述的方法,其中所述酶透化条件包括将所述生物样品与以下接触:
(i)锌内肽酶,胶原酶,胶原酶样酶或其功能等效物;
(ii)丝氨酸蛋白酶,蛋白酶K酶,蛋白酶K样酶或其功能等效物;或
(iii)两者。
42.如权利要求41所述的方法,其中所述胶原酶、胶原酶样酶或其功能等效物包含与SEQ ID NO:5或6具有至少80%相同性的序列。
43.如权利要求41或42所述的方法,其中所述蛋白酶K酶、蛋白酶K样酶或其功能等效物包含与SEQ ID NO:7具有至少80%相同性的序列。
44.如权利要求25或26所述的方法,其中使用与捕获探针杂交的片段化的基因组DNA作为延伸模板产生DNA分子。
45.如权利要求18或19所述的方法,其中使用与捕获探针杂交的片段化的基因组DNA作为连接模板产生DNA分子。
46.如权利要求44或45所述的方法,包括分析DNA分子的步骤。
47.如权利要求46所述的方法,其中分析DNA分子的步骤包括测序。
48.如权利要求1-47中任一项所述的方法,其中将捕获探针的空间条形码和与捕获探针相关联的片段化的基因组DNA相关联的步骤在空间上分析片段化的基因组DNA。
49.如权利要求1-48中任一项所述的方法,还包括其中生物样品在所述生物样品与基材接触之前或之后成像的步骤。
50.一种用于如权利要求1-49中任一项所定义的用于对生物样品的核酸进行空间分析的方法的试剂盒,其中所述试剂盒包括以下的任意两个或更多个:
(i)其上存在多个捕获探针的阵列;
(ii)一种或多种生物样品透化试剂;
(iii)一种或多种转座酶;
(iv)一种或多种逆转录酶;并且
(v)一种或多种裂解酶。
51.一种用于对生物样品中存在的基因组DNA和RNA进行空间分析的方法,所述方法包括:
提供阵列,其中所述阵列包括多个捕获探针,其中,所述多个捕获探针中的第一捕获探针包括空间条形码和第一捕获域,并且其中所述多个捕获探针中的第二捕获探针包括空间条形码和第二捕获域;
在足以使生物样品中的基因组DNA发生转座子插入的条件下透化所述生物样品;
在其中转座子序列被插入基因组DNA的条件下向所述生物样品提供转座子序列和转座酶;
允许转座酶从基因组DNA中切除插入的转座子序列,从而产生片段化的基因组DNA;
在其中第一捕获域与片段化的基因组DNA相互作用并且第二捕获域与RNA相互作用的条件下,将包含片段化的基因组DNA和RNA的生物样品与阵列接触;并且
将阵列上的第一捕获探针的位置与生物样品中的位置相关联,并且将阵列上的第二捕获探针的位置与生物样品中的位置相关联,从而在空间上分析生物样品中位置处的片段化的基因组DNA和RNA。
52.如权利要求51所述的方法,其中所述RNA是mRNA。
53.如权利要求51或52所述的方法,其中所述第一捕获域和第二捕获域是相同的。
54.如权利要求53所述的方法,其中所述第一捕获域和第二捕获域包含均聚多聚(T)序列。
55.如权利要求51-54中任一项所述的方法,其中所述第一捕获域和第二捕获域是不同的。
56.如权利要求55所述的方法,其中所述第一捕获域包括随机序列,第二捕获域包括多聚(T)序列。
57.如权利要求51-56中任一项所述的方法,其中在基材上提供包含多个捕获探针的阵列。
58.如权利要求51-56中任一项所述的方法,其中在特征上提供包含多个捕获探针的阵列。
59.如权利要求58所述的方法,其中所述特征包括第一捕获探针、第二捕获探针或两者。
60.如权利要求51-59中任一项所述的方法,其中所述第一捕获探针、第二捕获探针或两者直接或间接地附接。
61.如权利要求51-60中任一项所述的方法,其中在基材上的特征上提供包含多个捕获探针的阵列。
62.如权利要求51-61中任一项所述的方法,其中所述基材包括微流体通道。
63.如权利要求51-62中任一项所述的方法,其中所述第一捕获探针、第二捕获探针或两者包括裂解域、功能域和独特标识符中的一个或多个,或其组合。
64.如权利要求51-63中任一项所述的方法,包括迁移步骤,其中片段化的基因组DNA和RNA迁移到基材。
65.如权利要求64所述的方法,其中所述迁移步骤是主动迁移步骤。
66.如权利要求64所述的方法,其中所述迁移步骤是被动迁移步骤。
67.如权利要求64-66所述的方法,其中来自生物样品的片段化的基因组DNA和RNA的迁移包括将所述生物样品暴露于热中。
68.如权利要求51-67中任一项所述的方法,其中所述生物样品固定在所述基材上。
69.如权利要求51-68中任一项所述的方法,其中通过用连接酶连接断裂来修复片段化的基因组DNA。
70.如权利要求51-69中任一项所述的方法,还包括对片段化的基因组DNA中的单链断裂进行间隙修复。
71.如权利要求51-70中任一项所述的方法,其中将与第一捕获探针的第一捕获域互补的序列引至片段化的基因组DNA。
72.如权利要求51-71中任一项所述的方法,其中第一捕获探针的第一捕获域和与引至片段化的基因组DNA的捕获域互补的序列杂交。
73.如权利要求57所述的方法,其中第一捕获域的随机序列与片段化的基因组DNA杂交。
74.如权利要求51-73中任一项所述的方法,其中二捕获探针的第二捕获结构域与mRNA中的互补序列杂交。
75.如权利要求71-74中任一项所述的方法,其中与第一捕获域互补的序列和mRNA中的互补序列是均聚序列。
76.如权利要求75所述的方法,其中所述均聚序列是多聚(A)序列。
77.如权利要求51-76中任一项所述的方法,包括使用片段化的基因组DNA作为延伸模板来延伸第一捕获探针,并且使用RNA作为延伸模板来延伸第二捕获探针。
78.如权利要求77所述的方法,其中用DNA聚合酶延伸第一捕获探针。
79.如权利要求78所述的方法,其中用逆转录酶延伸第二捕获探针。
80.如权利要求51-79中任一项所述的方法,其中所述转座酶是Tn5转座酶或其功能性衍生物。
81.如权利要求80所述的方法,其中所述Tn5转座酶包含与SEQ ID NO:1具有至少80%相同性的序列。
82.如权利要求51-79中任一项所述的方法,其中所述转座酶是Mu转座酶或其功能性衍生物。
83.如权利要求82所述的方法,其中所述Mu转座酶包含与SEQ ID NO:2具有至少80%相同性的序列。
84.如权利要求51-83中任一项所述的方法,其中所述转座酶与包含转座子末端序列的衔接子复合。
85.如权利要求84所述的方法,其中所述转座子末端序列包含与SEQ ID NO:8具有至少80%相同性的序列。
86.如权利要求84所述的方法,其中所述转座子末端序列包含与SEQ ID NO:9-14中的任一个具有至少80%相同性的序列。
87.如权利要求51-86中任一项所述的方法,其中在化学透化条件、酶透化条件或两者下进行生物样品透化。
88.如权利要求87所述的方法,其中所述化学透化条件包括将生物样品与碱性溶液接触。
89.如权利要求86或87所述的方法,其中所述酶透化条件包括将生物样品与包含蛋白酶的酸性溶液接触。
90.如权利要求89所述的方法,其中所述蛋白酶是天冬氨酰蛋白酶、优选胃蛋白酶、胃蛋白酶样酶或其功能等效物。
91.如权利要求90所述的方法,其中所述胃蛋白酶、胃蛋白酶样酶或其功能等效物包含与SEQ ID NO:3或4具有至少80%相同性的序列。
92.如权利要求86-91中任一项所述的方法,其中所述酶透化条件包括将所述生物样品与以下接触:
(i)锌内肽酶,胶原酶,胶原酶样酶或其功能等效物;
(ii)丝氨酸蛋白酶,蛋白酶K酶,蛋白酶K样酶或其功能等效物;或
(iii)两者。
93.如权利要求92所述的方法,其中所述胶原酶、胶原酶样酶或其功能等效物包含与SEQ ID NO:5或6具有至少80%相同性的序列。
94.如权利要求92或93所述的方法,其中所述蛋白酶K酶、蛋白酶K样酶或其功能等效物包含与SEQ ID NO:7具有至少80%相同性的序列。
95.如权利要求51-94中任一项所述的方法,其中分析DNA分子的步骤包括测序。
96.如权利要求51-95中任一项所述的方法,其中将第一捕获探针的空间条形码和与第一捕获探针相关联的片段化的基因组DNA相关联的步骤在空间上分析片段化的基因组DNA。
97.如权利要求51-96中任一项所述的方法,其中将第二捕获探针的空间条形码和与第二捕获探针相关联的mRNA相关联在空间上分析mRNA。
98.如权利要求51-97中任一项所述的方法,还包括其中生物样品在所述生物样品与基材接触之前或之后成像的步骤。
CN201980071274.0A 2018-08-28 2019-08-27 用于生物样品中转座酶介导的空间标记和分析基因组dna的方法 Pending CN113366117A (zh)

Applications Claiming Priority (85)

Application Number Priority Date Filing Date Title
US201862723960P 2018-08-28 2018-08-28
US201862723957P 2018-08-28 2018-08-28
US201862723972P 2018-08-28 2018-08-28
US201862723950P 2018-08-28 2018-08-28
US201862723964P 2018-08-28 2018-08-28
US201862723970P 2018-08-28 2018-08-28
US62/723,957 2018-08-28
US62/723,960 2018-08-28
US62/723,964 2018-08-28
US62/723,950 2018-08-28
US62/723,970 2018-08-28
US62/723,972 2018-08-28
US201862724483P 2018-08-29 2018-08-29
US201862724487P 2018-08-29 2018-08-29
US201862724489P 2018-08-29 2018-08-29
US201862724561P 2018-08-29 2018-08-29
US62/724,487 2018-08-29
US62/724,489 2018-08-29
US62/724,483 2018-08-29
US62/724,561 2018-08-29
US201862779342P 2018-12-13 2018-12-13
US62/779,342 2018-12-13
US201962788897P 2019-01-06 2019-01-06
US201962788905P 2019-01-06 2019-01-06
US201962788885P 2019-01-06 2019-01-06
US201962788867P 2019-01-06 2019-01-06
US201962788871P 2019-01-06 2019-01-06
US62/788,867 2019-01-06
US62/788,897 2019-01-06
US62/788,871 2019-01-06
US62/788,905 2019-01-06
US62/788,885 2019-01-06
US201962812219P 2019-02-28 2019-02-28
US62/812,219 2019-02-28
US201962819467P 2019-03-15 2019-03-15
US201962819449P 2019-03-15 2019-03-15
US201962819486P 2019-03-15 2019-03-15
US201962819468P 2019-03-15 2019-03-15
US201962819496P 2019-03-15 2019-03-15
US201962819478P 2019-03-15 2019-03-15
US201962819458P 2019-03-15 2019-03-15
US201962819448P 2019-03-15 2019-03-15
US201962819456P 2019-03-15 2019-03-15
US62/819,496 2019-03-15
US62/819,486 2019-03-15
US62/819,449 2019-03-15
US62/819,468 2019-03-15
US62/819,478 2019-03-15
US62/819,458 2019-03-15
US62/819,448 2019-03-15
US62/819,456 2019-03-15
US62/819,467 2019-03-15
US201962822618P 2019-03-22 2019-03-22
US201962822554P 2019-03-22 2019-03-22
US201962822632P 2019-03-22 2019-03-22
US201962822605P 2019-03-22 2019-03-22
US201962822575P 2019-03-22 2019-03-22
US201962822649P 2019-03-22 2019-03-22
US201962822565P 2019-03-22 2019-03-22
US201962822627P 2019-03-22 2019-03-22
US201962822592P 2019-03-22 2019-03-22
US62/822,565 2019-03-22
US62/822,649 2019-03-22
US62/822,592 2019-03-22
US62/822,554 2019-03-22
US62/822,575 2019-03-22
US62/822,618 2019-03-22
US62/822,627 2019-03-22
US62/822,605 2019-03-22
US62/822,632 2019-03-22
US201962839223P 2019-04-26 2019-04-26
US201962839346P 2019-04-26 2019-04-26
US201962839320P 2019-04-26 2019-04-26
US201962839526P 2019-04-26 2019-04-26
US62/839,346 2019-04-26
US62/839,320 2019-04-26
US62/839,526 2019-04-26
US62/839,223 2019-04-26
US201962842463P 2019-05-02 2019-05-02
US62/842,463 2019-05-02
US201962858331P 2019-06-07 2019-06-07
US62/858,331 2019-06-07
US201962860993P 2019-06-13 2019-06-13
US62/860,993 2019-06-13
PCT/US2019/048425 WO2020047002A1 (en) 2018-08-28 2019-08-27 Method for transposase-mediated spatial tagging and analyzing genomic dna in a biological sample

Publications (1)

Publication Number Publication Date
CN113366117A true CN113366117A (zh) 2021-09-07

Family

ID=69643282

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201980071233.1A Pending CN113767175A (zh) 2018-08-28 2019-08-27 增加空间阵列分辨率
CN201980071234.6A Pending CN113286893A (zh) 2018-08-28 2019-08-27 生成阵列的方法
CN201980071274.0A Pending CN113366117A (zh) 2018-08-28 2019-08-27 用于生物样品中转座酶介导的空间标记和分析基因组dna的方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201980071233.1A Pending CN113767175A (zh) 2018-08-28 2019-08-27 增加空间阵列分辨率
CN201980071234.6A Pending CN113286893A (zh) 2018-08-28 2019-08-27 生成阵列的方法

Country Status (5)

Country Link
US (5) US20230323447A1 (zh)
EP (4) EP3844305A2 (zh)
CN (3) CN113767175A (zh)
SG (4) SG11202102019UA (zh)
WO (4) WO2020047002A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023116938A1 (zh) * 2021-12-24 2023-06-29 映泰科技有限公司 空间转录组学分析的生物芯片和其制备方法及应用
WO2023159999A1 (zh) * 2022-02-28 2023-08-31 南方科技大学 一种单细胞开放染色质和转录组共测序文库的构建方法

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
PT2556171E (pt) 2010-04-05 2015-12-21 Prognosys Biosciences Inc Ensaios biológicos codificados espacialmente
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
LT3013983T (lt) 2013-06-25 2023-05-10 Prognosys Biosciences, Inc. Erdviniai koduoti biologiniai tyrimai, naudojant mikrofluidinį įrenginį
CN113186256A (zh) 2015-04-10 2021-07-30 空间转录公司 生物样本的空间区别、多重核酸分析
EP4234717A3 (en) 2018-05-03 2023-11-01 Becton, Dickinson and Company High throughput multiomics sample analysis
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
SG11202105824RA (en) 2018-12-10 2021-06-29 10X Genomics Inc Imaging system hardware
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US20240026445A1 (en) * 2019-01-06 2024-01-25 10X Genomics, Inc. Methods for determining a location of a biological analyte in a biological sample
EP3927869A4 (en) * 2019-02-21 2023-04-26 Stratos Genomics, Inc. METHODS, COMPOSITIONS AND DEVICES FOR SOLID-STATE SYNTHESIS OF EXPANDABLE POLYMERS FOR USE IN INDIVIDUAL MOLECULESEQUENCING
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
WO2021092433A2 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Enhancing specificity of analyte binding
WO2021091611A1 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Spatially-tagged analyte capture agents for analyte multiplexing
EP4058598A1 (en) * 2019-11-13 2022-09-21 10X Genomics, Inc. Generating capture probes for spatial analysis
AU2020386521A1 (en) * 2019-11-22 2022-06-23 10X Genomics, Inc. Systems and methods for spatial analysis of analytes using fiducial alignment
WO2021119320A2 (en) 2019-12-11 2021-06-17 10X Genomics, Inc. Reverse transcriptase variants
AU2020412766A1 (en) 2019-12-23 2022-06-09 10X Genomics, Inc. Methods for spatial analysis using RNA-templated ligation
US11104961B2 (en) 2020-01-13 2021-08-31 Fluent Biosciences Inc. Single cell sequencing
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11835462B2 (en) 2020-02-11 2023-12-05 10X Genomics, Inc. Methods and compositions for partitioning a biological sample
WO2021168278A1 (en) * 2020-02-20 2021-08-26 10X Genomics, Inc. METHODS TO COMBINE FIRST AND SECOND STRAND cDNA SYNTHESIS FOR SPATIAL ANALYSIS
AU2021224760A1 (en) * 2020-02-21 2022-09-15 10X Genomics, Inc. Capturing genetic targets using a hybridization approach
WO2021168287A1 (en) 2020-02-21 2021-08-26 10X Genomics, Inc. Methods and compositions for integrated in situ spatial assay
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
US11926863B1 (en) 2020-02-27 2024-03-12 10X Genomics, Inc. Solid state single cell method for analyzing fixed biological cells
US11768175B1 (en) 2020-03-04 2023-09-26 10X Genomics, Inc. Electrophoretic methods for spatial analysis
CA3175931A1 (en) 2020-03-16 2021-09-23 Fluent Biosciences Inc. Multi-omic analysis in monodisperse droplets
EP4136227A1 (en) 2020-04-16 2023-02-22 10X Genomics, Inc. Compositions and methods for use with fixed samples
ES2965354T3 (es) 2020-04-22 2024-04-12 10X Genomics Inc Métodos para análisis espacial que usan eliminación de ARN elegido como diana
EP4146819A1 (en) * 2020-05-04 2023-03-15 10X Genomics, Inc. Spatial transcriptomic transfer modes
US11851700B1 (en) 2020-05-13 2023-12-26 10X Genomics, Inc. Methods, kits, and compositions for processing extracellular molecules
AU2021275906A1 (en) 2020-05-22 2022-12-22 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
WO2021247568A1 (en) 2020-06-02 2021-12-09 10X Genomics, Inc. Spatial trancriptomics for antigen-receptors
AU2021283174A1 (en) 2020-06-02 2023-01-05 10X Genomics, Inc. Nucleic acid library methods
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
EP4165207A1 (en) 2020-06-10 2023-04-19 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
AU2021294334A1 (en) 2020-06-25 2023-02-02 10X Genomics, Inc. Spatial analysis of DNA methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
WO2022035729A1 (en) 2020-08-10 2022-02-17 Dimensiongen Devices and methods for multi-dimensional genome analysis
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
WO2022061152A2 (en) * 2020-09-18 2022-03-24 10X Genomics, Inc. Sample handling apparatus and fluid delivery methods
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
CN112143784A (zh) * 2020-09-29 2020-12-29 生物岛实验室 空间组学测序、单细胞表观转录组学测序及定位标识方法
WO2022067565A1 (zh) * 2020-09-29 2022-04-07 生物岛实验室 空间组学测序、单细胞表观转录组学测序及定位标识方法
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022132645A1 (en) * 2020-12-14 2022-06-23 Chan Zuckerberg Biohub, Inc. Spatial genomics with single cell resolution
WO2022140028A1 (en) 2020-12-21 2022-06-30 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
WO2022147134A1 (en) * 2020-12-30 2022-07-07 10X Genomics, Inc. Molecular arrays and methods for generating and using the arrays
US20220314187A1 (en) * 2020-12-30 2022-10-06 10X Genomics, Inc. Methods and compositions for light-controlled surface patterning using a polymer
WO2022147296A1 (en) 2020-12-30 2022-07-07 10X Genomics, Inc. Cleavage of capture probes for spatial analysis
US20240084291A1 (en) * 2020-12-30 2024-03-14 Dovetail Genomics, Llc Methods and compositions for sequencing library preparation
US20240060122A1 (en) * 2021-01-12 2024-02-22 Paris Sciences Et Lettres Method for spatial mapping and sequencing of cells or organelles
EP4301870A1 (en) 2021-03-18 2024-01-10 10X Genomics, Inc. Multiplex capture of gene and protein expression from a biological sample
WO2022221425A1 (en) * 2021-04-14 2022-10-20 10X Genomics, Inc. Methods of measuring mislocalization of an analyte
WO2022226057A1 (en) * 2021-04-20 2022-10-27 10X Genomics, Inc. Methods for assessing sample quality prior to spatial analysis using templated ligation
EP4326901A1 (en) * 2021-04-23 2024-02-28 Ultima Genomics, Inc. Systems and methods for spatial reference sequencing
WO2022232571A1 (en) 2021-04-30 2022-11-03 10X Genomics, Inc. Fusion rt variants for improved performance
WO2022251419A1 (en) * 2021-05-26 2022-12-01 Board Of Regents, The University Of Texas System Methods and systems for single cell protein analysis
EP4348245A1 (en) * 2021-05-28 2024-04-10 Fluent Biosciences Inc. Spatial transcriptomics in pips
WO2022256503A1 (en) * 2021-06-03 2022-12-08 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
WO2022265965A1 (en) 2021-06-14 2022-12-22 10X Genomics, Inc. Reverse transcriptase variants for improved performance
EP4196605A1 (en) 2021-09-01 2023-06-21 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
US20230139059A1 (en) * 2021-10-04 2023-05-04 AtlasXomics Inc. System and methods for high throughput screening of tissue preparation conditions
WO2023076345A1 (en) * 2021-10-26 2023-05-04 10X Genomics, Inc. Methods for spatial analysis using targeted rna capture
WO2023114473A2 (en) 2021-12-16 2023-06-22 10X Genomics, Inc. Recombinant reverse transcriptase variants for improved performance
CN114574569B (zh) * 2022-03-28 2023-05-16 浙江大学 一种基于末端转移酶的基因组测序试剂盒和测序方法
WO2023196526A1 (en) 2022-04-06 2023-10-12 10X Genomics, Inc. Methods for multiplex cell analysis
US20240002902A1 (en) 2022-05-06 2024-01-04 10X Genomics, Inc. Analysis of antigen and antigen receptor interactions
WO2023225519A1 (en) 2022-05-17 2023-11-23 10X Genomics, Inc. Modified transposons, compositions and uses thereof
WO2023250077A1 (en) * 2022-06-22 2023-12-28 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
US20240002932A1 (en) * 2022-06-29 2024-01-04 10X Genomics, Inc. Click chemistry-based dna photo-ligation for manufacturing of high-resolution dna arrays
US20240167077A1 (en) * 2022-06-29 2024-05-23 10X Genomics, Inc. Covalent attachment of splint oligonucleotides for molecular array generation using ligation
WO2024112703A1 (en) * 2022-11-21 2024-05-30 Illumina, Inc. Reversibly cross-linked hydrogels, and methods of using the same for cluster amplification
WO2024112948A1 (en) 2022-11-23 2024-05-30 Alida Biosciences, Inc. Chromatin profiling compositions and methods
WO2024124044A1 (en) 2022-12-07 2024-06-13 The Brigham And Women’S Hospital, Inc. Compositions and methods targeting sat1 for enhancing anti¬ tumor immunity during tumor progression

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040019005A1 (en) * 2001-10-01 2004-01-29 Jeffrey Van Ness Methods for parallel measurement of genetic variations
US20040067493A1 (en) * 2001-07-25 2004-04-08 Affymetrix, Inc. Complexity management of genomic DNA
WO2012140224A1 (en) * 2011-04-13 2012-10-18 Jonas Frisen Method and product for localised or spatial detection of nucleic acid in a tissue sample
US20180112209A1 (en) * 2011-12-22 2018-04-26 Ibis Biosciences, Inc. Systems and methods for isolating nucleic acids

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4968601A (en) * 1988-02-09 1990-11-06 The United States Of America As Represented By The Dept. Of Health & Human Services Method for diagnosing latent viral infection
US5472881A (en) 1992-11-12 1995-12-05 University Of Utah Research Foundation Thiol labeling of DNA for attachment to gold surfaces
US5874239A (en) 1993-07-30 1999-02-23 Affymax Technologies N.V. Biotinylation of proteins
US5610287A (en) 1993-12-06 1997-03-11 Molecular Tool, Inc. Method for immobilizing nucleic acid molecules
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
US5552278A (en) 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5641658A (en) 1994-08-03 1997-06-24 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid with two primers bound to a single solid support
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
WO1998030575A1 (en) 1997-01-08 1998-07-16 Proligo Llc Bioconjugation of macromolecules
US5837860A (en) 1997-03-05 1998-11-17 Molecular Tool, Inc. Covalent attachment of nucleic acid molecules onto solid-phases via disulfide bonds
US6023540A (en) 1997-03-14 2000-02-08 Trustees Of Tufts College Fiber optic sensor with encoded microspheres
US6327410B1 (en) 1997-03-14 2001-12-04 The Trustees Of Tufts College Target analyte sensors utilizing Microspheres
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
EP1498494A3 (en) 1997-04-01 2007-06-20 Solexa Ltd. Method of nucleic acid sequencing
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US5919626A (en) 1997-06-06 1999-07-06 Orchid Bio Computer, Inc. Attachment of unmodified nucleic acids to silanized solid phase surfaces
US7427678B2 (en) 1998-01-08 2008-09-23 Sigma-Aldrich Co. Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method
US6387632B2 (en) * 1998-06-11 2002-05-14 Hitachi, Ltd. Polynucleotide separation method and apparatus therefor
EP2045334A1 (en) 1998-06-24 2009-04-08 Illumina, Inc. Decoding of array sensors with microspheres
US6159736A (en) 1998-09-23 2000-12-12 Wisconsin Alumni Research Foundation Method for making insertional mutations using a Tn5 synaptic complex
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6391937B1 (en) 1998-11-25 2002-05-21 Motorola, Inc. Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers
DK1923471T3 (da) 1999-04-20 2013-04-02 Illumina Inc Detektion af nukleinsyrereaktioner på bead-arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US20060275782A1 (en) * 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
RU2002105508A (ru) 1999-08-02 2004-01-27 Висконсин Элумни Рисёч Фаундейшн (Us) Мутантные ферменты Тn5-транспозазы и способ их применения
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
GB0018120D0 (en) 2000-07-24 2000-09-13 Fermentas Ab Nuclease
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20030153850A1 (en) 2002-01-16 2003-08-14 Davis Brian J. Method and apparatus for image-guided therapy
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
US7375234B2 (en) 2002-05-30 2008-05-20 The Scripps Research Institute Copper-catalysed ligation of azides and acetylenes
ES2550513T3 (es) 2002-08-23 2015-11-10 Illumina Cambridge Limited Nucleótidos modificados para secuenciación de polinucleótidos
KR20040062847A (ko) * 2003-01-03 2004-07-09 삼성전자주식회사 핵산 어레이의 복제방법
GB0302058D0 (en) * 2003-01-29 2003-02-26 Univ Cranfield Replication of nucleic acid arrays
US7083980B2 (en) 2003-04-17 2006-08-01 Wisconsin Alumni Research Foundation Tn5 transposase mutants and the use thereof
US20050031176A1 (en) 2003-08-08 2005-02-10 Hertel Sarah R. Method and apparatus of multi-modality image fusion
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
US7259258B2 (en) 2003-12-17 2007-08-21 Illumina, Inc. Methods of attaching biological compounds to solid supports using triazine
ES2949821T3 (es) 2004-01-07 2023-10-03 Illumina Cambridge Ltd Matrices moleculares
US7608434B2 (en) 2004-08-04 2009-10-27 Wisconsin Alumni Research Foundation Mutated Tn5 transposase proteins and the use thereof
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
PT2161336E (pt) * 2005-05-09 2013-10-03 Ono Pharmaceutical Co Anticorpos monoclonais humanos para morte programada 1 (pd-1) e métodos de tratamento do cancro utilizando anticorpos anti- pd-1 sozinhos ou em combinação com outros agentes imunoterapêuticos¿
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
ES2511218T5 (es) 2005-06-20 2017-12-07 Advanced Cell Diagnostics, Inc. Kits y productos para detección de ácidos nucleicos en células individuales y para identificación de células raras en grandes poblaciones de células heterogéneas
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP2021503A1 (en) 2006-03-17 2009-02-11 Solexa Ltd. Isothermal methods for creating clonal single molecule arrays
US20070231823A1 (en) * 2006-03-23 2007-10-04 Mckernan Kevin J Directed enrichment of genomic DNA for high-throughput sequencing
US9012390B2 (en) 2006-08-07 2015-04-21 Raindance Technologies, Inc. Fluorocarbon emulsion stabilizing surfactants
WO2008022332A2 (en) * 2006-08-18 2008-02-21 Board Of Regents, The University Of Texas System System, method and kit for replicating a dna array
EP2639579B1 (en) 2006-12-14 2016-11-16 Life Technologies Corporation Apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US20100055733A1 (en) 2008-09-04 2010-03-04 Lutolf Matthias P Manufacture and uses of reactive microcontact printing of biomolecules on soft hydrogels
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
ES2719502T3 (es) 2010-01-29 2019-07-10 Advanced Cell Diagnostics Inc Métodos de detección in situ de ácidos nucleicos
EP2354242A1 (en) * 2010-02-03 2011-08-10 Epiontis GmbH Assay for determining the type and/or status of a cell based on the epigenetic pattern and the chromatin structure
PT2556171E (pt) 2010-04-05 2015-12-21 Prognosys Biosciences Inc Ensaios biológicos codificados espacialmente
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
CN107400711A (zh) * 2011-08-03 2017-11-28 伯乐实验室公司 使用透化处理的细胞过滤小核酸
US9453258B2 (en) 2011-09-23 2016-09-27 Illumina, Inc. Methods and compositions for nucleic acid sequencing
MX337140B (es) 2012-04-03 2016-02-12 Illumina Inc Cabazal integrado de lectura optoelectrónica y cartucho fluído útil para secuenciación de ácidos nucleicos.
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US20140378345A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
EP2885418A4 (en) 2012-08-14 2016-03-02 10X Genomics Inc MICROCAPSE COMPOSITIONS AND METHOD THEREFOR
US9783841B2 (en) 2012-10-04 2017-10-10 The Board Of Trustees Of The Leland Stanford Junior University Detection of target nucleic acids in a cellular sample
EP3901280A1 (en) 2012-10-17 2021-10-27 Spatial Transcriptomics AB Methods and product for optimising localised or spatial detection of gene expression in a tissue sample
WO2014085725A1 (en) 2012-11-27 2014-06-05 Tufts University Biopolymer-based inks and use thereof
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
EP2971184B1 (en) 2013-03-12 2019-04-17 President and Fellows of Harvard College Method of generating a three-dimensional nucleic acid containing matrix
EP2971284A4 (en) * 2013-03-15 2017-01-18 HTG Molecular Diagnostics, Inc. Subtyping lung cancers
LT3013983T (lt) 2013-06-25 2023-05-10 Prognosys Biosciences, Inc. Erdviniai koduoti biologiniai tyrimai, naudojant mikrofluidinį įrenginį
US20150000854A1 (en) 2013-06-27 2015-01-01 The Procter & Gamble Company Sheet products bearing designs that vary among successive sheets, and apparatus and methods for producing the same
CA2924284C (en) 2013-09-13 2022-01-04 The Board Of Trustees Of The Leland Stanford Junior University Multiplexed imaging of tissues using mass tags and secondary ion mass spectrometry
EP3082839A4 (en) * 2013-12-20 2017-08-09 National University of Singapore Differentiation therapy with cd137 ligand agonists
CN106460069B (zh) 2014-04-18 2021-02-12 威廉马歇莱思大学 用于富集含稀有等位基因的物质的核酸分子的竞争性组合物
US20170343545A1 (en) 2014-06-06 2017-11-30 Herlev Hospital Determining Antigen Recognition through Barcoding of MHC Multimers
US11585806B2 (en) 2014-06-13 2023-02-21 Immudex Aps General detection and isolation of specific cells by binding of labeled molecules
CA2953374A1 (en) 2014-06-26 2015-12-30 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
WO2016007839A1 (en) 2014-07-11 2016-01-14 President And Fellows Of Harvard College Methods for high-throughput labelling and detection of biological features in situ using microscopy
EP3198036A4 (en) * 2014-09-26 2018-08-08 Two Pore Guys, Inc. Target sequence detection by nanopore sensing of synthetic probes
US20160108458A1 (en) 2014-10-06 2016-04-21 The Board Of Trustees Of The Leland Stanford Junior University Multiplexed detection and quantification of nucleic acids in single-cells
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
EP4180535A1 (en) * 2015-03-30 2023-05-17 Becton, Dickinson and Company Methods and compositions for combinatorial barcoding
CN113186256A (zh) 2015-04-10 2021-07-30 空间转录公司 生物样本的空间区别、多重核酸分析
WO2016166128A1 (en) 2015-04-14 2016-10-20 Koninklijke Philips N.V. Spatial mapping of molecular profiles of biological tissue samples
US10059990B2 (en) 2015-04-14 2018-08-28 Massachusetts Institute Of Technology In situ nucleic acid sequencing of expanded biological samples
EP4368728A2 (en) 2015-07-17 2024-05-15 Nanostring Technologies, Inc Simultaneous quantification of gene expression in a user-defined region of a cross-sectioned tissue
US10913975B2 (en) 2015-07-27 2021-02-09 Illumina, Inc. Spatial mapping of nucleic acid sequence information
CA2994958C (en) 2015-08-07 2024-02-13 Massachusetts Institute Of Technology Nanoscale imaging of proteins and nucleic acids via expansion microscopy
WO2017027368A1 (en) 2015-08-07 2017-02-16 Massachusetts Institute Of Technology Protein retention expansion microscopy
KR20180081164A (ko) 2015-12-04 2018-07-13 10엑스 제노믹스, 인크. 핵산 분석을 위한 방법 및 조성물
US20170241911A1 (en) 2016-02-22 2017-08-24 Miltenyi Biotec Gmbh Automated analysis tool for biological specimens
WO2017147483A1 (en) 2016-02-26 2017-08-31 The Board Of Trustees Of The Leland Stanford Junior University Multiplexed single molecule rna visualization with a two-probe proximity ligation system
US20170253918A1 (en) 2016-03-01 2017-09-07 Expansion Technologies Combining protein barcoding with expansion microscopy for in-situ, spatially-resolved proteomics
WO2017156336A1 (en) * 2016-03-10 2017-09-14 The Board Of Trustees Of The Leland Stanford Junior University Transposase-mediated imaging of the accessible genome
WO2017161251A1 (en) 2016-03-17 2017-09-21 President And Fellows Of Harvard College Methods for detecting and identifying genomic nucleic acids
US20180052081A1 (en) 2016-05-11 2018-02-22 Expansion Technologies Combining modified antibodies with expansion microscopy for in-situ, spatially-resolved proteomics
US10894990B2 (en) * 2016-05-17 2021-01-19 Shoreline Biome, Llc High throughput method for identification and sequencing of unknown microbial and eukaryotic genomes from complex mixtures
US11352667B2 (en) 2016-06-21 2022-06-07 10X Genomics, Inc. Nucleic acid sequencing
EP3490616B1 (en) 2016-07-27 2022-09-28 The Board of Trustees of the Leland Stanford Junior University Highly-multiplexed fluorescent imaging
GB2570412A (en) 2016-08-31 2019-07-24 Harvard College Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
EP3507385A4 (en) 2016-08-31 2020-04-29 President and Fellows of Harvard College METHODS OF COMBINING THE DETECTION OF BIOMOLECULES IN A SINGLE ASSAY USING IN SITU FLUORESCENT SEQUENCING
WO2018057999A1 (en) 2016-09-22 2018-03-29 William Marsh Rice University Molecular hybridization probes for complex sequence capture and analysis
EP3529357B1 (en) 2016-10-19 2022-03-09 10X Genomics, Inc. Methods for barcoding nucleic acid molecules from individual cells
GB201619458D0 (en) 2016-11-17 2017-01-04 Spatial Transcriptomics Ab Method for spatial tagging and analysing nucleic acids in a biological specimen
US10656144B2 (en) 2016-12-02 2020-05-19 The Charlotte Mecklenburg Hospital Authority Immune profiling and minimal residue disease following stem cell transplantation in multiple myeloma
WO2018107054A1 (en) 2016-12-09 2018-06-14 Ultivue, Inc. Improved methods for multiplex imaging using labeled nucleic acid imaging agents
WO2018136856A1 (en) 2017-01-23 2018-07-26 Massachusetts Institute Of Technology Multiplexed signal amplified fish via splinted ligation amplification and sequencing
CA3078158A1 (en) 2017-10-06 2019-04-11 Cartana Ab Rna templated ligation
US11753676B2 (en) 2017-10-11 2023-09-12 Expansion Technologies Multiplexed in situ hybridization of tissue sections for spatially resolved transcriptomics with expansion microscopy
EP3568494B1 (en) 2017-12-08 2021-05-05 10X Genomics, Inc. Methods and compositions for labeling cells

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040067493A1 (en) * 2001-07-25 2004-04-08 Affymetrix, Inc. Complexity management of genomic DNA
US20040019005A1 (en) * 2001-10-01 2004-01-29 Jeffrey Van Ness Methods for parallel measurement of genetic variations
WO2012140224A1 (en) * 2011-04-13 2012-10-18 Jonas Frisen Method and product for localised or spatial detection of nucleic acid in a tissue sample
US20180112209A1 (en) * 2011-12-22 2018-04-26 Ibis Biosciences, Inc. Systems and methods for isolating nucleic acids

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution", 《NATURE GENETICS》, vol. 48, no. 10 *
XINGQI CHEN ET AL: "ATAC-see reveals the accessible genome by transposase-mediated imaging and sequencing", 《NATURE METHODS》, vol. 13, no. 12, pages 1, XP055511788, DOI: 10.1038/nmeth.4031 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023116938A1 (zh) * 2021-12-24 2023-06-29 映泰科技有限公司 空间转录组学分析的生物芯片和其制备方法及应用
WO2023159999A1 (zh) * 2022-02-28 2023-08-31 南方科技大学 一种单细胞开放染色质和转录组共测序文库的构建方法

Also Published As

Publication number Publication date
SG11202102019UA (en) 2021-03-30
US20210010070A1 (en) 2021-01-14
US20210332425A1 (en) 2021-10-28
WO2020047002A1 (en) 2020-03-05
EP3844305A2 (en) 2021-07-07
WO2020047010A4 (en) 2020-07-16
WO2020047010A3 (en) 2020-04-16
WO2020047007A2 (en) 2020-03-05
US20230323447A1 (en) 2023-10-12
WO2020047010A8 (en) 2021-08-26
WO2020047004A2 (en) 2020-03-05
US20200407781A1 (en) 2020-12-31
WO2020047010A2 (en) 2020-03-05
EP3844306A2 (en) 2021-07-07
US20210332424A1 (en) 2021-10-28
SG11202102029TA (en) 2021-03-30
WO2020047007A3 (en) 2020-04-16
WO2020047004A3 (en) 2020-04-30
CN113767175A (zh) 2021-12-07
EP3844304A2 (en) 2021-07-07
WO2020047007A4 (en) 2020-07-16
SG11202102003TA (en) 2021-03-30
SG11202101944RA (en) 2021-03-30
WO2020047002A4 (en) 2020-04-30
EP3844307A1 (en) 2021-07-07
CN113286893A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
US11519033B2 (en) Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
US20200407781A1 (en) Method for transposase-mediated spatial tagging and analyzing genomic dna in a biological sample
US11753675B2 (en) Generating capture probes for spatial analysis
US20220267844A1 (en) Methods for determining a location of a biological analyte in a biological sample
US20210324457A1 (en) Methods for Generating Spatially Barcoded Arrays
US20210317524A1 (en) Resolving spatial arrays
US20220033888A1 (en) Generating capture probes for spatial analysis
US11926867B2 (en) Generating capture probes for spatial analysis
US20220049293A1 (en) Methods for determining a location of a biological analyte in a biological sample
CN114127309A (zh) 使用空间阵列进行单细胞测序的方法
US20240026445A1 (en) Methods for determining a location of a biological analyte in a biological sample
US20240191286A1 (en) Method for transposase-mediated spatial tagging and analyzing genomic dna in a biological sample
US20240209425A1 (en) Generating capture probes for spatial analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination