CN117242189A - 转座酶介导的对生物样品中的基因组dna在空间上加标签和分析的方法 - Google Patents

转座酶介导的对生物样品中的基因组dna在空间上加标签和分析的方法 Download PDF

Info

Publication number
CN117242189A
CN117242189A CN202280012312.7A CN202280012312A CN117242189A CN 117242189 A CN117242189 A CN 117242189A CN 202280012312 A CN202280012312 A CN 202280012312A CN 117242189 A CN117242189 A CN 117242189A
Authority
CN
China
Prior art keywords
biological sample
transposase
genomic dna
dna
capture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280012312.7A
Other languages
English (en)
Inventor
P·斯塔尔
M·马克隆德
E·洛伦斯博巴迪拉
J·弗里森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
10X Genomics Ltd
Original Assignee
10X Genomics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 10X Genomics Ltd filed Critical 10X Genomics Ltd
Priority claimed from PCT/US2022/011663 external-priority patent/WO2022164615A1/en
Publication of CN117242189A publication Critical patent/CN117242189A/zh
Pending legal-status Critical Current

Links

Abstract

本公开涉及用于空间分析生物样品中用转座酶片段化的核酸的材料和方法。

Description

转座酶介导的对生物样品中的基因组DNA在空间上加标签和 分析的方法
相关申请的交叉引用
本申请要求2021年1月29日提交的美国临时专利申请号63/143,438和2021年3月26日提交的美国临时专利申请号63/166,708的优先权。这些申请的内容全文以引用方式并入本文。
背景技术
由于不同细胞内不同的分析物水平(例如,基因和/或蛋白质表达),故组织内的细胞在细胞形态和/或功能上具有差异。细胞在组织内的具体位置(例如,细胞相对于相邻细胞的位置或细胞相对于组织微环境的位置)可影响例如细胞的形态、分化、命运、活力、增殖、行为、信号传导以及与组织中的其他细胞的串扰。
空间异质性先前已使用通常在完整组织或一部分组织(例如,组织切片)的背景下提供少量分析物的数据、或者提供来自各个单细胞的重要分析物数据的技术进行了研究,但未能提供关于来自起源生物样品(例如,组织)的单细胞的位置的信息。
染色质结构在生物样品中的细胞之间或来自相同组织的生物样品之间可能存在差异。测定可及染色质中的差异可以指示特定细胞中的转录活性序列,例如基因。进一步了解染色质内的转录活性区将能够鉴定哪些基因对细胞的功能和/或表型有贡献。
发明内容
本公开整体上描述了用于空间分析生物样品中存在的基因组DNA的方法。
已经开发了研究表观基因组的方法,例如染色质可及性测定法(ATAC-Seq),或者鉴定与染色质相关联的蛋白质的测定法,例如ChIP-Seq。这些测定法有助于鉴定促成动态细胞表型的调节因子(例如,顺式调节因子和/或反式调节因子)。虽然ATAC-Seq和ChIP-Seq在确定细胞群体内的表观遗传变异性方面具有不可估量的价值,但这些方法的常规应用在空间分辨促进细胞变异的相关联基因的能力方面有局限性。空间方法是已知的,然而,仍然需要附加方法和/或替代方法。
因此,本公开整体涉及对核酸在空间上加标签和分析。在一些实施方案中,本文提供了利用转座子基因组来片段化基因组DNA(例如,开放染色质、可及染色质)并在空间阵列上捕获片段化DNA的方法,从而揭示了关于在生物样品的空间背景下有助于细胞调节的结构特征的表观基因组见解。
本文提供了用于确定基因组DNA可及性的方法,该方法包括:(a)阵列上的生物样品,该阵列包括多个捕获探针,其中多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;(b)使多个夹板寡核苷酸与生物样品接触,其中夹板寡核苷酸与捕获结构域杂交;(c)使转座子基因组与生物样品接触,以将转座子末端序列插入可及的基因组DNA中,从而生成片段化的基因组DNA;(d)将片段化的基因组DNA与夹板寡核苷酸杂交,并且将片段化的基因组DNA连接到捕获探针;(e)从连接的片段化基因组DNA中释放一个或多个未连接的转座子末端序列;以及(f)确定(i)空间条形码的序列或其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定生物样品中的基因组DNA可及性。
在一些实施方案中,阵列包括一个或多个特征。在一些实施方案中,一个或多个特征包括珠粒。
在一些实施方案中,捕获探针还包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
在一些实施方案中,该方法包括主动迁移步骤,其中通过施加电场将片段化的基因组DNA迁移到阵列。
在一些实施方案中,步骤(b)中的杂交包括将夹板寡核苷酸或其一部分与捕获探针的捕获结构域或其一部分杂交。在一些实施方案中,步骤(d)中的杂交包括将夹板寡核苷酸或其一部分与片段化基因组DNA的转座子末端序列或其一部分杂交。
在一些实施方案中,使用DNA连接酶进行连接。
在一些实施方案中,该方法包括使用片段化的基因组DNA作为模板来延伸捕获探针的3’末端。在一些实施方案中,该延伸步骤使用具有链置换活性的DNA聚合酶进行。
在一些实施方案中,该方法包括在夹板寡核苷酸与片段化的基因组DNA之间进行缺口填充。
在一些实施方案中,转座子基因组包括转座酶,并且其中该转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属(Vibrio)物种转座酶,或者它们的功能性衍生物。在一些实施方案中,Tn5转座酶包括与SEQ ID NO:1至少80%相同的序列。
在一些实施方案中,步骤(f)中的确定包括对以下各项进行测序:(i)空间条形码或其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列,然后进一步确定可及的基因组DNA在生物样品中的位置。
在一些实施方案中,该方法包括在生物样品与阵列接触之前或之后对生物样品成像。
在一些实施方案中,步骤(d)中的释放包括对生物样品进行加热。在一些实施方案中,加热包括加热到约65℃至85℃的温度。在一些实施方案中,加热包括加热到约65℃至约80℃的温度。在一些实施方案中,加热包括加热到约75℃的温度。
在一些实施方案中,该方法包括对生物样品进行染色。在一些实施方案中,染色包括苏木精和曙红染色。
在一些实施方案中,使转座子基因组与生物样品接触是在化学透化条件下、在酶促透化条件下或这两种条件下进行的。在一些实施方案中,化学透化条件包括去污剂。在一些实施方案中,去污剂是NP-40、Tween-20、Triton X-100和洋地黄皂苷中的一者或多者。在一些实施方案中,去污剂的浓度为约0.001%(v/v)至约1.0%(v/v)。
在一些实施方案中,使转座子基因组与生物样品接触在酶促预透化条件之后进行。在一些实施方案中,酶促预透化条件包括蛋白酶。在一些实施方案中,蛋白酶是胃蛋白酶、胶原酶、蛋白酶K,以及它们的组合。在一些实施方案中,蛋白酶是胶原酶。
本文还提供了用于确定基因组DNA可及性的方法,该方法包括:(a)阵列上的生物样品,该阵列包括多个捕获探针,其中多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;(b)使转座子基因组与生物样品接触,以将转座子末端序列插入可及的基因组DNA中,从而生成片段化的基因组DNA;(c)将片段化基因组DNA的转座子末端序列与捕获探针的捕获结构域杂交;(d)释放未与捕获结构域结合的转座子末端序列;以及(e)确定(i)空间条形码的序列或其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定生物样品中的基因组DNA可及性。
在一些实施方案中,阵列包括一个或多个特征。在一些实施方案中,一个或多个特征包括珠粒。
在一些实施方案中,捕获探针还包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
在一些实施方案中,该方法还包括主动迁移步骤,其中通过施加电场将片段化的基因组DNA迁移到阵列。
在一些实施方案中,步骤(c)中的杂交包括将转座子末端序列或其一部分与捕获探针的捕获结构域或其一部分杂交。
在一些实施方案中,该方法包括使用片段化的基因组DNA作为模板来延伸捕获探针的3’末端。在一些实施方案中,该延伸步骤使用具有链置换活性的DNA聚合酶进行。
在一些实施方案中,该方法包括在转座子末端序列与片段化的基因组DNA之间进行缺口填充。
在一些实施方案中,转座子基因组包括转座酶,并且其中该转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属(Vibrio)物种转座酶,或者它们的功能性衍生物。在一些实施方案中,Tn5转座酶包括与SEQ ID NO:1至少80%相同的序列。
在一些实施方案中,步骤(e)中的确定包括对以下各项进行测序:(i)空间条形码的序列或其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列,然后进一步确定可及的基因组DNA在生物样品中的位置。
在一些实施方案中,该方法包括在生物样品与阵列接触之前或之后对生物样品成像。
在一些实施方案中,步骤(d)中的释放包括对生物样品进行加热。在一些实施方案中,加热包括加热到约65℃至85℃的温度。在一些实施方案中,加热包括加热到约65℃至约80℃的温度。在一些实施方案中,加热包括加热到约75℃的温度。
在一些实施方案中,该方法包括对生物样品进行染色。在一些实施方案中,染色包括苏木精和曙红染色。
在一些实施方案中,使转座子基因组与生物样品接触是在化学透化条件之后、在酶促透化条件下或同时满足这两者的情况下进行的。在一些实施方案中,化学透化条件包括去污剂。在一些实施方案中,去污剂是NP-40、Tween-20、Triton X-100和洋地黄皂苷中的一者或多者。在一些实施方案中,去污剂的浓度为约0.001%(v/v)至约0.1%(v/v)。在一些实施方案中,使转座子基因组与生物样品接触在酶促预透化条件之后进行。在一些实施方案中,酶促预透化条件包括蛋白酶。在一些实施方案中,蛋白酶是胃蛋白酶、胶原酶、蛋白酶K,以及它们的组合。在一些实施方案中,蛋白酶是胶原酶。
本文还提供了用于确定生物样品中DNA的位置的方法,该方法包括:(a)阵列上的生物样品,该阵列包括多个捕获探针,其中多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;(b)使生物样品与蛋白酶接触,其中该蛋白酶能够降解一种或多种组蛋白,从而释放DNA;(c)使转座子基因组与生物样品接触,以将转座子末端序列插入释放的基因组DNA中,从而生成片段化的基因组DNA;(d)将片段化DNA的转座子末端序列与捕获结构域杂交;(e)释放未与捕获结构域结合的转座子末端序列;以及(f)确定(i)空间条形码的序列或其互补序列,和(ii)该DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定生物样品中DNA的位置。
在一些实施方案中,蛋白酶能够降解生物样品中的至少一种接头组蛋白和至少一种核心组蛋白。在一些实施方案中,蛋白酶能够降解来自生物样品中的每个核心组蛋白家族的至少一种组蛋白。在一些实施方案中,蛋白酶是丝氨酸蛋白酶、天冬氨酰蛋白酶、肽酶家族C1酶、被重氮甲烷抑制剂Z-Phe-Phe-CHN(2)或环氧化物抑制剂E-64抑制的蛋白酶、溶酶体蛋白酶、胶原酶或嗜苯胺蓝酶。在一些实施方案中,蛋白酶是胶原酶。
在一些实施方案中,捕获结构域包含均聚序列。在一些实施方案中,捕获结构域包含单一序列。
在一些实施方案中,捕获探针还包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
在一些实施方案中,该方法包括主动迁移步骤,其中通过施加电场将片段化的基因组DNA迁移到阵列。
在一些实施方案中,步骤(d)中的杂交包括将转座子末端序列或其一部分与捕获探针的捕获结构域或其一部分杂交。
在一些实施方案中,该方法包括使用片段化的基因组DNA作为模板来延伸捕获探针的3’末端。在一些实施方案中,该延伸步骤使用具有链置换活性的DNA聚合酶进行。
在一些实施方案中,该方法包括在转座子末端序列与片段化的基因组DNA之间进行缺口填充。
在一些实施方案中,转座子基因组包括转座酶,并且其中该转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属物种转座酶,或者它们的功能性衍生物。在一些实施方案中,Tn5转座酶包括与SEQ ID NO:1至少80%相同的序列。
在一些实施方案中,步骤(f)中的确定包括对以下各项进行测序:(i)空间条形码或其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列。
在一些实施方案中,该方法还包括对生物样品进行成像和/或染色。在一些实施方案中,染色包括苏木精和曙红染色。
在一些实施方案中,蛋白酶与生物样品接触约5分钟至约15分钟。在一些实施方案中,蛋白酶与生物样品接触约10分钟。在一些实施方案中,蛋白酶在约30℃至约45℃的温度下与生物样品接触。在一些实施方案中,蛋白酶在约37℃的温度下与生物样品接触。
在一些实施方案中,步骤(d)中的释放包括对生物样品进行加热。在一些实施方案中,加热包括加热到约65℃至85℃的温度。
在一些实施方案中,确定生物样品中DNA的位置还包括对生物样品的整个基因组进行空间分析。
在一些实施方案中,生物样品是组织切片。在一些实施方案中,组织切片是新鲜的冷冻组织切片。在一些实施方案中,组织切片是固定的组织切片。在一些实施方案中,固定的组织切片是福尔马林固定石蜡包埋的固定组织切片、丙酮固定组织切片、多聚甲醛固定组织切片或甲醇固定组织切片。
本说明书中提到的所有出版物、专利和专利申请均以引用方式并入本文,其程度与每个单独的出版物、专利、专利申请或信息条目特异性且单独地指示以引用方式并入相同。如果通过引用并入的出版物、专利、专利申请和信息项与本说明书中包含的公开内容相矛盾,则本说明书旨在取代和/或优先于任何此类矛盾的材料。
在以范围描述值的情况下,应理解,该描述包括公开这样的范围内所有可能的子范围,以及落入这样的范围内的具体数值,而不管明确陈述的是具体数值还是具体子范围。
在提及项目集合而使用时,术语“各”旨在识别集合中的单个项目但不一定是指集合中的每个项目,除非另有明确说明,或除非使用的上下文另有明确指示。
本文描述了本公开的特征的各种实施方案。然而,应当理解,此类实施方案仅通过举例来提供,在不脱离本公开范围的情况下,本领域技术人员可以想到许多变型形式、变化和替换方案。还应当理解,本文所述具体实施方案的各种替代方案也在本公开的范围内。
附图说明
以下附图展示了本公开的特征和优点的某些实施方案。这些实施方案无意于以任何方式限制所附权利要求书的范围。附图中相同的附图符号表示相同的元件。
图1示出了示例性的捕获探针。
图2示出了转座酶可及染色质(spATAC)工作流程的示例性空间测定法。
图3A至图3B示出了具有人神经胶质瘤异种移植物的小鼠大脑组织切片的A)苏木精和曙红(H&E)染色情况和B)基因表达模式。
图4A至图4B示出了小鼠大脑组织切片中用于测试图2中所述工作流程的空间分辨率的不同物质的A)H&E染色情况和B)基因表达模式。
图5A至图5B是重复实验的坐标图,示出了斑点的数量(y轴)与在每个斑点处鉴定的独特分子标识符的数量(x轴)的关系。在每个坐标图的上方示出了对应于这些坐标图的图像。
图6A至图6B是指示当实施本文所述方法时核小体周期性的恢复情况的示例性坐标图;bp=碱基对,FU=荧光单位。
图7A至图7H示出了在空间ATAC-seq工作流程之前用SOX9抗体进行免疫染色的两个连续小鼠组织切片(图7A和图7E)。图7B和图7F示出了每个斑点捕获的标签片段化DNA片段的总数。图7C和图7G是示出当实施本文所述方法时转录起始位点(TSS)富集和对应的核小体周期性的坐标图(图7D和图7H)。
图8示出了图7A和图7E中所示小鼠胚胎的参考小鼠数据集(e13,5;顶部)和空间ATAC-seq数据集(e13,5;中部)的ATAC-seq读取密度的基因组迹线。空间ATAC-seq信号富集和峰检分析(底部)示出了片段富集的匹配位置。
图9A至图9B示出了基于无偏图的聚类(图9A)和组织切片中每个斑点的簇分配(图9B)。
图10A至图10D示出了UMAP图(图10A和图10C),其通过发现在组织切片区域(图10B和图10D)之间存在可及性差异的两个基因区域的相对可及性来着色。
图11A至图11F示出了基于基因表达的第一基因组合区域聚类(图11A)。空间簇用数字表示。图11B至图11F示出了相邻部分中每个簇的标记基因的可及性。
图12示出了空间ATAC-seq信号富集的基因组迹线,其中示出了在组织簇7中发现更易触及的一个这种区域的可及性。
具体实施方式
本文所述的空间分析方法和组合物能够以高空间分辨率提供生物样品内的多种分析物的大量分析物和/或表达数据,同时保留天然的空间背景。空间分析方法和组合物可包括例如使用包含空间条形码(例如,提供关于分析物在细胞或组织样品(例如,哺乳动物细胞或哺乳动物组织样品)内的地点或位置的信息的核酸序列)和能够与由细胞产生的和/或存在于细胞中的分析物(例如,蛋白质和/或核酸)结合的捕获结构域的捕获探针。空间分析方法和组合物也可包括使用具有捕获中间剂的捕获结构域的捕获探针以间接检测分析物。例如,中间剂可包括与中间剂相关联的核酸序列(例如,条形码)。中间剂的检测因此指示细胞或组织样品中的分析物。
空间分析方法和组合物的非限制性方面见述于以下中:美国专利号10,774,374、10,724,078、10,480,022、10,059,990、10,041,949、10,002,316、9,879,313、9,783,841、9,727,810、9,593,365、8,951,726、8,604,182、7,709,198;美国专利申请公开号2020/239946、2020/080136、2020/0277663、2020/024641、2019/330617、2019/264268、2020/256867、2020/224244、2019/194709、2019/161796、2019/085383、2019/055594、2018/216161、2018/051322、2018/0245142、2017/241911、2017/089811、2017/067096、2017/029875、2017/0016053、2016/108458、2015/000854、2013/171621;WO 2018/091676、WO2020/176788;Rodriques等人,Science 363(6434):1463-1467,2019;Lee等人,Nat.Protoc.10(3):442-458,2015;Trejo等人,PLoS ONE 14(2):e0212031,2019;Chen等人,Science 348(6233):aaa6090,2015;Gao等人,BMC Biol.15:50,2017;和Gupta等人,Nature Biotechnol.36:1197-1202,2018;Visium空间基因表达试剂盒用户指南(例如,RevC,日期为2020年6月)和/或Visium空间组织优化试剂盒用户指南(例如,Rev C,日期为2020年7月),二者均在10x基因组学支持文献网站(10x Genomics Support Documentationwebsite)提供,并可以任何组合在本文中使用。本文描述了空间分析方法和组合物的其他非限制性方面。
可用于本公开中的一些通用术语可见于WO 2020/176788和/或美国专利申请公开号2020/0277663的第(I)(b)节中。通常,“条形码”为传达或能够传达信息(例如,关于样品、珠和/或捕获探针中的分析物的信息)的标签或标识符。条形码可以是分析物的一部分,也可以独立于分析物。条形码可以附接到分析物。特定条形码相对于其他条形码可以是独特的。出于本公开的目的,“分析物”可以包括待分析的任何生物物质、结构、部分或组分。术语“目标”可以类似地指感兴趣的分析物。
分析物可以大致分为以下两组之一:核酸分析物和非核酸分析物。非核酸分析物的实例包括但不限于脂质、碳水化合物、肽、蛋白质、糖蛋白(N-连接或O-连接)、脂蛋白、磷蛋白、蛋白质的特定磷酸化或乙酰化变体、蛋白质的酰胺化变体、蛋白质的羟基化变体、蛋白质的甲基化变体、蛋白质的泛素化变体、蛋白质的硫酸化变体、病毒蛋白(例如,病毒衣壳、病毒包膜、病毒外壳、病毒辅助蛋白、病毒糖蛋白、病毒刺突等)、胞外和胞内蛋白、抗体和抗原结合片段。在一些实施方案中,分析物可位于亚细胞位置,包括例如细胞器,例如线粒体、高尔基体、内质网、叶绿体、胞吞小泡、胞泌小泡、液泡、溶酶体等。在一些实施方案中,分析物可以是肽或蛋白质,包括但不限于抗体和酶。分析物的另外的实例可见于WO 2020/176788和/或美国专利申请公开号2020/0277663的第(I)(c)节中。在一些实施方案中,可以间接检测分析物,如通过检测中间剂,例如连接产物或分析物捕获剂(例如,寡核苷酸缀合抗体),如本文描述的那些。
“生物样品”通常从受试者获得,以使用多种技术中的任何一种进行分析,所述多种技术包括但不限于活检、外科手术和激光捕获显微镜法(LCM),并通常包括来自受试者的细胞和/或其他生物材料。在一些实施方案中,生物样品可以是组织切片。在一些实施方案中,生物样品可以是固定的和/或染色的生物样品(例如,固定的和/或染色的组织切片)。染色剂的非限制性实例包括组织学染色剂(例如,苏木精和/或曙红)和免疫学染色剂(例如,荧光染色剂)。在一些实施方案中,可以对生物样品(例如,固定的和/或染色的生物样品)进行成像。生物样品也在WO 2020/176788和/或美国专利申请公开号2020/0277663的第(I)(d)节中有所描述。
在一些实施方案中,用一种或多种透化试剂来透化生物样品。例如,透化生物样品可以促进分析物捕获。示例性的透化剂和透化条件在WO2020/176788和/或美国专利申请公开号2020/0277663的第(I)(d)(ii)(13)节或示例性实施方案章节中有所描述。
基于阵列的空间分析方法涉及将一种或多种分析物从生物样品转移到基板上的特征阵列,其中每个特征与该阵列上的独特空间位置相关联。随后对转移的分析物的分析包括确定分析物的身份和分析物在生物样品内的空间位置。分析物在生物样品内的空间位置基于分析物在阵列上所结合(例如,直接或间接地)的特征和该特征在阵列内的相对空间位置来确定。
“捕获探针”是指能够捕获(直接或间接地)和/或标记生物样品中的分析物(例如,感兴趣的分析物)的任何分子。在一些实施方案中,捕获探针是核酸或多肽。在一些实施方案中,捕获探针包括条形码(例如,空间条形码和/或独特分子标识符(UMI))和捕获结构域。在一些实施方案中,捕获探针可包括切割结构域和/或功能结构域(例如,引物结合位点,如用于下一代测序(NGS))。参见例如WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(b)节(例如,第(i)-(vi)小节)。捕获探针的产生可以通过任何适当的方法实现,包括WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(d)(ii)节中描述的那些方法。
在一些实施方案中,来自生物样品的多于一种分析物类型(例如,核酸和蛋白质)可以使用任何适当的多重分析技术来检测(例如,同时或依次),诸如WO 2020/176788和/或美国专利申请公开号2020/0277663的第(IV)节中描述的那些技术。
在一些实施方案中,可以使用一种或多种分析物捕获剂来进行对一种或多种分析物(例如,蛋白质分析物)的检测。如本文所用,“分析物捕获剂”是指与分析物(例如,生物样品中的分析物)以及与捕获探针(例如,附接到基板或特征的捕获探针)相互作用以识别分析物的试剂。在一些实施方案中,分析物捕获剂包含:(i)分析物结合部分(例如,其与分析物结合),例如,抗体或其抗原结合片段;(ii)分析物结合部分条形码;和(iii)分析物捕获序列。如本文所用,术语“分析物结合部分条形码”是指与分析物结合部分相关联或以其他方式识别分析物结合部分的条形码。如本文所用,术语“分析物捕获序列”是指配置为与捕获探针的捕获结构域杂交、结合、联接或以其他方式相互作用的区域或部分。在一些情况下,分析物结合部分条形码(或其一部分)可能够从分析物捕获剂去除(例如,切割)。分析物捕获剂的另外的描述可见于WO 2020/176788的第(II)(b)(ix)节和/或美国专利申请公开号2020/0277663的第(II)(b)(viii)节中。
至少有两种方法将空间条形码与一个或多个相邻细胞相关联,使得该空间条形码将一个或多个细胞和/或一个或多个细胞的内容物标识为与特定空间位置相关联。一种方法是将分析物或分析物替代物(例如,中间剂)推出细胞并推向在空间上加条形码的阵列(例如,包括在空间上加条形码的捕获探针)。另一种方法是将在空间上加条形码的捕获探针从阵列上裂解,然后将在空间上加条形码的捕获探针推向生物样品以及/或者推到生物样品之中或之上。
在一些情况下,捕获探针可以被构造成从模板(例如,DNA或RNA模板,诸如分析物或中间剂(例如,连接产物或分析物捕获剂),或其一部分)或其衍生物引发、复制并因此产生任选地加条形码的延伸产物(参见例如,WO 2020/176788和/或美国专利申请公布号2020/0277663有关延伸的捕获探针的第(II)(b)(vii)节)。在一些情况下,捕获探针可配置为与模板(例如,DNA或RNA模板,如分析物或中间剂,或其一部分)形成连接产物,从而产生充当模板的代替物的连接产物。
如本文所用,“延伸的捕获探针”是指具有添加到捕获探针的末端(例如,3’或5’末端)从而延长捕获探针的总长度的另外的核苷酸的捕获探针。例如,“延伸的3’端”表示额外的核苷酸添加到捕获探针的最靠近3’端的核苷酸以延伸该捕获探针的长度,例如,通过用于延伸核酸分子的聚合反应,包括由聚合酶(例如,DNA聚合酶或逆转录酶)催化的模板化聚合。在一些实施方案中,延伸捕获探针包括向捕获探针的3’端添加核酸序列,该核酸序列与特异性地结合捕获探针的捕获结构域的分析物或中间剂的核酸序列互补。在一些实施方案中,使用逆转录来延伸捕获探针。在一些实施方案中,使用一种或多种DNA聚合酶来延伸捕获探针。延伸的捕获探针包括捕获探针的序列和捕获探针的空间条形码的序列。
在一些实施方案中,将延伸的捕获探针扩增(例如,在本体溶液中或在阵列上)以产生足以用于下游分析(例如,经由DNA测序)的量。在一些实施方案中,延伸的捕获探针(例如,DNA分子)充当扩增反应(例如,聚合酶链式反应)的模板。
空间分析方法的附加变型(在一些实施方案中包括成像步骤)在WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(a)节中有所描述。对所捕获分析物(和/或中间剂或其部分)的分析,例如,包括样品去除、延伸捕获探针、测序(例如,对裂解的延伸捕获探针和/或与延伸捕获探针互补的cDNA分子进行测序)、阵列上测序(例如,使用例如原位杂交方法或原位连接方法)、时间分析和/或邻近捕获,在WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(g)节中有所描述。WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(h)节中描述了一些质量控制措施。
空间信息可提供具有生物学和/或医学重要性的信息。例如,本文描述的方法和组合物可允许:鉴定疾病或病症的一种或多种生物标志物(例如,诊断生物标志物、预后生物标志物和/或用于确定治疗功效的生物标志物);鉴定用于治疗疾病或病症的候选药物靶标;鉴定(例如,诊断)受试者患有某疾病或病症;鉴定受试者的疾病或病症的阶段和/或预后;鉴定受试者具有增加的发生某疾病或病症的可能性;监测受试者的疾病或病症的进展;确定受试者的疾病或病症的治疗功效;鉴定治疗对于疾病或病症有效的患者亚群;改进患有某疾病或病症的受试者的治疗;选择参与临床试验的受试者;和/或选择针对患有某疾病或病症的受试者的治疗。
空间信息可提供具有生物学重要性的信息。例如,本文所述的方法和组合物能够允许:识别转录组表达谱和/或蛋白质组表达谱(例如,在健康组织和/或患病组织中);识别非常接近的多种分析物类型(例如,最近邻分析);确定患病组织中上调和/或下调的基因和/或蛋白质;表征肿瘤微环境;表征肿瘤免疫反应;表征细胞类型和它们在组织中的共定位;以及识别组织内的遗传变体(例如,基于与特定疾病或异常生物标志物相关联的基因表达谱和/或蛋白质表达谱)。
通常,对于基于空间阵列的方法,基板用作将捕获探针直接或间接地附接到阵列特征的支持物。“特征”是充当空间分析中使用的各种分子实体的支持物或储存库的实体。在一些实施方案中,阵列中的一些或全部特征被功能化,以便捕获分析物。示例性基板在WO2020/176788和/或美国专利申请公开号2020/0277663的第(II)(c)节中有所描述。阵列的示例性特征和几何属性可以在WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(d)(i)节、第(II)(d)(iii)节和第(II)(d)(iv)节中找到。
一般来讲,当生物样品与包括捕获探针的基板(例如,具有嵌入、点样、印刷、制造在基板上的捕获探针的基板,或具有包括捕获探针的特征(例如,珠粒、孔)的基板)接触时,可以捕获分析物和/或中间剂(或其部分)。如本文所用,生物样品与基板的“接触”是指使得捕获探针可以与来自生物样品的分析物相互作用(例如,共价或非共价结合(例如,杂交))的任何接触(例如,直接或间接)。捕获可以主动实现(例如,使用电泳)或被动实现(例如,使用扩散)。分析物捕获在WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(e)节中进一步描述。
在一些情况下,可以通过将具有条形码(例如,空间条形码)的分子(例如,肽、脂质或核酸分子)附接到和/或引入生物样品(例如,生物样品中的细胞)来进行空间分析。在一些实施方案中,将具有多个条形码(例如,多个空间条形码)的多个分子(例如,多个核酸分子)引入生物样品(例如,生物样品中的多个细胞),以用于空间分析。在一些实施方案中,在将具有条形码的分子附接到和/或引入生物样品之后,可以将生物样品物理分离(例如,解离)成单细胞或细胞群以供分析。一些这样的空间分析方法在WO 2020/176788和/或美国专利申请公开号2020/0277663的第(III)节中有所描述。
在一些情况下,可以通过检测与分析物杂交的多个寡核苷酸来进行空间分析。例如,在一些情况下,可以使用RNA模板化连接(RTL)来进行空间分析。之前已描述过RTL方法。参见例如,Credle等人,Nucleic Acids Res.2017年8月21日;45(14):e128。通常,RTL包括两个寡核苷酸与分析物(例如,RNA分子,如mRNA分子)上的相邻序列的杂交。在一些情况下,寡核苷酸为DNA分子。在一些情况下,寡核苷酸中的一个在3’末端处包括至少两个核糖核酸碱基和/或另一个寡核苷酸在5’末端处包括磷酸化核苷酸。在一些情况下,两个寡核苷酸中的一个包括捕获结构域(例如,poly(A)序列、非同聚序列)。在与分析物杂交之后,连接酶(例如,SplintR连接酶)将两个寡核苷酸连接在一起,产生连接产物。在一些情况下,两个寡核苷酸与彼此不相邻的序列杂交。例如,两个寡核苷酸的杂交在杂交的寡核苷酸之间产生间隙。在一些情况下,聚合酶(例如,DNA聚合酶)可在连接之前延伸寡核苷酸中的一个。连接后,从分析物释放连接产物。在一些情况下,使用核酸内切酶(例如,RNAse H)释放连接产物。然后,释放的连接产物可被阵列上的捕获探针捕获(例如,而不是直接捕获分析物),任选地扩增和测序,从而确定生物样品中分析物的位置和任选地丰度。
在空间信息的分析过程中,获得与分析物相关联的空间条形码的序列信息,并且该序列信息可用于提供关于生物样品中分析物的空间分布的信息。可以使用各种方法来获得空间信息。在一些实施方案中,特定的捕获探针和它们捕获的分析物与基板上特征的阵列中的特定位置相关联。例如,特定的空间条形码可在阵列制造之前与特定的阵列位置相关联,并且空间条形码的序列可与特定的阵列位置信息一起存储(例如,存储在数据库中),以便每个空间条形码唯一地映射到一个特定的阵列位置。
或者,特定的空间条形码可在制造期间沉积在特征阵列中的预定位置处,使得在每个位置处仅存在一种类型的空间条形码,以便空间条形码唯一地与阵列的单个特征相关联。必要时,可使用任何本文描述的方法对阵列解码,使得空间条形码唯一地与阵列特征位置相关联,并且可如上所述存储此映射。
当在空间信息的分析期间获得关于捕获探针和/或分析物的序列信息时,可通过参考唯一地关联每个空间条形码与阵列特征位置的存储信息来确定捕获探针和/或分析物的位置。以这种方式,特定的捕获探针和所捕获分析物与特征阵列中的特定位置相关联。每个阵列特征位置表示相对于阵列的坐标参考点(例如,阵列位置、基准标记物)的位置。因此,每个特征位置在阵列的坐标空间中均具有一个“地址”或位置。
一些示例性空间分析工作流程在WO 2020/176788和/或美国专利申请公开号2020/0277663的示例性实施方案章节中有所描述。参见例如WO 2020/176788和/或美国专利申请公开号2020/0277663中以“在本文描述的工作流程的一些非限制性实例中,可将样品浸入……”开头的示例性实施方案。另外参见例如Visium空间基因表达试剂盒用户指南(例如,Rev C,日期为2020年6月)和/或Visium空间组织优化试剂盒用户指南(例如,Rev C,日期为2020年7月)。
在一些实施方案中,可使用专用硬件和/或软件来进行空间分析,如WO 2020/176788和/或美国专利申请公开号2020/0277663的第(II)(e)(ii)和/或(V)节中描述的任何系统,或者WO 2020/123320的“用于成像的对照载片,使用对照载片和基板进行成像的方法,使用对照载片和基板进行成像的系统,和/或样品和阵列对准装置及方法,信息标签”部分中描述的装置或方法中的任何一种或多种。
用于执行空间分析的合适系统可以包括诸如用于容纳生物样品的腔室(例如,流动池或可密封的流体密封腔室)之类的部件。生物样品可以安装在例如生物样品保持器中。一个或多个流体腔室可以经由流体导管连接到前述腔室和/或样品保持器,流体可以经由流体泵、真空源或联接到流体导管产生压力梯度以驱动流体流动的其他装置输送到前述腔室和/或样品保持器中。一个或多个阀也可以连接到流体导管,以调节试剂从储存器到前述腔室和/或样品保持器的流动。
该系统可以任选地包括控制单元,该控制单元包括一个或多个电子处理器、输入接口、输出接口(诸如显示器)和存储单元(例如固态存储介质,诸如但不限于磁存储介质、光存储介质或其他固态存储介质,持久的、可写的和/或可重写的存储介质)。该控制单元可以任选地经由网络连接到一个或多个远程装置。该控制单元(及其部件)一般可以执行本文所述步骤和功能中的任一种。在系统连接到远程装置的情况下,一个或多个远程装置可以执行本文所述步骤或特征中的任一种。该系统可以任选地包括一个或多个用于捕获图像的检测器(例如,CCD、CMOS)。该系统还可以任选地包括用于照射样品的一个或多个光源(例如,基于LED、基于二极管、激光器)、具有特征的基板、来自基板上捕获的生物样品的分析物,以及各种对照和校准介质。
该系统可以任选地包括在有形存储介质和硬件部件(诸如专用集成电路)中的一者或多者中编码和/或实现的软件指令。这些软件指令在由控制单元(特别是电子处理器)或集成电路执行时,可以使得控制单元、集成电路或执行软件指令的其他部件执行本文所述方法步骤或功能中的任一种。
在一些情况下,本文所述的系统可以检测(例如,记录图像)阵列上的生物样品。用于检测阵列上的生物样品的示例性方法在PCT申请号2020/061064和/或美国专利申请序列号16/951,854中有所描述。
在将分析物从生物样品转移到基板上的特征阵列之前,可以将生物样品与阵列对准。生物样品与包括捕获探针的特征阵列对准可以促进空间分析,其可以用于检测生物样品中不同位置内分析物存在和/或水平的差异,例如,以生成分析物存在和/或水平的三维图。用于生成分析物存在和/或水平的二维图和/或三维图的示例性方法在PCT申请号2020/053655中有所描述,空间分析方法在WO 2020/061108和/或美国专利申请序列号16/951,864中有大致描述。
在一些情况下,可以使用一个或多个基准标记物(例如,放置在成像系统的视野中且出现在所产生的图像中的物体)将分析物存在和/或水平的图与生物样品的图像对准,如WO 2020/123320、PCT申请号2020/061066和/或美国专利申请序列号16/951,843的“基板属性”章节、“用于成像的对照载片”章节中所述。基准标记物可以用作参考点或测量标度,用于对准(例如,对准样品和阵列、对准两个基板、确定样品或阵列在基板上相对于基准标记物的位置)以及/或者用于尺寸和/或距离的定量测量。
针对转座酶可及染色质的空间测定法
人体包括大量不同类型的细胞,每种细胞类型均提供特化和特定于环境的功能。了解细胞的染色质结构可以揭示有关细胞功能的信息。开放染色质或可及染色质,或可及基因组DNA,通常指示特定细胞中的转录活性序列,例如基因。进一步了解染色质内的转录活性区将能够鉴定哪些基因对细胞的功能和/或表型有贡献。
已经开发了研究表观基因组的方法,例如染色质可及性测定法(ATAC-Seq),或者鉴定与染色质相关联的蛋白质的测定法,例如ChIP-Seq。这些测定法有助于鉴定例如促成动态细胞表型的调节因子(例如,顺式调节因子和/或反式调节因子)。虽然ATAC-Seq和ChIP-Seq在确定细胞群体内的表观遗传变异性方面具有不可估量的价值,但这些方法的常规应用在空间分辨促进细胞变异的三维结构和相关联基因的能力方面有局限性。
因此,本公开整体涉及对核酸在空间上加标签和分析。在一些实施方案中,本文提供了利用转座酶接合与片段化例如可及(例如,开放染色质)基因组DNA并使得能够从生物样品中同时捕获DNA和RNA的方法,从而揭示了有关有助于细胞调节的结构特征的表观基因组见解。
本文提供了用于确定基因组DNA可及性的方法,包括:(a)阵列上的生物样品,该阵列包括多个捕获探针,其中多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;(b)使多个夹板寡核苷酸与生物样品接触,其中夹板寡核苷酸与捕获结构域结合;(c)使转座子基因组与生物样品接触,以将转座子末端序列插入可及的基因组DNA中,从而生成片段化的基因组DNA;(d)将片段化的基因组DNA与夹板寡核苷酸杂交,并且将片段化的基因组DNA的转座子末端序列连接到捕获探针,从而生成连接的转座子末端序列;(e)从连接的转座子末端序列中释放一个或多个未连接的转座子末端序列;(f)确定(i)空间条形码的全部或部分序列,或者其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定生物样品中的基因组DNA可及性。
在一些实施方案中,步骤(d)和(e)顺次进行。在一些实施方案中,步骤(d)和(e)同时进行。例如,一些标签片段化的DNA片段可以用仍然杂交的未连接的转座子末端序列来捕获。在此类实例中,这些未连接的转座子末端序列在捕获标签片段化的DNA之后释放。在一些实施方案中,这些未连接的转座子末端序列在被捕获结构域捕获之前释放。
本文还提供了用于确定基因组DNA可及性的方法,包括:(a)阵列上的生物样品,该阵列包括多个捕获探针,其中多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;(b)使转座子基因组与生物样品接触,以将转座子末端序列插入可及的基因组DNA中,从而生成片段化的基因组DNA;(c)将片段化基因组DNA的转座子末端序列与捕获探针的捕获结构域杂交;(d)释放未与捕获结构域结合的一个或多个转座子末端序列;(e)确定(i)空间条形码的全部或部分序列,或者其互补序列,和(ii)片段化基因组DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定生物样品中的基因组DNA可及性。
在一些实施方案中,步骤(c)和(d)顺次进行。在一些实施方案中,步骤(c)和(d)同时进行。例如,一些标签片段化的DNA片段可以用一个或多个仍然杂交的转座子末端序列来捕获。在此类实例中,一个或多个转座子末端序列在捕获标签片段化的DNA之后释放。在一些实施方案中,一个或多个转座子末端序列在被捕获结构域捕获之前释放。
在一些实施方案中,本文提供了用于对生物样品中的核酸(例如,基因组DNA、mRNA)进行空间分析的方法。在一些实施方案中,提供了一种阵列,其中该阵列包括多个捕获探针。在一些实施方案中,捕获探针可以直接地附接到基板(例如,包括基板的阵列,该基板包括多个捕获探针)。在一些实施方案中,捕获探针可以间接地附接到基板。例如,捕获探针可以附接到基板上的特征。在一些实施方案中,特征是珠粒。在一些实施方案中,捕获探针包括空间条形码和捕获结构域。在一些实施方案中,捕获探针可以是部分双链的。在一些实施方案中,捕获探针可以结合互补寡核苷酸。在一些实施方案中,互补寡核苷酸(例如,夹板寡核苷酸)可以具有单链部分。在一些实施方案中,单链部分可以与片段化的(例如,标签片段化的)DNA杂交。在一些实施方案中,在足以使生物样品细胞中的核酸(例如,基因组DNA)可触及转座子插入(例如,用转座子末端来为DNA片段加标签)的条件下处理生物样品。在一些实施方案中,向生物样品提供转座子末端序列和转座酶(统称为转座子基因组),使得转座子末端序列可以插入生物样品中存在的细胞的可及基因组DNA中。在一些实施方案中,转座子基因组复合物的转座酶将基因组DNA片段化,然后将转座子末端附接到基因组DNA片段的末端(例如,“标签片段化”)。
在一些实施方案中,使包含核酸(例如,基因组DNA、mRNA)的生物样品与基板接触,使得捕获探针可以与片段化且加标签的(例如,标签片段化)基因组DNA相互作用。在一些实施方案中,包含核酸(例如,基因组DNA、mRNA)的生物样品与基板接触,使得捕获探针可以与生物样品中存在的标签片段化基因组DNA和mRNA两者相互作用(例如,第一捕获探针可以结合标签片段化基因组DNA,第二捕获探针可以结合mRNA)。
在一些实施方案中,捕获探针在基板上的位置可以与生物样品中的位置相关,从而在空间上确定生物样品中的标签片段化基因组DNA的位置。在一些实施方案中,捕获探针在基板上的位置可以与生物样品中的位置相关,从而在空间上确定生物样品中的标签片段化基因组DNA和mRNA的位置。
空间ATAC-seq
在一些实施方案中,在本文所述的任何空间分析方法中,使用ATAC-seq来生成全基因组染色质可及性图谱。这些全基因组可及性图谱可以与附加的全基因组轮廓分析数据(例如,RNA-seq、ChIP-seq、Methyl-Seq)整合,以产生基因调控相互作用图谱,从而促进对转录调节的理解。例如,对全基因组可及性图谱的询问可以揭示在给定基因组位置处负责染色质可及性的潜在转录因子和转录因子基序。将染色质可及性的变化与基因表达的变化(RNA-seq)、转录因子结合的变化(例如,ChIP-seq)和/或DNA甲基化水平的变化(例如,Methyl-seq)相关联可以鉴定驱动这些变化的转录调节。在疾病状态下,转录调节时常不平衡。因此,使用空间分析方法分析染色质可及性和例如基因表达这两者,能够鉴定转录调节中潜在的不平衡,及其潜在的原因。
在一些实施方案中,其中在空间上确定分析物位置包括对来自生物样品(例如,组织切片)内的单细胞或细胞亚群的不同类型分析物进行同时分析,可以将附加的空间信息层整合到基因组调控相互作用图谱中。在一些实施方案中,对分析物的空间测定可以对整个基因组进行。在一些实施方案中,可以对固定化生物样品进行空间轮廓分析。
在一些实施方案中,由空间ATAC-seq生成的全基因组染色质可及性图谱可以用于细胞类型鉴定。例如,传统的细胞类型分类依赖于mRNA表达水平,但染色质可及性可能更适合捕获细胞身份。此外,在一些实施方案中,能够以空间方式确定转录活性区域(例如,可及的开放染色质)与表达谱(例如,mRNA的表达谱)之间的相关性。
透化生物样品
本公开整体上描述了对基因组DNA进行标签片段化以在生物样品中生成DNA片段的方法。在一些实例中,可以采用对固定在基板上的生物样品的化学或酶促“预透化”来允许生物样品中的DNA变得可被(例如,转座子基因组复合物中的)转座酶触及。在一些实施方案中,透化生物样品可以是两步过程(例如,预透化处理,之后是透化处理)。在一些实施方案中,透化生物样品可以是一步过程(例如,足以透化生物样品中的细胞膜和核膜的单次透化处理)。
在一些实施方案中,预透化可以包括酶促条件或化学条件。在一些实施方案中,可以用酶(例如,蛋白酶)进行预透化。在一些实施方案中,以非限制性的方式,蛋白酶可以包括胰蛋白酶、胃蛋白酶、分散酶、木瓜蛋白酶或胶原酶。在一些实施方案中,预透化可以包括用胃蛋白酶进行酶促处理。在一些实施方案中,预透化可以包括在0.5M乙酸中的胃蛋白酶。在一些实施方案中,预透化可以包括在核酸外切酶-1缓冲液中的胃蛋白酶。在一些实施方案中,该缓冲液的pH可以是酸性的。在一些实施方案中,预透化可以包括用胶原酶进行酶促处理。在一些实施方案中,预透化可以包括在HBSS缓冲液中的胶原酶。在一些实施方案中,HBSS缓冲液可以包括牛血清白蛋白(BSA)。在一些实施方案中,预透化可以持续约1分钟至约20分钟。在一些实施方案中,预透化可以持续约2分钟、约3分钟、约4分钟、约5分钟、约6分钟、约7分钟、约8分钟、约9分钟、约10分钟、约11分钟、约12分钟、约13分钟、约14分钟、约15分钟、约16分钟、约17分钟、约18分钟或约19分钟。在一些实施方案中,预透化可以持续约10分钟至约1小时。例如,在一些实施方案中,预透化可以持续约20分钟、约30分钟、约40分钟或约50分钟。
在一些实施方案中,透化生物样品包括酶促处理。在一些实施方案中,酶促处理可以是胃蛋白酶处理,或胃蛋白酶样酶处理。在一些实施方案中,酶促处理可以是蛋白酶处理。在一些实施方案中,酶促处理可以在试剂的存在下进行。在一些实施方案中,酶促处理(例如,预透化)可以包括使生物样本与包含蛋白酶的酸性溶液接触。在一些实施方案中,试剂可以是HCl。在一些实施方案中,试剂可以是乙酸。在一些实施方案中,HCl的浓度可以为约100mM。在一些实施方案中,约100mM的HCl可以具有约1.0或1.0左右的pH。在一些实施方案中,附加试剂可以是0.5M乙酸,其具有约2.5或2.5左右的pH。应当注意,对生物样品的酶促处理可以对标签片段化有不同的影响。例如,用胃蛋白酶和100mM HCl进行酶促处理可以导致染色质标签片段化,而与染色质可及性无关。在一些实施方案中,用胃蛋白酶和0.5M乙酸进行酶促处理可以导致染色质标签片段化,其可以保留指示染色质可及性的核小体模式。
在一些实施方案中,酶促处理可以包括使生物样品与在酸性缓冲液中包含天冬氨酰蛋白酶(例如,胃蛋白酶)的反应混合物(例如,溶液)接触,该酸性缓冲液例如pH为约4.0以下,诸如约3.0以下,例如约0.5至约3.0,或约1.0至约2.5的缓冲液。在一些实施方案中,天冬氨酰蛋白酶是胃蛋白酶、胃蛋白酶样酶,或者它们的功能性等同物。因此,酶委员会编号3.4.23.1中的任何酶或酶组合。
在一些实施方案中,酶促处理(例如,预透化)可以使用胶原酶来进行。在一些实施方案中,用胶原酶进行酶促处理可以使转座酶触及基因组DNA,同时保持核的完整性。在一些实施方案中,用胶原酶预透化(例如,进行酶促处理)产生通常与染色质可及性相关联的核小体模式。胶原酶可以分离自溶组织梭状芽孢杆菌(Clostridium histolyticum)。在一些实施方案中,用锌肽链内切酶(例如,胶原酶)与试剂在适合蛋白水解活性的条件下进行的酶促处理包括pH为约7.0至约8.0(例如,约7.4)的缓冲溶液。胶原酶是锌肽链内切酶,可以被EDTA或EGTA或这两者抑制。因此,在一些实施方案中,可以在不存在二价阳离子螯合剂(例如,EDTA、EGTA)的情况下,使生物样品与锌肽链内切酶(例如,胶原酶)接触。在一些实施方案中,中断锌肽链内切酶(例如,胶原酶)可能是有用的,可以通过使生物样品与二价阳离子螯合剂(例如,EDTA、EGTA)接触来终止(例如,抑制)透化步骤。
在一些实施方案中,锌肽链内切酶是胶原酶、胶原酶样酶,或者它们的功能性等同物。在此类实施方案中,根据本文所述的材料和方法,可以使用酶委员会编号3.4.23.3中的任何酶或酶组合。在一些实施方案中,胶原酶是选自下组的一种或多种胶原酶(UniProtKB/Swiss-Prot登录号):P43153/COLA_CLOPE、P43154/COLA_VIBAL、Q9KRJ0/COLA_VIBCH、Q56696/COLA_VIBPA、Q8D4Y9/COLA_VIBVU、Q9X721/COLG_HATHI、Q46085/COLH_HATHI、Q899Y1/COLT_CLOTE URSTH以及它们的功能性变体和衍生物(本文所述),或者它们的组合。
透化生物样品的方法是本领域公知的。本领域技术人员将会知道,不同来源的生物样品可以用不同试剂(例如,蛋白酶、核糖核酸酶、去污剂、缓冲液)在不同条件(例如,压力、温度、浓度、pH、时间)下处理。在一些实施方案中,透化生物样品可以包括足以破坏生物样品的细胞膜以捕获核酸(例如,mRNA)的试剂和条件。在一些实施方案中,透化生物样品可以包括足以破坏生物样品的核膜以捕获核酸(例如,基因组DNA)的试剂和条件。在一些实施方案中,可以使用从其天然来源(例如,动物、微生物来源)分离的市售蛋白酶。在一些实施方案中,可以使用(例如,细菌表达系统、病毒表达系统)重组产生的蛋白酶。在一些实施方案中,生物样品的预透化和透化可以是一步过程(例如,酶促处理)。在一些实施方案中,生物样品的预透化和透化可以是两步过程(例如,酶促处理,之后是化学处理或去污剂处理)。
在一些实施方案中,化学透化条件包括使生物样本与碱性溶液接触,该碱性溶液例如pH为约8.0至约11.0,诸如约8.5至约10.5或约9.0至约10.0,例如约9.5的缓冲溶液。在一些实施方案中,缓冲液是甘氨酸-KOH缓冲液。其他缓冲液在本领域中是已知的。
在一些实施方案中,生物样品可以在酶促处理(例如,预透化步骤后的透化)后用去污剂处理。去污剂在本领域中是已知的。可以使用任何合适的去污剂,以非限制性的方式包括NP-40或等同物、洋地黄皂苷、Tween-20、IGEPAL-40或等同物、皂角苷、SDS、Pitsop2、Triton X-100,或者它们的组合。在一些实施方案中,生物样品可以用已知能透化细胞膜的其他化学品来处理。如在下面的实施例中进一步举例说明的,本文所述的去污剂能够以介于约0.001%(v/v)至约5%(v/v)之间的浓度使用。在一些实施方案中,本文所述的去污剂能够以约0.01%(v/v)、约0.02%(v/v)、约0.03%(v/v)、约0.04%(v/v)、约0.05%(v/v)、约0.06%(v/v)、约0.07%(v/v)、约0.08%或约0.09%的浓度使用。在一些实施方案中,本文所述的去污剂能够以约0.1%(v/v)、约0.2%(v/v)、约0.3%(v/v)、约0.4%(v/v)、约0.5%(v/v)、约0.6%(v/v)、约0.7%(v/v)、约0.8%(v/v)、约0.9%(v/v)、约1.0%(v/v)或约1.1%至约10%(v/v)以上的浓度使用。在一些实施方案中,本文所述的去污剂能够以约2%(v/v)、约3%(v/v)、约4%(v/v)、约5%(v/v)、约6%(v/v)、约7%(v/v)、约8%(v/v)、约9%(v/v)或约10%(v/v)的浓度使用。
用于样品透化的附加方法描述于例如Jamur等人,Method Mol.Biol.588:63-66,2010中,其全部内容以引用方式并入本文。任何合适的生物样品透化方法通常可以与本文所述的生物样品结合使用。
不同来源的生物样品可以用不同的试剂(例如,蛋白酶、核糖核酸酶、去污剂、缓冲液)在不同的合适条件(例如,压力、温度、浓度、pH、时间)下处理,以实现充分的预透化和透化,从而捕获核酸(例如,基因组DNA、mRNA)。
在一些实施方案中,包含本文所述蛋白酶的反应混合物(例如,溶液)可以含有足以确保蛋白酶具有功能性的其他试剂(例如,缓冲液、盐等)。例如,反应混合物还可以包含白蛋白(例如,BSA)。在一些实施方案中,包含胶原酶(或者其功能性变体或衍生物)的反应混合物(例如,溶液)包含白蛋白(例如,BSA)。
在一些实施方案中,在生物样品的预透化与透化之间存在一个或多个洗涤步骤。例如,可能优选的是在添加透化溶液之前,从生物样品中洗去尽可能多的预透化溶液。因此,在一些实施方案中,在预透化以除去预透化试剂之后并且在将透化试剂施加到生物样品之前,例如用SSC洗涤溶液对生物样品进行洗涤。在一些实施方案中,在添加用于对释放的基因组DNA进行标签片段化的转座子基因组试剂之前,从生物样品中除去透化溶液。还可以在透化后和标签片段化前进行一次或多次洗涤,例如使用SSC溶液。在一些实施方案中,在透化生物样品与标签片段化基因组DNA之间没有洗涤步骤。
标签片段化
转座酶和转座子可以用于空间基因组分析方法中。一般来讲,转座是特定遗传序列(例如,转座子序列)从基因组中的一个位置重定位到另一个位置的过程。许多转座方法和可转座元件在本领域中是已知的(例如,DNA转座子、逆转录转座子、自主转座子、非自主转座子)。转座事件的一个非限制性实例是保守转座。保守转座是一种非复制性转座模式,其中转座子完全从基因组中去除并重新整合到新的基因座中,使得转座子序列是保守的(例如,保守转座事件可以被认为是“剪切粘贴”事件)(参见例如,Griffiths A.J.等人,Mechanism of transposition in prokaryotes.An Introduction to Genetic Analysis(第7版),New York:W.H.Freeman(2000))。
在一个实例中,当转座酶结合转座子基因组末端侧翼序列(例如识别序列,例如镶嵌末端序列、转座子序列)时,可以发生剪切粘贴转座。转座子基因组(例如,转座复合物)形成,内源性DNA可以被操纵形成预切除复合物,使得两种转座酶可以相互作用。在一些实施方案中,当这些转座酶相互作用时,双链断裂被引入DNA中。转座酶可以定位并结合DNA中的目标位点、产生双链断裂,然后插入转座子末端序列(参见例如,Skipper,K.A.等人,DNAtransposon-based gene vehicles-scenes from an evolutionary drive,J BiomedSci.,20:92(2013)doi:10.1186/1423-0127-20-92)。替代性的剪切粘贴转座酶包括Tn552(College等人,J.BacterioL,183:2384-8,2001;Kirby C等人,Mol.Microbiol,43:173-86,2002)、Tyl(Devine和Boeke,Nucleic Acids Res.,22:3765-72,1994,以及国际公布WO 95/23875)、Tn7(Craig,N L,Science.271:1512,1996;Craig,N L,Review in:Curr TopMicrobiol Immunol,204:27-48,1996)、Tn/O和IS10(Kleckner N等人,Curr TopMicrobiol Immunol,204:49-82,1996)、Mariner转座酶(Lampe D J等人,EMBO J.,15:5470-9,1996)、Tel(Plasterk R H,Curr.Topics Microbiol.Immunol,204:125-43,1996)、P元件(Gloor,G B,Methods Mol.Biol,260:97-114,2004)、Tn3(Ichikawa和Ohtsubo,JBiol.Chem.265:18829-32,1990)、细菌插入序列(Ohtsubo和Sekine,Curr.Top.Microbiol.Immunol.204:1-26,1996)、逆转录酶病毒(Brown等人,Proc NatlAcad Sci USA,86:2525-9,1989),以及酵母反转录转座子(Boeke和Corces,Annu RevMicrobiol.43:403-34,1989)。更多的实例包括IS5、TnlO、Tn903、IS911和转座酶家族酶的工程化版本(Zhang等人,(2009)PLoS Genet.5:el000689.Epub 2009年10月16日;WilsonC.等人,(2007)J.Microbiol.Methods 71:332-5)。
转座子介导的片段化和加标签(“标签片段化”)是转座酶介导的DNA片段化和加标签的过程。转座子基因组是转座酶与包含转座子末端序列(也称为“转座酶识别序列”或“镶嵌末端”(ME))的DNA的复合物。在一些空间基因组分析方法中,DNA以下述方式被片段化:功能性序列(诸如与捕获探针的捕获结构域(例如,夹板寡核苷酸的捕获结构域)互补的序列)被插入片段化DNA中(例如,片段化DNA被“加标签”),使得该序列(例如衔接子,例如Nextera序列)可以与捕获探针杂交。在一些实施方案中,捕获探针存在于基板上。在一些实施方案中,捕获探针(例如,捕获探针和夹板寡核苷酸)存在于特征上。与转座子序列(例如,转座子基因组)结合的转座酶二聚体(例如,就Tn5转座酶系统而言)能够基于其转座子识别序列同时将DNA片段化并将来自转座子基因组的DNA(例如,转座子序列)连接到片段化DNA(例如,标签片段化DNA)。已使用超高活性转座酶和包含ME的经修饰DNA分子(衔接子)使该系统适应于将DNA片段化并且用功能性DNA分子(例如,引物结合位点)对DNA双链体片段的两条链加标签。例如,Tn5转座酶可以作为纯化的蛋白单体产生。Tn5转座酶也可商购获得(例如,制造商Illumina,Illumina.com,目录号15027865,TD Tagment DNA缓冲液目录号15027866)。这些转座酶随后可以负载感兴趣的寡核苷酸,例如含有用于Tn5识别的ME(例如,转座子序列)的ssDNA寡核苷酸,然后将附加的功能性序列(例如Nextera衔接子,例如引物结合位点)退火形成dsDNA镶嵌末端寡核苷酸(MEDS),其在二聚体组装(例如,转座子基因组二聚化)期间被Tn5识别。在一些实施方案中,超高活性Tn5转座酶可以装载能够同时对基因组进行片段化和加标签的衔接子(例如,感兴趣的寡核苷酸)。
如本文所用,术语“标签片段化”是指针对转座酶可及染色质的测定法中使用测序(ATAC-seq)的步骤。(参见例如,Buenrostro,J.D.,Giresi,P.G.,Zaba,L.C,Chang,H.Y.,Greenleaf,W.J.,Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin,DNA-binding proteins and nucleosomeposition,Nature Methods,10(12):1213-1218(2013))。ATAC-seq使用超高活性原核Tn5-转座酶来鉴定开放染色质区域,该转座酶优先插入可及染色质中并且用衔接子来对位点加标签(Buenrostro,J.D.等人,Transposition of native chromatin for fast andsensitive epigenomic profiling of open chromatin,DNA-binding proteins andnucleosome position.NatMethods,10:1213-1218(2013))。
如本文所用,“可及染色质”或“开放染色质”或“可及基因组DNA”是指基因组中作为核小体缺失区的部分,其可以被蛋白质结合并且在核组织、基因转录中发挥各种作用,通常被认为是DNA的转录活性区(Zhang,Q.等人,Genome-wide open chromatin regions andtheir effects on the regulation of silk protein genes in Bombyx mori,Scientific Reports,7:12919(2017))。
在一些实施方案中,将生物样品细胞中的基因组DNA片段化的步骤包括在任何合适的条件下,使含有该基因组DNA的生物样品与转座酶(例如转座子基因组,例如包含转座酶的反应混合物(例如,溶液))接触。在一些实施方案中,此类合适的条件引起生物样品中存在的细胞基因组DNA发生标签片段化。典型的条件将取决于所使用的转座酶,并且可以使用本领域中已知的常规方法来确定。因此,合适的条件可以是转座酶具有功能性的条件(例如,缓冲液、盐、浓度、pH、温度、时间条件),例如,其中转座酶在生物样品中显示转座酶活性,特别是标签片段化活性。
如本文关于转座酶所使用的术语“功能性”,意味着包括以下实施方案:其中转座酶相对于转座酶在该酶的最佳条件下(例如,在制造商推荐的缓冲液、盐和温度条件下)的活性可以显示出活性有所下降。因此,如果转座酶具有相对于转座酶在该酶的最佳条件下的活性至少为约50%,例如至少为约60%、约70%、约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或约100%的活性,则可以认为该转座酶具有“功能性”。
在一个非限制性实例中,反应混合物包含在pH为约6.5至约8.5(例如约7.0至约8.0,诸如约7.5)的缓冲溶液(例如Tris-乙酸盐)中的转座子基因组。除此之外或替代性地,反应混合物可以在任何合适的温度下使用,诸如约10℃至约55℃,例如约10℃至约54℃、约11℃至约53℃、约12℃至约52℃、约13℃至约51℃、约14℃至约50℃、约15℃至约49℃、约16℃至约48℃、约17℃至约47℃,例如约10℃、约12℃、约15℃、约18℃、约20℃、约22℃、约25℃、约28℃、约30℃、约33℃、约35℃或约37℃,优选地约30℃至约40℃,例如约37℃。在一些实施方案中,转座子基因组可以与生物样品接触约10分钟至约1小时。在一些实施方案中,转座子基因组可以与生物样品接触约20分钟、约30分钟、约40分钟或约50分钟。在一些实施方案中,转座子基因组可以与生物样品接触约1小时至约4小时。
在一些实施方案中,转座子基因组复合物的转座酶是Tn5转座酶,或者其功能性衍生物或变体。(参见例如,Reznikoff等人、WO 2001/009363,美国专利号5,925,545、5,965,443、7,083,980和7,608,434,以及Goryshin和Reznikoff,J.Biol.Chem.273:7367,(1998),这些文献均以引用方式并入本文)。在一些实施方案中,Tn5转座酶是超级Tn5转座酶,或者其功能性衍生物或变体(美国专利号9,790,476,其以引用方式并入本文)。例如,Tn5转座酶可以是融合蛋白(例如,Tn5融合蛋白)。Tn5是蛋白质的核糖核酸酶超家族的成员。Tn5转座子是一种复合转座子,其中两个几乎相同的插入序列(IS50L和IS50R)侧接三个抗生素抗性基因。每个IS50包含两个反向的19bp末端序列(ES),一个是外侧末端(OE),另一个是内侧末端(IE)。野生型Tn5转座酶通常是无活性的(例如,低转座事件活性)。然而,氨基酸置换可以产生超高活性的变体或衍生物。在一个非限制性实例中,氨基酸置换L372P是用亮氨酸替代脯氨酸,这引起α螺旋断裂,从而诱导C-末端结构域的构象变化。α螺旋断裂将C-末端结构域和N-末端结构域充分分离,以促进更高的转座事件活性(参见Reznikoff,W.S.,Tn5 as amodel for understanding DNA transposition,Mol Microbiol,47(5):1199-1206(2003))。引起超高活性Tn5的其他氨基酸置换在本领域中是已知的。例如,经修饰的转座酶(例如,经修饰的Tn5转座酶)对OE末端重复序列的亲合力改善(第(1)类突变)可以通过在第54号氨基酸处提供赖氨酸残基来实现,第54号氨基酸在野生型Tn5转座酶中为谷氨酸(参见美国专利号5.925,545)。该突变强烈改变了经修饰的转座酶(例如,经修饰的Tn5转座酶)的偏好,优先结合OE末端,而不是IE末端。这种称为EK54的突变与OE末端的更高结合导致转座率大约升高到使用野生型转座酶(例如,野生型Tn5转座酶)时所见转座率的10倍。第54位类似地改变为缬氨酸(例如,EV54)也导致OE末端的结合/转座有所增加,第47位从苏氨酸改变为脯氨酸也是如此(例如TP47,大约升高到10倍)(参见美国专利号5.925,545)。
经修饰的转座酶(例如,经修饰的Tn5转座酶)的其他实例是已知的。例如,一种经修饰的Tn5转座酶,其与野生型Tn5转座酶的不同之处在于,它不仅以比野生型Tn5转座酶更高的亲合力与供体DNA的重复序列结合,而且比野生型转座酶更不容易呈现无活性的多聚体形式(美国专利号5,925,545,其全文以引用方式并入本文)。此外,一般描述将来自供体DNA(例如衔接子序列,例如Nextera衔接子(例如顶部衔接子和底部衔接子))的任何可转座元件(例如Tn5)引入目标中的技术在本领域中是已知的(参见例如美国专利号5,925,545)。进一步的研究已经鉴定了产生经修饰的转座酶(例如,经修饰的Tn5转座酶)的突变类型(参见美国专利号5,965,443,其全文以引用方式并入本文)。例如,具有“第1类突变”的经修饰的转座酶(例如,经修饰的Tn5转座酶)以比野生型Tn5转座酶更大的亲合力与供体DNA的重复序列结合。此外,具有“第2类突变”的经修饰的转座酶(例如,经修饰的Tn5转座酶)比野生型Tn5转座酶更不容易呈现无活性的多聚体形式。已经证明,当与如Weinreich,M.D.,“Evidence that the cis Preference of the Tn5 Transposase is Caused byNonproductive Multimerization,”Genes and Development 8:2363-2374(1994)所述的体内偶联测定法结合起来测试时,含有第1类突变和第2类突变两者的经修饰的转座酶可以诱导至少是野生型转座酶的大约100倍(+10%)的转座事件,前述文献以引用方式并入本文(参见例如,美国专利号5,965,443)。另外,在充分的条件下,使用经修饰的转座酶(例如,经修饰的Tn5转座酶)产生的转座可能更高。仅含有第1类突变的经修饰的转座酶能够以比野生型Tn5转座酶高得多的亲合力与重复序列结合,使得当在体内测量时,Tn5转座酶诱导的转座是野生型转座酶的约5倍至约50倍。当在体内测量时,仅含有第2类突变(例如,减少Tn5转座酶呈现无活性形式的突变)的经修饰的转座酶呈现多聚体形式的可能性比野生型Tn5转座酶低得多,使得这种Tn5转座酶诱导的转座也是野生型转座酶的约5倍至约50倍(参见美国专利号5,965,443)。
美国专利号5,965,443和美国专利号9,790,476中进一步大致描述了使用经修饰的转座酶(例如,经修饰的Tn5转座酶)的其他方法。例如,经修饰的转座酶可以将选择性标记提供给目标DNA、将可移动的同源区域提供给目标DNA、促进特化DNA序列插入目标DNA中、提供用于DNA测序的引物结合位点或标签,或者促进产生基因融合以供基因表达。对研究和蛋白质结构域作图,以及将DNA序列的其他所需组合集合到一起(组合遗传学)(美国专利号5,965,443)。
在染色体核酸或染色体外核酸的随机或半随机位置处插入可转座元件(例如,转座子)的另外一些方法是已知的。例如,方法包括在介导转座事件进入基因组DNA的条件下,将生物样品中的核酸(例如,基因组DNA)与突触复合物结合的步骤,该突触复合物包含与序列复合的Tn5转座酶,该序列包含适于与Tn5转座酶和可转座元件(例如,转座子)可操作地相互作用的一对核苷酸序列。在该方法中,突触复合物可以在不利于或阻止突触复合物经历转座事件的条件下在体外形成。转座频率(例如,转座事件)可以通过使用超高活性转座酶(例如,突变转座酶)或含有在超高活性转座酶(例如,超高活性Tn5转座酶)存在下充分适应有效转座事件的序列的可转座元件(例如,转座子)或这两者来增加(美国专利号6,159,736,其以引用方式并入本文)。
用于处理核酸的方法、组合物和试剂盒,特别是使用转座子组合物来将DNA片段化和加标签的方法和组合物在以下文献中详细描述:美国专利申请公布号US 2010/0120098、美国专利申请公布号US2011/0287435,以及Satpathy,A.T.等人,Massively parallelsingle-cell chromatin landscapes of human immune cell development andintratumoral T-cell exhaustion,Nat Biotechnol.,37,925-936(2019),这些文献的内容均全文以引用方式并入本文。
可以使用具有标签片段化活性的任何转座酶,例如,能够片段化DNA并将寡核苷酸(例如衔接子,例如Nextera索引衔接子)插入片段化(例如,标签片段化)DNA的末端中的任何转座酶。在一些实施方案中,转座酶是能够保守转座的任何转座酶。在一些实施方案中,转座酶是剪切粘贴转座酶。其他种类的转座酶在本领域中是已知的,并且在本公开的范围内。例如,合适的转座酶包括但不限于Mos-1、HyperMuTM、Ts-Tn5、Ts-Tn5059、Hermes、Tn7、弧菌属物种转座酶(参见例如,美国专利申请号20120301925A1和WO 2015/069374,这些专利申请的内容全文以引用方式并入本文),或者先前列出的转座酶的任何功能性变体或衍生物。
在一些实施方案中,Tn5转座酶的超高活性变体能够在只花费很短时间(例如,约5分钟)的反应中介导双链DNA的片段化以及合成寡核苷酸(例如,Nextera衔接子)在DNA的两个5’末端处的连接。然而,由于野生型末端序列具有相对低的活性,所以它们有时在体外被超高活性镶嵌末端(ME)序列替换。Tn5转座酶与19bp ME的复合物促进转座,前提条件是居间的DNA足够长,以使两个这样的序列靠拢在一起形成活性Tn5转座酶同源二聚体。
在一些实施方案中,Tn5转座酶或者其功能性变体或衍生物包含与SEQ ID NO:1具有至少80%序列同一性的氨基酸序列。在一些实施方案中,Tn5转座酶或者其功能性变体或衍生物包含与SEQ ID NO:1具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的氨基酸序列。在一些实施方案中,转座酶与包含转座子末端序列的衔接子复合。在一些实施方案中,Tn5转座子末端序列包含与SEQ ID NO:2具有至少80%序列同一性的序列。在一些实施方案中,Tn5转座子末端序列包含与SEQ IDNO:2具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的氨基酸序列。
在一些实施方案中,转座酶是Mu转座酶,或者其功能性变体或衍生物。在一些实施方案中,Mu转座酶或者其功能性变体或衍生物包含与SEQ ID NO:3具有至少80%同一性的氨基酸序列。在一些实施方案中,Mu转座酶或者其功能性变体或衍生物包含与SEQ ID NO:3具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的氨基酸序列。在一些实施方案中,Mu转座子末端序列(例如,转座酶识别序列)包含与SEQ ID NO:4至9中任一者具有至少80%序列同一性的序列。在一些实施方案中,Mu转座子末端序列(例如,Mu转座酶识别序列)包含与SEQ ID NO:4至9中任一者具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的序列。
在一些实施方案中,转座酶是ISR家族转座酶,或者其功能性变体或衍生物。例如,ISR家族转座酶可以是NCBI参考序列WP 012128611.1和/或美国专利号9,005,935中描述的ISR家族转座酶,该专利全文以引用方式并入本文。在一些实施方案中,ISR家族转座酶或者其功能性变体或衍生物包含与SEQ ID NO:10具有至少80%同一性的氨基酸序列。在一些实施方案中,ISR家族转座酶或者其功能性变体或衍生物包含与SEQ ID NO:10具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的氨基酸序列。在一些实施方案中,ISR家族转座酶转座子末端序列(例如,转座酶识别序列)包含与SEQ ID NO:11至13中任一者具有至少80%同一性的序列。在一些实施方案中,ISR家族转座酶转座子末端序列(例如,转座酶识别序列)包含与SEQ ID NO:11至13具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%氨基酸序列同一性的序列。
与转座酶的复合物中的衔接子(例如,Nextera衔接子)(例如形成转座子基因组的一部分,例如本文所述的MEDS)可以包括部分双链的寡核苷酸。在一些实施方案中,存在第一衔接子和第二衔接子。在一些实施方案中,第一衔接子可以与第一单体复合。在一些实施方案中,第二衔接子可以与第二单体复合。在一些实施方案中,与第一衔接子复合的第一单体和与第二单体复合的第二单体可以组装形成二聚体。在一些实施方案中,衔接子的双链部分包含转座子末端序列(例如,镶嵌末端(ME))序列。在一些实施方案中,衔接子(例如,Nextera索引衔接子)的单链部分(5’突出端)含有将要掺入标签片段化DNA中的功能性结构域或序列。在一些实施方案中,衔接子可以是Nextera衔接子(例如,索引衔接子)(例如,试剂包括用于ATAC-seq的Nextera DNA文库制备试剂盒(不再可用)、TDE-1Tagment DNA酶(目录号15027865)、TD Tagment DNA缓冲液(目录号15027866),购自Illumina,Illumina.com)。在一些实施方案中,掺入标签片段化DNA中的序列是与捕获探针的捕获结构域互补的序列。在一些实施方案中,与捕获探针的捕获结构域互补的序列是转座子末端序列。在此类实施方案中,功能性结构域位于衔接子的将与捕获探针连接的链上。换句话讲,功能性结构域可以位于ME序列的上游(例如5’端),例如,在衔接子的5’突出端中。
与标签片段化DNA连接的衔接子(例如,Nextera索引衔接子,例如第一衔接子和第二衔接子)可以是任何合适的序列。例如,该序列可以是病毒序列。在一些实施方案中,该序列可以是CRISPR序列。在一些实施方案中,与标签片段化DNA连接的衔接子(例如,寡核苷酸)可以是CRISPR指导序列。在一些实施方案中,CRISPR指导序列可以靶向感兴趣的序列(例如,感兴趣的基因组基因座,其例如具有基因特异性)。
在一些实施方案中,ME序列是Tn5转座酶识别序列。在一些实施方案中,镶嵌末端(例如,ME)序列是Mu转座酶识别序列。在一些实施方案中,ME序列是弧菌属物种转座酶识别序列。
在一些实施方案中,将包含转座酶(例如,本文所述的任何转座酶)和与该转座酶复合的包含转座子末端序列(例如,镶嵌末端序列)的衔接子(例如,分别与第一单体和第二单体复合的第一衔接子和第二衔接子)的组合物用于一种对生物样品中的核酸在空间上加标签的方法中。在一些实施方案中,包含转座酶的组合物还包含与如本文所述的捕获探针结合的结构域(例如Nextera衔接子,例如第一衔接子),并且第二衔接子用于对生物样品的核酸在空间上加标签的方法(诸如本文所述的任何方法)中。
在一些实施方案中,转座酶可以是包含衔接子(MEDS)的转座子基因组形式,这些衔接子中的5’突出端可以被磷酸化。在一些实施方案中,衔接子(例如Nextera衔接子,例如第一衔接子和第二衔接子)可以在与转座酶组装形成转座子基因组之前被磷酸化。在一些实施方案中,当与转座酶复合时,可以发生衔接子的磷酸化(例如,转座子基因组中的原位磷酸化)。
在一些实施方案中,衔接子的5’突出端在其组装到转座子基因组中之前未被磷酸化。在此类实施方案中,该5’突出端可以具有位于镶嵌末端转座酶序列外部的可及5’羟基。在一些实施方案中,组装的转座子基因组复合物的5’突出端的磷酸化可以通过在ATP存在下将转座子基因组复合物的这些5’末端暴露于多核苷酸激酶(例如,T4-多核苷酸激酶(T4-PNK))来实现。
在一些实施方案中,用转座子基因组(例如,本文所述的任何转座子基因组)对生物样品的基因组DNA进行标签片段化可以包括使转座子基因组复合物中的衔接子的5’末端(例如,Nextera衔接子(例如MEDS)的5’突出端)磷酸化的另一步骤。
在一些实施方案中,本文提供的方法包括提供以下转座子基因组的步骤,该转座子基因组已被处理以将转座子基因组复合物中的衔接子的5’末端(例如,Nextera衔接子(例如,第一衔接子和第二衔接子)例如MEDS的5’突出端)磷酸化,从而用已被处理以将转座子基因组复合物中的衔接子的5’末端磷酸化的转座子基因组将该生物样品片段化。
任何合适的酶和/或条件都可以用来将转座子基因组复合物(例如,T4-PNK或T7-PNK)中衔接子的5’末端(例如衔接子(例如MEDS)的5’突出端)磷酸化。在一些实施方案中,磷酸化反应可以通过使转座子基因组与多核苷酸激酶(例如,T4-PNK或T7-PNK)在缓冲溶液(例如Tris-HCl,pH为约7.0至约8.0,例如约7.6)中在约20℃至约40℃,例如约25℃至约37℃下接触约1分钟至约60分钟,例如约5分钟至约50分钟、约10分钟至约40分钟、约20分钟至约30分钟来进行。
在一些实施方案中,可以对片段化(例如,标签片段化)DNA进行缺口填充和连接断裂。例如,Tn5转座事件在插入的转座子末端序列与基因组DNA之间产生9碱基对缺口。在一些实施方案中,在插入的转座子末端序列与片段化的基因组DNA之间进行缺口填充,之后将填充的缺口序列与基因组DNA连接。
在一些实施方案中,邻近9碱基对缺口的转座子末端序列释放,随后是片段化基因组DNA释放。在一些实例中,从片段化基因组DNA中释放(例如,去除)邻近缺口的转座子末端序列(例如,从互补的转座子末端序列中释放)。在一些实施方案中,释放的转座子末端序列不与夹板寡核苷酸连接(例如,未连接的转座子末端序列)。在一些实施方案中,未连接的转座子末端序列用热梯度释放。在一些实施方案中,连接的转座子末端序列连接到捕获探针。在一些实施方案中,夹板寡核苷酸与捕获探针的捕获结构域或其一部分以及剩余的转座子末端序列(例如,连接的转座子末端序列)杂交。在一些实施方案中,进行缺口填充反应。在一些实施方案中,缺口填充发生在夹板寡核苷酸与片段化的基因组DNA之间。例如,缺口填充聚合酶促进夹板寡核苷酸与基因组DNA片段化末端之间的核酸延伸,从而填充夹板寡核苷酸与片段化基因组DNA(例如,其一部分包括释放的转座子末端序列)之间的缺口。
在一些实施方案中,用以下热梯度来释放未连接的转座子末端序列(例如,邻近9碱基对缺口的转座子末端序列):约20℃至约90℃、约25℃至约85℃、约30℃至约80℃、约35℃至约75℃、约40℃至约75℃、约45℃至约75℃、50℃至约75℃,或约50℃至约70℃。在一些实施方案中,释放未连接的转座子末端序列在以下温度下发生:约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃、约50℃、约51℃、约52℃、约53℃、约54℃、约55℃、约56℃、约57℃、约58℃、约59℃、约60℃、约70℃、约71℃、约72℃、约73℃、约74℃、约75℃、约76℃、约77℃、约78℃、约79℃、约80℃、约81℃、约82℃、约83℃、约84℃、约85℃、约86℃、约87℃、约88℃、约89℃或约90℃。
在一些实施方案中,用热梯度将未连接的转座子末端序列(例如,邻近9碱基对缺口的转座子末端序列)释放约10分钟至约150分钟、约20分钟至约140分钟、约30分钟至约130分钟、约40分钟至约120分钟、约40分钟至约110分钟、约50分钟至约110分钟、约60分钟至约100分钟、约70分钟至约90分钟、约10分钟、约15分钟、约20分钟、约25分钟、约30分钟、约35分钟、约40分钟、约45分钟、约50分钟、约55分钟、约60分钟、约65分钟、约70分钟、约75分钟、约80分钟、约85分钟、约90分钟、约95分钟、约100分钟、约105分钟、约110分钟、约115分钟、约120分钟、约125分钟、约130分钟、约135分钟、约140分钟、约145分钟、约150分钟、约155分钟、约160分钟、约165分钟、约170分钟、约175分钟、约180分钟、约185分钟、约190分钟、约195分钟、约200分钟、约205分钟、约210分钟、约215分钟、约220分钟、约225分钟、约230分钟、约235分钟、约240分钟、约245分钟,或约250分钟。
在一些实施方案中,对基因组DNA在空间上加标签可以通过用本文所述的衔接子将转座子序列插入基因组DNA中来进行。扩增步骤可以用针对衔接子(例如,将衔接子插入基因组DNA中)的引物来进行。扩增产物可以含有能够通过本文所述方法在空间上加标签的可及基因组DNA。
在一些实施方案中,对基因组DNA在空间上加标签可以通过固定在基板表面上的转座子基因组复合物来进行。在一些实施方案中,对基因组DNA在空间上加标签可以通过固定在特征(例如,珠粒)上的转座子基因组复合物来进行。在一些实施方案中,转座子基因组复合物是在将生物样品添加到基板或特征之前组装的。在一些实施方案中,转座子基因组复合物是在将生物样品添加到基板或基板上的特征之后组装的。例如,在空间上加条形码的基板(例如,阵列)可以包括多个捕获探针,这些捕获探针包括镶嵌末端序列(例如,转座酶识别序列)。镶嵌末端序列可以位于捕获探针的3’末端(例如,捕获探针通过其5’末端固定,镶嵌末端序列位于捕获探针上最靠近3’末端的位置)。镶嵌末端序列可以是本文所述任何转座酶的镶嵌末端序列。镶嵌末端序列(例如,转座酶识别序列)可以与反向互补序列(例如,寡核苷酸)杂交。例如,反向互补序列(例如,与镶嵌末端序列反向互补)可以与镶嵌末端序列杂交,从而在捕获探针上生成双链DNA的一部分。镶嵌末端序列的反向互补序列(例如,寡核苷酸)可以在将生物样品提供给基板之前提供给在空间上加条形码的阵列。在一些实施方案中,镶嵌末端序列的反向互补序列可以在生物样品已提供给基板之后提供。可以将转座酶提供给基板,然后在捕获探针的双链部分处组装(例如,反向互补寡核苷酸和镶嵌末端序列彼此杂交),从而生成转座子基因组复合物。例如,转座子基因组同源二聚体可以在捕获探针的双链部分处形成。可以将生物样品提供给基板,使得捕获探针在基板上的位置可以与生物样品中的位置(例如,定位)相关联。转座子基因组复合物可以对基因组DNA进行片段化(例如,标签片段化)以及在空间上加标签。
在一些实施方案中,对基因组DNA在空间上加标签可以通过将单链捕获探针与标签片段化DNA杂交来进行。在一些实施方案中,单链捕获探针可以是简并序列。在一些实施方案中,单链捕获探针可以是随机序列。单链捕获探针可以具有功能性结构域、空间条形码、独特分子标识符、裂解结构域,或者它们的组合。单链捕获探针(例如,随机序列、简并序列)可以与标签片段化基因组DNA非特异性杂交,从而在空间上捕获标签片段化DNA。用于延伸反应的方法在本领域中是已知的,可以进行本文所述的任何合适的延伸反应方法。
夹板寡核苷酸
如本文所用,术语“夹板寡核苷酸”是指当与其他多核苷酸杂交时,充当“夹板”来募集和定位彼此相邻的多核苷酸,使得它们可以连接在一起的寡核苷酸。在一些实施方案中,夹板寡核苷酸是DNA或RNA。夹板寡核苷酸可以包括与来自两种或更多种不同寡核苷酸的核苷酸序列部分互补的核苷酸序列。在一些实施方案中,夹板寡核苷酸有助于连接“供体”寡核苷酸和“受体”寡核苷酸。在一些实施方案中,RNA连接酶、DNA连接酶或其他连接酶可以用于将两个核苷酸序列连接在一起。
在一些实施方案中,夹板寡核苷酸的长度可以介于约10个核苷酸与约50个核苷酸之间,例如,其长度介于约10个核苷酸与约45个核苷酸之间、约10个核苷酸与约40个核苷酸之间、约10个核苷酸与约35个核苷酸之间、约10个核苷酸与约30个核苷酸之间、约10个核苷酸与约25个核苷酸之间,或者约10个核苷酸与约20个核苷酸之间。在一些实施方案中,夹板寡核苷酸的长度可以介于约15个核苷酸与约50个核苷酸之间、约15个核苷酸与约45个核苷酸之间、约15个核苷酸与约40个核苷酸之间、约15个核苷酸与约35个核苷酸之间、约15个核苷酸与约30个核苷酸之间、约15个核苷酸与约30个核苷酸之间,或者约15个核苷酸与约25个核苷酸之间。在一些实施方案中,片段化DNA可以包括在DNA片段化期间添加(例如,连接)的序列。例如,在转座事件(例如,Tn5转座事件)期间,附加的序列(例如,转座子末端序列)可以附接(例如,共价附接,例如经由连接事件)到片段化DNA(例如,片段化基因组DNA,例如,标签片段化基因组DNA)。在一些实施方案中,夹板寡核苷酸可以具有与片段化DNA(例如片段化基因组DNA,例如包含在DNA片段化期间添加的序列的片段化基因组DNA,该序列例如在DNA片段化期间附接的第一衔接子,例如转座子末端序列)互补的序列(例如,捕获结构域),以及与捕获探针的捕获结构域互补的序列。在一些实施方案中,夹板寡核苷酸可以被视为捕获探针的一部分。例如,捕获探针可以是部分双链的,其中捕获探针的一部分可以用作与捕获探针的一部分(例如,dsDNA部分)杂交的夹板寡核苷酸,并且可以具有可以与片段化DNA(例如,片段化(例如,标签片段化)基因组DNA,例如在DNA片段化期间附接的衔接子,例如Nextera衔接子)杂交的单链部分(例如,捕获结构域)。第一衔接子序列(例如,附接到与捕获结构域互补的片段化DNA的序列,例如Nextera衔接子)可以是任何合适的序列。在一些实施方案中,衔接子序列的长度可以介于约15个核苷酸与25个核苷酸之间。在一些实施方案中,衔接子序列的长度可以为约16个、约17个、约18个、约19个、约20个、约21个、约22个、约23个或约24个核苷酸。
在一些实施方案中,夹板寡核苷酸可以包括与附接到片段化DNA(例如,标签片段化DNA)的第一衔接子互补的序列(例如,捕获结构域)。在一些实施方案中,夹板寡核苷酸包括与附接到片段化DNA(例如,标签片段化DNA)的第一衔接子(例如,Nextera衔接子)不完全互补、但仍然能够与连接到片段化DNA(例如,Nextera衔接子)上的第一衔接子序列(例如,与捕获结构域互补的序列)杂交的序列。
根据本文所述的材料和方法,可以使用具有与夹板寡核苷酸杂交的捕获结构域的多种捕获探针中的任一种。如本文所述,捕获结构域是捕获探针上能够与夹板寡核苷酸杂交形成部分双链捕获探针的结构域。例如,单链捕获探针可以具有与夹板寡核苷酸的一部分互补的序列(例如,捕获结构域),从而形成部分双链捕获探针,其单链部分能够与插入的转座子末端序列杂交。在一些实施方案中,夹板寡核苷酸包括与捕获探针的捕获结构域互补(例如,至少部分互补)的序列。
在一些实施方案中,夹板寡核苷酸包括与捕获探针的捕获结构域不完全互补、但仍然能够与捕获探针的捕获结构域杂交的序列。在一些实施方案中,夹板寡核苷酸可以经由其与捕获结构域互补的序列与转座子末端序列(例如,附接到标签片段化DNA的附加序列)和捕获探针的捕获结构域两者杂交。在此类实施方案中,在夹板寡核苷酸可以与转座子末端序列(例如,Nextera衔接子、附接到片段化DNA(例如,标签片段化DNA)的附加序列)和捕获探针的捕获结构域两者杂交的情况下,夹板寡核苷酸可以被视为捕获探针的一部分。
在一些实施方案中,夹板寡核苷酸可以具有均聚的捕获结构域。例如,该捕获结构域可以是多聚(T)捕获结构域。
在一些实施方案中,夹板寡核苷酸可以促进标签片段化DNA与捕获探针的连接。可以使用本领域已知或本文描述的任何种类的合适连接酶。在一些实施方案中,连接酶是T4DNA连接酶。在一些实施方案中,连接反应可以持续约1小时至约5小时。在一些实施方案中,连接反应可以持续约2小时、约3小时或约4小时。在一些实施方案中,在连接之后,可以进行链置换聚合。在一些实施方案中,DNA聚合酶可以用于进行链置换聚合。在一些实施方案中,DNA聚合酶是DNA聚合酶I。
多重分析
本公开描述了在足以允许对基因组DNA进行标签片段化的条件下透化生物样品的方法。可以经由捕获探针(例如,捕获探针和夹板寡核苷酸)来捕获标签片段化DNA,然而,有时同时捕获标签片段化DNA和其他核酸(例如,mRNA)可能是有用的。例如,转录物的表达谱可以与开放染色质相关(或不相关)。换句话讲,转录物的存在可以与对应于转录物从其转录的基因(例如,基因组DNA)的开放染色质(例如,可及染色质)相关。
本公开描述了关于在空间上加条形码的阵列上同时捕获标签片段化的DNA和mRNA的方法。例如,在空间上加条形码的阵列可以具有固定在基板表面上的多个捕获探针。替代性地,在空间上加条形码的阵列可以具有固定在特征上的多个捕获探针。在一些实施方案中,具有多个捕获探针的特征可以位于基板上。捕获探针可以具有对应于基板上的位置(例如,定位)的空间条形码。在一些实施方案中,捕获探针还可以具有独特分子标识符、裂解结构域和一个或多个功能性结构域,或者它们的组合。在一些实施方案中,捕获探针包括捕获结构域。在一些实施方案中,捕获探针可以是均聚序列。例如,以非限制性的方式,该均聚序列可以是多聚(T)序列。在一些实施方案中,核酸(例如,mRNA)可以通过结合(例如,杂交)mRNA转录物的多聚(A)尾而被捕获结构域捕获。在一些实施方案中,标签片段化DNA可以通过结合(例如,杂交)有多聚(A)尾的标签片段化DNA而被捕获探针的捕获结构域捕获。例如,在将基因组DNA片段化之后,缺口填充(例如,无链置换)聚合酶和连接酶可以修复标签片段化DNA中的缺口和连接断裂。在一些实施方案中,可以将与捕获结构域互补的序列引入片段化DNA中。例如,可以将多聚(A)尾添加到标签片段化DNA,使得捕获探针的捕获结构域(例如,多聚(T)序列)可以结合(例如,杂交)到有多聚(A)尾的标签片段化DNA(参见例如WO2012/140224,其以引用方式并入本文)。在一些实施方案中,通过末端转移酶将多聚(A)尾添加到标签片段化DNA上。在一些实施方案中,末端转移酶是末端脱氧核苷酸转移酶(TdT),或其突变变体。TdT是一种独立的聚合酶(例如,不需要模板分子),其可以催化脱氧核苷酸添加到DNA分子的3’羟基末端。其他模板非依赖性聚合酶在本领域中是已知的。例如,聚合酶或其突变变体可以用作末端转移酶(参见例如,Kent,T.,Polymerase is a robustterminal transferase that oscillates between three different mechanismsduring end-joining,eLIFE,5:e13740 doi:10.7554/eLife.13740,(2016))。引入多聚(A)尾的其他方法在本领域中是已知的。在一些实施方案中,多聚(A)尾可以通过非校对聚合酶引入标签片段化DNA中。在一些实施方案中,多聚(A)尾可以通过多核苷酸激酶引入片段化DNA中。
在一些实施方案中,TDT酶将生成具有3’多聚(A)尾的标签片段,从而模拟mRNA的多聚(A)尾。在一些实施方案中,捕获探针的捕获结构域(例如,多聚(T)序列)将与mRNA的多聚(A)尾相互作用,生成的(例如,合成的)多聚(A)尾被添加到片段化(例如,标签片段化)DNA中,从而同时捕获片段化DNA(例如,标签片段化DNA)和mRNA转录物。片段化DNA(例如,标签片段化DNA)上生成的(例如,合成的)多聚(A)尾的长度可以介于约10个核苷酸至约30个核苷酸之间。片段化DNA(例如,标签片段化DNA)上生成的(例如,合成的)多聚(A)尾的长度可以为约11个、约12个、约13个、约14个、约15个、约16个、约17个、约18个、约19个、约20个、约21个、约22个、约23个、约24个、约25个、约26个、约27个、约28个或约29个核苷酸。
除此之外或替代性地,代替顺序(例如两步)反应(例如缺口填充和连接,之后是末端转移酶),可以使片段化(例如,标签片段化)DNA与聚合酶接触。例如,聚合酶可以是可以对片段化DNA(例如,标签片段化DNA)进行延伸反应的DNA聚合酶。可以使用本领域已知或本文描述的任何种类的DNA聚合酶。延伸产物可以通过本文所述的任何方法来捕获和处理(例如,扩增和测序)。
杂交后步骤与P.L.等人,Visualization and analysis of geneexpression in tissue sections by spatial transcriptomics Science,第353卷第6294期第78至82页(2016)中所述相同,该文献以引用方式并入本文。
组合物
本文还提供了包含捕获探针、标签片段化DNA、夹板寡核苷酸和一种或多种聚合酶的组合物。在一些实施方案中,夹板寡核苷酸与捕获探针的捕获结构域杂交。在一些实施方案中,夹板寡核苷酸与片段化(例如,标签片段化)基因组DNA的转座子末端序列杂交。在一些实施方案中,夹板寡核苷酸与捕获探针的捕获结构域和片段化基因组DNA的转座子末端序列杂交。在一些实施方案中,组合物包含一个或多个转座子末端序列。在一些实施方案中,一个或多个转座子末端序列连接到捕获探针。在一些实施方案中,在片段化基因组DNA与捕获探针连接之前或之后,从片段化DNA中释放一个或多个转座子序列。在一些实施方案中,组合物包含连接酶(例如,T4 DNA连接酶)。在一些实施方案中,组合物包含缺口填充聚合酶。在一些实施方案中,组合物包含DNA聚合酶。在一些实施方案中,组合物包含一种或多种转座酶。在一些实施方案中,组合物包含转座子基因组复合物。
在一些实施方案中,捕获探针的捕获结构域与转座子末端结合(例如,没有夹板寡核苷酸的促进作用)。在一些实施方案中,组合物包含链置换聚合酶。在一些实施方案中,组合物包含缺口填充聚合酶。
qPCR和分析
本文还提供了用于对捕获效率进行定量的方法和材料。在一些实施方案中,对捕获效率的定量包括对来自本文所述的任何空间分析方法的捕获片段(例如基因组DNA片段,例如标签片段化DNA片段)的定量。在一些实施方案中,定量包括PCR、qPCR、电泳、毛细管电泳、荧光光谱法和/或UV分光光度法。在一些实施方案中,qPCR包括嵌入荧光染料(例如,SYBR green)和/或荧光标记探针(例如,但不限于,Taqman探针或PrimeTime探针)。在一些实施方案中,NGS文库定量试剂盒用于定量。例如,可以使用KAPA文库定量试剂盒(KAPABiosystems)、qPCR NGS文库定量试剂盒(Agilent)、GeneRead文库定量系统(Qiagen)和/或PerfeCTa NGS定量试剂盒(Quantabio)来进行定量。在使用qPCR进行定量的一些实施方案中,qPCR可以包括但不限于数字PCR、液滴数字PCR(ddPCR)和ddPCR-Tail。在一些使用电泳进行量化的实施方案中,电泳可以包括但不限于自动化电泳(例如,Agilent的TapeStation系统,和/或Agilent的生物分析仪)和毛细管电泳(例如,Applied Biosystems的片段分析仪)。在一些使用光谱法进行定量的实施方案中,光谱法可以包括但不限于荧光光谱法(例如,Qubit、Thermo Fisher)。在一些实施方案中,NGS可以用于量化捕获效率。
在一些实施方案中,对捕获的标签片段进行定量PCR(qPCR)。在一些实施方案中,片段化(例如,标签片段化)DNA在捕获前通过本文所述的任何方法进行扩增。例如,在捕获片段化DNA(例如,标签片段化DNA)之后,可以进行连接和链置换杂交qPCR。在一些实施方案中,DNA聚合酶可以用于进行链置换聚合。可以使用本领域已知的任何合适的链置换聚合酶。在一些实施方案中,DNA聚合酶是DNA聚合酶I。如实施例中所举例说明的,DNA聚合酶I可以与试剂(例如,BSA、dNTP、缓冲液)一起孵育,用于对片段化DNA(例如,标签片段化DNA)进行链置换。在一些实施方案中,DNA聚合酶I可以与基板上(例如,特征(例如孔)上)的试剂一起孵育约30分钟至约2小时。在一些实施方案中,DNA聚合酶I可以与基板上的试剂一起孵育约40分钟、约50分钟、约60分钟、约70分钟、约80分钟、约90分钟、约100分钟或约110分钟。在一些实施方案中,DNA聚合酶I可以在约35℃至约40℃下与基板上(例如,特征(例如孔)上)的试剂一起孵育。在一些实施方案中,DNA聚合酶I可以在约36℃、约37℃、约38℃或约39℃下与基板上的试剂一起孵育。在一些实施方案中,DNA聚合酶I可以在约37℃下与基板上的试剂一起孵育约1小时。
链置换杂交完成后,可以进行qPCR反应。在一些实施方案中,连接到片段化DNA(例如,标签片段化DNA)的捕获探针可以从基板(例如,特征)的表面释放。在一些实施方案中,可以将溶液(例如,释放混合物)与基板一起孵育,以便从基板表面释放捕获探针。释放混合物可以包含试剂(例如,BSA、酶、缓冲液等)。本文描述了从基板(例如,特征)释放捕获探针的方法。在一些实施方案中,酶可以使捕获探针裂解。在一些实施方案中,酶可以是USER(尿嘧啶特异性切除试剂)酶。在一些实施方案中,USER酶可以与基板(例如特征,例如孔)上的试剂一起孵育约30分钟至约2小时。在一些实施方案中,USER酶可以与基板上的试剂一起孵育约40分钟、约50分钟、约60分钟、约70分钟、约80分钟、约90分钟、约100分钟或约110分钟。在一些实施方案中,USER酶可以在约35℃至约40℃下与基板(例如特征,例如孔)上的试剂一起孵育。在一些实施方案中,USER酶可以在约36℃、约37℃、约38℃或约39℃下与基板上的试剂一起孵育。在一些实施方案中,USER酶可以在约37℃下与基板上的试剂一起孵育约1小时。
在与USER酶一起孵育之后,可以收集样品(例如,释放混合物中连接到片段化DNA(例如,标签片段化DNA)的释放捕获探针,或其一部分)。在一些实施方案中,可以减小样品体积。减小样品体积的方法在本领域中是已知的,可以使用任何合适的方法。在一些实施方案中,减小样品体积可以用快速真空仪(例如,SpeedVac)来实现。在一些实施方案中,样品体积减小可以是样品体积减小约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%或约90%。在一些实施方案中,样品体积减小可以是样品体积减小大致介于80%与90%之间。在一些实施方案中,样品体积减小可以是样品体积减小约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%或约89%。在一些实施方案中,样品体积减小可以是样品体积减小约85%(例如,样品体积减小后为约10μL)。
在一些实施方案中,可以用减小的样品体积来进行qPCR反应。如本文所述,可以实施任何合适的qPCR方法。在一些实施方案中,可以使用1xKAPA HiFi HotStart Ready、1xEVA green和引物。可以根据本领域已知的方法进行扩增。例如,扩增可以相应地在72℃下进行10分钟、在98℃下进行3分钟,然后是以下循环:98℃下保持20秒、60℃下保持30秒,72℃下保持30秒。
在一些实施方案中,在qPCR反应期间可以使用一个或多个引物对。在一些实例中,引物对可以覆盖连接部分(例如,捕获探针和衔接子序列(例如,附接到片段化DNA(例如标签片段化DNA)的序列)的连接位点)。例如,引物对覆盖连接部分和捕获探针。只有在发生连接而不是仅发生杂交的情况下,才能检测到扩增产物。在一些实施方案中,不同的引物可以仅覆盖片段化DNA(例如,标签片段化DNA)。在一些实施方案中,仅覆盖片段化DNA(例如,标签片段化DNA)的引物对可以是连接对照。在一些实施方案中,可以用本文所述的任何标记的核苷酸来进行qPCR。
在一些实施方案中,可以将样品纯化。在一些实施方案中,可以根据Lundin等人,Increased Throughput by Parallelization of Library Preparation for MassiveSequencing,PLOS ONE,5(4),doi.org/10.1371/journal.pone.0010029(2010)来纯化样品,该文献以引用方式并入本文。
在一些实施方案中,可以确定捕获的片段化DNA(例如,标签片段化DNA)的平均长度。在一些实施方案中,可以使用生物分析仪(例如,Agilent 2100生物分析仪)。可以使用本领域已知的任何合适的生物分析仪。在一些实施方案中,qPCR和生物分析仪分析可以对整个基因组(例如纯化的片段化DNA,例如标签片段化DNA)进行。在一些实施方案中,qPCR和生物分析仪分析可以对固定化生物样品(例如,固定的生物样品)进行。例如,可以实施本文所述的方法(例如,预透化、透化)来捕获片段化DNA(例如,标签片段化DNA)并且优化qPCR和生物分析仪对不同生物样品的分析。
在一些实施方案中,在连接后,可以进行基于表面的变性步骤。换句话讲,在将片段化DNA(例如标签片段化DNA)连接到捕获探针,之后进行本文所述的链置换杂交(例如,DNA聚合酶I)之后,可以在并行工作流中进行基于表面的变性步骤。在一些实施方案中,碱性溶液可以进行基于表面的变性。例如,碱性溶液可以使捕获的双链片段化DNA(例如,标签片段化DNA)变性,从而生成连接到片段化DNA(例如,标签片段化DNA)的捕获的单链捕获探针。在一些实施方案中,碱性溶液是KOH。在一些实施方案中,碱性溶液是NaOH。在一些实施方案中,碱性溶液可以是约1M NaOH。在本文描述的方法中可以使用其他碱性溶液。在一些实施方案中,碱性溶液可以施用约1分钟至约1小时。在一些实施方案中,碱性溶液可以施用约10分钟、约20分钟、约30分钟、约40分钟或约50分钟。在一些实施方案中,碱性溶液可以施用约1分钟至约20分钟。在一些实施方案中,碱性溶液可以施用约2分钟、约3分钟、约4分钟、约5分钟、约6分钟、约7分钟、约8分钟、约9分钟、约10分钟、约11分钟、约12分钟、约13分钟、约14分钟、约15分钟、约16分钟、约17分钟、约18分钟或约19分钟。在一些实施方案中,碱性溶液可以在介于约30℃至约40℃之间的温度下施加。在一些实施方案中,碱性溶液可以在约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃或约39℃下施加。在一些实施方案中,碱性溶液可以在约37℃下施加约10分钟。
在一些实施方案中,变性步骤可以通过探针将片段化DNA(例如,标签片段化DNA)暴露于杂交。在一些实施方案中,探针可以是寡核苷酸探针。在一些实施方案中,寡核苷酸探针可以具有可检测标签(例如,本文所述多种可检测标签中的任一种)。在一些实施方案中,可检测标签可以是Cy5。在一些实施方案中,寡核苷酸探针可以是Cy5标记的。在一些实施方案中,Cy5标记的寡核苷酸探针可以与片段化DNA(例如,标签片段化DNA)中的互补序列杂交。在一些实施方案中,Cy5标记的寡核苷酸可以与附接到片段化DNA(例如,标签片段化DNA)的序列(例如Nextera衔接子,例如第一衔接子或第二衔接子)杂交。在一些实施方案中,可以检测Cy5标签。例如,检测寡核苷酸探针中的Cy5标签可以揭示DNA标签片段的空间位置。在一些实施方案中,生物样品可以被染色(例如,苏木精和曙红染色)。对生物样品进行染色的方法在本领域中是已知的,并且在本文中有所描述。在一些实施方案中,可以对生物样品进行成像。
整个基因组分析
也可以对生物样品进行整个基因组分析(例如,空间基因组学)。例如,本文描述的空间ATAC方法被设计成捕获基因组的可及(例如,“开放”或转录活性)区域,然而,在空间上捕获整个基因组(例如,DNA)也是可能的。为了能够捕获整个基因组,染色质结构由于组蛋白降解而受到破坏。
因此,本文提供了用于确定生物样品中DNA的位置的方法,该方法包括:(a)阵列上的生物样品,该阵列包括多个捕获探针,其中多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;(b)使生物样品与蛋白酶接触,其中该蛋白酶能够降解一种或多种组蛋白,从而释放DNA;(c)使转座子基因组与生物样品接触,以将转座子末端序列插入释放的基因组DNA中,从而生成片段化的基因组DNA;(d)将片段化DNA的转座子末端序列与捕获结构域杂交;(e)释放未与捕获结构域结合的转座子末端序列;以及(f)确定(i)空间条形码的序列或其互补序列,和(ii)该DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定生物样品中DNA的位置。
因此,本文提供的方法包括用能够降解组蛋白的蛋白酶来处理生物样品,从而导致片段化基因组DNA的生成。片段化基因组DNA可以被捕获探针的捕获结构域捕获,其中,例如,插入基因组DNA中的转座子末端序列包括与捕获探针的捕获结构域互补的序列。在一些实施方案中,捕获结构域包含均聚序列。在一些实施方案中,捕获结构域包含单一序列。
在一些实施方案中,通过将生物样品暴露于能够降解组蛋白的蛋白酶来透化该样品。如本文所用,术语“组蛋白”通常指接头组蛋白(例如,H1)和/或核心组蛋白(例如,H2A、H2B、H3和H4)。在一些实施方案中,蛋白酶降解接头组蛋白、核心组蛋白,或者接头组蛋白和核心组蛋白。可以使用能够降解生物样品中的组蛋白的任何合适的蛋白酶。能够降解组蛋白的蛋白酶的非限制性实例包括被亮抑酶肽和TLCK(甲苯磺酰基-L-赖氨酰-氯甲烷盐酸盐)抑制的蛋白酶、胶原酶、由来自沙眼衣原体血清变种A(Chlamydia trachomatisserovar A)的EUO基因编码的蛋白酶、颗粒酶A、丝氨酸蛋白酶(例如,胰蛋白酶或胰蛋白酶样蛋白酶、中性丝氨酸蛋白酶、弹性蛋白酶、组织蛋白酶G)、天冬氨酰蛋白酶(例如,组织蛋白酶D)、肽酶家族C1酶(例如,组织蛋白酶L)、被重氮甲烷抑制剂Z-Phe-Phe-CHN(2)或环氧化物抑制剂E-64抑制的蛋白酶、溶酶体蛋白酶或嗜苯胺蓝酶(例如,组织蛋白酶G、弹性蛋白酶、蛋白酶3、中性丝氨酸蛋白酶)。在一些实施方案中,丝氨酸蛋白酶是胰蛋白酶、胰蛋白酶样酶,或者它们的功能性变体或衍生物(例如,P00761、C0HK48、Q8IYP2、Q8BW11、Q6IE06、P35035、P00760、P06871、Q90627、P16049、P07477、P00762、P35031、P19799、P35036、Q29463、P06872、Q90628、P07478、P07146、P00763、P35032、P70059、P29786、P35037、Q90629、P35030、P08426、P35033、P35038、P 12788、P29787、P35039、P35040、Q8NHM4、P35041、P35043、P35044、P54624、P04814、P35045、P32821、P54625、P35004、P35046、P32822、P35047、C0HKA5、C0HKA2、P34627、P35005、C0HKA6、C0HKA3、P52903、P83348、P00765、P35042、P81071、P35049、P51588、P35050、P35034、P35051、P24664、P35048、P00764、P00775、P54628、P42278、P54629、P42279、Q91041、P54630、P42280、C0HKA4),或者它们的组合。在一些实施方案中,胰蛋白酶是P00761、P00760、Q29463,或者它们的组合。在一些实施方案中,能够降解一种或多种组蛋白的蛋白酶包含与P00761、P00760或Q29463具有至少80%序列同一性的氨基酸序列。在一些实施方案中,能够降解一种或多种组蛋白的蛋白酶包含与P00761、P00760或Q29463具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。如果蛋白酶具有相对于蛋白酶在该酶的最佳条件下的活性至少为50%,例如至少为60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的活性,则可以认为该蛋白酶是功能性变体。
此外,蛋白酶可以包含在反应混合物(溶液)中,该反应混合物还包括其他组分(例如,缓冲液(例如,Tris-HCl、盐、螯合剂(例如,EDTA)、去污剂(例如,SDS))。反应混合物可以被缓冲为具有约6.5至8.5(例如,约7.0至8.0)的pH。此外,反应混合物可以在任何合适的温度下使用,诸如约10℃至45℃,例如约10℃至44℃、11℃至43℃、12℃至42℃、13℃至41℃、14℃至40℃、15℃至39℃、16℃至38℃、17℃至37℃,例如约10℃、12℃、15℃、18℃、20℃、22℃、25℃、28℃、30℃、33℃、35℃或37℃,优选地约30℃至40℃,例如约37℃。
在一些实施方案中,反应混合物可以与生物样品一起孵育约1分钟至约30分钟、约5分钟至约25分钟、约10分钟至约20分钟,或约15分钟。在一些实施方案中,将反应混合物与生物样品在37℃下孵育约10分钟。
在一些实施方案中,该方法包括对生物样品进行成像和/或染色,诸如苏木精和曙红染色。
在一些实施方案中,捕获探针包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
在一些实施方案中,该方法包括主动迁移步骤,其中通过施加电场将片段化的基因组DNA迁移到阵列。
在一些实施方案中,步骤(d)中的杂交包括将转座子末端序列或其一部分与捕获探针的捕获结构域或其一部分杂交。在一些实施方案中,该方法包括使用片段化的基因组DNA作为模板来延伸捕获探针的3’末端。在一些实施方案中,该延伸步骤使用具有链置换活性的DNA聚合酶进行。在一些实施方案中,该方法包括在转座子末端序列与片段化的基因组DNA之间进行缺口填充(例如,如本文所述)。在一些实施方案中,转座子基因组包括转座酶(例如,本文所述的任何转座酶),诸如Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属物种转座酶,或者它们的功能性衍生物或变体。
在一些实施方案中,步骤(d)中的释放包括对生物样品进行加热。在一些实施方案中,加热包括加热到约65℃至85℃的温度。
在一些实施方案中,确定生物样品中DNA的位置还包括对生物样品的整个基因组进行空间分析。
实施例
实施例1.空间阵列的ATAC工作流程
组织制备和空间ATAC工作流程
将组织样品置于最佳切割温度(OCT)块中速冻,冷冻切片为10μm切片,置于Visium空间阵列载玻片(10X Genomics,Inc.)上在37℃下加热1分钟。在室温下用福尔马林将组织固定(1%甲醛的PBS溶液)10分钟,然后在PBS中漂洗几次。固定后,将异丙醇(80%)漫过载玻片,移出带组织的载玻片,使其风干。将组织用HBSS缓冲液中的胶原酶(0.2U胶原酶,0.2mg BSA)在37℃下预透化20分钟,然后用0.1X SSC洗涤缓冲液洗涤。洗涤后,在室温下用含有0.1%NP40、0.1%Tween-20和0.01%洋地黄皂苷的缓冲溶液将组织透化10分钟。
将标签片段化试剂(Illumina,Inc.)在37℃下沉积在透化组织上,持续1小时。这些试剂包括标签片段化混合物(1xTD缓冲液、31%PBS、0.01%洋地黄皂苷、0.1%Tween-20、H2O)中的2.5μl Tn5。洗涤载玻片(使用洗涤缓冲液3),用标签片段化终止缓冲液(0.01%SDS、50mM EDTA、10mM Tris-HCl和H2O)在37℃下终止标签片段化,持续10分钟。
将2μM夹板寡核苷酸混合物(1x NEB 2.1,H2O)和相关联试剂添加到组织中,在75℃下孵育15分钟。将温度缓慢降至20℃过夜,以0.1℃/min的斜坡速度冷却以实现标签片段扩散、夹板寡核苷酸与标签片段杂交,随后捕获夹板寡核苷酸-标签片段复合物。
使用T4 DNA混合物(5U T4 DNA聚合酶、0.4U T4 DNA连接酶、1μM dNTP、3mM ATP、H2O、1xNEB2.1)进行聚合与连接,然后在20℃下孵育3小时。使用PKD缓冲液中的2mg/ml蛋白酶K去除组织,然后在56℃下孵育1小时。载玻片在50℃下在洗涤缓冲液1(0.3xSSC,SDS)中洗涤10分钟,之后在室温下用洗涤缓冲液2(0.2xSSC)洗涤1分钟,最后在洗涤缓冲液3(0.1xSSC)中洗涤,旋转干燥。
文库制备和测序
为了能够对在空间上加条形码的表面结合标签片段进行批量文库制备,用0.08NKOH在室温下将载玻片上的捕获探针变性10分钟。将混合物从载玻片转移到装有pH为7.0的1M Tris的LoBind管中。重复变性步骤,进行清理(MinElute反应清理试剂盒,Qiagen),之后在20μl洗脱缓冲液中洗脱。将样品加工成测序文库,按照制造商的方案使用配对末端读段在Illumina Nextseq 500仪器上测序。
染色程序
标签片段化之后,将一层80%异丙醇添加到载玻片上的组织中,移出载玻片,如上所述使其风干。将组织切片在室温下用苏木精染色7分钟,水中漂洗,室温下在上蓝缓冲液中孵育2分钟,水中漂洗,然后在室温下用曙红染色10秒或20秒,视组织样品而定(例如,分别为小鼠的大脑和前列腺癌组织)。将载玻片置于水中漂洗,旋转干燥,用甘油和盖玻片覆盖,然后成像。
免疫组织化学
与染色缓冲液一起孵育5分钟,将载玻片上的组织切片封闭。去除染色缓冲液,添加一抗稀释液,在室温下孵育30分钟。用染色缓冲液洗涤两次,每次3分钟,之后添加二抗稀释液,在室温下孵育15分钟。用染色缓冲液洗涤三次,每次3分钟,最后用移液管吸取PBS洗涤一次。将载玻片旋转干燥,用甘油和盖玻片覆盖,然后成像。
图1是示出如本文所述的捕获探针的一个实例的示意图。如图所示,捕获探针102任选地通过可裂解接头103(诸如光可裂解接头)联接到特征101。捕获探针可以包括可用于后续加工的功能性序列,诸如功能性序列104,其可以包括测序仪特异性流动池附接序列,例如P5或P7序列,以及功能性序列105,其可以包括测序引物序列,例如R1引物结合位点、R2引物结合位点。在一些实施方案中,序列104是P7序列,序列105是R2引物结合位点。空间条形码106可以包括在捕获探针内,用于对目标分析物加条形码。通常可以选择与多种不同测序系统中的任一种系统及其要求相容的功能序列,这些测序系统例如:Ion TorrentProton或PGM、Illumina测序仪器、PacBio、Oxford Nanopore,等等。在一些实施方案中,可以选择与未商业化的测序系统相容的功能序列。可以使用合适的功能序列的这类测序系统和技术的实例包括(但不限于)Ion Torrent Proton或PGM测序、Illumina测序、PacBioSMRT测序和Oxford Nanopore测序。此外,在一些实施方案中,功能序列可选择为与其他测序系统相容,包括非商业化测序系统。
在一些实施方案中,空间条形码106、功能性序列104(例如,流动池附接序列)和105(例如,测序引物序列)可以是附接到给定特征的所有探针所共有的。空间条形码还可以包括捕获结构域107来促进对目标分析物的捕获。在一些实施方案中,捕获探针中可以包括附加的序列。例如,可以在功能性序列105与空间条形码106之间包括独特分子标识符,或者可以在空间条形码106与捕获结构域107之间插入独特分子标识符。附加的功能性序列,例如引物测序(例如,测序引物结合序列、扩增引物结合序列)也可以包括在捕获探针中,例如可以在空间条形码106与捕获结构域107之间发现不同于第一功能性序列的第二功能性序列。在一些实施方案中,捕获探针可以包括独特分子标识符和第二功能性序列中的一者或两者。
图2示出了示例性的空间ATAC(spATAC)工作流程。该工作流程包括使生物样品与包含多个捕获探针的阵列接触,然后用转座子基因组对可及基因组DNA进行标签片段化,从而得到具有插入的转座子末端序列(例如,Nextera A、Nextera B)的片段化DNA。得到的标签片段化DNA在转座子末端序列与片段化基因组DNA之间产生缺口。在一些实例中,从片段化基因组DNA中释放(例如,去除)邻近缺口的转座子末端序列。在一些实例中,此类转座子末端序列用热梯度释放。夹板寡核苷酸与捕获探针的捕获结构域或其一部分以及剩余的转座子末端序列杂交。进行缺口填充、DNA延伸(例如,用DNA聚合酶延伸),以及转座子末端序列与捕获探针的连接。缺口填充聚合酶用需要填充的缺口的互补核酸来填充夹板寡核苷酸与片段化基因组DNA(例如,其一部分包括释放的转座子末端序列)之间的缺口。DNA延伸导致生成具有与空间条形码互补的序列的第二链和双链DNA复合物。在一些实例中,生成的第二链被释放(例如,变性)、收集、扩增和加工,用于索引和文库构建。所得文库用于确定生物样品中可及染色质的位置。
实施例2.空间ATAC分析
以下结果由实施例1中描述的示例性spATAC工作流程生成。图3A示出了具有人神经胶质瘤异种移植物的小鼠大脑的苏木精和曙红(H&E)染色组织切片。图3B示出了小鼠大脑组织切片的空间聚类(例如,斑点位置),其中数据示出了捕获的基因组DNA与小鼠大脑组织切片的形态结构之间的广泛空间一致性。这两张图中的方框表示用作内部质量控制区域的区域,以证明获得了spATAC方法的空间分辨率(例如,在两个方框中没有看到组织也没有看到聚类,在一个方框中有一小片组织存在聚类)。
图4A至图4B示出了来自组织实验的代表性照片,其中小鼠表达的人细胞用于测试图2中描述的工作流程的空间分辨率。图4A示出了具有人神经胶质瘤异种移植物的小鼠大脑的H&E染色组织切片。图像上圈起的较暗部分是组织切片中含有人类细胞的区域。图4B示出了鉴定的人类DNA,其在小鼠组织切片内用圆圈指示。数据示出聚类反映了组织切片的形态,并且在检测和区分样品组织切片中的人类DNA和小鼠DNA方面是灵敏的。
表1.自然对数标度中每个斑点的读数
索引 平均值 标准差
1 14.197071531445 11.3092012410549
2 34.9050753875557 32.2738289613216
3 36.3514060287275 23.8985761010508
4 4.52903081732917 3.35271103443555
5 24.6123792800702 31.4306497970632
6 4.91824739513759 4.25066145637371
表2.自然对数标度中每个斑点的基因
索引 平均值 标准差
1 12.8216514642343 9.68067308393996
2 22.8551709492461 14.954558667119
3 32.3910580619057 20.1521778991193
4 4.16033943724877 2.92892111421054
5 17.9218612818262 17.9319400455273
6 4.50601122094577 3.76867917965407
图5A至图5B示出了斑点数量与在两个小鼠大脑组织切片(在表1和表2中分别是索引6和索引5;索引1至4的数据未示出)中鉴定的独特分子标识符(UMI)总数的关系的复制图。示出的数据映射到染色体上而不是基因上。虚线表示均值(图5A至图5B,底部)。针对索引6和索引5示出了生物样品内的斑点位置(图5A至图5B,顶部)。较暗的斑点表示在该位置处检测到更多的UMI。
图6A至图6B示出了当在标签片段化后未用蛋白酶K处理生物样品并且在标签片段化后还进行了H&E染色时指示核小体周期性的恢复情况的坐标图。数据表明,在未用蛋白酶K处理并且在标签片段化后染色的情况下,染色质结构保持完整。
总的来说,数据证明,图2中描述的示例性spATAC工作流程可以用于对来自生物样品的可及基因组DNA进行空间测定。另外,该方法也是灵敏的,因为人类DNA和小鼠DNA可通过该工作流程在具有人神经胶质瘤异种移植物的小鼠大脑组织切片中单独鉴别。
实施例3.整个基因组分析工作流程
也可以对组织样品进行整个基因组分析(例如,空间基因组学)。例如,本文描述的空间ATAC方法被设计成捕获基因组的可及(例如,“开放”或转录活性)区域,然而,在空间上捕获整个基因组也是可能的。为了能够捕获整个基因组,在如实施例1中所述的胶原酶处理之后,通过用组蛋白降解来破坏染色质结构,之后在蛋白酶K缓冲液(1%SDS,50mM EDTA,10mM Tris-HCl,H2O)中与蛋白酶K(2mg/ml)一起在37℃下孵育10分钟。所得的片段化DNA可以在空间阵列上捕获,之后如本文所述进行文库制备和序列分析。
实施例4.空间ATAC分析
图7A至图7H示出了在本文所述的空间ATAC-seq工作流程之前,对用SOX9抗体进行免疫染色的两个连续小鼠胚胎组织切片进行的重复分析(图7A和图7E)。图7B和图7F示出了每个斑点捕获的标签片段化DNA片段的总数,其指示片段化基因组DNA捕获的空间分辨率。图7C和图7G是示出连续切片的组织切片下斑点的转录起始位点(TSS)富集的坐标图,图7D和图7H是示出测序后重建的捕获标签片段尺寸分布中所反映的对应核小体周期性的坐标图。
图8示出了来自图7A和图7E中所示小鼠胚胎的参考小鼠数据集(e13,5ENCODE)和空间ATAC-seq(e13,5)的ATAC-seq读取密度的基因组迹线。空间ATAC-seq信号富集和峰检分析(底部)示出以下基因的片段富集的匹配位置:Gga1、Mir6955、Sh3bp1、Pdxp、Lgals1、Nol12和Triobp,因此证明本文所述的空间ATAC工作流程可以用于检测来自生物样品(例如,小鼠胚胎切片)的可及基因组DNA。
实施例5.空间ATAC分析
图9A至图12B中所示的数据是根据如实施例1中所述进行的文库制备和测序步骤、染色程序和免疫组织化学分析而生成的。然而,组织准备和空间ATAC工作流程是根据以下方案来准备的。
组织制备和空间ATAC工作流程
将组织样品置于最佳切割温度(OCT)块中速冻,冷冻切片为10μm切片,置于Visium空间阵列载玻片上在37℃下加热1分钟。在室温下用福尔马林将组织固定(1%甲醛的PBS溶液)10分钟,然后在PBS中漂洗几次。固定后,将异丙醇(80%)漫过载玻片,移出带组织的载玻片,使其风干。将组织用HBSS缓冲液中的胶原酶(0.2U胶原酶,0.2mg BSA)在37℃下预透化20分钟,然后用0.1X SSC洗涤缓冲液洗涤。洗涤后,在室温下用含有0.1%NP40、0.1%Tween-20和0.01%洋地黄皂苷的缓冲溶液将组织透化10分钟。
将标签片段化试剂(Illumina)在37℃下沉积在透化组织上,持续1小时。这些试剂包括标签片段化混合物(1xTD缓冲液、31%PBS、0.01%洋地黄皂苷、0.1%Tween-20、H2O)中的2.5μl Tn5。洗涤载玻片(使用洗涤缓冲液3),用标签片段化终止缓冲液(0.01%SDS、50mMEDTA、10mM Tris-HCl和H2O)在37℃下终止标签片段化,持续10分钟。
将在含有0.2mg/μl蛋白酶K和Triton X-100稀释液(0.2%至0.01%)的盐溶液(基于NEB 2.1或SSC)中的2μM夹板寡核苷酸混合物添加到组织切片中,在30℃下孵育约2小时至8小时,以经由蛋白酶消化、标签片段扩散和夹板寡核苷酸与标签片段的杂交,以及后续通过捕获探针捕获夹板寡核苷酸-标签片段复合物,来实现标签片段释放。
使用T4 DNA混合物(5U T4 DNA聚合酶、0.4U T4 DNA连接酶、1μM dNTP、3mM ATP、H2O、补充有Triton X-100(0.2%至0.01%)的1xNEB2.1)进行聚合与连接,然后在20℃下孵育3小时。使用PKD缓冲液中的2mg/ml蛋白酶K去除组织,然后在56℃下孵育1小时。载玻片在50℃下在洗涤缓冲液1(0.3xSSC,SDS)中洗涤10分钟,之后在室温下用洗涤缓冲液2(0.2xSSC)洗涤1分钟,最后在洗涤缓冲液3(0.1xSSC)中洗涤,旋转干燥。
图9A是基于无偏图的聚类的均匀流形近似和投影(UMAP),图9B示出了组织切片中每个斑点的簇分配。图9B示出了根据空间ATAC-seq加工的小鼠切片中跨组织斑点的基因可及性(UMAP)图。总的来说,数据示出空间ATAC-seq捕获了跨组织区域的基因可及性的有意义的生物变异。
图10A至图10D示出了UMAP图(图10A和图10C),其通过发现在组织切片区域(对应于图10B和图10D中示出的相对可及性)之间存在可及性差异的两个基因区域(分别是血型糖蛋白C(Gypc)和粘附G蛋白偶联受体1(Bail))的相对可及性来着色。
图11A示出了基于基因表达的聚类。簇(也就是具有特征性基因表达谱的组织区域)用数字表示。图11B至图11F示出了根据空间ATAC-seq,在相邻部分中每个簇的一些顶部标记基因(图11B中有28个基因;图11C中有61个基因;图11D中有132个基因;图11E中有180个基因;图11F中有807个基因)的可及性,表明了高度一致性。
测定小鼠组织样品的基因组区域可及性,其中当使用所述的spATAC-seq方法时,发现这些区域的可及性存在差别。图12示出了空间ATAC-seq信号富集的基因组迹线,以及在小鼠组织切片中发现更易触及的区域之一的可及性。
总的来说,来自图9A至图12的数据证明,包括组织制备和空间ATAC工作流程的示例性工作流程可以用于检测来自生物样品的可及基因组DNA。
序列表附录
SEQ ID NO:1-Tn5转座酶
SEQ ID NO:2Tn5镶嵌末端序列
SEQ ID NO:3-噬菌体Mu转座酶
SEQ ID NO:4-Mu转座酶识别序列
SEQ ID NO:5-Mu转座酶识别序列
SEQ ID NO:6-Mu转座酶识别序列
SEQ ID NO:7-Mu转座酶识别序列
/>
SEQ ID NO:8-Mu转座酶识别序列
SEQ ID NO:9-Mu转座酶识别序列
SEQ ID NO:10-IS4家族转座酶
SEQ ID NO:11-哈维氏弧菌(V.harveyi)转座酶识别序列
SEQ ID NO:12-哈维氏弧菌转座酶识别序列
SEQ ID NO:13-哈维氏弧菌转座酶识别序列
/>
序列表
<110> 10X基因组学有限公司(10x Genomics, Inc.)
<120> 转座酶介导的对生物样品中的基因组DNA在空间上加标签和分析的方法
<130> 47706-0292WO1
<150> 63/143,438
<151> 2020-01-29
<150> 63/166,708
<151> 2021-03-26
<160> 13
<170> PatentIn版本3.5
<210> 1
<211> 476
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 1
Met Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val
1 5 10 15
Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val
20 25 30
Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile
35 40 45
Ser Ser Glu Gly Ser Glu Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile
50 55 60
Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met
65 70 75 80
Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu
85 90 95
Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly
100 105 110
Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser
115 120 125
Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His
130 135 140
Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys
145 150 155 160
Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met
165 170 175
Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp
180 185 190
Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val
195 200 205
Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu
210 215 220
Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser
225 230 235 240
Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg
245 250 255
Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu
260 265 270
Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn
275 280 285
Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu
290 295 300
Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr
305 310 315 320
His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala
325 330 335
Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met
340 345 350
Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu
355 360 365
Ser Phe Thr Leu Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu
370 375 380
Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp
385 390 395 400
Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys
405 410 415
Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu
420 425 430
Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala
435 440 445
Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu
450 455 460
Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile
465 470 475
<210> 2
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> Tn5镶嵌末端序列
<400> 2
ctgtctctta tacacatct 19
<210> 3
<211> 662
<212> PRT
<213> 噬菌体Mu
<400> 3
Met Lys Glu Trp Tyr Thr Ala Lys Glu Leu Leu Gly Leu Ala Gly Leu
1 5 10 15
Pro Lys Gln Ala Thr Asn Ile Thr Arg Lys Ala Gln Arg Glu Gly Trp
20 25 30
Glu Phe Arg Gln Val Ala Gly Thr Lys Gly Val Ser Phe Glu Phe Asn
35 40 45
Ile Lys Ser Phe Pro Val Ala Leu Arg Ala Glu Ile Leu Leu Gln Gln
50 55 60
Gly Arg Ile Glu Thr Ser Gln Gly Tyr Phe Glu Ile Ala Arg Pro Thr
65 70 75 80
Leu Glu Ala His Asp Tyr Asp Arg Glu Ala Leu Trp Ser Lys Trp Asp
85 90 95
Asn Ala Ser Asp Ser Gln Arg Arg Leu Ala Glu Lys Trp Leu Pro Ala
100 105 110
Val Gln Ala Ala Asp Glu Met Leu Asn Gln Gly Ile Ser Thr Lys Thr
115 120 125
Ala Phe Ala Thr Val Ala Gly His Tyr Gln Val Ser Ala Ser Thr Leu
130 135 140
Arg Asp Lys Tyr Tyr Gln Val Gln Lys Phe Ala Lys Pro Asp Trp Ala
145 150 155 160
Ala Ala Leu Val Asp Gly Arg Gly Ala Ser Arg Arg Asn Val His Lys
165 170 175
Ser Glu Phe Asp Glu Asp Ala Trp Gln Phe Leu Ile Ala Asp Tyr Leu
180 185 190
Arg Pro Glu Lys Pro Ala Phe Arg Lys Cys Tyr Glu Arg Leu Glu Leu
195 200 205
Ala Ala Arg Glu His Gly Trp Ser Ile Pro Ser Arg Ala Thr Ala Phe
210 215 220
Arg Arg Ile Gln Gln Leu Asp Glu Ala Met Val Val Ala Cys Arg Glu
225 230 235 240
Gly Glu His Ala Leu Met His Leu Ile Pro Ala Gln Gln Arg Thr Val
245 250 255
Glu His Leu Asp Ala Met Gln Trp Ile Asn Gly Asp Gly Tyr Leu His
260 265 270
Asn Val Phe Val Arg Trp Phe Asn Gly Asp Val Ile Arg Pro Lys Thr
275 280 285
Trp Phe Trp Gln Asp Val Lys Thr Arg Lys Ile Leu Gly Trp Arg Cys
290 295 300
Asp Val Ser Glu Asn Ile Asp Ser Ile Arg Leu Ser Phe Met Asp Val
305 310 315 320
Val Thr Arg Tyr Gly Ile Pro Glu Asp Phe His Ile Thr Ile Asp Asn
325 330 335
Thr Arg Gly Ala Ala Asn Lys Trp Leu Thr Gly Gly Ala Pro Asn Arg
340 345 350
Tyr Arg Phe Lys Val Lys Glu Asp Asp Pro Lys Gly Leu Phe Leu Leu
355 360 365
Met Gly Ala Lys Met His Trp Thr Ser Val Val Ala Gly Lys Gly Trp
370 375 380
Gly Gln Ala Lys Pro Val Glu Arg Ala Phe Gly Val Gly Gly Leu Glu
385 390 395 400
Glu Tyr Val Asp Lys His Pro Ala Leu Ala Gly Ala Tyr Thr Gly Pro
405 410 415
Asn Pro Gln Ala Lys Pro Asp Asn Tyr Gly Asp Arg Ala Val Asp Ala
420 425 430
Glu Leu Phe Leu Lys Thr Leu Ala Glu Gly Val Ala Met Phe Asn Ala
435 440 445
Arg Thr Gly Arg Glu Thr Glu Met Cys Gly Gly Lys Leu Ser Phe Asp
450 455 460
Asp Val Phe Glu Arg Glu Tyr Ala Arg Thr Ile Val Arg Lys Pro Thr
465 470 475 480
Glu Glu Gln Lys Arg Met Leu Leu Leu Pro Ala Glu Ala Val Asn Val
485 490 495
Ser Arg Lys Gly Glu Phe Ala Leu Lys Val Gly Gly Ser Leu Lys Gly
500 505 510
Ala Lys Asn Val Tyr Tyr Asn Met Ala Leu Met Asn Ala Gly Val Lys
515 520 525
Lys Val Val Val Arg Phe Asp Pro Gln Gln Leu His Ser Thr Val Tyr
530 535 540
Cys Tyr Thr Leu Asp Gly Arg Phe Ile Cys Glu Ala Glu Cys Leu Ala
545 550 555 560
Pro Val Ala Phe Asn Asp Ala Ala Ala Gly Arg Glu Tyr Arg Arg Arg
565 570 575
Gln Lys Gln Leu Lys Ser Ala Thr Lys Ala Ala Ile Lys Ala Gln Lys
580 585 590
Gln Met Asp Ala Leu Glu Val Ala Glu Leu Leu Pro Gln Ile Ala Glu
595 600 605
Pro Glu Ala Pro Glu Ser Arg Ile Val Gly Ile Phe Arg Pro Ser Gly
610 615 620
Asn Thr Glu Arg Val Lys Asn Gln Glu Arg Asp Asp Glu Tyr Glu Thr
625 630 635 640
Glu Arg Asp Glu Tyr Leu Asn His Ser Leu Asp Ile Leu Glu Gln Asn
645 650 655
Arg Arg Lys Lys Ala Ile
660
<210> 4
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Mu转座酶识别序列
<400> 4
tgaagcggcg cacgaaaaac gcgaaag 27
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Mu转座酶识别序列
<400> 5
gcgtttcacg ataaatgcga aaa 23
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Mu转座酶识别序列
<400> 6
ctgtttcatt tgaagcgcga aag 23
<210> 7
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Mu转座酶识别序列
<400> 7
tgtattgatt cacttgaagt acgaaaa 27
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Mu转座酶识别序列
<400> 8
ccttaatcaa tgaaacgcga aag 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Mu转座酶识别序列
<400> 9
ttgtttcatt gaaaatacga aaa 23
<210> 10
<211> 458
<212> PRT
<213> 哈氏弧菌(Vibrio harveyi)
<400> 10
Met Thr His Ser Asp Ala Lys Leu Trp Ala Gln Glu Gln Phe Gly Gln
1 5 10 15
Ala Gln Leu Lys Asp Pro Arg Arg Thr Gln Arg Leu Ile Ser Leu Ala
20 25 30
Thr Ser Ile Ala Asn Gln Pro Gly Val Ser Val Ala Lys Leu Pro Phe
35 40 45
Ser Pro Ala Asp Met Glu Gly Ala Tyr Arg Phe Ile Arg Asn Glu Asn
50 55 60
Ile Asn Ala Glu Asp Ile Ala Glu Ala Gly Phe Gln Ser Thr Val Ser
65 70 75 80
Arg Ala Asn Glu His Lys Glu Leu Leu Ala Leu Glu Asp Thr Thr Thr
85 90 95
Leu Ser Phe Pro His Arg Ser Ile Lys Glu Glu Leu Gly His Thr Asn
100 105 110
Gln Gly Asp Arg Thr Arg Ala Leu His Val His Ser Thr Leu Leu Phe
115 120 125
Ala Pro Gln Ser Gln Thr Ile Val Gly Leu Ile Glu Gln Gln Arg Trp
130 135 140
Ser Glu Asp Ile Thr Lys Arg Gly Gln Lys His Gln His Ala Thr Arg
145 150 155 160
Pro Tyr Lys Glu Lys Glu Ser Tyr Lys Trp Glu Gln Ala Ser Arg Arg
165 170 175
Val Val Glu Arg Leu Gly Asp Lys Met Leu Asp Val Ile Ser Val Cys
180 185 190
Asp Arg Glu Ala Asp Leu Phe Glu Tyr Leu Thr Tyr Lys Arg Gln His
195 200 205
Gln Gln Arg Phe Val Val Arg Ser Met Gln Ser Arg Cys Leu Glu Glu
210 215 220
His Ala Gln Lys Leu Tyr Asp Tyr Ala Gln Ala Leu Pro Ser Val Glu
225 230 235 240
Thr Lys Ala Leu Thr Ile Pro Gln Lys Gly Gly Arg Lys Ala Arg Asn
245 250 255
Val Lys Leu Asp Val Lys Tyr Gly Gln Val Thr Leu Lys Ala Pro Ala
260 265 270
Asn Lys Lys Glu His Ala Gly Ile Pro Val Tyr Tyr Val Gly Cys Leu
275 280 285
Glu Gln Gly Thr Ser Lys Asp Leu Ala Trp His Leu Leu Thr Ser Glu
290 295 300
Pro Ile Asn Asn Val Asp Asp Ala Met Arg Ile Ile Gly Tyr Tyr Glu
305 310 315 320
Arg Arg Trp Leu Ile Glu Asp Phe His Lys Val Trp Lys Ser Glu Gly
325 330 335
Thr Asp Val Glu Ser Leu Arg Leu Gln Ser Lys Asp Asn Leu Glu Arg
340 345 350
Leu Ser Val Ile Tyr Ala Phe Val Ala Thr Arg Leu Leu Ala Leu Arg
355 360 365
Phe Met Lys Glu Val Asp Glu Leu Thr Lys Glu Ser Cys Glu Lys Val
370 375 380
Leu Gly Gln Lys Ala Trp Lys Leu Leu Trp Leu Lys Leu Glu Ser Lys
385 390 395 400
Thr Leu Pro Lys Glu Val Pro Asp Met Gly Trp Ala Tyr Lys Asn Leu
405 410 415
Ala Lys Leu Gly Gly Trp Lys Asp Thr Lys Arg Thr Gly Arg Ala Ser
420 425 430
Ile Lys Val Leu Trp Glu Gly Trp Phe Lys Leu Gln Thr Ile Leu Glu
435 440 445
Gly Tyr Glu Leu Ala Met Ser Leu Asp His
450 455
<210> 11
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 哈氏弧菌转座酶识别序列
<400> 11
ctgtctcttg atcacaagt 19
<210> 12
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 哈氏弧菌转座酶识别序列
<400> 12
agatgtgatc aagagacag 19
<210> 13
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 哈氏弧菌转座酶识别序列
<400> 13
ctgtctcttg atcacatct 19

Claims (86)

1.一种用于确定基因组DNA可及性的方法,所述方法包括:
(a)阵列上的生物样品,所述阵列包括多个捕获探针,其中所述多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;
(b)使多个夹板寡核苷酸与所述生物样品接触,其中夹板寡核苷酸与所述捕获结构域杂交;
(c)使转座子基因组与所述生物样品接触,以将转座子末端序列插入可及的基因组DNA中,从而生成片段化的基因组DNA;
(d)将所述片段化的基因组DNA与所述夹板寡核苷酸杂交,并且将所述片段化的基因组DNA连接到所述捕获探针;
(e)从所述连接的片段化基因组DNA中释放一个或多个未连接的转座子末端序列;以及
(f)确定(i)所述空间条形码的序列或其互补序列,和(ii)所述片段化基因组DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的所述确定序列来确定所述生物样品中的基因组DNA可及性。
2.根据权利要求1所述的方法,其中所述阵列包括一个或多个特征。
3.根据权利要求2所述的方法,其中所述一个或多个特征包括珠粒。
4.根据权利要求1至3中任一项所述的方法,其中所述捕获探针还包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
5.根据权利要求1至4中任一项所述的方法,还包括主动迁移步骤,其中通过施加电场将所述片段化的基因组DNA迁移到所述阵列。
6.根据权利要求1至5中任一项所述的方法,其中步骤(b)中的所述杂交包括将所述夹板寡核苷酸或其一部分与所述捕获探针的所述捕获结构域或其一部分杂交。
7.根据权利要求1至6中任一项所述的方法,其中步骤(d)中的所述杂交包括将所述夹板寡核苷酸或其一部分与片段化基因组DNA的转座子末端序列或其一部分杂交。
8.根据权利要求1至7中任一项所述的方法,其中所述连接使用DNA连接酶进行。
9.根据权利要求1至8中任一项所述的方法,还包括使用所述片段化的基因组DNA作为模板来延伸所述捕获探针的3’末端。
10.根据权利要求9所述的方法,其中所述延伸步骤使用具有链置换活性的DNA聚合酶进行。
11.根据权利要求1至8中任一项所述的方法,其中所述连接步骤引起DNA分子的生成。
12.根据权利要求1至11中任一项所述的方法,还包括在所述夹板寡核苷酸与所述片段化的基因组DNA之间进行缺口填充。
13.根据权利要求1至12中任一项所述的方法,其中所述转座子基因组包括转座酶,并且其中所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属物种转座酶,或者它们的功能衍生物。
14.根据权利要求13所述的方法,其中所述Tn5转座酶包括与SEQ ID NO:1至少80%相同的序列。
15.根据权利要求1至14中任一项所述的方法,其中步骤(f)中的所述确定包括对以下各项进行测序:(i)所述空间条形码或其互补序列,和(ii)所述片段化基因组DNA的全部或部分序列,或者其互补序列,然后进一步确定所述可及的基因组DNA在所述生物样品中的位置。
16.根据权利要求1至15中任一项所述的方法,还包括在所述生物样品与所述阵列接触之前或之后对所述生物样品成像。
17.根据权利要求1至16中任一项所述的方法,其中步骤(d)中的所述释放包括对所述生物样品进行加热。
18.根据权利要求17所述的方法,其中所述加热包括加热到约65℃至85℃的温度。
19.根据权利要求18所述的方法,其中所述加热包括加热到约65℃至约80℃的温度。
20.根据权利要求19所述的方法,其中所述加热包括加热到约75℃的温度。
21.根据权利要求1至20中任一项所述的方法,还包括对所述生物样品进行染色。
22.根据权利要求21所述的方法,其中所述染色包括苏木精和曙红染色。
23.根据权利要求1至22中任一项所述的方法,其中使所述转座子基因组与所述生物样品接触是在化学透化条件下、在酶促透化条件下或这两种条件下进行的。
24.根据权利要求23所述的方法,其中所述化学透化条件包括去污剂。
25.根据权利要求24所述的方法,其中所述去污剂是NP-40、Tween-20、Triton X-100和洋地黄皂苷中的一者或多者。
26.根据权利要求25所述的方法,其中所述去污剂的浓度为约0.001%(v/v)至约1.0%(v/v)。
27.根据权利要求1至27中任一项所述的方法,其中使所述转座子基因组与所述生物样品接触是在酶促预透化条件之后进行的。
28.根据权利要求28所述的方法,其中所述酶促预透化条件包括蛋白酶。
29.根据权利要求29所述的方法,其中所述蛋白酶是胃蛋白酶、胶原酶、蛋白酶K,以及它们的组合。
30.根据权利要求30所述的方法,其中所述蛋白酶是胶原酶。
31.一种用于确定基因组DNA可及性的方法,所述方法包括:
(a)阵列上的生物样品,所述阵列包括多个捕获探针,其中所述多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;
(b)使转座子基因组与所述生物样品接触,以将转座子末端序列插入可及的基因组DNA中,从而生成片段化的基因组DNA;
(c)将所述片段化基因组DNA的转座子末端序列与所述捕获探针的所述捕获结构域杂交;
(d)释放未与所述捕获结构域结合的转座子末端序列;以及
(e)确定(i)所述空间条形码的序列或其互补序列,和(ii)所述片段化基因组DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定所述生物样品中的基因组DNA可及性。
32.根据权利要求31所述的方法,其中所述阵列包括一个或多个特征。
33.根据权利要求32所述的方法,其中所述一个或多个特征包括珠粒。
34.根据权利要求31至33中任一项所述的方法,其中所述捕获探针还包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
35.根据权利要求31至34中任一项所述的方法,还包括主动迁移步骤,其中通过施加电场将所述片段化的基因组DNA迁移到所述阵列。
36.根据权利要求31至35中任一项所述的方法,其中步骤(c)中的所述杂交包括将所述转座子末端序列或其一部分与所述捕获探针的所述捕获结构域或其一部分杂交。
37.根据权利要求31至36中任一项所述的方法,还包括使用所述片段化的基因组DNA作为模板来延伸所述捕获探针的3’末端。
38.根据权利要求37所述的方法,其中所述延伸步骤使用具有链置换活性的DNA聚合酶进行。
39.根据权利要求31至38中任一项所述的方法,还包括在所述转座子末端序列与所述片段化的基因组DNA之间进行缺口填充。
40.根据权利要求31至39中任一项所述的方法,其中所述转座子基因组包括转座酶,并且其中所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属物种转座酶,或者它们的功能衍生物。
41.根据权利要求40所述的方法,其中所述Tn5转座酶包括与SEQ ID NO:1至少80%相同的序列。
42.根据权利要求31至41中任一项所述的方法,其中步骤(e)中的所述确定包括对以下各项进行测序:(i)所述空间条形码的所述序列或其互补序列,和(ii)所述片段化基因组DNA的全部或部分序列,或者其互补序列,然后进一步确定所述可及的基因组DNA在所述生物样品中的所述位置。
43.根据权利要求31至42中任一项所述的方法,还包括在所述生物样品与所述阵列接触之前或之后对所述生物样品成像。
44.根据权利要求31至43中任一项所述的方法,其中步骤(d)中的所述释放包括对所述生物样品进行加热。
45.根据权利要求44所述的方法,其中所述加热包括加热到约65℃至85℃的温度。
46.根据权利要求45所述的方法,其中所述加热包括加热到约65℃至约80℃的温度。
47.根据权利要求46所述的方法,其中所述加热包括加热到约75℃的温度。
48.根据权利要求31至47中任一项所述的方法,还包括对所述生物样品进行染色。
49.根据权利要求48所述的方法,其中所述染色包括苏木精和曙红染色。
50.根据权利要求31至49中任一项所述的方法,其中使所述转座子基因组与所述生物样品接触是在化学透化条件之后、在酶促透化条件下或同时满足这两者的情况下进行的。
51.根据权利要求50所述的方法,其中所述化学透化条件包括去污剂。
52.根据权利要求51所述的方法,其中所述去污剂是NP-40、Tween-20、Triton X-100和洋地黄皂苷中的一者或多者。
53.根据权利要求52所述的方法,其中所述去污剂的浓度为约0.001%(v/v)至约0.1%(v/v)。
54.根据权利要求31至53所述的方法,其中使所述转座子基因组与所述生物样品接触是在酶促预透化条件之后进行的。
55.根据权利要求54所述的方法,其中所述酶促预透化条件包括蛋白酶。
56.根据权利要求55所述的方法,其中所述蛋白酶是胃蛋白酶、胶原酶、蛋白酶K,以及它们的组合。
57.根据权利要求56所述的方法,其中所述蛋白酶是胶原酶。
58.一种用于确定生物样品中的DNA位置的方法,所述方法包括:
(a)阵列上的生物样品,所述阵列包括多个捕获探针,其中所述多个捕获探针中的一个捕获探针包括:(i)空间条形码和(ii)捕获结构域;
(b)使所述生物样品与蛋白酶接触,其中所述蛋白酶能够降解一种或多种组蛋白,从而释放所述DNA;
(c)使转座子基因组与生物样品接触,以将转座子末端序列插入释放的基因组DNA中,从而生成片段化的基因组DNA;
(d)将片段化DNA的转座子末端序列与捕获结构域杂交;
(e)释放未与捕获结构域结合的转座子末端序列;以及
(f)确定(i)所述空间条形码的序列或其互补序列,和(ii)所述DNA的全部或部分序列,或者其互补序列,并且使用(i)和(ii)的确定序列来确定所述生物样品中DNA的位置。
59.根据权利要求58所述的方法,其中所述蛋白酶能够降解所述生物样品中的至少一种接头组蛋白和至少一种核心组蛋白。
60.根据权利要求58或59所述的方法,其中所述蛋白酶能够降解来自所述生物样品中的每个核心组蛋白家族的至少一种组蛋白。
61.根据权利要求58至60中任一项所述的方法,其中所述蛋白酶是丝氨酸蛋白酶、天冬氨酰蛋白酶、肽酶家族C1酶、被重氮甲烷抑制剂Z-Phe-Phe-CHN(2)或环氧化物抑制剂E-64抑制的蛋白酶、溶酶体蛋白酶、胶原酶或嗜苯胺蓝酶。
62.根据权利要求61所述的方法,其中所述蛋白酶是胶原酶。
63.根据权利要求58至62中任一项所述的方法,其中所述捕获结构域包含均聚序列。
64.根据权利要求58至62中任一项所述的方法,其中所述捕获结构域包含单一序列。
65.根据权利要求58至64中任一项所述的方法,其中所述捕获探针还包括裂解结构域、一个或多个功能性结构域、独特分子标识符,或者它们的组合。
66.根据权利要求58至65中任一项所述的方法,还包括主动迁移步骤,其中通过施加电场将所述片段化的基因组DNA迁移到所述阵列。
67.根据权利要求58至66中任一项所述的方法,其中步骤(d)中的所述杂交包括将所述转座子末端序列或其一部分与所述捕获探针的所述捕获结构域或其一部分杂交。
68.根据权利要求58至67中任一项所述的方法,还包括使用所述片段化的基因组DNA作为模板来延伸所述捕获探针的3’末端。
69.根据权利要求68所述的方法,其中所述延伸步骤使用具有链置换活性的DNA聚合酶进行。
70.根据权利要求58至69中任一项所述的方法,还包括在所述转座子末端序列与所述片段化的基因组DNA之间进行缺口填充。
71.根据权利要求58至70中任一项所述的方法,其中所述转座子基因组包括转座酶,并且其中所述转座酶是Tn5转座酶、Mu转座酶、Tn7转座酶、弧菌属物种转座酶,或者它们的功能衍生物。
72.根据权利要求71所述的方法,其中所述Tn5转座酶包括与SEQ ID NO:1至少80%相同的序列。
73.根据权利要求58至72中任一项所述的方法,其中步骤(f)中的所述确定包括对以下各项进行测序:(i)所述空间条形码或其互补序列,和(ii)所述片段化基因组DNA的全部或部分序列,或者其互补序列。
74.根据权利要求58至73中任一项所述的方法,其中所述方法还包括对所述生物样品进行成像和/或染色。
75.根据权利要求74所述的方法,其中所述染色包括苏木精和曙红染色。
76.根据权利要求58至75中任一项所述的方法,其中所述蛋白酶与所述生物样品接触约5分钟至约15分钟。
77.根据权利要求76所述的方法,其中所述蛋白酶与所述生物样品接触约10分钟。
78.根据权利要求58至77中任一项所述的方法,其中所述蛋白酶在约30℃至约45℃的温度下与所述生物样品接触。
79.根据权利要求78所述的方法,其中所述蛋白酶在约37℃的温度下与所述生物样品接触。
80.根据权利要求58至79中任一项所述的方法,其中步骤(d)中的所述释放包括对所述生物样品进行加热。
81.根据权利要求80所述的方法,其中所述加热包括加热到约65℃至85℃的温度。
82.根据权利要求58至81中任一项所述的方法,其中确定生物样品中DNA的所述位置还包括对所述生物样品的整个基因组进行空间分析。
83.根据权利要求1至82中任一项所述的方法,其中所述生物样品是组织切片。
84.根据权利要求83所述的方法,其中所述组织切片是新鲜的冷冻组织切片。
85.根据权利要求83所述的方法,其中所述组织切片是固定的组织切片。
86.根据权利要求85所述的方法,其中所述固定的组织切片是福尔马林固定石蜡包埋的固定组织切片、丙酮固定组织切片、多聚甲醛固定组织切片或甲醇固定组织切片。
CN202280012312.7A 2021-01-29 2022-01-07 转座酶介导的对生物样品中的基因组dna在空间上加标签和分析的方法 Pending CN117242189A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/143,438 2021-01-29
US202163166708P 2021-03-26 2021-03-26
US63/166,708 2021-03-26
PCT/US2022/011663 WO2022164615A1 (en) 2021-01-29 2022-01-07 Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample

Publications (1)

Publication Number Publication Date
CN117242189A true CN117242189A (zh) 2023-12-15

Family

ID=89083056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280012312.7A Pending CN117242189A (zh) 2021-01-29 2022-01-07 转座酶介导的对生物样品中的基因组dna在空间上加标签和分析的方法

Country Status (1)

Country Link
CN (1) CN117242189A (zh)

Similar Documents

Publication Publication Date Title
US20220364163A1 (en) Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample
US20230175045A1 (en) Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample
US11732300B2 (en) Increasing efficiency of spatial analysis in a biological sample
US11898205B2 (en) Increasing capture efficiency of spatial assays
US11773433B2 (en) Methods for spatial analysis using targeted RNA depletion
US11891654B2 (en) Methods of making gene expression libraries
US20230042817A1 (en) Analyte capture from an embedded biological sample
US20230081381A1 (en) METHODS TO COMBINE FIRST AND SECOND STRAND cDNA SYNTHESIS FOR SPATIAL ANALYSIS
US20230220454A1 (en) Methods of releasing an extended capture probe from a substrate and uses of the same
EP4087945B1 (en) Methods for determining a location of a target nucleic acid in a biological sample
US20220170083A1 (en) Rna integrity analysis in a biological sample
US20230279477A1 (en) Methods for spatial analysis using targeted rna capture
US11608520B2 (en) Spatial analysis to detect sequence variants
US11702693B2 (en) Methods for printing cells and generating arrays of barcoded cells
US20230279474A1 (en) Methods for spatial analysis using blocker oligonucleotides
US20220348992A1 (en) Methods for determining a location of a target nucleic acid in a biological sample
EP4320271A1 (en) Methods for increasing resolution of spatial analysis
US11827935B1 (en) Methods for spatial analysis using rolling circle amplification and detection probes
WO2023225519A1 (en) Modified transposons, compositions and uses thereof
CN117242189A (zh) 转座酶介导的对生物样品中的基因组dna在空间上加标签和分析的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination